Skip to main content

¿Qué es el reconocimiento de voz?

Constituição Federal Completa e atualizada - 10 Horas de Audio (Abril 2025)

Constituição Federal Completa e atualizada - 10 Horas de Audio (Abril 2025)
Anonim

El reconocimiento de voz es una tecnología que permite la entrada hablada en los sistemas. Habla con su computadora, teléfono o dispositivo y usa lo que dijo como entrada para activar alguna acción. La tecnología se está utilizando para reemplazar otros métodos de entrada, como escribir, hacer clic o seleccionar de otras maneras. Es un medio para hacer que los dispositivos y el software sean más fáciles de usar y para aumentar la productividad.

Hay muchas aplicaciones y áreas donde se utiliza el reconocimiento de voz, incluido el ejército, como ayuda para personas discapacitadas (imagine una persona con manos o dedos lisiados), en el campo médico, en robótica, etc. En un futuro próximo, casi todos estarán expuestos al reconocimiento de voz debido a su propagación entre dispositivos comunes como computadoras y teléfonos móviles.

Ciertos teléfonos inteligentes están haciendo un uso interesante del reconocimiento de voz. Los dispositivos iPhone y Android son ejemplos de eso. A través de ellos, puede iniciar una llamada a un contacto simplemente recibiendo instrucciones habladas como "Llamar a la oficina". Otros comandos también pueden ser entretenidos, como 'Activar Bluetooth'.

Problemas con el reconocimiento de voz

El reconocimiento de voz, en su versión conocida como voz a texto (STT), también se ha utilizado durante mucho tiempo para traducir palabras habladas en texto. "Hablas, se escribe", como diría ViaVoice en su caja. Pero hay un problema con STT como lo conocemos. ViaVoice es uno de los mejores en la industria, así que imagínate el resto. La tecnología ha madurado y mejorado, pero el discurso a texto todavía hace que las personas hagan preguntas. Una de sus principales dificultades son las inmensas variaciones entre las personas al pronunciar palabras.

No todos los idiomas se suponen en el reconocimiento de voz, y los que lo hacen a menudo no son compatibles tan bien como el inglés. Como resultado, la mayoría de los dispositivos que ejecutan software de reconocimiento de voz se desempeñan razonablemente solo en inglés.

Un conjunto de requisitos de hardware hace que el reconocimiento de voz sea difícil de implementar en ciertos casos. Necesita un micrófono que sea lo suficientemente inteligente como para filtrar el ruido de fondo, pero al mismo tiempo lo suficientemente potente como para capturar la voz de forma natural.

Hablando de ruido de fondo, puede hacer que todo un sistema falle. Como resultado, el reconocimiento de voz falla en muchos casos debido a ruidos que están fuera del control del usuario.

Se está comprobando que el reconocimiento de voz está mejor como método de entrada para nuevos teléfonos y tecnologías de comunicación como VoIP, que como herramienta de productividad para la entrada masiva de texto.

Aplicaciones de reconocimiento de voz

La tecnología está ganando popularidad en muchas áreas y ha tenido éxito en lo siguiente:

  • Control del dispositivo. El solo hecho de decir "OK ​​Google" a un teléfono con Android enciende un sistema que es todo para sus comandos de voz.
  • Sistemas bluetooth del coche. Muchos autos están equipados con un sistema que conecta su mecanismo de radio a su teléfono inteligente a través de Bluetooth. Luego puede hacer y recibir llamadas sin tocar su teléfono inteligente, e incluso puede marcar números con solo decirlos.
  • Transcripción de voz. En áreas donde la gente tiene que escribir mucho, algunos programas inteligentes capturan sus palabras habladas y las transcriben en texto. Esto es actual en cierto software de procesamiento de textos. La transcripción de voz también funciona con el correo de voz visual.