Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Consiste en un sistema que es capaz de analizar datos en grandes cantidades (big data), identificar
patrones y por lo tanto, formular predicciones de forma automática, con rapidez y precisión, permite
que experiencias cotidianas sean más inteligentes, utilizando análisis predictivos en aplicaciones que
se usan diariamente. Por ejemplo: Siri funciona como asistente personal, utilizando procesamiento de
lenguaje natural, Facebook y Google Fotos mediante el reconocimiento de imagen sugieren el
etiquetado de fotos y otras aplicaciones más que se están desarrollando junto con el Internet de las
Cosas [1].
Técnicas de reconocimiento.
El reconocimiento automático del habla cubre varios campos, entre ellos están: la informática, el
procesamiento digital de señales, la fonética acústica y las redes neuronales artificiales. Existen tres
estrategias fundamentales para abordar el reconocimiento del habla [2].
A pesar de ser estrategias con enfoques diferentes, las tres deben implementar una etapa inicial en la
que se determinan las características espectrales de los sonidos. Esto es importante debido a que la
información más relevante de la voz se codifica en el dominio de la frecuencia, mientras que las
muestras de sonido que se obtienen con dispositivos electrónicos se encuentran codificados en el
dominio del tiempo [2].
Los sistemas de procesamiento de voz son una parte importante de los sistemas de Inteligencia
Artificial ya que su principal objetivo es permitir una comunicación entre dos entes, el ser humano y
los sistemas electrónicos [3].
La importancia del desarrollo de estos sistemas permitirá que surjan ciertas aplicaciones con las cuales
se mejoraría el estilo de vida de las personas, puede ser también una herramienta de inclusión para
personas con algún tipo de discapacidad, que mediante el uso de procesamiento de voz puedan realizar
actividades de manera autónoma, como por ejemplo activar o desactivar componentes eléctricos y
electrónicos en el hogar, conducir una silla de ruedas mediante comandos de voz, y así varias
aplicaciones más con la finalidad de brindar comodidad a todas las personas dentro de la sociedad.
Aplicaciones.
En lo que se refiere a la síntesis del habla, el TTS se utiliza para transformar el Texto To Speech en
aplicaciones donde se requiere convertir textos escritos en recursos audibles. Estos sistemas se
utilizan para producir habla humana de manera artificial [2].
Otra aplicación es el reconocimiento automático del habla, que consiste en la conversión automática,
asistida por ordenadores, del lenguaje humano en su correspondiente texto escrito [2].
El Speech Understanding convierte la voz en una representación semántica del mensaje, que puede
ser procesado para desarrollar una acción [2].
Referencias
[1] C. G. Alvarez Pululuchi y M. A. Cajas Fuela, Desarrollo de una interfaz para el reconocimiento
de comandos de voz aplicado al control de sistemas domóticos., Cuenca: UPS, 2016.
[3] J. Camargo Serrano, Sistema de Reconocimiento de Voz Humana por Hardware, Bucaramanga:
Universidad Pontificia Bolivariana, 2010.