Sei sulla pagina 1di 2

Conferencia: “Inteligencia Artificial Orientada al Tratamiento de Voz”

¿En qué consiste la Inteligencia Artificial?

Consiste en un sistema que es capaz de analizar datos en grandes cantidades (big data), identificar
patrones y por lo tanto, formular predicciones de forma automática, con rapidez y precisión, permite
que experiencias cotidianas sean más inteligentes, utilizando análisis predictivos en aplicaciones que
se usan diariamente. Por ejemplo: Siri funciona como asistente personal, utilizando procesamiento de
lenguaje natural, Facebook y Google Fotos mediante el reconocimiento de imagen sugieren el
etiquetado de fotos y otras aplicaciones más que se están desarrollando junto con el Internet de las
Cosas [1].

Técnicas de reconocimiento.

El reconocimiento automático del habla cubre varios campos, entre ellos están: la informática, el
procesamiento digital de señales, la fonética acústica y las redes neuronales artificiales. Existen tres
estrategias fundamentales para abordar el reconocimiento del habla [2].

• La primera estrategia, el uso de técnicas de comparación de patrones, que se divide en el uso de


métodos clásicos o con modelos automáticos [2].
• La segunda estrategia está orientada a la obtención de las características fonéticas de la voz [2].
• La tercera es una conformación de las dos anteriores [2].

A pesar de ser estrategias con enfoques diferentes, las tres deben implementar una etapa inicial en la
que se determinan las características espectrales de los sonidos. Esto es importante debido a que la
información más relevante de la voz se codifica en el dominio de la frecuencia, mientras que las
muestras de sonido que se obtienen con dispositivos electrónicos se encuentran codificados en el
dominio del tiempo [2].

Herramientas para procesamiento de habla.

• Procesamiento de habla no continua [2].


• Procesamiento de habla continua [2].
• Entrenamiento de redes neuronales [2].
• Sistemas de procesamiento de habla en general [2].
Importancia del desarrollo de sistemas basados en procesamiento de voz.

Los sistemas de procesamiento de voz son una parte importante de los sistemas de Inteligencia
Artificial ya que su principal objetivo es permitir una comunicación entre dos entes, el ser humano y
los sistemas electrónicos [3].

La importancia del desarrollo de estos sistemas permitirá que surjan ciertas aplicaciones con las cuales
se mejoraría el estilo de vida de las personas, puede ser también una herramienta de inclusión para
personas con algún tipo de discapacidad, que mediante el uso de procesamiento de voz puedan realizar
actividades de manera autónoma, como por ejemplo activar o desactivar componentes eléctricos y
electrónicos en el hogar, conducir una silla de ruedas mediante comandos de voz, y así varias
aplicaciones más con la finalidad de brindar comodidad a todas las personas dentro de la sociedad.

Aplicaciones.

En lo que se refiere a la síntesis del habla, el TTS se utiliza para transformar el Texto To Speech en
aplicaciones donde se requiere convertir textos escritos en recursos audibles. Estos sistemas se
utilizan para producir habla humana de manera artificial [2].

Otra aplicación es el reconocimiento automático del habla, que consiste en la conversión automática,
asistida por ordenadores, del lenguaje humano en su correspondiente texto escrito [2].

El Speech Understanding convierte la voz en una representación semántica del mensaje, que puede
ser procesado para desarrollar una acción [2].

Referencias

[1] C. G. Alvarez Pululuchi y M. A. Cajas Fuela, Desarrollo de una interfaz para el reconocimiento
de comandos de voz aplicado al control de sistemas domóticos., Cuenca: UPS, 2016.

[2] C. Salamea Palacios, «Machine Listening,» de Inteligencia Artificial Orientada al Tratamiento de


Voz, Cuenca, 2019.

[3] J. Camargo Serrano, Sistema de Reconocimiento de Voz Humana por Hardware, Bucaramanga:
Universidad Pontificia Bolivariana, 2010.

Potrebbero piacerti anche