Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
RESUMEN: Se describe la importancia y aplicabilidad del anlisis acstico de la voz y el habla como herramienta
objetiva complementaria a la evaluacin subjetiva que, mediante la cuantificacin y cualificacin de los
parmetros acsticos imperceptibles al odo humano y la visualizacin de la emisin, se constituye en un
instrumento til para los diferentes quehaceres del fonoaudilogo. Desde el apoyo en el diagnstico, hasta
observacin de la evolucin en los tratamientos de reeducacin y educacin vocal, a su vez genera nuevas
posibilidades de investigacin de diversa ndole, entre las que se incluyen caracterizaciones y tipologas de los
diversos parmetros acsticos a nivel individual y poblacional.
PALABRAS CLAVE: Voz, habla, parmetros acsticos, prueba objetiva, anlisis acstico, disfona reeducacin,
entrenamiento.
Existen numerosas referencias sobre aplicaciones del anlisis acstico en aspectos como:
Descripcin de las caractersticas distintivas normales del habla
Estudio del lenguaje patolgico
Estudio de la voz hablada
Estudio de la voz cantada.
Las dos ltimas aplicaciones son el tema del presente artculo.
A nivel mundial, el mercado ofrece diferentes analizadores de las caractersticas acsticas de la voz, entre ellos el
CSL de Kay elemetrics, El Sistema de registro, grabacin y anlisis digital de la voz desarrollado por la compaa
speech tecnology center ltd, el Dr. Speech y, el Laboratorio De Anlisis De Sonidos Del Habla desarrollado por el
laboratorio de Investigaciones Sensoriales (L.I.S.) al cual haremos referencia especial ya que se ha tenido la
experiencia durante 10 aos tanto en el campo asistencial como investigativo.
El anlisis acstico de la voz es un mtodo utilizado para comparar la voz antes y despus de alguna
intervencin en el campo mdico y fonoaudiolgico . De igual manera ayuda a caracterizar la voz cantada en su
impostacin, timbre, calidad vocal, vibrato, pasajes de la voz, registros, frecuencia fundamental, extensin y el
control de hbitos (Facal, 1998, Jackson Menaldi, 2002). sirve adems para verificar los cambios vocales de
acuerdo a la edad, gnero y utilizacin de la voz.
El anlisis acstico de la voz diseado por el Laboratorio de Investigaciones Sensoriales Argentina tiene la
siguiente presentacin:
El parmetro fsico, la variacin acstica y el correlato psicoacstico diseado por Facal L. et all, 1996, Facal
L.1998, se describen en el siguiente cuadro:
Para el manejo de este instrumento, es importante recordar las definiciones bsicas relacionadas con la acstica,
para la comprensin y correlacin de la voz a evaluar. El sonido est constituido por ondas que se difunden a
travs de cuerpos elsticos; una onda es originada por una vibracin, una vibracin es un movimiento repetido
causante por un agente sobre el cuerpo que se encontraba en reposo (Betancurth, 1997). La mayor parte de los
sonidos que percibimos son ondas compuestas como la que producen los pliegues vocales denominado tono
fundamental.
Para realizar la descripcin del anlisis acstico de la voz se utilizan indicadores fsicos del sonido como: la
frecuencia, la intensidad, la composicin espectral, las variaciones del sonido modificadas por la resonancia que
actan originando un producto sonoro percibido, siendo importante resaltar la sonoridad, la frecuencia
fundamental, el pitch, el timbre y los formantes. (Sunberg,1994).
Al ejecutar el anlisis acstico en una voz se tienen en cuenta tres puntos de vista: la produccin, el proceso y la
percepcin, llevados a los correspondientes trminos de variacin de los pliegues vocales, frecuencia
fundamental y pitch (Furui, 1992). Los pliegues vocales se refieren a la observacin del mecanismo fisiolgico, la
frecuencia fundamental a las caractersticas cuasiperidicas en el tiempo y, el pitch a las caractersticas
espectrales de la seal, ya que la percepcin est ligada al dominio de la frecuencia.
Cuando se habla de diferencia de frecuencias, se refiere a que un sonido con mayor frecuencia da como
resultado uno agudo, menor frecuencia ser un sonido grave, por lo que se clasifica la voz del hombre de 70 a
220 Hz y la de la mujer de 150 a 330 Hz; la voz del nio entre 200 y 440Hz.
Con el analizador acstico se puede medir el Jitter (caracterstica no perceptible al oido) definido como la
perturbacin de la frecuencia. Segn Jackson Menaldi , 1992, es la variacin de la frecuencia fundamental o
recprocamente del perodo fundamental durante el habla, sin tener en cuenta los cambios voluntarios de la
frecuencia fundamental. Los valores utilizados en el analizador del L.I.S. son normales hasta 1.4Hz en valores
mayores se considera alterados o patolgicos. Otro aspecto importante es la relacin armnico / ruido,
considerado como el medidor del escape de aire durante la fonacin, cuando este es pequeo tambin se torna
imperceptible al oido, sus valores normales son mayores de 4,0 dB. Para tener un concepto claro sobre lo
descrito se presenta a continuacin el siguiente caso:
CASO N1 : Adolescente masculino de 15 aos de edad, quien consulta por sentir su voz como cuando tena
doce aos es remitido por el O.R.L. con una descripcin en la laringoscopia indirecta de ligera congestin de
cuerdas con hiatus a.p. no lesin de bordes libres, edema de cornete derecho de aspecto alrgico requiere
valoracin y tratamiento Fonoaudiolgico. En el estudio subjetivo la ficha respiratoria evidencia alteraciones, gran
rigidez en rganos fonoarticuladores, en especial en el maxilar inferior, con presencia de tensin extralarngea al
desarrollar los movimientos de labios, lengua y maxilar, verticalidad corporal tendiente a la hipertonicidad con
posicin de cabeza y hombros hacia adelante. Calidad vocal agudizada, spera, soplada, extrangulada con
presencia de bloqueos, golpes glticos, bitonalidad durante la emisin. Tos con altura tonal agravada. Se realiz
el tratamiento fonoaudiolgico inmediato y se tom la muestra de la voz al llegar y al salir de la sesin, con los
siguientes resultados:
En la primera grfica la frecuencia fundamental estaba entre 201 y 212 Hz, Jitter: de 17 a 44 Hz, Armnico ruido
fluctuante entre 2 y 5 dB: En la segunda grfica la frecuencia fundamental pas a ser de 141 - 173 Hz lo cual es
una baja significativa y hace que su voz sea agravada. Jitter entre 1,2 5 Hz y armnico ruido fluctuante de 1 a 6
dB. Al observar la grfica en la lnea azul de evidencia la bitonalidad (Combariza G, 2005) en las vocales /a/, /e/ y
bloqueos en el final de la vocal /i/, mayor en la emisin de /o/ y menor en /u/.
Otro ejemplo relacionado con la cuantificacin de la frecuencia fundamental en diferentes edades, se pudo
evidenciar en el proyecto de investigacin titulado Caracterizacin de los indicadores acsticos de la voz normal
en la poblacin urbana de la ciudad de Manizales en las edades de 12 a 18 aos pertenecientes a un nivel IV de
uso de la voz segn su ocupacin Martinez, Arango, Morillo, Botero, 2001 en los cuales se encontraron datos
como:
Frecuencia fundamental.
Lo anterior, cuantifica el cambio vocal evidente que se escucha en la prueba subjetiva, pero que no estimaba los
cambios leves en Hz que se pudieran producir durante el descenso y la estabilizacin vocal de una edad a la otra;
de igual manera los valores del jitter y armnico ruido fueron evidentes y acordes con el perodo de mutacin
vocal que se encontrara.
Otro parmetro es el denominado Shimmer, el cual se define, segn Jackson Menaldi, 1992, como la
perturbacin de la amplitud. Las mediciones del Shimmer sirven para cuantificar pequeos lapsos de inestabilidad
de la seal vocal. En el analizador de los parmetros de normalidad son de 20 dB en adelante la intensidad y el
Shimmer de 0,0 a 0,3 dB. El ejemplo del manejo de la energa se observa en el caso N2.
CASO N2: Mujer de 36 aos de edad, remitida para valoracin y terapia por el especialista de cabeza y cuello
POP tiroidectoma total y vaciamiento Radical completo, paresia de cuerda vocal izquierda. La impresin
diagnstica fonoaudiolgica fue de 1. Disfagia etapa farngea grado moderado para consistencias lquidas y
semilquidas 2. Disfona con caractersticas hipofuncionales grado moderado causas orgnico funcional.
los cambios en la energa fueron considerables, en la primera grabacin de 15 a 20 dB, pasaron en la segunda
de 24 a 28 dB. No hubo alteracin del Shimmer.
CASO N3: Hombre de 76 aos, remitido por el Otorrinolaringlogo por presentar presbilaringe. La impresin
diagnstica fue disfona con caractersticas hipofuncionales grado moderado por causa orgnico- funcional.
Entre los dos anlisis se pueden observar diferencias significativas en su energa (lnea roja) tanto en el
transcurso de la emisin como en el inicio, cuerpo y final de cada vocal. En la figura nmero 1 es fluctuante entre
13 29 dB, obsrvese como va descendiendo a medida que emite el sonido, valores del Shimmer alterados en la
vocal /a/ de 0,5 y en la vocal /o/ de 1,0 dB; esta caracterstica tambin es evidente en la longitud de onda (
amplitud - onda verde). En la segunda grabacin la energa oscil de 28 a 40 dB con valores del shimmer como
1,31 en la /a/ y 0,29 en la /e/, ntese en la lnea roja el cambio observable en las curvas.
En principio la voz es un proceso no estacionario, la posicin del tracto vocal puede variar el sonido en cualquier
momento, por lo cual, la estructura de la seal cambia debido a las diferentes posiciones de los rganos mviles.
En el espectro - zona tres o superior- de una seal de voz se encuentran regiones de nfasis llamadas
resonancias y de denfasis denominadas antirresonancias (Deller, et all, 1993, Navarro et all, 1999). Estas
resonancias son una consecuencia de las articulaciones formadas por varias cavidades acsticas del tracto vocal.
De tal forma que la localizacin de estas resonancias en el dominio de las frecuencias depende de la forma y de
las dimensiones fsicas del tracto vocal (Moore, 1990).
Cada forma del tracto vocal es caracterizada por un grupo de frecuencias de resonancia; desde el punto de vista
del modelado de sistemas, las articulaciones determinan propiedades del sistema de filtros de la voz. Debido a
que estas resonancias tienden a formar el espectro, se las llama formantes (Parsa, 1996). Este trmino es
empleado para referirse a la frecuencia nominal central de las resonancias. (Navarro, 1999, Castellanos et all,
2000)
Los formantes son rasgos de las frecuencias que caracterizan las emisiones sonoras de las vocales y de otros
sonidos peridicos. Las frecuencias de los formantes siguen patrones comunes en la mayora de los humanos ya
que obedecen en primera instancia a medidas antropomtricas del individuo. El tracto vocal es considerado un
perfecto cilindro cerrado al nivel de la glotis, abierto en los labios y tiene una longitud aproximada de 17,5 cm. Los
primeros cuatro formantes estn cerca de los 500, 1500, 2500, 3500 Hz (Jackson Menaldi, 1992). Sin embargo la
posicin de esta frecuencia puede ser variada, lo cual es un indicador de aspectos como el nivel de articulacin y
manejo de los mismos para su proyeccin vocal.
Una caracterstica de los formantes son los anchos de banda, los cuales permiten definir la relacin entre los
armnicos del tono fundamental larngeo y las frecuencias de resonancias impuestas en las cavidades, cuanto
ms cerca est la frecuencia propia de un formante de la frecuencia de un armnico tanto ms aumentar la
amplitud y la calidad sonora de la emisin, esto depende de la acomodacin de las partes mviles. Existen otros
formantes que indican la colocacin de la voz y permite verificar el brillo de la misma, estos son los formantes 4 Y
5.
CASO N4: Hombre de 17 aos de edad, quien consulta para entrenar y obtener el uso adecuado de la voz.
En la primera grfica se comparan la voz hablada y cantada, con inadecuado manejo y colocacin de la voz, voz
esforzada, tensa, extrangulada. Con valores de formantes 1 dentro de parmetros normales, aumentados los
valores de formantes 2, 3 durante ambas emisiones, sin presencia de formante 4 y 5 en la voz hablada, pero en la
voz cantada existe cierta aparicin de los mismos sin precisin y con valores aumentados. En la segunda grfica
se observa la presencia de los formante 4 y 5, falta mayor manejo de la voz y la impostacin vocal.
La ventaja de la integracin de este instrumento para la valoracin de la voz, es contar con una documentacin
objetivamente corroborada acerca del diagnstico, seguimiento y evolucin posterior al manejo teraputico. De
igual manera, es posible, mediante la ayuda de este tipo de herramientas, la valoracin del efecto de las de las
tcnicas utilizadas para la reeducacin vocal.
A su vez, el uso de este tipo de software, permite una mejor comunicacin entre diferentes disciplinas, puesto
que adems de ser herramienta de verificacin, ha permitido que otros profesionales como los
otorrinolaringlogos, los profesores de canto, los mdicos en general y particularmente los usuarios, accedan a
una cabal comprensin de la evaluacin y evolucin de las patologas referidas, a su rehabilitacin , reeducacin,
educacin. se visualiza y cuantifica los cambios, por leves e imperceptibles al oido humano, lo que genera mayor
credibilidad; facilita la orientacin e incrementa el compromiso y la motivacin, lo que contribuye positivamente al
desarrollo del tratamiento.
Y hoy es.. Todas las noches es ms: a toda hora cuando en alguna parte del mundo se hace de noche- se
levantan mil telones de mil escenarios teatrales en la tierra. Sonidos orquestales surgen bajo la batuta de un
director, y luego diez veces mil voces irrumpen en las salas llenas de centenares de miles, de millones oyentes. Y
otros mil cantantes se hallan de pie sobre algn podio de conciertos, en algn lugar del mundo hacen vibrar cien
mil corazones al susurro de un tilo delante de los portones de la ciudad...... se deleitan escuchando el arte de
grandes cantantes.... Kurt Pahlen.
ARONSON, L. y otros. Caractersticas acsticas de las vocales del espaol rioplatense. En Fonoaudiolgica.
Tomos 46, N2 y 47, N1, 2001.
BACOT, C., Facal,L. Valenzuela G. El uso adecuado de la voz Buenos Aires Editora talleres mrgenes, 1996
BEHLAU M, PONTES, P. Avaliacao e tratamento das disfonias. Sao Paulo, Editora Lovise 1996
BELLOTTO, R. Voz y pronunciacin. Buenos Aires, Editorial publicaciones mdicas Argentina
BERNAL, S., BAQUERO M., Manejo fonolgico. Bogot editorial gazeta ltda, 1988
BETANCURTH, A. Fontica y fonologa, Bogot Universidad Santo Toms, 1997
BORZONE, A. Manual de fontica acstica. Buenos Aires, editorial Hachette, 1980
BOTERO, L.M. Proyecto de investigacin: Caracterizacin de los indicadores acsticos de la voz en la poblacin
urbana de la ciudad de Manizales. Universidad Catlica de Manizales, 2000
BOTERO,L.M. MEJIA G.E, CASTRO L. La voz hablada y cantada. Normalidad y patologa Mdulo de la materia
Foniatra Universidad catlica de Manizales, 1998.
BOTERO, L.M. y otros. resumen de la investigacin diseo y desarrollo de un sistema interactivo de anlisis
acstico de la voz y el habla para la ciudad de Manizales. Revista cientifica en salud, Universidad Catlica de
Manizales, 2000.
BUSTOS I. Et all.La percepcin auditiva un enfoque transversal. Madrid editorial tetun, 2001
CASTELLANOS, G, y otros. mtodos de estimacin de parmetros en el anlisis acstico de la voz universidad
de los andes, 2000.
CHINA, N. Et all. Anlisis espectrogrfico de las alteraciones fonticas en un caso de afasia de Broca. En
Fonoaudiolgica. Tomo 46, No. 1 , 2000.
ECKLEY, C y otros. Registro de voz en paresia y parlisis larngea. En Journal of Voice Volumen 12 N3, 1998
FACAL, L. La voz del cantante. Buenos Aires. Talleres Vladimir, 1998
FURUI, Sadoaki and SONDHI M., Mohan. Advances in speech signal processing. New York: Marcel Dekker INC,
1992.
GALVIS, V. La voz como prueba judicial. Bogot, editorial plaza y jans
GUIRAO, M. Procesos sensoriales y cognitivos. Buenos Aires, ediciones Dunken, 1997
GURLEKIAN, Jorge y otros. Preparacin de un informe clnico para tres patologas de la voz. En: : Tpicos em
Fonoaudiologia 1996 . Volume III. Editora Lovise. Brasil.
GURLEKIAN, Jorge. Anlisis acstico del habla. En: Ecos Fonoaudiolgicos. Buenos Aires. (1993).
GURLEKIAN, Jorge. El hombre dialoga con la mquina. Buenos Aires, 1986.
GURLEKIAN, Jorge. Anlisis acstico del habla. Informe fonoaudiolgico. En: Fonoaudiolgica. Tomo 40, No. 2
, 1995.
GURLEKIAN, Jorge. Aplicacin de la tecnologa informtica al estudio de la voz del locutor profesional. En: Ecos
fonoaudiolgicos. Buenos Aires ,1996.
HARRIS M., Cyril. Manual de medidas acsticas y Control del ruido. Vol1. Madrid. Mc Graw Hill, 1998
JACKSON, Cristina. La voz Patolgica. Argentina. Editorial Panamericana, 2002
JACKSON, Cristina.. Eficacia del tratamiento rehabilitador en la patologa vocal. En Fonoaudiolgica Tomo48,
N1, 2002
JACKSON, Cristina.. La voz normal. Argentina. Editorial Panamericana, 1993
MARTINEZ L., MORILLO E., ARANGO T., BOTERO L.M. Subproyecto Caracterizacin de los indicadores
acsticos de la voz en la poblacin urbana de la ciudad de Manizales en las edades de 12 a 18 aos
pertenecientes a un nivel IV de uso de la voz segn su ocupacin. Universidad Catlica de Manizales, 2000.
MONACO, M.J. y otros. El sistema de anlisis de la voz y el habla como mtodo de estudio objetivo del estridor.
En Fonoaudiolgica artculo publicado en la pgina Web de ASALFA, 2002
MUOZ, D. , CUBILLOS, J.C. Sistema de acceso mltiple en lnea sobre la Web orientado al anlisis acstico de
la voz. Tesis de grado Universidad Nacional de Colombia - Sede Manizales, Facultad de Ingeniera Electrnica,
2002