Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Figura. 3 (a) Palabra sin eliminar silencios de Figura. 4 Detección de máximos de una palabra
inicio y fin. (b) Palabra sin silencios. Fuente: Fuente: Grupo de Automatización Industrial
Grupo de Automatización Industrial UCC. UCC.
Enventanado y extracción de frecuencias formantes1, envolvente del
características LPC: espectro y función del tracto vocal, es
ampliamente usada en sistemas de
La señal recortada se divide en ventanas reconocimiento de la señal de voz
de 160 muestras para su posterior (Rabiner & Schafer, Digital Processing
procesamiento utilizando coeficientes of speech signals, 1978)
de predicción lineal (LPC). A cada una
de estas ventanas se aplica la ventana
Hamming (figura 5) con el fin de
suavizar los extremos de la ventana
haciendo posible la determinación de la
combinación lineal de todos los
elementos de una señal transformada
(Santos García, 2001).
0≤k ≤ p
La principal característica de los
coeficientes cepstrales es que permiten
separar del espectro la señal de voz de
En la ecuación “Rn(k)” , N es la la estructura fina y los formantes
cantidad de muestras de la ventana para (Rabiner & Biing Hwang,
este caso 160, Sn las muestras (de la Fundamentals of speech recognition,
señal de voz) y P la cantidad de 1993).
coeficientes LPC deseados, de la
cantidad de coeficientes LPC elegidos Se obtienen en total 14 coeficientes
depende la exactitud espectral, el cepstrum por ventana procesada. Estos
tiempo de cómputo y los recursos de conformaran los vectores que serán
memoria utilizados (Pech Carmona, cuantizados en la siguiente etapa Figura
2006). El número de coeficientes a 7.
seleccionar puede variar entre 8 y 30,
para este caso se usaron 14. La ecuación
“a1, a2, a3…” permite encontrar los
coeficientes LPC “ak” a partir de los
coeficientes de autocorrelación, para la
solución de esta ecuación se emplea el
método recursivo de Durbin (Rabiner
& Biing Hwang, Fundamentals of
speech recognition, 1993).
−1
a1 R(0) R(1) ... R(p−1) R(1)
a R(2)
=
2 R(1) R(0) ... R(p−2)
... ... ... ... ... ...
ap R(p−1) R(p−2) ... R(0) R(p)
; Es el numero esperado de veces
en el estado Sj y símbolo Vk dividido
entre el numero esperado de veces en el
estado Sj.
La selección de la cantidad de
Tabla. 1 Resultados por palabra. Fuente: Grupo
de Automatización Industrial UCC. coeficientes LPC en el análisis de la
señal de entrada es muy importante
para incrementar hasta cierto punto el
porcentaje de aciertos, además,
cantidades como el número de estados y
el número de símbolos de cada modelo
afectan considerablemente el tiempo de
reconocimiento y los recursos
computacionales.