Sei sulla pagina 1di 32

MANUAL DE PRAAT

Preparado por: Ling. Hctor Hugo Rodrguez Toledo

Revisado por: Mtra. Rosa Mara Rojas Torres

Primera versin Enero 2013

ndice de contenido
Privada del Relox No. 16 A piso 5, Col. Chimalistac, Deleg. lvaro Obregn, Mxico D.F. 01070 Tel. (55) 50 04 21 22

I.

Introduccin..

II.

Instalacin

III.

Abrir Praat..

IV.

Leer un sonido

V.

Abrir archivo extenso de audio..

VI.

La segmentacin Parte 1..

VII.

La segmentacin Parte 2..

10

VIII.

La transcripcin

14

IX.

Insertar smbolos fonticos..

15

X.

Dnde escuchar los sonidos del AFI? .

18

Privada del Relox No. 16 A piso 5, Col. Chimalistac, Deleg. lvaro Obregn, Mxico D.F. 01070 Tel. (55) 50 04 21 22

XI.

Guardar TextGrid. 20

XII.

Extraccin de audio con script

22

ANEXO I. Etiquetas. 25

ANEXO II. Uso de Lenz.

25

XIII.

Dividir pistas extensas.

12

XIV.

Exportar seleccin.

15

Privada del Relox No. 16 A piso 5, Col. Chimalistac, Deleg. lvaro Obregn, Mxico D.F. 01070 Tel. (55) 50 04 21 22

MANUAL SINTETIZADO DE PRAAT Praat (del holands "hablar") es un software gratuito para el anlisis acstico del habla. Es un software libre, de cdigo abierto, multiplataforma y gratuito. Fue desarrollado en la Universidad de Amsterdam por Paul Boersma y David Weenink a partir del ao 1992.

I.

INTRODUCCIN

Se trata de un software de amplios propsitos; en efecto, permite hacer anlisis acstico, sntesis articulatoria, procesamiento estadstico de los datos, edicin y manipulacin de seales de audio, y un largo etctera. Otra cualidad interesantsima es que el usuario puede crear sus propias rutinas e incluso aadirlas a los mens del programa. Por tratarse de un programa especializado, no es la amabilidad de las interfaces una de sus caractersticas; ms bien, requiere un cierto adiestramiento y, mucha informacin terica. Por esta razn se ha escrito este manual orientado a facilitar su uso a los investigadores que apoyan las labores de Documentacin lingstica del Instituto Nacional de Lenguas de Lenguas Indgenas (INALI), a travs de la Direccin de Investigacin (DI) y del Archivo de Lenguas Indgenas Nacionales (ALIN).

Este es un manual bsico, en el que se presenta cmo hacer la instalacin del programa, abrir archivos de audio, crear textgrids, segmentar audio, crear intervalos de transcripcin en los distintos tiers, ingresar texto comn y corriente en los intervalos, ingresar smbolos Alfabeto Fontico Internacional (AFI) a los intervalos utilizando Lenz, y guardar audio por tem. II. INSTALACIN

Praat, puede ser instalado en varios sistemas operativos, incluyendo Unix, Mac y Microsoft Windows (en todas sus versiones). 1. Para hacerlo, tenemos que dirigirnos a la siguiente direccin electrnica: http://www.fon.hum.uva.nl/praat/ o en su defecto podemos dirigirnos al buscador de Google y escribir: Praat phonetics. 2. Una vez que nos encontramos en la pgina principal, encontraremos una seccin de Descarga/Download. Elegimos la versin para Windows o podemos teclear en la barra de bsqueda la siguiente direccin web que les llevara al enlace de descarga automticamente para el sistema operativo Windows:

http://www.fon.hum.uva.nl/praat/download_win.html

3. Una vez que estamos en la pgina web de Descarga/Download, elegimos bajar el archivo comprimido que contiene el programa Praat en su versin ejecutable con extensin (.exe). Recordemos que por ser Windows la plataforma ms difundida hemos optado por mostrar cmo se realiza la instalacin de esta forma.

4. Como vemos en la imagen, la ltima versin revisada en Enero de 2013, es la 5.3.39, y existen para sistemas de 32 y 64-bits, (aqu no nos detendremos a dar mayor detalle, nicamente mencionamos que tiene que ver con el hardware de su computadora y la memoria RAM). Elegimos la versin de 32-bits titulada: praat5339_win32.zip (que sirve para cualquier computadora estndar actual). Al dar clic, elegimos la opcin de Guardar archivo y damos clic en Aceptar.

5. Abrimos el archivo encriptado con extensin (.zip) y extraemos el contenido en una ubicacin deseada, que pude ser por ejemplo, el Escritorio.

III.

ABRIR PRAAT que es la imagen que simula a

Damos doble clic sobre el icono de Praat

una boca y una oreja debajo. Inmediatamente nos desplegara un par de pantallas llamadas Praat Objects y Praat Picture, y si logramos verlas en nuestra pantalla, enhorabuena, podemos empezar a usar el programa.

IV.

LEER UN SONIDO

Nota: Antes de ver los pasos para abrir un sonido, podemos cerrar la pantalla de Praat Picture, ya que no la necesitaremos. 1. Usted puede leer un archivo de sonido existente desde su disco duro. Con Read from file desde el men Open. Praat le brinda la posibilidad de leer extensiones estndares de sonido como, por ejemplo, la extensin (.wav). A continuacin, se abre una ventana que permite navegar por el disco duro de su computadora y seleccionar el fichero/carpeta que contiene el audio que desee.

2. A continuacin, el archivo seleccionado se mostrar como un objeto en la ventana administrativa (Object window). Para estos efectos, si usted abre el archivo ejemplo.wav, un objeto denominado Sound ejemplo se asignar en la lista.

Nota: Nosotros abrimos un sonido denominado: abeja_esa_bizu_ca que en Object window aparece como Sound abeja_esa_bizu_ca. Esto lo puede ver en la imagen siguiente: Ejemplo de audio listo para usarse en Praat

V.

ABRIR ARCHIVO EXTENSO DE AUDIO

1. Si el audio con el que se desea trabajar tiene una duracin demasiado elevada y Praat no puede almacenarlo en la memoria temporal, puede abrirse con la opcin Open long sound file... en el men Read.

Nota: Debe tenerse en cuenta que el tamao mximo de un fichero que puede abrirse con Praat es de 2 Gigabytes. VI. LA SEGMENTACIN PARTE I

1. Crearemos un archivo (.TextGrid), con la finalidad de segmentar y despus transcribir en distintos niveles el texto que deseamos. Entonces, una vez abierto el fichero que se desea etiquetar, se selecciona este fichero en la ventana Objects y se elige el men Annotate y se da clic en la opcin To TextGrid.

2. Aparecer el recuadro correspondiente a All tier names donde se escriben los nombres de los niveles en que desee transcribir el corpus.

3. Substituya el texto Mary John bell que aparece por defecto. Utilisaremos cuatro lineas de transcripcin correspondientes a la Transcripcin fontica (TF), Transcripcin ortogrfica (TO), Glosa

espaol (GE) y Etiquetado (ET). As escribiremos las abreviaturas propuesta, es importante que cuando las escribia no use comas slo espacios en blanco como se muestra en imagen y borre el contenido del recuadro Which of these are point tiers?, que por el momento no usaremos.

4. A continuacin, se selecciona conjuntamente el elemento Sound que contiene el sonido con el objeto TextGrid y se elige la opcin View & Edit en el men de la derecha.

5. Si realizamos los pasos anteriores correctamente, nos aparecer una ventana, con los niveles de transcripcin definidos antes, en los cuales podemos segmentar y anotar texto.

Nota: Para reproducir la grabacin, damos un clic donde dice Visible part (esto quiere decir que se escuchara la parte visible del oscilograma), lo que haremos enseguida es mostrar cmo se hace un zoom para poder inicar los intervalos a anotar, es decir, la segmentacin del audio. Recordemos que debemos identificar emisiones completas. Por ejemplo en el oscilograma, el inicio del audio es una lnea recta al igual que donde existe una ausencia de sonido, es sencillo identificar palabras completas ya que al oir y ver la imagen de ondas distinguimos las pausas.

Para visualizar mejor, damos clic en in, icono ubicado en la parte inferior izquierda de la pantalla, ajustando con out, hasta que ajustemos la imagen como deseamos, tomando encuenta las cuestiones anteriores. Adems no es de preocuparse que en algunas computadoras se visualice mejor que en otras, esto es debido a la resolucin de su pantalla.

Vemos que la parte visible ya no es la de la duracin total del audio, y para desplazarnos, usamos justamente la barra de desplazamiento. VII. LA SEGMENTACIN PARTE II

1. Primero debe poner el cursor en el nivel/lnea donde se desea marcar el segmento, esta se activara en un color amarillo.

En este ejemplo se activo la lnea 2 correspondiente a la Transcripcin ortogrfica y se visualiza el icono de mano sealndola.
10

2. Posiciona el cursor sobre la secuencia de sonido, al situar el cursor en el lugar donde se desea segmentar, aparece una lnea vertical gris y unos puntos, en cada uno de los niveles de etiquetado.

3. Dar un clic sobre el punto, y as se fija la primera frontera del segmento que se desea, que aparece en color rojo.

11

4. An estando activados los puntos en cada una de los niveles, contine marcndolos hasta que se haga una solo lnea de color azul, esto nos srive para que cada nivel este alineado al sonido y podamos ingresar texto en el mismo segmento.

5. Con

el

mismo

procedimiento

se

introducen

las

marcas

de

segmentacin del fin de la emisin que se deseen en cada nivel. IMPORTATE: De las emisiones que responda su colaborador, debe seleccionar la mejor de ellas.

En la imagen de abajo, note que ahora nos podemos posicionar dentro del corte y que la emisin corresponde a una sola palabra (puede hacerlo al ver el oscilograma que aparece de inicio con una lnea recta, seguido de ondas, y termina con lnea).

12

Nota: Puede desplazarse entre los segmentos seleccionndolos, usando men Interval y Boundary (con los que puede editarlos) Y usando las teclas Alt + Flechas del cursos (adelante, atrs, arriba, abajo). Si se equivoca y es necesario eliminar un segmento marcado, debe ir a Boundary>Remove, o con la combinacin de las teclas Alt y Retroceso (Alt+).

13

VIII.

LA TRANSCRIPCIN

Si hemos terminado con los pasos anteriores, podemos proceder a introducir texto, es decir, a transcribir. Para ello, sigamos los pasos siguientes: 1. Seleccione el corte/segmento que desea transcribir, al hacerlo se activara con un color amarillo entre dos marcas de segmentacin y podr introducir el texto en la ventana superior, se percatara que el cursor comienza a parpadear. (Tambin se muestra el texto, en la lnea).

Nota: Para introducir smbolos fonticos debe tenerse instalada la fuente Charis SIL que puede obtenerse desde la pgina de descarga de Praat:

http://www.fon.hum.uva.nl/praat/CharisSIL-4.110.zip o desde la pgina de SIL International: http://scripts.sil.org/CharisSILfont. Los links son directos y una vez que se descargue debe ejecutar el archivo y dar clic en instalar.

14

En la primera lnea usted usara, el Alfabeto Fontico Internacional (AFI), en la segunda lnea o nivel, el Alfabeto Practico de su lengua, en la tercera, la glosa en espaol (traduccin) y en la cuarta la etiqueta (que les proporcionar el equipo que coordina el proyecto). Para mayor informacin sobre la etiqueta vea el Anexo I.

IX.

INSERTAR SMBOLOS FONTICOS

Mostraremos como deben utilizarse las convenciones descritas en los apartados Phonetic symbols: consonants, Phonetic symbols: vowels y Phonetic symbols: diacritics del manual de ayuda que se encuentra en el men Help. Adems en el Anexo II se muestra el uso de un remapeador del teclado para fuentes AFI llamado Lenz. 1. Nos dirigimos a la derecha de la ventana donde aparece el men Help, en el se encuentra un acceso directo a las tablas de smbolos fonticos dentro del men Phonetic symbols.

2. Una vez que dimos clic, se abre la pgina correspondiente del manual y se puede seleccionar una de las tres tablas de smbolos: Phonetic symbols: consonants, Phonetic symbols: vowels o Phonetic symbols: diacritics, correspondientes a consonantes, vocales y diacrticos.
15

3. Al elegir lo que deseamos, aparecern tablas con la combinacin que debe teclearse para obtener el smbolo fontico deseado.

Nota: Podemos imprimir el contenido de las tablas o guardarlas en un formato Html (pagina web) para visualizarlos ms rpido, esto se hace en el men File.

16

4. Como vimos, debemos ir a la ventana superior para ingresar el texto y teclear como aparece en las tablas. Por ejemplo, si tecleamos la combinacin \zh, se obtiene el smbolo correspondiente a la fricativa postalveolar sonora [].

5. Ahora, y una vez que se inserto la transcripcin en las dos primeras lneas, ahora iremos a la lnea tres e introduciremos la Glosa en espaol, es decir la traduccin.

17

6. En la siguiente lnea (la cuarta), se debe escribir la etiqueta que se le asignar a ese tem. En este ejemplo, es hipottico (debe ver el Anexo I, para poder tener un panorama ms amplio, adems de la informacin que les dar el equipo del INALI).

X.

DONDE ESCUCHAR LOS SONIDOS DEL AFI? es un sistema de anotacin fontica

El Alfabeto Fontico Internacional (AFI),

creado por lingistas. Su propsito es otorgar en forma regularizada, precisa y nica la representacin de los sonidos de cualquier lenguaje oral. Debido a que existen diversos sonidos distintos al espaol en las lenguas indgenas y a que no todo mundo est entrenado en fontica, hemos pensado que es importante tener a la mano el audio para poder familiarizarnos con los sonidos de cada grafa que se representa en el AFI.

18

A continuacin ponernos algunas ligas donde puede hacerlo, estando conectado a internet: http://www.phonetics.ucla.edu/course/chapter1/consonants1.html http://web.uvic.ca/ling/resources/ipa/charts/IPAlab/IPAlab.htm

Adems les mostramos como poder bajar la aplicacin titulada IPA Help, para ser instalada en su computadora y podrn recurrir a esta cuando deseen. 1. Dirigirse a esta pgina web: http://www.sil.org/computing/ipahelp/ipahelp_download.htm

19

2. Cuando se encuentre en ella, dirigirse a la seccin Download y de clic en el link IPA Help que est en azul.

3. Al terminar de bajar SIL_IPA_2_1.exe, slo de doble clic e instale. 4. Una vez descargado, dirjase a la carpeta donde lo guard y de doble clic. 5. Se creara una carpeta llamada SIL_IPA_2_1, dentro esta un archivo llamado Setup, ejectelo (dando doble clic) y siga los pasos de instalacin. 6. Al terminar, se creara un acceso directo del programa en el Escritorio

, bralo y usted ya podr escuchar y ver la grafas del AFI.

20

XI.

GUARDAR TEXTGRID la anotacin

1. Terminando

cerramos la ventana, y nos dirigimos a la ventana de objetos (Praat Objects), se selecciona nicamente el

TextGrid y se guarda dando clic en Save, despus Save as text file...

2. Al aparecer la ventana, tendremos que elegir la ruta donde queremos guardar el archivo, que de preferencia ser en la misma carpeta donde se encuentra nuestro archivo de audio. Despus slo damos clic en guardar, y el archivo se salva con una extensin (.TextGrid) que despus podemos abrir en Praat. (El programa no tiene la funcin de autoguardado, por eso es importante hacerlo manualmente).

21

XII.

EXTRACCIN DE AUDIO CON SCRIPT

EL script que les proporcianamos, se llama: extraer_audio_en_wav.praat y es el mismo que Save intervals to small WAV sound files, realizado por Mietta Lennes 8.3.2002. Bsicamente, le permite realizar una tarea rutinaria que consiste en extraer el audio de los segmentos anotados con las etiquetas de sus tems usando la formula que les proporciona el Archivo Nacional de Lenguas Indgenas del Instituto Nacional de Lenguas Indgenas a travs de la Direccin de Investigacin. Los archivos automticamente llevaran el nombre de la etiqueta y se guardaran en formato (.wav) y se guardan en la siguiente ruta: C/audios/. Nota: Debe abrir el archivo de sonido (.wav) como Long Sound File desde el men Open. Adems el LongSound y el archivo Sound, debe tener el mismo nombre (idntico). 1. Debe crear una carpeta en el disco duro de su computadora desde la unidad C, y nombrarla audios.

2.- Abra su audio como Long Sound File, (vea el apartado V) 3. Abra su TextGrid previamente guardado (para ms detalle vea el apartado XI).
22

4. Selecciones ambos elementos en la pantalla de Objetos. Y despus vaya a Praat, Open Praat script:

6. De preferencia guarde el archivo del script en el Escritorio, entonces, vaya ah y Seleccinelo.

23

7. Una vez abierto, vera esta pantalla.

8. Presione Ctrl+R o vaya a Run>Run. Cuando aparezca esta pantalla, solo de clic en OK y se har la tarea automticamente, despus vaya a la carpeta C:/audios en su disco duro y ah estarn sus audios cortados.

24

ANEXO I. ETIQUETAS La frmula que usaremos funciona de esta forma: Cdigo CLIN- Numero de Entidad Federativa-Nmero de Comunidad Estudiada Sexo del Hablante-Siglas del Investigador Abreviatura de Lista _Nmero de dato (tem, narracin, etc.). Ejemplo en nhuatl: Y05-21-2-H-HHRT-Y-001 En este caso Y05, corresponde al cdigo propuesto el Centro de Documentacin del INALI como poltica de Catalogacin, adaptada del sistema de Dewey Decimal. Y= Familia lingstica (Yuto-nahua) 05= Agrupacin lingstica (nhuatl) Despus el numero 21, corresponde al estado de Puebla Seguido del guin, el 2, es el numero de la comunidad que estudia el investigador, en este caso es la segunda. H= Hombre, M=Mujer, en general se piden datos de dos hombres y dos mujeres, se pide nombrar H1 y H2 o M1 y M2, segn sea el caso HHRT= Siglas de Hctor Hugo Rodrguez Toledo La Y, corresponde a la lista (cedula) que uso, en este caso es la de Yolanda Lastra. 001, corresponde a el numero de tem, que es agua, porque en la lista es la primera palabra a elicitar. Esta etiqueta nos servir para poder identificar cada segmento y poder extraerlo como un audio nico, y nos quedara algo as: Y05-21-2-H-HHRT-Y-001.wav.

25

ANEXO II. USO DE LENZ Lenz es una aplicacin que nicamente se puede ejecutar en un ambiente Windows, es gratuita y fue desarrollada por el Dr. Scott Sadowsky, de la Universidad de La Frontera-Temuco, Chile. La aplicacin es compatible con cualquier otro que soporte el estndar de escritura virtual Unicode, entre ellos Praat, y tambin la paquetera de Office, ELAN y muchos ms. Se puede utilizar casi con cualquier otro software que use el sistema operativo Windows. 1. Para usar la aplicacin, es necesario tener instalada la fuente Charis SIL y/o Doulos SIL. Para utilizar Lenz, slo hay que bajar el archivo (.zip) de la siguiente direccin: http://sadowsky.cl/files/lenz/1.3/LenzEsp.zip, guardarlo, descomprimirlo.

2. Una vez que extraemos el contenido vemos que hay tres archivos, uno es la aplicacin, y los otros son las tablas con las combinaciones que debemos usar para insertar el smbolo del AFI.

26

3. Ejecutamos (dando doble clic) el archivo Lenz-Esp.exe que contiene la capeta. Aparecer un cono verde en la barra de conos de Windows; esto seala que el programa est funcionando, y permite, a travs de un clic del botn derecho, suspenderlo o cerrarlo en cualquier momento. Al mismo tiempo se nos desplegara en pantalla el siguiente mensaje:

Como se indica, presionando las teclas

+H puede ver el mapa del teclado.

En la imagen de abajo, se muestra que Lenz est funcionando, y para usar el teclado comn, debe cerrarlo dando clic derecho e indicar Exit.

Cuando Lenz est cargado, las teclas normales producen los caracteres de siempre. Las teclas modificadoras CTRL, ALT, CTRL+ALT, CTRL+SHIFT y ALT+SHIFT, en combinacin con las normales, generan los smbolos AFI. El grfico que figura al final de esta pgina indica dnde en el teclado se encuentran los distintos smbolos fonticos. As, por ejemplo, schwa [ ] se produce con la
27

combinacin CTRL+e, esh [] se produce con ALT+s y el smbolo de aspirado [] se genera con la combinacin ALT+SHIFT+h.

Nota: El programa est diseado para el teclado espaol en el cual @ se produce con AltGr+2 y las llaves {} se encuentran en la misma fila que ASDF. Funciona con otros teclados, pero no todos los smbolos se producen con las mismas teclas. La imagen muestra la funcin de teclas.

Adems, recomendamos imprimir la imagen y que esta sea a color, tenerla a la mano para que sea ms sencillo poder escribir los smbolos.

En el mismo ejemplo, que usamos anteriormente, ahora en lugar de tener que ir al men Help y seguir los pasos descritos, nicamente presionamos la combinacin de teclas: Alt+d, lo que nos como resultado //. (No necesitamos recurrir a la combinacin \zh).

28

29