Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
RESUMO
Objetivo: investigar coincidncias e divergncias entre transcrio e textualizao de udios, a fim de
verificar se h evidncias estatsticas que possam servir de subsdio quanto ao melhor procedimento
a ser aplicado. Mtodos: estudo retrospectivo. Foram selecionados aleatoriamente 30 udios, entre
os 239 udios disponveis, provenientes de interceptaes telefnicas do mesmo processo judicial.
Foram considerados: o nmero de palavras e tempo em minutos para a realizao de cada udio, e a
anlise comparativa da manuteno dos focos principais de contedo. Trs Fonoaudilogos transcreveram e textualizaram teros diferentes do arquivo, garantindo independncia. Um Fonoaudilogo,
que no participou da etapa anterior, realizou a anlise de contedo. Para a anlise estatstica foi
utilizado o teste de Wilcoxon-Mann Whitney no ambiente R, com interface Tinn R. Nvel de significncia de 5% (0,05). CEP: 274-742. Resultados: o nmero mdio de palavras utilizadas na transcrio
dos arquivos de udio foi 27% maior que o nmero de palavras utilizadas na textualizao, p=0,52.
A mdia do tempo em minutos necessrios para realizar a transcrio foi significantemente maior
p=0,013. Na anlise comparativa da manuteno dos focos principais de contedo, foi possvel verificar que em mdia 93% dos focos foram mantidos, p=0,61%. Concluso: as semelhanas entre
os processos de transcrio e textualizao foram com relao ao nmero mediano de palavras e a
manuteno do nmero mediano de focos de contedo. Houve divergncia quanto ao tempo para a
realizao, significantemente menor na textualizao. Considerando os dados obtidos neste estudo,
o processo de textualizao mostrou ser o mais indicado na degravao de udios.
DESCRITORES: Voz; Fonoaudiologia; Linguagem; Cincias Forenses
(1)
(2)
Ministrio Pblico do Estado de So Paulo; Ncleo de Percias em Fonoaudiologia Forense; Universidade Catlica de
Braslia, Braslia, Brasil.
(3)
(4)
(5)
Instituto de Geocincias e Cincias Exatas, UNESP - Universidade Estadual Paulista, Rio Claro,SP,Brasil.
INTRODUO
A Cincia Forense tem sido desenvolvida,
pesquisada e praticada em diversos pases h
dcadas, contribuindo com a justia nas mais
diferentes reas do conhecimento. Dos procedimentos que envolvem a Cincia Forense com
enfoque na Comunicao Humana, destacam-se a
anlise de contedo de udio e vdeo, transcries,
textualizaes, anlise do perfil comunicativo,
exames grafotcnicos, identificao facial, estabelecimento de nexo causal entre alteraes auditivas
e/ou vocais e a atividade ocupacional. Dentre estas,
Rev. CEFAC. 2014 Nov-Dez; 16(6):1919-1927
1920
Rehder MIBC, Cazumb LAF, Assis RMK, Souza PJS, Tandel MCFF
MTODOS
A presente pesquisa foi devidamente registrada
na Plataforma Brasil tendo a aprovao do CEP sob
o nmero 274-742.
Este um estudo de carter retrospectivo. O
material de udio utilizado como amostra proveniente de registros de interceptaes telefnicas
que foram utilizadas para identificao de falantes
em um mesmo processo judicial. Por no se tratar
de um estudo comparativo, as amostras mantm
o cdigo de sigilo, uma vez que no identificam
nenhum dado do processo bem como dos falantes.
O pesquisador responsvel por este estudo se
comprometeu a manter o sigilo assinando um
Termo de Compromisso de Utilizao e Divulgao
de Dados.
Para a composio da amostra, os udios provenientes de um mesmo processo foram submetidos a
um tratamento estatstico de amostragem aleatria
utilizando-se os softwares R e Tinn-R22. Os 239
udios que compunham o banco de dados foram
primeiramente planilhados por tempo, o menor
udio tinha 0,13min e o maior 10,12min. Foram
selecionados aleatoriamente 30 udios entre os 239
disponveis. O boxplot um grfico que possibilita
representar a distribuio de um conjunto de dados
com base na mediana e demais quartis, utilizou-se
o boxplot para descrever a representatividade da
amostra (Figura 1).
1921
1922
Rehder MIBC, Cazumb LAF, Assis RMK, Souza PJS, Tandel MCFF
1923
RESULTADOS
O nmero mdio de palavras utilizadas na transcrio dos arquivos de udio foi 27% maior que
o nmero mdio de palavras utilizadas na textualizao, p=0,52. A mdia do tempo em minutos
necessrios para realizar a transcrio foi o dobro
do tempo necessrio para a realizao da textualizao, p=0,013. Os avaliadores transcreveram
em mdia 12,44 palavras por minuto e textualizaram 18,79 palavras por minuto. O tempo para a
Tamanho do
udio (min)
N de palavras
Transcrio
N de palavras
Textualizao
0,13
1,44
1,24
4,68
14
244
229
796
0,52
29
184
158
616
Tempo para
Transcrio
(min)
1
21,5
21,7
82
0,013 *
Tempo para
Textualizao
(min)
2
10,3
9,4
48
1924
Rehder MIBC, Cazumb LAF, Assis RMK, Souza PJS, Tandel MCFF
N de foco Transcrio
Mnimo
Mdia
Desvio Padro
Mximo
P
2
10,3
7,5
31
0,61
N do audio
Interlocutores
V1
V2
V1
V2
N de focos mantidos
na Textualizao
2
9,2
6,6
30
N de palavras
N do audio
Interlocutores
Texto:
N de palavras
N Amostra
DISCUSSO
A busca por peritos na rea de comunicao
humana tem sido cada vez mais frequente no Brasil,
um possvel reflexo do empenho do poder judicirio
brasileiro no sentido de fazer a justia mais precisa
e transparente23,24.
Neste contexto, vrias so as solicitaes de
transcrio e textualizao de udios provenientes,
principalmente, de escutas telefnicas23,24. Cabe ao
perito no s transladar o material de udio para a
escrita, como tambm, em alguns casos, identificar
as vozes dos falantes25,26.
Este estudo buscou elucidar coincidncias e
divergncias entre transcrio e textualizao de
udios a fim de contribuir com o poder judicirio,
operadores do direito e/ou sujeitos do processo, na
opo da solicitao de um ou outro procedimento.
Rev. CEFAC. 2014 Nov-Dez; 16(6):1919-1927
1925
CONCLUSO
De acordo com os resultados deste estudo, que
teve como objetivo verificar coincidncias e divergncias entre transcrio e textualizao de udios,
conclui-se que as semelhanas entre os processos
de transcrio e textualizao foram com relao
ao nmero mediano de palavras e a manuteno
do nmero mediano de focos de contedo.
Houve divergncia quanto ao tempo para a realizao, significantemente menor na textualizao.
Considerando os dados obtidos neste estudo,
o processo de textualizao mostrou ser o mais
indicado na degravao de udios.
1926
Rehder MIBC, Cazumb LAF, Assis RMK, Souza PJS, Tandel MCFF
ABSTRACT
Purpose: investigate coincidences and divergences between audio transcription and textualization
in order to check for statistical evidence which may be a justification as to the best procedure to be
applied. Methods: retrospective study. 30 audios were selected randomly among the 239 available
audios, proceeding from telephone intercepts of the same lawsuit. We considered: the number of
words and time in minutes for each audio, and the comparative analysis for maintaining the main
content highlights. Three Speech Pathologists transcribed and textualized different parts of the file,
ensuring independence. A Speech Pathologists, who did not attend the previous step, conducted
content analysis. For statistical analysis we used Wilcoxon-Mann Whitney test in R environment, with
Tinn R interface. Significance level 5% (0.05). CEP: 274-742. Results: the mean number of words used
in of audio file transcription was 27% greater than the number of words used in textualization, p=0.52.
The mean time in minutes required to perform the transcription was significantly higher p=0.013. In the
comparative analysis as for the maintenance of the main content highlights, we found that on average
93% of highlights were kept, p=0.61%. Conclusion: the similarities among the of transcription and
textualization processes were compared with the median number of words and the maintenance as
for the median number of content highlights. There was divergence as for the implementation time,
significantly lower in textualization. Considering the data obtained in this study, textualization process
proved to be the most suitable in audio de-recording.
KEYWORDS: Voice; Speech, Language and Hearing Sciences; Language; Forensic Sciences
REFERNCIAS
1. Amino K, Sugawara T, Arai T. Effects of the syllable
structure on perceptual speaker identification. IEICE
Tech. Rep. 2006;105:109-14.
2. De Sordi NAD, Axt G, Fonseca PRP. Manual
de procedimentos do programa de histria oral da
justia federal. Braslia: Conselho da Justia Federal.
2007. [acesso em 17 Jul 2013]. Disponvel em: http://
www2.cjf.jus.br/jspui/bitstream/handle/1234/19/
manual%20historia%20oral.pdf?sequence=1
3. Rose P. Forensic Speaker Identification .1st ed.
London. Taylor & Francis; 2002.
4. Porto AC, Gonalves CS. Proposta de anlise
perceptivo-auditiva de voz e fala para uso em
fontica forense. Rev. do IGP. 2007;3(3):23-5.
5. Cabette ELS. Interceptaes Telefnicas. 2 ed.
So Paulo: Saraiva; 2011.
6. Bonfim EM. Curso de Processo Penal. 8 ed. So
Paulo: Saraiva; 2013.
7. Tourinho Filho FC. Manual de Processo Penal.
16 ed. So Paulo: Saraiva; 2013.
8. Oliveira EP. Curso de Processo Penal. 17 ed.
Belo Horizonte: Del Rey; 2013.
9. Flres O, Silva MR. Da oralidade escrita: uma
busca da mediao multicultural e plurilingustica.
Canoas, Rio Grande do Sul: Ed. Ulbra; 2005.
10. Gold E, French P. An international investigation
of forensic speaker comparison practices. 17th
International Congress of Phonetic Sciences, 2011
Aug 17-21; Hong Kong.
Rev. CEFAC. 2014 Nov-Dez; 16(6):1919-1927
1927
http://dx.doi.org/10.1590/1982-0216201413913
Recebido em: 29/07/2013
Aceito em: 01/04/2014
Endereo para correspondncia:
Maria Ins Beltrati Cornacchioni Rehder
Avenida 15, 531 - Rio Claro/SP
CEP: 13500-330
E-mail: mariainesrehder@uol.com.br
Rev. CEFAC. 2014 Nov-Dez; 16(6):1919-1927