GT 2
Organização e Representação do Conhecimento
O GT 2 aborda Teorias, metodologias e práticas relacionadas à organização e preservação de do- cumentos e da informação, enquanto conheci- mento registrado e socializado, em ambiências informacionais tais como: arquivos, museus, bibliotecas e congêneres. Compreende, tam- bém, os estudos relacionados aos processos, produtos e instrumentos de representação do conhecimento (aqui incluindo o uso das tec- nologias da informação) e as relações inter e transdisciplinares neles verificadas, além de aspectos relacionados às políticas de organi- zação e preservação da memória institucional.
SUMÁRIO
A BIBLIOTECA DIGITAL PAULO FREIRE COMO DISPOSITIVO DE ACESSO E USO DO
|
CONTEÚDO FREIREANO Izabel França Lima, Mirian de Albuquerque Aquino |
317 |
|
MAPA CONCEITUAL E TERMINOLÓGICO PARA A CIÊNCIA DA INFORMAÇÃO: UM ESTUDO EXPLORATÓRIO PARA SUA ELABORAÇÃO Vânia Mara Alves Lima |
333 |
A PRECISÃO NAS LINGUAGENS DE INDEXAÇÃO: UM ESTUDO COM A TEMÁTICA DA
|
HOMOSSEXUALIDADE MASCULINA Fabio Assis Pinho, José Augusto Chaves Guimarães |
352 |
|
|
O |
BLOOD PROJECT: UMA INICIATIVA PARA ORGANIZAÇÃO DA INFORMAÇÃO EM |
|
|
BIOMEDICINA |
||
|
Almeida, M.B.; Coelho, K.C.; Andrade, A.Q.; Carneiro, L.E.S.; Oliveira, J. A.; Mendonça, B.M.; Souza, |
371 |
|
|
INDICADORES DE QUALIDADE DA INFORMAÇÃO EM SISTEMAS BASEADOS EM FOLKSONOMIA: UMA ABORDAGEM SEMIÓTICA Juliana de Assis e Maria Aparecida Moura |
389 |
|
|
A |
IMPORTÂNCIA DOS PRESSUPOSTOS ONTOLÓGICOS COMO BASE PARA O USO |
|
|
ARTICULADO DE ONTOLOGIAS NO CONTEXTO DA WEB SEMÂNTICA Linair Maria Campos, Maria Luiza Almeida Campos, Maria Luiza Machado Campos e Miguel Gabriel Prazeres de Carvalho |
406 |
|
|
O |
VOCABULÁRIO CONTROLADO COMO INSTRUMENTO DE ORGANIZAÇÃO E |
|
|
REPRESENTAÇÃO DA INFORMAÇÃO NA FINEP Tatiana Almeida Rosali Fernandes Souza |
424 |
|
|
TRATAMENTO TÉCNICO DA DOCUMENTAÇÃO AUDIOVISUAL NA TV DA UNIVERSIDADE FEDERAL DE GOIÁS Maria Leticia Costa Miranda, Maria de Fátima Garbelini |
439 |
|
|
A |
LINGUÍSTICA DOCUMENTÁRIA E A |
|
|
ANÁLISE DE DOMÍNIO NA ORGANIZAÇÃO DA INFORMAÇÃO Julietti de Andrade, Marilda Lopes Ginez de Lara |
452 |
|
|
A |
ORGANIZAÇÃO DA INFORMAÇÃO EM SITES DE RECURSOS HUMANOS |
|
|
Brigida Maria Nogueira Cervantes, Antonio Bezerra de Lima Filho |
468 |
|
RELAÇÕES CONCEITUAIS E CATEGORIAS FILOSÓFICAS: APORTES DAS ONTOLOGIAS
E DA TERMINOLOGIA PARA A REPRESENTAÇÃO DO CONHECIMENTO Walter Moreira, Marilda Lopes Ginez de Lara
485
GT2
314
|
INDEXAÇÃO AUTOMÁTICA E VISUALIZAÇÃO DE INFORMAÇÕES: UM ESTUDO BASEADO EM LÓGICA PARACONSISTENTE Carlos Alberto Correa,Nair Yumiko Kobashi |
502 |
|
|
A |
TEORIA CLÁSSICA DE CATEGORIZAÇÃO E OS PRINCÍPIOS CATEGORIAIS DE |
|
|
RANGANATHAN: UMA ANÁLISE TEÓRICA Alessandra Rodrigues da Silva e Gercina Angela Borem Oliveira Lima |
523 |
|
|
A |
APLICAÇÃO DA TEORIA DA CLASSIFICAÇÃO FACETADA EM BANCO DE DADOS, |
|
|
ATRAVÉS DA MODELAGEM CONCEITUAL Márcio Bezerra da Silva, Dulce Amélia de Brito Neves |
540 |
|
|
IDENTIFICAÇÃO ARQUIVÍSTICA: SUBSÍDIOS PARA A CONSTRUÇÃO TEÓRICA DA METODOLOGIA NA PERSPECTIVA DA TRADIÇÃO BRASILEIRA Ana Celia Rodrigues |
558 |
|
|
MÉTODO DE COMPATIBILIZAÇÃO DE LINGUAGENS APLICADO A IMAGENS FOTOGRÁFICAS: UMA PROPOSTA DE AVALIAÇÃO Joice Cleide Cardoso Ennes de Souza |
572 |
|
ORGANIZAÇÃO DOS CONTEÚDOS DE CONHECIMENTO PARA SITES:
REPRESENTAÇÃO DAS ATIVIDADES DE PESQUISA EM LABORATÓRIO CIENTÍFICO DE
|
BIOLOGIA MOLECULAR Laura de Lira e Oliveira, Maria Luiza de Almeida Campos, Hagar Espanha Gomes (CNPq) |
585 |
|
|
O |
CORDEL E AS LINGUAGENS DOCUMENTÁRIAS |
|
|
Maria Elizabeth Baltar Carneiro de Albuquerque |
597 |
|
|
BIASES NA REPRESENTAÇÃO DO CONHECIMENTO: UMA ANÁLISE DA QUESTÃO FEMININA EM LINGUAGENS DOCUMENTAIS BRASILEIRAS Suellen Oliveira Milani, José Augusto Chaves Guimarães |
616 |
|
SEMIOSE E ANÁLISE DE ASSUNTO EM ÍCONES COMEMORATIVOS DA GOOGLE:
IMPLICAÇÕES DA EXPERIÊNCIA COLATERAL NA REPRESENTAÇÃO DA INFORMAÇÃO ICONOGRÁFICA EM AMBIENTES DIGITAIS
|
Maria Aparecida Moura |
631 |
|
|
PROTÓTIPO DE UM SISTEMA DE SUBMISSÃO DE ARTIGO CIENTÍFICO PARA PERIÓDICO ELETRÔNICO SEMÂNTICO EM CIÊNCIAS BIOMÉDICAS Leonardo Cruz da Costa |
645 |
|
|
A |
LEITURA DE IMAGENS FOTOGRÁFICAS: PRELIMINARES DA ANÁLISE |
|
|
DOCUMENTÁRIA DE FOTOGRAFIAS |
||
|
Miriam Paula Manini |
663 |
|
|
ORGANIZAÇÃO CONCEITUAL DO DOMÍNIO DE INSTRUMENTOS MUSICAIS COM BASE NA TEORIA DO CONCEITO Adriana Olinto Ballesté |
679 |
|
GT2
315
TAXONOMIA FACETADA NAVEGACIONAL: AGREGANDO VALOR ÀS INFORMAÇÕES DISPONIBILIZADAS EM BIBLIOTECAS DIGITAIS DE TESES E DISSERTAÇÕES Benildes Coura Moreira dos Santos Maculan, Gercina Angela Borém de Oliveira Lima
TESAUROS CONCEITUAIS E ONTOLOGIAS DE FUNDAMENTAÇÃO: ANÁLISE COMPARATIVA ENTRE AS BASES TEÓRICO-METODOLÓGICAS UTILIZADAS EM SEUS MODELOS DE REPRESENTAÇÃO DE DOMÍNIOS
696
|
Jackson da Silva Medeiros, Maria Luiza de Almeida Campos |
715 |
|
REPRESENTAÇÃO DA INFORMAÇÃO MUSICAL: SUBSÍDIOS PARA RECUPERAÇÃO DA INFORMAÇÃO EM REGISTROS SONOROS E PARTITURAS NO CONTEXTO EDUCACIONAL E DE PESQUISA Camila Monteiro de Barros, Lígia Maria Arruda Café |
731 |
|
PRESERVAÇÃO DIGITAL DE DOCUMENTOS DE ARQUIVO À LONGO PRAZO: |
|
|
ESTRATÉGIAS E INICIATIVAS O DOCUMENTO AUDIOVISUAL INSERIDO EM AMBIENTE DE ARQUIVO Luiz Antonio Santana da Silva, Telma Campanha Carvalho Madio |
746 |
|
IDENTIFICAÇÃO DE CATEGORIAS INFORMACIONAIS PARA REPRESENTAÇÃO DE IMAGENS FOTOGRÁFICAS FIXAS EM BANCOS DE IMAGENS COMERCIAIS Joice Cleide Cardoso Ennes de Souza, Rosali Fernandez de Souza |
754 |
|
COMUNICAÇÃO CIENTÍFICA E REPRESENTAÇÃO DA INFORMAÇÃO: ESTUDO PRELIMINAR SOBRE A INDEXAÇÃO COM PALAVRAS-CHAVE NO ENANCIB Marilucy da Silva Ferreira, Fábio Mascarenhas Silva |
760 |
GT2
316
COMUNICAÇÃO
ORAL
A BIBLIOTECA DIGITAL PAULO FREIRE COMO DISPOSITIVO DE ACESSO E USO DO CONTEÚDO FREIREANO
Izabel França Lima, Mirian de Albuquerque Aquino
Resumo: Reflete sobre as bibliotecas digitais como um dispositivo de acesso e uso da informação e sua contribuição para a educação, viabilizada pelo uso das tecnologias da informação e comunicação no cotidiano escolar. Objetiva proceder a uma análise da Biblioteca Digital Paulo Freire (BDPF) no que diz respeito ao acesso e ao uso do conteúdo freireano por professores de uma escola pública municipal de João Pessoa, Paraíba. A construção da Biblioteca Digital Paulo Freire na Universidade Federal da Paraíba (UFPB) teve como finalidade democratizar o conhecimento, descentralizando o pensamento de Paulo Freire da cultura escrita (impressa) para recolocá-la na cultura digital, com a finalidade a fim de disseminar sua produção intelectual desse educador e a de seus intérpretes e de críticos, por meio de tecnologia digital.
Palavras-chave: acesso e uso de informação, biblioteca digital, educação, inclusão digital, Biblioteca Digital Paulo Freire.
1 INTRODUÇÃO
Os efeitos da globalização e as exigências da sociedade da informação e do conhecimento instigam-nos a pensar a educação mediada pelas tecnologias da informação e comunicação como uma temática articulada a um contexto sociocultural anteriormente inimaginável, em que os indivíduos vislumbram possibilidades de mudanças na forma de pensar, aprender, conhecer, ensinar e agir sobre o mundo. Por tecnologias entendemos, com Castells (1999), um conjunto de tecnologias em microeletrônica, computação (software e hardware), telecomunicação, radiodifusão, optoeletrônica e engenharia genética cuja dinâmica penetra em quase todos os campos do conhecimento, construindo redes de informação que interligam organizações, empresas, editoras, bancos, arquivos, bibliotecas, museus, centros de informação, Ong’s, instituições de ensino etc. São formas novas de interagir, com diferentes suportes, que exigem a parceria da educação na formação de competências para se acessar e usar adequadamente a informação e transformá-la em conhecimento e, assim, se adaptar às mudanças e desenvolver atividades cada vez mais complexas no mundo do trabalho e/ou na vida cotidiana. Sem dúvida, as TICs vêm provocando inúmeras mutações nos hábitos humanos, nas atividades profissionais e nos projetos educacionais, convertendo a oralidade, a escrita e o digital em um mesmo sistema de comunicação. Elas têm sido vistas como ferramentas importantes para a educação, contribuindo para novas relações no processo ensino e aprendizagem. Com o advento da sociedade da informação e do conhecimento, essas tecnologias ganham
GT2
317
destaque no mundo globalizado, onde os países interligam-se pela rede mundial de computadores - Internet - com seus produtos e serviços, a partir dos quais é possível reconhecer as bibliotecas digitais como um ambiente virtual de aprendizagem e dispositivo de inclusão digital/social na educação, cujos efeitos podem levar a escola a repensar e redefinir as suas teorias e metodologias de ensino, as relações com o conhecimento armazenado em diferentes suportes, independentemente de tempo e de espaço. Essa desconstrução espaço-temporal nos ajuda a considerar que a condição física dos livros não está mais num único lugar. No caso específico das bibliotecas tradicionais, o armazenamento de milhares de acervos nas estantes de salas com paredes, como é comumente visto ali, foram desafiados pelo contexto da virtualidade, com o surgimento das bibliotecas digitais, onde se depositam apenas referências (hyperlinks) de arquivos espalhados por diversos servidores em qualquer lugar, onde os indivíduos podem acessar os textos criando seus próprios meios, interagindo com “objetos de aprendizagem” ou “objetos multimídia” (AQUINO, 2004), com um potencial de recuperação da informação, anteriormente desconhecida em formato digital, oferecendo a possibilidade de recuperação do texto, independente de sua localização original, “para além do lugar em que ele se encontre” (PARENTE, 1999, p. 68). A biblioteca digital desconstruiu os muros milenares das bibliotecas tradicionais, antes conhecidas como repositório da memória da humanidade, apresentando-se com um novo formato, deslocando a noção de lugar e de memória do conhecimento. É evidente que os conceitos de “descentralização” e de “delimitação” sofrem mutações perceptíveis para dar lugar à interface da tela (computador) que passa a existir enquanto distância, profundidade de campo de uma representação nova, de uma visibilidade que apaga o antigo modelo. A descentralização é vista na perspectiva de espaço geográfico em oposição à centralização e à delimitação como espaço físico definido, “assinalando o fim da unidade de lugar” (VIRILIO, 1993, p. 99). Esses conceitos constituíram o ponto de partida da criação das bibliotecas digitais, nos mais distantes campos do conhecimento e, como uma organização social, constituídas por serviços e produtos diferenciados (na função de selecionar, organizar, disponibilizar, disseminar e democratizar a informação), são concebidas como um espaço que reduz as barreiras físico-geográficas que sempre limitaram o acesso e ao uso das bibliotecas físicas. Nessa era da informação e do conhecimento, as bibliotecas digitais para utilização pela educação constituem um potencial ambiente de aprendizagem, pois é por meio delas que os (as) professores(as) acessam e usam a informação com a qual interagem. Empregamos, neste estudo, a noção de aprendente para nos referir aos (às) professores (as) como sujeitos que estão em constante estado de aprendizagem das TICs. Essa transposição de termos tem como base o argumento de Assmann (2000, p. 10), quando diz que é necessária a substituição dos termos tradicionais pelo cenário epistemológico das novas linguagens, pois o que há de novo e inédito com as [TICs] é a parceria cognitiva que começam a exercer na relação que o aprendente estabelece com elas. Os termos como “usuário” já não expressam bem essa relação cooperativa entre ser humano e as máquinas inteligentes.
GT2
318
2 ACESSO E USO DAS TICs NA EDUCAÇÃO
O advento da Internet trouxe possibilidades, até então, inusitadas para a criatividade humana
que conta hoje com o acesso e uso da informação e da comunicação global. O acesso público inclui
o acesso à tecnologia (computador, conexão, banda larga etc.) e a todo o conteúdo armazenado
na “maior rede mundial de computadores” (a Internet). Dentre esses dois elementos, o segundo
é hierarquicamente superior ao primeiro, uma vez que a tecnologia se subordina ao conteúdo
(conhecimento) que pode comportar. Assim sendo, como podemos ver as TICs são postas no centro
da cena, como um dispositivo de inclusão digital/social na educação. No que concerne à inserção das TICs no ambiente escolar, Lèvy (1993, p. 160), refletindo sobre a interação homem, técnica e razão, diz que a escola tem o dever de “realizar uma fusão entre objetos e sujeitos, permitindo o exercício da racionalidade”. Para este autor, a racionalidade equivale ao uso de certo número de tecnologias intelectuais, que recorrem a dispositivos exteriores ao sistema cognitivo humano. Trata-se de investir numa educação mediada pelas TICs, como um processo que deve se inserir nas atividades escolares, as quais, para Castells (1999), não constituem ferramentas a serem aplicadas, mas processos a serem desenvolvidos.
A partir da visão do autor, parece-nos que uma nova educação precisará ser construída, como
as redes sociais, com responsabilidade individual e coletiva. Talvez, a educação possa vir a ser um espaço de reflexão para pensar a construção do conhecimento com o uso dessas tecnologias. Essa possibilidade de um novo fazer educativo exige dos (as) pesquisadores (as), que atuam no campo da educação, a tarefa de examinar criticamente os discursos e as práticas de inclusão digital/social que, possivelmente, estão sendo desenvolvidas em contextos escolares, deixando de perceber o papel das bibliotecas digitais como dispositivo de comunicação e inclusão digital/social e, consequentemente, da inclusão informacional. É verdade que insistir nas práticas convencionais de ensino obscurece a visão de que as tecnologias atuais figuram na sociedade atual como um motor impulsionador das transformações educacionais. Porém, tudo se manifesta pelas inovações, e não, simplesmente pelas TICs, interferindo nas maneiras de ensinar e aprender. Por outro lado, afirma Brunner (2004, p. 74), para se conseguir uma mudança
] [
maior de docentes modifique seu enfoque pedagógico e que se operem mudanças substanciais na administração escolar, na estrutura institucional e nas relações com a comunidade.
em grande escala na prática do ensino, é necessário que um número muito
Então, o diferencial estaria em reconhecer, também, que o uso dessas tecnologias desloca os
conceitos de tempo, espaço, ambiente educacional e a relação professor-aluno, tentando romper com
o ensino formal, reprodutivo, que prioriza a transmissão de informações descontextualizadas para
memorização. Sem dúvida, os “novos paradigmas educacionais revelam uma ruptura com as práticas pedagógicas tradicionais, buscando a interdisciplinaridade que envolva o aluno no seu potencial cognitivo e contemplando também os fatores afetivos e sociais” (SANTOS; RADTKE, 2005, p. 328).
O Programa da Sociedade da Informação Para o Brasil - Livro Verde, Takahashi (2000, p. 7)
GT2
319
ressalta que “a educação é o elemento-chave para a construção de uma sociedade da informação e condição essencial para que pessoas e organizações estejam aptas a lidar com o novo, a criar e, assim, garantir seu espaço de liberdade e autonomia”, devendo permanecer ao longo da vida para que o indivíduo tenha condições de acompanhar as mutações tecnológicas. Embora esse autor considere que a educação básica, no Brasil, ainda apresente deficiências marcantes nos segmentos sociais de baixa renda e em regiões menos favorecidas, o analfabetismo permanece como realidade nacional. No atual contexto, a educação assume um papel relevante na sociedade que prioriza o domínio de certas habilidades (FLECHA; TORTAJADA, 2000). Os indivíduos desprovidos de competências para processar, ressignificar e atribuir sentido à informação, para transformá-la em conhecimento necessitam ser reconhecidos e valorizados, pois ao contrário podem ser excluídos. Novos espaços de aprendizagem e de produção do conhecimento possibilitados pelas TICs foram também um das preocupações do educador Paulo Freire ao alicerçar o ensino-aprendizagem em ambientes interativos com o uso do vídeo, da televisão e da informática (FREIRE; GUIMARÃES, 2003), mas sempre buscando utilizar essas tecnologias de forma crítica (AQUINO, 2004).
2 A CONSTRUÇÃO E A IMPLEMENTAÇÃO DA BIBLIOTECA DIGITAL PAULO FREIRE
A compreensão de que o conhecimento na sociedade contemporânea não está mais centrado apenas nas páginas de livros catalogados ou nas bibliotecas dos grandes centros de disseminação de conhecimentos (universidades e outras instituições educativas), bem como o entendimento de que o conhecimento navega instantaneamente para todo o mundo a qualquer hora e lugar, fundamentaram a construção e a implementação da Biblioteca Digital Paulo Freire (BDPF) (http://www.paulofreire.ufpb.br) cuja consolidação encontra-se nas ações do projeto de pesquisa “Implementação e Desenvolvimento da Biblioteca Digital Paulo Freire”, desenvolvido na Universidade Federal da Paraíba (UFPB) em parceria com a Universidade Federal de Pernambuco (UFPE) e o Centro Paulo Freire: Estudos e Pesquisa. Esse empreendimento digital recebeu apoio da Coordenação Institucional de Educação a Distância (CEAD) e da Coordenação de Informática da UFPB e contou com recursos financeiros do Conselho Nacional de Desenvolvimento em Ciência e Tecnologia (CNPq). O projeto coadunou-se com as estratégias do Programa Sociedade da Informação/MCT e do Plano Plurianual 2000 – 2004 que inclui projetos de educação à distância, criação e difusão cultural, criação de bibliotecas digitais no sentido de colocar o mundo virtual como “habilitador de competências e de participação social” (Brenannd et al., 2000). Em seu processo de criação foram consideradas as orientações do Programa de Informação para a Pesquisa (Prossiga), que investia na criação de novos serviços de informação para a pesquisa, ou seja, a criação de bibliotecas virtuais na internet e a relevância concedida à educação por parte das instituições governamentais, contemplando os objetivos de ampliação da ação educativa nos projetos educativos “Vivendo e Aprendendo” e “Pedagogia da Pergunta”, do Programa Ação Cultural, desenvolvidos pela UFPB e pela UFPE, fortalecendo, assim, a ampliação dos espaços de difusão de informações para atender à expansão da inclusão digital/social.
GT2
320
Na UFPB, essa construção da Biblioteca Digital Paulo Freire (BDPF) teve como finalidade democratizar o conhecimento com o intuito de disponibilizá-lo para diferentes grupos sociais, descentralizando o pensamento de Paulo Freire da cultura escrita (impressa) para recolocá-lo na cultura digital, com a finalidade de disseminar a produção intelectual desse educador, de intérpretes e de críticos, por meio de tecnologia digital. Essa Biblioteca foi concebida como um dispositivo de inclusão digital/social, que se propôs buscar, recuperar, armazenar, organizar, indexar e disponibilizar digitalmente a informação para transformá-la em conhecimento, com o propósito de democratizar os pressupostos filosóficos, sociológicos e pedagógicos do pensamento freireano, a fim de dar suporte a ações educativas democráticas e coletivas que tenham como vetor o desenvolvimento de competências de participação social, facilitando a inserção dos sujeitos educacionais na sociedade da informação e do conhecimento (BRENNAND et al., 2000). Seus idealizadores a definem como uma fonte de conhecimento de fácil acesso, sobre Paulo Freire e seus críticos, não apenas para uma comunidade, mas para todos que desejarem conhecer mais sobre esse pensador, um dos mais importantes pedagogos da história, não apenas pelo conhecimento que gerou para a humanidade, ou melhor, para a história da educação, mas também por sua postura contra as desigualdades que assolam o nosso país (ARAGÃO JÚNIOR; BRENNAND, 2004). Tiveram como propósito também fazer com que todas as pessoas que estiverem conectadas aos computadores tenham acesso, sem ônus, ao conhecimento disponibilizado através de um amplo acervo de materiais diversificados, incluindo livros, artigos, áudios e vídeos etc., referentes à vida e à obra de Paulo Freire, espalhados pelo Brasil e pelo mundo (AQUINO et al., 2001; BRENNAND et al., 2000). A BDPF contribui para a educação ao consolidar e disponibilizar a vida, a obra e as ideias de Paulo Freire, difundidas no mundo inteiro, tornando-se um instrumentos de pesquisa e recurso didático, pressupondo que novos subprodutos de informação sobre a vida e a obra de Paulo Freire (CD-ROOM, catálogos, folders eletrônicos, eventos) possam trazer a possibilidade de uma nova reorganização dos modos de registro e produção do conhecimento, modificando, de forma permanente, a maneira de se lidar com a informação na sociedade (BRENANND et al.,2000). No Brasil, o acesso e o uso da informação são definidos pelo poder aquisitivo, evidenciado no alto custo dos livros e na escassez de bibliotecas públicas (CUNHA, 2000), que se assume como parceira na dinâmica da formação de cidadãos/ãs, numa “sociedade aberta e global”, estritamente contraditória, em que uma grande parte da população ainda não tem pleno acesso ao ensino tradicional (alfabetização funcional) e, menos ainda, ao ensino tecnológico (alfabetização digital), projetando aos nossos olhos um quadro cada vez mais assustador.
3 A BDPF COMO UM DISPOSITIVO DE INCLUSÃO DIGITAL/SOCIAL NA EDUCAÇÃO
Deleuze (2005) propõe o conceito de dispositivo inspirando-nos a entender as bibliotecas digitais como ferramentas criadas e produzidas a partir das condições dadas, e que operam no âmbito mesmo dessas condições. O conceito de dispositivo oferecido por Deleuze comunga com o conceito sugerido por Peraya (2002, p. 29) que o entende como a organização “estruturada de meios materiais, tecnológicos, simbólicos e relacionais, naturais e artificiais, que tipificam, a partir de suas
GT2
321
características próprias, os comportamentos e as condutas sociais, cognitivas e afetivas dos sujeitos”. Os dispositivos formam um conjunto de interações promovidas por toda mídia, toda máquina, todas as TICs, entre os universos técnico, semiótico e, ainda, social ou relacional, sendo as TICs a fronteira desses três universos (PERAYA, 2002). Desse modo, os dispositivos de comunicação midiatizada, as mídias, das mais antigas, a exemplo da escrita, às mais contemporâneas, como a Web, a internet,
o ciberespaço, as bibliotecas digitais podem se constituir em dispositivos de inclusão digital/social. Nesta perspectiva, as bibliotecas digitais podem ser entendidas como dispositivos de inclusão digital/social que possibilitam aos aprendentes (docentes e discentes) o rápido acesso e uso da informação confiável, ampliando as possibilidades de aprendizagem e configurando as experiências de uso. Essas bibliotecas digitais, consideradas aqui como dispositivos de inclusão digital/social, supõem “as novidades e as possibilidades de criatividade que rompem com o poder que impede
o saber, permitindo que as linhas de subjetivação sejam capazes de traçar caminhos de criação e aprendizagem” (DELEUZE, 2005, p.92) por meio do computador e da internet como suportes no processo de produção do conhecimento.
A internet e as bibliotecas digitais podem executar importante papel na garantia da ampliação
do acesso à informação: “[
as bibliotecas digitais constituem o único canal que tem o potencial de
disponibilizar conteúdo cultural de bom nível” (CUNHA; MCCARTHY, 2006, p. 51). Elas constituem fontes de registros históricos de rápido acesso, recuperação, disseminação e democratização da informação, permitindo a existência da relação entre o conhecimento e as necessidades educacionais
e informacionais, dando ênfase à importância da informação e do conhecimento e ao fortalecimento
dos processos educativos, enfatizando a importância da informação e do conhecimento para atender
a essas necessidades. Para desempenhar a função educacional, a biblioteca deve prover a educação continuada, criando e apoiando os interesses da comunidade, dando suporte à atividade intelectual independente
e à liberdade de expressão.
]
4 INFOVIAS METODOLÓGICAS
A abordagem quanti-quali, adotada nesta pesquisa, fundamenta-se nas contribuições teórico-
metodológicas que proporcionam a percepção de estruturas, da ação dos sujeitos, de indicadores e das relações entre micro e macro realidades (DEMO,1995), articuladas com a análise de conteúdo
(BARDIN, 2010) para focar os eventos ocorridos no Laboratório da escola pesquisada, no momento da exposição verbal dos sujeitos sobre a BDPF e na aplicação do teste de usabilidade. Para tanto, procuramos levar em conta múltiplos fatores que poderiam afetar o desempenho das professoras- aprendentes no acesso e uso das TICs.
A escolha dos sujeitos da pesquisa recaiu sobre um único grupo voluntários: os professores-
aprendentes da Rede Pública Municipal de Ensino, selecionados mediante o atendimento a critérios
mínimos estabelecidos em relação à sua interação com as TICs e a Internet. Essa seleção contou com
o envolvimento da Direção da Escola, que se utilizou de uma prática convencional de convocação dos
(as) professores (as) para participarem das reuniões pedagógicas mensais, servindo tal prática apenas
GT2
322
como pano de fundo para uma primeira aproximação entre pesquisadora e futuros participantes da pesquisa. Esse momento tornou-se crucial para aproximá-los ou afastá-los, no momento das ações da pesquisadora concernentes à aplicação do teste de usabilidade da BDPF. Após a interação inicial com o grupo, visando à coleta de dados, a pesquisadora fez uma explanação sobre a concepção contemporânea de biblioteca frente às digressões teóricas da sociedade da informação e do conhecimento com o propósito de levar o grupo à compreensão do novo sentido adquirido pela biblioteca no contexto digital e suas possibilidades de inclusão digital/social. Essa intervenção abrangeu as peculiaridades da interface da biblioteca que contou com recursos (Data Show e slides), sendo os slides dotados de um efeito significativo em qualquer apresentação, especialmente naquelas em que não há muitas variedades de mídia, e servem a um plano de contingência, principalmente quando os professores desconhecem as bibliotecas digitais. Apesquisa de campo foi desenvolvida durante dois meses, seguindo-se os passos metodológicos que não se desenvolveram de forma estanque, e serão discorridos nos itens seguintes, considerando as intrínsecas relações envolvendo o papel da pesquisadora, que se inicia com a descoberta do ambiente
de estudo, passando pela aplicação do teste de usabilidade e suas consequentes análise e interpretação. Foram utilizados questionários, observação, anotações em caderno de campo e teste de usabilidade, com base na triangulação de instrumentos de coleta de dados visando à descrição, à análise e à interpretação dos dados. Os questionários utilizados, com perguntas fechadas e abertas, abrangeram duas partes: uma serviu para caracterizar os dados pessoais relacionados ao sexo, à idade,
à formação e ao tempo de serviço e a outra, para a categorização dos conhecimentos e habilidades dos
sujeitos da pesquisa, a sua relação com a tecnologia e conhecimento sobre Internet. Esse questionário
determinou a realização da amostra, pois, a partir de sua aplicação, verificamos que apenas onze dos (as) professores (as) presentes na reunião tinham conhecimento mínimo necessário para participar do teste de usabilidade.
O segundo questionário (pós-teste), com questões abertas e fechadas, abrangeu duas partes:
uma constou de três questões fechadas por meio das quais avaliamos a realização das atividades
executadas pelos professores-aprendentes durante o teste de usabilidade, visando atender às categorias relativas à facilidade de uso da BDPF. A segunda parte pretendeu conhecer a opinião dos participantes sobre a BDPF, e caracterizou-se por questões abertas, quando os professores-aprendentes puderam expressar, livremente, os pontos positivos e negativos detectados no uso da Biblioteca.
A observação serviu para detectar os problemas de usabilidade da BDPF vivenciados pelos
professores-aprendentes, durante a realização do teste, no momento em que tiveram contato com os computadores para a realização das atividades selecionadas e baseadas em propostas de teste de
usabilidade, que visava perceber se a BDPF é de fácil acesso e uso. Sobre o texto Bohmerwald (2005,
p. 96) ressalta que “[
é o processo pelo qual as características de interação homem-computador de
um sistema são medidas, e as fraquezas são identificadas para correção”, ou seja, os testes ajudam
a determinar a facilidade de uso da BDPF pelo professor-aprendente que, “ao ser confrontado com
novas informações, ele modifica suas representações e reconstrói as diferentes situações-problema que encontra” (SILVINO; ABRAHÃO, 2003, p. 5).
A aplicação do teste de usabilidade teve início com a apresentação da BDPF aos professores-
]
GT2
323
aprendentes por meio do Data Show e sua participação, posteriormente, no Laboratório. A lista de atividades a serem realizadas pelos professores-aprendentes durante o teste de usabilidade foi elaborada para verificar se existiam dificuldades no uso e na localização das informações na biblioteca. Sobre essa questão, Ferreira (2002, p. 17) explicita que “as tarefas [atividades] são apresentadas aos participantes, provendo detalhes realistas e habilitando-os a executá-las com o mínimo de intervenção do observador”. No momento da aplicação do teste, esclarecemos aos professores-aprendentes que o nosso objetivo não era o de avaliá-los, mas analisar a BDPF como um dispositivo de inclusão digital/ social (BOHMERWALD, 2005; DIAS, 2003). Durante o teste de usabilidade, os (as) professores (as) tiveram contato com o computador, enquanto eram observados (as) pela pesquisadora. O teste de busca e uso visa conhecer a facilidade de uso de um site ou software para desempenhar atividades prescritas.
O pós-teste foi aplicado imediatamente após a execução das atividades, atendendo à
recomendação de Bohmerwald (2005, p. 100), que ressalta a importância de “[
aplicar o questionário
logo após os usuários terem experimentado o site, pois nesse momento eles ainda se lembram de como eram as páginas e estão mais à vontade para avaliar [
Para analisarmos a interação dos professores-aprendentes com a BDPF e a perspectiva de este ambiente se tornar um dispositivo de inclusão digital/social na educação, adaptamos os parâmetros sugeridos por Bohmerwald (2005, p. 100), como categorias de nossa pesquisa: a) Se aprende rápido a usar a BDPF; b) Se as instalações disponíveis na BDPF são suficientes para seu uso; c) Se a terminologia usada pela BDPF é compreendida no momento do uso; d) Se o menu é suficiente para orientar o uso da BCPF.
O material recolhido na pesquisa de campo, por meio dos questionários e do teste de
usabilidade, foi submetido à análise de caráter interpretativo baseada em proposições que “apontam os testes como sendo uma ótima forma de se entender o que os usuários querem e o de que precisam para facilitar a realização de suas tarefas [atividades]”, conforme sublinham Veldof, Prasse e Mills (1999, p.116), citados por Bohmerwald (2005, p. 95). O teste de usabilidade é o responsável por revelar como se estabelece a interação entre professores-aprendentes e biblioteca digital, de acordo com as categorias previamente propostas.
]
4.1 A interação Professores-Aprendentes com as TICs: uma análise
A nossa pretensão inicial foi a de compreender, por meio das falas registradas no teste de usabilidade e nos questionários pós-teste, o modo como os professores-aprendentes - sujeitos da pesquisa - acessam e usam a BDPF na execução das seguintes atividades: os recursos empregados (rapidez na aprendizagem de uso; as instruções disponíveis são suficientes para seu uso; a terminologia compreendida para uso; o menu suficiente para orientar o uso) e a obtenção de indícios da satisfação ou insatisfação que ela possa trazer ao usuário. Em seguida, passamos a caracterizar os professores-aprendentes e suas possibilidades de acesso e uso da BDPF. Constatamos que os sujeitos da pesquisa são do sexo feminino. A maioria
GT2
324
situa-se na faixa etária entre 35 e 45 anos, sendo que apenas uma professora tem entre 20 e 25 anos. No que tange à formação, dezesseis dessas professoras-aprendentes são graduadas, sendo que dez tem pós-graduação (Especialização). Percebemos, ainda, que essas professoras-aprendentes com mais de vinte anos de dedicação à sala de aula e, mesmo tendo feito cursos de capacitação para o uso das TICs e da Internet, ainda não se sentem suficientemente habilitadas para incorporar essas ferramentas à sua prática.
No que tange à questão “conhecimento e habilidade”, quatro professoras-aprendentes ao responderem à questão “Tem facilidade em interagir com PC?” confirmaram ter facilidade na interação com o computador, enquanto as demais admitiram ter dificuldade. Essa dificuldade ou resistência apresentada pela maioria das professoras-aprendentes em incorporar o computador na sua prática
educativa e enfrentar os novos desafios da educação, remete-nos a Demo (1995), ao posicionar-se no sentido de ser necessário incorporar as tecnologias ao fazer educativo, assegurando que: o professor “não pode fugir do entendimento das tendências típicas das sociedades atuais e futuras, em particular, sua marca científica e tecnológica” (DEMO, 1995, p. 20). Prosseguindo a análise, constatamos que cinco dessas professoras-aprendentes informaram não usar o computador na sua prática educativa. Essas dificuldades corroboraram para ficarem fora da amostra da pesquisa, já que deixaram de atender aos requisitos básicos estabelecidos para sua participação. Essa pouca familiaridade com as tecnologias nos leva a Silva (2000, p. 70), quando
diz que “a escola não se encontra em sintonia com a emergência da interatividade [
alheia ao
espírito do tempo, mantém-se fechada em si mesma, em seus rituais de transmissão”. Por outro lado, acrescenta o autor, os/as professores/as ainda não “sabem raciocinar senão na transmissão linear e
separando emissão e recepção”, e esquecem que aprender com as TICs é o mais recente desafio do/a professor/a e sua inclusão digital/social faz-se necessária na educação da sociedade da informação e do conhecimento. À questão “Recursos da Internet mais utilizados” nas suas interações com as tecnologias da informação e comunicação, as professoras-aprendentes indicaram o correio eletrônico, seguido dos sites de busca, como os recursos mais usados. Apenas duas professoras-aprendentes mencionaram
o uso das bibliotecas digitais, demonstrando, a nosso ver, certo desconhecimento desse ambiente de aprendizagem para a busca e a recuperação de informação na preparação de suas aulas. Chamou-nos a atenção o fato das professoras-aprendentes desconhecerem a BDPF, pois, quando pesquisamos sobre o pedagogo Paulo Freire, nos buscadores (Google, Yahoo) citados por elas como um dos recursos mais utilizados da internet, o link da BDPF aparece na primeira página (www.paulofreire.ufpb.br/paulofreire). Este não acesso pode ser um indício de que essas professoras-aprendentes parecem não ter conhecimento das possibilidades de ensino, aprendizagem
e conhecimento do conteúdo freireano, digitalmente, ou não conseguem se apropriar de sua riqueza
para reinventarem a sua prática pedagógica, principalmente quando se trabalha numa escola localizada
numa comunidade que vive em condições sociais vulneráveis. Tendo verificado o conhecimento e a habilidade das professoras-aprendentes com as TICs, selecionamos onze para participar do teste de usabilidade, atendendo ao critério de ter conhecimento básico em informática. Demonstraremos o seu desempenho diante das atividades em que utilizamos o
]
GT2
325
questionário de avaliação da BDPF no quadro a seguir. Nas atividades de 1 a 8, procuramos verificar se as professoras tinham facilidade para usar a BDPF, com o intuito de avaliar a categoria “se o aprendizado quanto ao uso é rápido”. Quadro 1 – Apresentação dos dados das atividades do teste de usabilidade
|
Muito |
Não |
|||||
|
Atividades |
Muito fácil |
Fácil |
Médio |
Difícil |
difícil |
conseguiu |
|
1 |
3 |
2 |
3 |
1 |
2 |
0 |
|
2 |
3 |
2 |
3 |
1 |
2 |
0 |
|
3 |
3 |
3 |
1 |
2 |
0 |
2 |
|
4 |
7 consegui visualizar normalmente; 2 não consegui achar o endereço para acessá-lo |
|||||
|
5 |
2 o arquivo não abriu no computador; |
|||||
|
6 |
3 |
2 |
3 |
1 |
2 |
0 |
|
7 |
3 |
3 |
1 |
2 |
2 |
0 |
|
8 |
3 |
3 |
1 |
2 |
2 |
|
Fonte: dados da pesquisa, 2007
Os dados obtidos com as respostas do questionário para a avaliação das atividades demonstram que oito professoras-aprendentes consideram de médio a fácil a realização das atividades, e apenas três tiveram dificuldades para realizá-las, mas nenhuma delas deixou de fazer. A partir desse posicionamento, podemos afirmar que a BDPF é de fácil uso. Porém, precisamos, ainda, considerar
que elas não conheciam a BDPF e ainda não haviam acessado o site. Assim, por ser o primeiro contato,
e todas as informações solicitadas nas atividades serem encontradas pelas professoras-aprendentes, podemos inferir que a BDPF é um espaço virtual que possibilita um rápido e fácil aprendizado.
A questão da facilidade de uso em bibliotecas digitais é determinada pelo modelo de interface adotada e, neste sentido, Ferreira e Souto (2006, p. 188) afirmam que a “facilidade de uso identifica a percepção de que inexiste esforço por parte do usuário para manusear o sistema. Quanto mais fácil for
a interação do usuário com o sistema, mais ele sentirá a utilidade do mesmo e crescerá sua intenção de adotá-lo”.
As observações feitas durante a realização do teste de usabilidade corroboram com os dados, pois não registramos qualquer demanda de ajuda por parte das professoras-aprendentes. Isso ratifica
o pensamento dos idealizadores da BDPF, quando a definem “como uma fonte de conhecimento de fácil acesso, sobre Paulo Freire e seus críticos” (BRENNAND et al., 2000). A aplicação da atividade 3 buscou compreender se “as instruções disponíveis na BDPF são
suficientes para habilitar o professor-aprendente para uso”. Para atender à essa categoria, foi dada
a instrução 3: “Acessar o link Guia do Usuário, que mostra dicas e informações sobre a Biblioteca
Digital Paulo Freire”. As respostas das professoras-aprendentes demonstram que as informações contidas no guia de usuário são suficientes para orientá-las quanto ao uso e à localização das informações. Assim sendo, observamos que sete professoras-aprendentes localizaram os links com relativa facilidade;
GT2
326
duas consideraram difícil e duas não conseguiram realizar a tarefa. Em nossa avaliação, constatamos que as dificuldades relatadas referem-se à localização dos links nacionais, e não, do guia de usuário. As atividades 2, 4 e 7 foram elaboradas com a finalidade de percebermos “se a terminologia usada pela BDPF é compreendida no momento da busca pela informação ao utilizar essa Biblioteca”. Para atender à essa categoria, foram dadas as seguintes instruções: Instrução 2 - Achar e visualizar o mesmo artigo do item 1, agora utilizando o sistema de busca da Biblioteca Digital Paulo Freire; Instrução 4 - Visualizar, em tamanho máximo, a imagem (que está relacionada com a obra de Paulo Freire) com o seguinte título (observação: utilize o sistema de busca para tal): Paulo Freire e Henry Giroux; Instrução 7 - Achar e visualizar a seguinte resenha (observação: utilizar o sistema de busca para tal): Pedagogia da indignação: cartas pedagógicas e outros escritos. Ao solicitar o uso do sistema de busca disponível no site, intencionávamos perceber se a indexação (terminologia, cabeçalhos de assunto ou termos de busca) adotada é adequada, pois, conforme Bohmerwald (2005, p. 100), “é importante a utilização de terminologia que seja conhecida e, conseqüentemente, compreendida pelo usuário, em vez de termos comuns aos profissionais da informação ou da biblioteconomia”. No uso do sistema de busca da BDPF, oito professoras-aprendentes consideram o nível de dificuldade de fácil a médio, na localização da informação solicitada e três assinalaram ter dificuldades em realizar a tarefa. O resultado demonstrou que a terminologia adotada facilita a busca da informação, principalmente por disponibilizar a relação dos termos adotados na indexação do conteúdo disponibilizado. As atividades 5 e 8 foram aplicadas com a finalidade de evidenciar “se o menu é suficiente para orientar o uso da BDPF” e a localização das informações solicitadas. Para atender à essa categoria, foram dadas as seguintes instruções: Instrução 5 - Visualizar o vídeo (que está relacionado com a crítica a Paulo Freire) com o seguinte título (observação: não utilizar o sistema de busca para tal, mas sim, outra seção do menu superior): depoimento de José Genoíno; Instrução 8 - Acessar o seguinte link nacional, a partir da página da Biblioteca Digital Paulo Freire: Revista Nova Escola On-Line. No teste de usabilidade, quando a tarefa solicitava não usar a ferramenta de busca, tínhamos a intenção de perceber se seria fácil localizar a informação usando apenas o menu disponível nas barras de ferramenta, tanto superior como inferior. Nessa questão, as professoras-aprendentes expressaram facilidade na localização, mas, na tarefa 8, duas delas não conseguiram localizar a informação porque, no equipamento em que elas acessaram, não havia o programa Adobe Acrobat ou um programa que ajudasse a visualizar um arquivo em PDF. Nesse momento da pesquisa, queríamos saber se a interface da BDPF possibilitava uma exploração fácil dos conteúdos, recorrendo, principalmente, aos menus. Em relação à categoria 1, “se aprende rápido ao usar a BDPF”, as questões 4 e 5 indicam a percepção das professores-aprendentes a respeito da visualização das imagens, uma vez que, para isso, teriam que acessar outros recursos multimídia, como imagem e som. As professoras-aprendentes consideraram que as imagens na BDPF são de fácil localização e visualização. Sete conseguiram realizar as atividades. A avaliação mostrou que as duas professoras-aprendentes que não conseguiram visualizar o vídeo enfrentaram a dificuldade de o software necessário não estar instalado na máquina. Nas questões do pós-teste, as professoras-aprendentes P 4 , P 8 e P 11 , mesmo tendo realizado as atividades, não responderam as questões do pós-teste. P 4 e P 8 consideraram como muito fácil
GT2
327
encontrar as informações, mas, ao terem que visualizar as imagens, tarefa que requer um pouco mais familiaridade com as TICs, elas não conseguiram executar, justificando não ter respondido as questões do pós-teste, como vemos na fala de P 4 : “não tenho muita experiência com computador, preciso me aperfeiçoar melhor”. Em relação à facilidade de uso dessa Biblioteca apresentada pelas professoras-aprendentes nas questões sobre os pontos positivos e negativos, fica evidente que elas perceberam mais pontos positivos do que negativos. A maioria das respostas evidencia que a BDPF é um ambiente de
aprendizagem interativo, com facilidade de acesso aos usuários para pesquisa e novos conhecimentos, como mostram as falas seguintes: P 1 – “a praticidade”; P 2 – “facilidade de acesso para pesquisa
e informações corretas”; P 3 – “a facilidade de acesso a informação”; P 5 – “oportunidade a novos
conhecimentos”; P 6 – “facilita o acesso para a pesquisa”; P 7 – “facilitar o acesso à pesquisa”; P 9 – “é de fácil acesso”; P 10 – “fácil acesso; menu claro e explicativo”. Em relação aos pontos negativos da BDPF, apenas P 1 se pronunciou: “o manuseio do computador ainda é difícil”. Também assumindo uma posição, P 10 declarou: “não vejo pontos negativos, já que a facilidade permite o acesso de pessoas sem um conhecimento aprofundado de computação”. Na avaliação geral que as professoras-aprendentes fazem da BDPF, opinam sobre o sistema de busca, o conteúdo e a aparência da BDPF, que foram investigados nas questões em relação ao sistema de busca, algumas pistas revelam a interação das professoras-aprendentes com a BDPF: excelente; ótimo, facílimo; muito prático; interessante; proveitoso; muito boa; muito bom. Complementando
essas pistas de interação, P 5 considerou o sistema de busca “interessante
conhecimentos”. P 6 também opinou que o sistema de busca é “bastante proveitoso para pesquisa”, e
o conteúdo disponibilizado é “muito positivo”. P 10 ponderou: é “bom” o sistema de busca da BDPF,
mas acrescenta: “não obtive sucesso na busca avançada”. Quanto à disposição do conteúdo, as professoras-aprendentes registraram: muito bom; ótima; satisfatória; muito positivo; excelente; importante. P 6 opinou que o conteúdo disponibilizado é “muito positivo”. Em relação à disposição do conteúdo no menu, P 10 expressou: “importante, pois centraliza os temas que abordam Paulo Freire”. Essa fala nos leva a intuir que o fato de atuar na área da pedagogia faz com que P 10 considere importante o uso do conteúdo freireano para a construção do material didático e a reflexão de sua prática educativa. Esse momento de reflexão é importante porque se baseia na consciência da capacidade de pensamento, que caracteriza o ser humano como criativo e não como mero reprodutor de ideias e práticas que lhes são impostas. É importante lembrar que é esse o primeiro contato das professoras-aprendentes com a BDPF. Quando não temos familiaridade como o uso de um site, sempre apresentamos dificuldades de interação. Entretanto, a resposta de P 5 não a impediu de se satisfazer com o conteúdo disponível.
nos ajuda a ampliar nossos
Neste ponto, Ferreira e Souto (2006) explicitam que a interface de uma biblioteca digital, antes de gerar qualquer frustração ao usuário, deve satisfazê-lo. Isso significa que a interface não deve retardar
a resposta, mas permitir que o usuário obtenha ajuda na interação. Em termos de interação, a BDPF apresenta, em sua interface, informações em múltiplos formatos, tais como: imagens, hipertextos, gráficos, vídeos e diferentes formas de visualização do seu conteúdo, disponibilizando os softwares para download. Além do mais, promove uma visualização
GT2
328
geral do seu conteúdo, possibilitado pelo menu em cascata, que vai abrindo ao deslizar do mouse, e o usuário percebe como está organizado o conteúdo nela disponibilizado, iniciando com apresentação dos conteúdos relativos à obra do educador e, depois, vem a crítica, que contém obras de outros autores sobre o pensamento freiriano, os objetos multimídia disponíveis na biblioteca e os instrumentos de busca, com a opção de busca simples ou avançada. Em relação à questão da aparência da BDPF ou design gráfico, as respostas das professoras- aprendentes pontuaram: gostei muito; muito boa; ótima; excelente; boa; simples e elegante. Neste contexto, das falas, P 5 declarou: “Ainda não tenho uma opinião formada a esse respeito”. Analisando a fala da professora, percebemos pouca familiaridade com o uso da internet, demonstrando certo desconhecimento sobre a interface da biblioteca. Entretanto, ela realizou todas as atividades e considerou o grau de dificuldade em localizar a informação como fácil. Fazendo uma observação mais completa, P 10 fez uma revelação sobre o visual da BDPF, caracterizando-o como “Simples, completo e elegante, em especial, a página principal”, que ela considerou “excelente”. Há, nesse posicionamento de P 10 , a presença de uma série de características desejáveis em uma interface para uma biblioteca digital. De forma geral, as professoras-aprendentes demonstraram uma avaliação positiva da BDPF, como foi possível constatar nas falas de P 2 , e P 6 , que consideram a BDPF “nota dez”, e P 7 , que a classificou como “excelente”. A opinião de P 3 também foi positiva em relação à BDPF: facilita no “racionamento do tempo do professor que trabalha em mais de uma escola”. Nesta direção, P 9 afirma: “é muito bom e de muita utilidade para nós educadores”. Já P 5 considera a BDPF como “positiva, visto que nos mantém bem informados acerca não só de Paulo Freire, como também de outros autores”, o que demonstra interesse em conhecer e usar o conteúdo freireano. P 10 , por sua vez, refere: “só posso avaliar positivamente, pois o acesso foi sem dificuldades”. Entretanto, P 1 assim se expressou: “não é fácil, porque ainda não entendo bem os comandos do computador”. Os posicionamentos das professoras-aprendentes permitem-nos avaliar a BDPF como dispositivo adaptável, que promove a visualização global do conteúdo freireano em múltiplos formatos e oferece mecanismos de recuperação desse conteúdo de modo consistente. Então, podemos afirmar que a BDPF não tem problemas? É importante salientar que as professoras-aprendentes admitem não ter prática no uso de bibliotecas digitais, sendo essa a sua primeira experiência. Elas conseguiram, com certa facilidade, realizar todas as atividades solicitadas, tais como visualizar os hipertextos, vídeos e sons e, por se sentirem satisfeitas com o uso do dispositivo, atribuíram-lhe a nota máxima, considerando-o “excelente”.
5 CONSIDERAÇÕES FINAIS
As TICs constituem um importante meio para dar “voz” aos excluídos do mundo digital e, assim, incrementar a inclusão de todas as pessoas na educação mediada pelas tecnologias, independente de cor, idade, geração, orientação sexual, deficiência etc. Todavia, para que a relação educacional se caracterize como um diálogo de ideias é importante que cada sujeito do processo educativo possa revelar e tornar explícita a maneira como faz as coisas e, por conseguinte, o conhecimento de que
GT2
329
dispõe e como está pensando esse conhecimento. Assim sendo, ao trazermos essa discussão para o campo onde realizamos a pesquisa, foi possível perceber que, na escola pesquisada, os computadores são usados para navegar na internet, mas não como forma de expandir a cognição dos/as alunos/as. Apenas acessar a internet não realiza a inclusão digital/social. Assim, caberia aos educadores/as a tarefa de examinar criticamente os discursos e as práticas de inclusão digital/social desenvolvidas em contextos escolares. Nesta linha de discussão, as bibliotecas digitais podem ser compreendidas como dispositivos de inclusão digital/social que possibilitam aos professores (as) /alunos (as) o rápido acesso à informação, e seu uso, ampliando as possibilidades de aprendizagem. Isso é possível pelas novas formas de acesso e uso e de aplicação das TICs, que têm ocasionado mudanças substantivas nas formas de aprendizagem dos sujeitos, alterando significativamente a autonomia da mente humana e os sistemas culturais. Nessa inserção crítica dos indivíduos no seu processo histórico, a BDPF pode ser mobilizada como um dispositivo de inclusão digital/social, capaz de propiciar condições para os/as professores/as da escola pública se apropriarem dos conteúdos disponíveis e construam novos conteúdos. As professoras-aprendentes apresentam um perfil positivo, pois têm formação acadêmica adequada e experiência de sala de aula. É importante destacar que a maioria delas não conhecia e nunca havia acessado a BDPF, demonstrando desconhecê-la. A pouca facilidade para lidar com o computador, não causou dificuldades para as onze participantes do teste de usabilidade da BDPF. Considerando ter sido o primeiro contato das professoras-aprendentes com a BDPF podemos inferir que ela é um espaço virtual rápido e fácil. Constatamos, ainda, que as informações contidas no guia de usuário são suficientes para orientar quanto ao uso e à localização das informações e atribuímos a isso a facilidade de uso. Assim sendo, é possível considerar, a partir do ponto de vista das professoras-aprendentes, que a BDPF é um solo fértil para as estratégias de ensino-aprendizagem não só por conter informações indexadas, organizadas e disponibilizadas digitalmente e que podem e devem ser utilizadas para propiciar reestruturação do conhecimento, mas também oferecer possibilidades para a construção do próprio caminho do usuário na busca da informação relevante para compor o material didático a ser utilizado em sala de aula. Do mesmo modo que acontece com as demais bibliotecas digitais, a BDPF ainda é pouco usada pelos (as) professores (as) da rede pública como fonte de informação para a construção do material didático. Por fim, consideramos que as bibliotecas digitais são cada vez mais necessárias para o acesso ao conhecimento, por disponibilizarem uma informação sistematizada, organizada, de fácil acesso e com boa navegabilidade. Percebemos, portanto, a necessidade de que seja mais usada e divulgada entre os (as) professores (as) que precisam ter acesso à informação indispensável à construção dos conteúdos pedagógicos a serem trabalhos em sala de aula. Como estratégia, podemos pensar que as duas áreas do conhecimento - Ciência da Informação e Educação - podem trabalhar conjuntamente para minimizar as questões da escola e compreender que as bibliotecas digitais estão disponibilizadas na internet para serem usadas também com fins pedagógicos.
GT2
330
ABSTRACT: It reflects on digital libraries as a device for information access and use and its contribution to education, by means of information and communication technologies use in the school routine. It aims at analyzing Paulo Freire Digital Library (BDPF) with regard to the access and use of Freire’s content by teachers of a municipal public school of João Pessoa, Paraíba. Paulo Freire Digital Library’s design, at the Federal University of Paraíba (UFPB), had the purpose of democratizing knowledge, by decentralizing Paulo Freire’s thought from the written culture (printed format) so as to replace it into the digital one, with the goal of disseminating such an educator’s intellectual production as well as his interpreters’ and critics’ one through digital technology.
Keywords: information access and use, digital library, education, digital inclusion, Paulo Freire Digital Library.
REFERÊNCIAS
AQUINO, M. A. et al. Recuperação do conteúdo freireano para construção da Biblioteca Digital Paulo Freire. (Projeto de Iniciação à Pesquisa). João Pessoa: PIBIC/CNPq/UFPB, 2001.
AQUINO, M. A. Metamorfoses da cultura: do impresso ao digital, criando novos formatos e papéis em ambientes de informação. Ciência da Informação, Brasília, DF, v. 33, n. 2, 7-14, maio/ago. 2004.
ARAGÃO JÚNIOR, M. L.; BRENANND, E. G. G. Relatório Técnico-Científico da Pesquisa Concepção e Implementação da Biblioteca Digital Paulo Freire. (Relatório Projeto de Iniciação à Pesquisa). João Pessoa: PIBIC/CNPq/UFPB, 2004.
ASSMANN, H. A Metamorfose do aprender na sociedade da informação. Ciência da Informação, 29 (2), 7-15, maio/ago. 2000.
BARDIN, Laurence. Análise de Conteúdo: Lisboa: Edições 70, 2010.
BOHMERWALD, P. Uma proposta metodológica para avaliação de bibliotecas digitais: usabilidade e comportamento de busca por informação na biblioteca digital da PUC - Minas. Ciência da Informação, Brasília, DF, v. 34, n. 1, p. 95-105, jan./abr. 2005.
BRENANND, E. G. G. et al. Concepção e Implementação da Biblioteca Digital Paulo Freire. (Projeto de Iniciação à Pesquisa). João Pessoa: PIBIC/CNPq/UFPB, 2000.
BRENNAND, E. G. G.; BEZERRA, E. P. Construindo redes comunicacionais: a Biblioteca Digital Paulo Freire. In: Comunicação Científica, 25 Congresso Brasileiro de Ciências da Comunicação. [CD-ROM]. Salvador: Sociedade Brasileira de Estudos Interdisciplinares da Comunicação2002
BRUNNER, J. J. Educação no encontro com as novas tecnologias. In: TEDESCO, J. C. (Org.) Educação e novas tecnologias: esperança ou incerteza? Brasília, DF: UNESCO, 2004.
CASTELLS, M. A sociedade em rede. São Paulo: Paz e Terra, 1999.
CUNHA, M. B. Construindo o futuro: a biblioteca universitária brasileira em 2010. Ciência da Informação, Brasília, DF, v. 29, n. 1, p. 71-89, jan./abr. 2000.
GT2
331
CUNHA, M. B.; McCARTHY, C. Estado atual das bibliotecas digitais no Brasil. In: MARCONDES,
C. H. et al. (Org.) Bibliotecas digitais: saberes e práticas. 2. ed. Brasília, DF: IBICT, 2006. p. 25-54.
DELEUZE, G. O que é dispositivo? In:
2005. p. 83-96.
DEMO, P. Desafios modernos da educação . 3. ed. Petropólis, RJ: Vozes, 1995.
DIAS, C. Usabilidade na Web: criando portais mais acessíveis. Rio de Janeiro: Alta Books, 2003.
FERREIRA, K. G. Teste de Usabilidade. 60f. Trabalho de conclusão de Curso (Especialização em Informática) - Curso de Especialização em Informática, Universidade Federal de Minas Gerais, Belo Horizonte, 2002.
O mistério de Ariana. 2. ed. Lisboa: Passagens,
FERREIRA, S. M. S. P.; SOUTO, P. C. N. (2206). A Interface do usuário e as bibliotecas digitais. In:
MARCONDES, C. H. et al. (Org.) Bibliotecas digitais: saberes e práticas. 2. ed. Brasília, DF: IBICT,
2006. p. 187-204.
FLECHA, R.; TORTAJADA, I. Desafios e saídas educativas na entrada do século. In: IMBERNON, F (Org.) A educação no século XXI: os desafios imediatos. Porto Alegre: Artmed, 2000.
FREIRE, P.; GUIMARÃES, S. Sobre educação. 3. ed. Rio de janeiro: Paz e Terra, 2003.
LÈVY, P. As tecnologias da inteligência : o futuro do pensamento na era da informática. Rio de Janeiro: Editora 34, 1993. (Coleção TRANS).
PARENTE, A. O virtual e o hipertextual. Rio de Janeiro: Pajulin, 1999.
PERAYA, D. O Ciberespaço: um dispositivo de comunicação e de formação midiatizada. In: ALAVA,
S. (Org.) Ciberespaço e formações abertas: rumo a novas práticas educacionais? Porto Alegre:
Artmed, 2002.
SANTOS, B. S.; RADTKE, M. L. Inclusão digital: reflexões sobre a formação docente. In: N. PELLANDA, M. C; SCHLÜNZEN, E. T. M.; SCHLÜNZEN JÚNIOR, K. (Org.) Inclusão digital:
tecendo redes afetivas / cognitivas. Rio de Janeiro: DP&A, 2005. p.327-343.
SILVA, M. Sala de aula interativa. Rio de Janeiro: Quartet, 2000.
SILVINO, A. M. D.; ABRAHÃO, J. I. Navegabilidade e inclusão digital: usabilidade e competência. RAE-eletrônica, v. 2, n. 2, jul./dez. 2003. Disponível em: <http://www16.fgv.br/rae/
eletronica/index.cfm?FuseAction=Artigo&ID=1808&Secao=CI%C3%8ANCIA&Volume=2&Num
ero=2&Ano=2003>. Acesso em: 20 mar. 2011.
TAKAHASHI, T. Sociedade da Informação no Brasil: o livro verde. Brasília, DF: Ministério da Ciência e Tecnologia, 2000.
VIRILIO, P. O espaço crítico: e as perspectivas do tempo real. Rio de Janeiro: Edição 34, 1993.
GT2
332
COMUNICAÇÃO
ORAL
MAPA CONCEITUAL E TERMINOLÓGICO PARA A CIÊNCIA DA INFORMAÇÃO: UM ESTUDO EXPLORATÓRIO PARA SUA ELABORAÇÃO
Vânia Mara Alves Lima
Resumo: Apresenta um estudo exploratório para coleta de conceitos/termos no domínio da Ciência da Informação de forma a elaborar um mapa conceitual e terminológico da área. O referencial para elaboração desse instrumento passa pelos referenciais teóricos da terminologia, assim como pelos princípios e critérios para a elaboração de mapas conceituais e ontologias. O corpus, para coleta dos conceitos/termos consiste nos artigos publicados entre 2008 e 2010 nas revistas científicas do domínio relacionadas no Qualis. Como referência para categorização desses conceitos/termos utilizam-se os grupos de trabalho do ENACIB que representam o estado da arte das pesquisas no país.
Palavras-chave: Mapa conceitual. Ciência da Informação.
1 INTRODUÇÃO
Neste trabalho realiza-se um estudo exploratório de coleta dos conceitos/termos no domínio da Ciência da Informação para a elaboração de um mapa conceitual e terminológico da área. A necessidade de se elaborar um mapa conceitual e terminológico da Ciência da Informação se deve em primeiro lugar ao fato de que a área é considerada ainda um campo científico em constituição, interdisciplinar, cujos conceitos são tomados de empréstimo de outras disciplinas como a Lógica, a Linguística, as Ciências da Computação, etc. e muitas vezes os termos utilizados não refletem conceitos, mas remetem a procedimentos práticos e ou instrumentos que regulamentam suas aplicações (SMIT; TÁLAMO; KOBASHI, 2004). Em segundo lugar, a que essa interdisciplinaridade demanda novas perspectivas educacionais de forma a contribuir para o desenvolvimento dos diferentes segmentos sociais, tanto do ponto de vista cultural quanto econômico; além de preparar as novas gerações não apenas para absorver, mas, sobretudo, para produzir e novos conhecimentos. Como a produção de novos conhecimentos, em qualquer área, está diretamente ligada à apropriação, por parte de seus futuros profissionais e/ou pesquisadores, dos conceitos que a constituem, torna-se imprescindível buscar alternativas didático-pedagógicas, para a formação desses quadros, assim como elaborar instrumentos que permitam determinar a estrutura conceitual dos domínios no ensino, na pesquisa e na atuação profissional. A elaboração de um mapa conceitual e terminológico, além dos referenciais teóricos e metodológicos da terminologia (CABRÉ, 1987; 1995; FELBER, 1987, ISO, 1990, 2000; BARROS,
GT2
333
2004) deve considerar também os critérios, princípios e normas para a elaboração de topic maps e ontologias (ROVIRA, 2005; MOREIRO, 2004; FEITOSA, 2006, THELLEFSEN, 2004). O termo mapa conceitual tem origem nos trabalhos de psicologia da aprendizagem de Joseph D. Novak, nos anos 60,onde seria um instrumento para tornar visível, na forma de um gráfico, a aprendizagem das crianças. Ao ordenar um grupo de proposições sobre um determinado assunto em forma de árvore, onde os conceitos seriam os nós e a ligação entre os nós demonstrariam os
relacionamentos entre os conceitos conectados seria possível representar o conhecimento sobre esse assunto e assim, prover aprendizagem (ROVIRA, 2005). Os mapas conceituais representam graficamente o conhecimento, já que os conceitos aparecem interligados em redes cognitivas formadas por nós (conceitos) e laços (relações entre conceitos)
e podem ser construídos com vários objetivos: gerar ideias, desenhar estruturas complexas (sites
da web, hipermídia); para comunicar ideias complexas; para auxiliar na aprendizagem e integrar o conhecimento novo ao antigo (MOREIRO, 2004). Do ponto de vista do ensino e aprendizagem os mapas conceituais são definidos como instrumentos que buscam dar uma visão geral de um assunto ou área possibilitando o planejamento de ações, através do fornecimento de grande quantidade de dados e estimulando a solução de problemas, permitindo uma percepção de novos caminhos criativos dentro de um conjunto (BUZAN, 2005 apud FENDRICH e PEREIRA, 2006). Segundo Moreiro (2004) o processo para a construção de um mapa conceitual segue as seguintes etapas: seleção dos conceitos que serão representados no mapa, lista desses conceitos, agrupamento dos conceitos relacionados (categorização), ordenação dos conceitos em forma bidimensional ou tridimensional; estabelecimento de relações entre cada par de conceitos mediante etiquetas (modo preposicional ou proposicional). Já o termo topic map, surge a partir da elaboração de uma norma internacional, a ISO/ IEC 13250, no início dos anos 90 pelos editores de livros eletrônicos, conhecido como Grupo de Davenport, cujo objetivo é armazenar e processar a informação a partir de um formato padronizado.
Rovira (2005) distingue mapa conceitual de topic map, pois considera que o mapa conceitual tem como preocupação a aprendizagem a partir da representação do conhecimento e os topic maps se preocupam com a representação do conhecimento para seu armazenamento e recuperação. Ao relacionar as diferenças e semelhanças entre mapa conceitual e topic map, observa que
é possível modelar um mapa conceitual a partir da norma para os topic maps, pois os dois objetivos
são complementares visto que a aprendizagem, ou aquisição do conhecimento, depende tanto da sua representação quanto da possibilidade do seu armazenamento, recuperação e disseminação. Assim, a norma ISO/IEC 13250 ao estabelecer regras para a representação da informação desde a definição dos conceitos até as relações existentes entre eles torna-se parâmetro para a elaboração de um mapa conceitual que funcione também como um topic map nos sistemas de recuperação de informação. Moreiro (2004) observa também que devido à estruturação semântica que oferece e dos laços
GT2
334
que estabelece, a norma é denominada “o GPS do universo da informação”, pois tem se mostrado uma solução para navegar e organizar os crescentes recursos de informação, publicações de todos os tipos, especialmente os sites da web, além de estabelecer uma ponte entre os campos do conhecimento e a gestão da informação. O termo ontologia surge na Filosofia, definido como o estudo do ser e de suas propriedades fundamentais. De acordo com a etimologia da palavra, ontos (ser) e logos (saber) entende-se ontologia no seu aspecto existencial: é um saber sobre aquilo que é fundamental, comum a todos os entes singulares; e no seu aspecto essencial: busca determinar as leis, estruturas ou causas do ser em si (FEITOSA, p.70, 2006). A pergunta que a ontologia pretende responder é: quais tipos de coisas existem ou podem existir no mundo, e quais são as relações que essas coisas podem ter umas com as outras.
A teoria ontológica pretende representar o conhecimento humano de maneira estruturada, onde parte da essência de cada fenômeno ou objeto e estabelece suas relações com outras essências, isto é, investiga quais são as propriedades e ou características essenciais de maneira a representar objetos, conceitos ou outras entidades existentes em uma área de interesse, bem como as relações entre tais objetos, conceitos e entidades; estruturando o conhecimento através de categorias. Ao se preocupar com as relações entre conceitos e com a sua estruturação para representar um domínio do conhecimento, a ontologia aproxima-se da terminologia e dos mapas conceituais e pode colaborar na construção do mapa conceitual e terminológico pretendido, pois especifica as categorias
fundamentais da existência, isto é, classifica os conceitos e examina as distinções que sustentam cada fenômeno no mundo. Segundo Gomez-Pérez (1999 apud FEITOSA, p.75, 2006) alguns princípios básicos devem ser seguidos para a estruturação de ontologias, os quais são válidos também para a elaboração de um mapa conceitual e terminológico:
- clareza e objetividade: uma ontologia deve fornecer o significado dos termos definidos, fornecendo definições objetivas e também documentação em linguagem natural;
- completeza: uma definição expressa por condições necessárias e suficientes é preferível a uma definição parcial;
- coerência: para permitir inferências que sejam consistentes com as definições;
- maximização da extensão: novos termos gerais ou especializados devem ser incluídos na ontologia de modo que não seja necessário realizar a revisão das definições já existentes;
- comprometimento ontológico mínimo: fazer a menor quantidade possível de declarações sobre o
mundo que está sendo modelado, isto é, especificar, em um contexto tão pequeno quanto possível, os
significados de seus termos;
- princípio da distinção ontológica: as classes de uma ontologia devem ser desmembradas, o critério
para isolar a propriedade invariante para uma classe é o critério da identidade;
- diversificação de hierarquias: usar tantos critérios de classificação quanto possível, o que permite
GT2
335
herdar propriedades a partir de diferentes pontos de vista;
- modularidade: redução da distância semântica entre conceitos similares, os quais são agrupados
e representados como subclasses de uma classe e devem ser definidos utilizando-se as mesmas propriedades, enquanto conceitos menos similares são representados mais apartados na hierarquia;
- padronização: os nomes devem ser padronizados quando possível. Feitosa (p. 77, 2006) resume da seguinte maneira os vários conceitos e aplicações de uma teoria ontológica: “uma ontologia define vários conceitos de um domínio do conhecimento, por meio de um vocabulário; uma aplicação faz uso dos objetos, por meio de axiomas e de regras lógicas; tais regras dizem como utilizar os conceitos referenciados, com vistas à solução de problemas em particular; há sempre uma estrutura que melhor representa o domínio do conhecimento, mas tal estrutura depende dos objetivos do sistema e, por isso, deve obedecer a certos princípios; existem níveis de formalismo a serem estabelecidos, os quais terão inferência determinante na efetividade do sistema; mas também se conformam aos objetivos do sistema”. Portanto, somando-se os procedimentos ontológicos aos terminológicos na construção de um mapa conceitual e terminológico podemos elaborar um instrumento capaz de representar o conhecimento de um domínio, aumentar a capacidade de recuperação da informação relevante diante da interdisciplinaridade das áreas e da diversidade do uso profissional, além de contribuir para a apropriação do conhecimento através dos processos de cognição e decisão embasados nas relações de significação identificadas pelo sujeito que o utiliza. Segundo Thellefsen (2004) ele inicia-se a partir do estabelecimento de um perfil de conhecimento do domínio que se quer mapear. Para criar o perfil de conhecimento de um domínio deve-se em primeiro lugar considerar o conceito mais geral que tem influência nesse domínio. Esse conceito mais geral também denominado de signo fundamental é a ideia central de um domínio de conhecimento. A terminologia do domínio é centrada no signo fundamental. O signo fundamental consiste na soma dos termos de um domínio e cada termo do domínio só pode ser entendido em relação ao signo fundamental. O signo fundamental é uma entidade abstrata a qual contem um potencial a ser desenvolvido. Ao elaborar um perfil do conhecimento mantêm-se o projeto na trilha terminológica. Assim, é necessário conhecer a base epistemológica do domínio, ou seja, a maneira como se desenvolvem seus conceitos e teorias, seus objetos de pesquisa e os domínios correlatos, a partir de um signo fundamental, além de estabelecer as categorias, isto é, conceitos elementares, princípios que permitem identificar um conceito como pertencente a um domínio do conhecimento. Neste trabalho, considera-se que o conceito mais geral, ou signo fundamental da Ciência da Informação é a informação, pois cabe a Ciência da Informação, estabelecer os princípios e práticas
da criação, organização e distribuição da informação, bem como investigar as propriedades e o comportamento da informação em todas as suas formas e suportes; estudar as forças que governam os fluxos de informação, os meios utilizados para o seu processamento, sua disseminação, além de procurar garantir sua acessibilidade e usabilidade a qualquer usuário (SMIT e BARRETO, 2002, p.
GT2
336
17-18 apud LOUREIRO, 2006; CUNHA; CAVALCANTI, 2008, p.81). A operacionalização desse mapa conceitual e terminológico inicia-se com a definição primeiramente, do público a que ele quer atingir e em segundo lugar, com a delimitação de um
corpus para coleta desses conceitos, o que, tratando-se de uma ciência tão interdisciplinar como a Ciência da Informação e que agrega em seu escopo áreas como a Biblioteconomia, a Documentação,
a Arquivologia e a Museologia, só é possível a partir de instrumentos de procuram representar e
disseminar a convergência das pesquisas realizadas, o que é o caso das revistas científicas e dos eventos da área. Por esse motivo, considera-se como público de um mapa conceitual e terminológico do domínio da Ciência da Informação os seus pesquisadores, por princípio, usuários e criadores dos conceitos pertencentes ao domínio e como corpus para a coleta de conceitos, nesse estudo exploratório, as
palavras-chave, atribuídas pelos pesquisadores, aos 487 artigos publicados nas revistas científicas da área, referenciadas no QUALIS, entre 2008 e 2010 e os termos propostos para a indexação, atribuídos aos mesmos artigos, pelo Sistema de Indizacíon Semi-Automática – SISA. A inclusão de termos
a partir em um processo de indexação semi-automático deve-se ao fato de o software utilizado
permitir a análise do texto completo dos artigos e o seu cotejamento com um instrumento de controle terminológico interdisciplinar, no caso o Vocabulário Controlado do Sistema Integrado de Bibliotecas da Universidade de São Paulo - VOCAUSP. Da mesma maneira, definem-se como norteadores das categorias desse mapa conceitual e terminológico, os Grupos de Trabalho do ENANCIB - Encontro Nacional de Pesquisa em Ciência da Informação, evento da Associação Nacional de Pesquisa e Pós-graduação em Ciência da Informação, que reúne os pesquisadores da área por temas e representam o estado da arte das pesquisas no país.
2 METODOLOGIA
Devido ao grande escopo teórico-metodológico proposto, isto é delinear o mapa conceitual e terminológico do domínio da Ciência da Informação, nesse estudo exploratório, de coleta e categorização dos conceitos desse domínio, definimos como corpus terminológico de pesquisa os 487 artigos publicados nas principais revistas da área da Ciência da Informação no Brasil relacionadas no Sistema Qualis no período 2008-2010 que pudessem ser exportados do formato pdf para o formato txt.
O Sistema Qualis da Coordenadoria para Aperfeiçoamento de Pessoal de Nível Superior – CAPES é um conjunto de indicadores para a avaliação de periódicos científicos brasileiros e as revistas selecionadas foram: Ciência da Informação; Transinformação; Datagramazero, Encontros Bibli, Informação & Sociedade, Revista Digital de Biblioteconomia e Ciência da Informação, Revista Brasileira de Biblioteconomia e Documentação e Ponto de Acesso. Os conceitos foram coletados, a partir das palavras-chave atribuídas pelos autores em seus artigos, e a partir da indexação automática utilizando-se o software SISA (Sistema de Indización Semi
GT2
337
Automática). A utilização desse instrumento permitiu coletar os conceitos pertencentes ao domínio da Ciência da Informação relevantes no texto e que não foram indicados como palavras chave pelos autores, ampliando-se assim o escopo do mapa conceitual. Ao software SISA foi incorporado, como base terminológica, o Vocabulário Controlado do Sistema Integrado de Bibliotecas da Universidade de São Paulo (VOCAUSP), por ser o único em língua portuguesa a abranger as áreas das Ciências Humanas, Exatas e Biológicas. Na coleta das palavras-chaves não foram considerados os nomes próprios e de instituições, por serem entidades cujas formas de representação são normalizadas no âmbito da representação descritiva e não da representação temática. Da mesma maneira não foram considerados os nomes geográficos. Já o SISA segue os seguintes critérios para a coleta de termos (Gil Leiva, 1999, p.123): se um termo autorizado aparece no título e no resumo, ele se apresenta como um termo de indexação; se um termo autorizado aparece no título e no corpo do texto, ele se apresenta como um termo de indexação; se um termo autorizado aparece no resumo e no corpo do texto, ele se apresenta como um termo de indexação; se uma palavra semivazia, palavra não encontrada no vocabulário controlado de referência, aparece no título, no resumo e no corpo do texto, ela se apresenta como um termo candidato à indexação; se uma palavra semivazia aparece no corpo do texto dez vezes ou mais e, além disso, em oitos parágrafos diferentes ou mais, e não está incluída no vocabulário controlado, ela se apresenta como termo candidato à indexação. Os dois primeiros critérios, segundo Gil Leiva (1999), se devem à importância dos títulos e dos resumos na indexação dos documentos. O terceiro critério é utilizado para atribuir valor aos termos que apareçam no corpo do texto. Os dois últimos critérios possibilitam que um novo termo, não incluído no vocabulário controlado, possa ser convertido em termo de indexação. A partir da análise dos resultados foram selecionados como conceitos a serem inicialmente incorporados ao mapa conceitual e terminológico, tanto as palavras chave quanto os termos propostos pelo SISA que obtiveram 5 ocorrências ou mais. Esses conceitos foram agrupados em categorias de acordo com as ementas dos GTs do ENANCIB. Ao mesmo tempo, procurando-se identificar quais as áreas tem sido objeto do maior número de produção científica, agrupamos os artigos como um todo também de acordo com os GTs do ENANCIB. Por último realizamos algumas considerações sobre os resultados e indicamos as próximas etapas da pesquisa.
3
RESULTADOS 3.1 Resultados referentes às Palavras-chave Foram coletadas 1193 palavras-chave totalizando com 2099 ocorrências em 487 artigos publicados entre 2008-2010 nas revistas: Ciência da Informação; Transinformação; Datagramazero, Encontros Bibli, Informação & Sociedade, Revista Digital de Biblioteconomia e Ciência da Informação, Revista Brasileira de Biblioteconomia e Documentação e Ponto de
GT2
338
Acesso. Foram retiradas palavras-chave referentes a nomes próprios, eventos, instituições, títulos de obras publicadas e locais geográficos restando 1121 palavras chave com 2048 ocorrências. A seguir o quadro 1 indica a relação entre o número de palavras chave e o número de ocorrências.
|
Número de Ocorrências |
Número de palavras chave |
% |
|
|
5 |
ou mais ocorrências |
72 |
6 |
|
4 |
ocorrências |
20 |
2 |
|
3 ocorrências |
46 |
4 |
|
|
2 |
ocorrências |
142 |
13% |
|
Apenas 1 ocorrência |
841 |
75% |
|
|
Total |
1121 |
100% |
|
Quadro 1 – Resultado das palavras-chave em relação ao número de ocorrências
Observa-se que a maioria das palavras-chave atribuídas aos artigos, aproximadamente 75%, aparece apenas uma vez no universo da amostra, indicando uma alta especificidade na indexação por parte dos autores. Por outro lado, apenas 72 palavras chave, 6%, aparecem 5 vezes ou mais, indicando conceitos mais gerais que são sempre utilizados pelos autores na representação de seus trabalhos. O quadro 2 relaciona essas 72 palavras chave e o número de ocorrências de cada uma para análise.
Palavras-Chave
CIÊNCIA DA INFORMAÇÃO
INFORMAÇÃO
GESTÃO DO CONHECIMENTO
GESTÃO DA INFORMAÇÃO
SOCIEDADE DA INFORMAÇÃO
BIBLIOTECÁRIOS
TECNOLOGIAS DE INFORMAÇÃO E COMUNICAÇÃO - TICS
COMPETÊNCIA EM INFORMAÇÃO
BIBLIOTECAS UNIVERSITÁRIAS
BIBLIOTECAS; PROFISSIONAIS DA INFORMAÇÃO
Número de
Ocorrências*
66
36
26
21
20
19
18
17
16
15
GT2
339
|
BIBLIOMETRIA; INCLUSÃO DIGITAL |
14 |
|
CIENTOMETRIA; SISTEMAS DE INFORMAÇÃO |
13 |
|
CONHECIMENTO; ESTUDO DE USUÁRIOS |
12 |
|
BIBLIOTECAS DIGITAIS; ONTOLOGIAS; ORGANIZAÇÃO DO CONHECIMENTO; PRODUÇÃO CIENTÍFICA |
11 |
|
COMUNICAÇÃO CIENTIFICA; EDUCAÇÃO A DISTÂNCIA; TECNOLOGIA DA INFORMAÇÃO |
10 |
|
ORGANIZAÇÃO DA INFORMAÇÃO |
9 |
|
RECUPERAÇÃO DE INFORMAÇÃO |
8 |
|
BIBLIOTECA ESCOLAR; BIBLIOTECONOMIA; DISCURSO; FLUXOS DE INFORMAÇÃO; INTERDISCIPLINARIDADE; MEMÓRIA; NECESSIDADES DE INFORMAÇÃO; REDES SOCIAIS; USOS DE INFORMAÇÃO; WEB SEMÂNTICA |
7 |
|
ANÁLISE DE CITAÇÕES; BUSCA E USO DE INFORMAÇÃO; COMUNICAÇÃO; FONTES DE INFORMAÇÃO; INDICADORES; INFORMETRÍA; INTELIGÊNCIA COMPETITIVA; INTERNET; LEITURA; LIVROS; MEDIAÇÃO; METADADOS; PESQUISA EM CIÊNCIA DA INFORMAÇÃO; TECNOLOGIA; USABILIDADE; USUÁRIOS; USUÁRIOS DA INFORMAÇÃO |
6 |
|
ACESSIBILIDADE; ACESSO LIVRE; ARQUITETURA DA INFORMAÇÃO; BASES DE DADOS; COMPARTILHAMENTO DE CONHECIMENTO; COMPETÊNCIAS; EDUCAÇÃO; ÉTICA; ÉTICA INFORMACIONAL; INDEXAÇÃO; INFORMAÇÃO E TECNOLOGIA; INOVAÇÃO; LINGUAGENS DOCUMENTÁRIAS; PERIÓDICOS ELETRÔNICOS; PÓS-GRADUAÇÃO; PRODUTIVIDADE DOS AUTORES; REPOSITÓRIOS DIGITAIS; SOFTWARE LIVRE; WEB 2 0 |
5 |
Quadro 2 – Relação das palavras-chave com 5 ou mais ocorrências na amostra coletada * para cada uma das palavras-chave relacionadas na coluna anterior.
Verifica-se que o conceito com o maior número de ocorrências indica o próprio domínio Ciência da Informação, e que em segundo lugar aparece o conceito considerado como signo fundamental do domínio, ou seja, Informação. De acordo com a representação realizada pelos próprios autores poderíamos inferir que os temas mais presentes na produção científica publicada nos dois últimos anos seriam por demais genéricos.
3.2 Resultados dos Termos propostos Indexação Automática
GT2
340
Dentre os 656 termos propostos pela indexação automática que totalizaram 3824 ocorrências foram considerados em um primeiro momento apenas aqueles reconhecidos como pertencentes à área da Ciência da informação, cerca de 210 termos que totalizam 1821 ocorrências. O quadro 3 indica a relação entre o número de termos propostos e o número de ocorrências
|
Número de ocorrências |
Número de termos propostos pelo SISA |
% |
|
|
5 |
ocorrências ou mais |
71 |
34 |
|
4 |
ocorrências |
9 |
4 |
|
3 ocorrências |
22 |
10 |
|
|
2 |
ocorrências |
33 |
16 |
|
Apenas 1 ocorrências |
75 |
36 |
|
|
Total |
210 |
100 |
|
Quadro 3 – Resultado dos termos propostos em relação ao número de ocorrências
Observa-se um maior equilíbrio entre os termos propostos com maior número de ocorrências, aproximadamente 34% e os termos propostos com apenas uma ocorrência, aproximadamente 36%, quando da utilização de um software de indexação com base terminológica. A seguir relacionamos no Quadro 4 os 71 termos propostos pelo software SISA com 5 ocorrências ou mais para análise.
Termos Propostos
CONHECIMENTO
PESQUISA
CIÊNCIA
SOCIEDADE
INFORMAÇÃO
BIBLIOTECAS
TECNOLOGIA
BIBLIOTECONOMIA
PERIÓDICOS
DOCUMENTOS
PAPEL
Número de
Ocorrências*
166
156
150
75
64
62
53
42
40
37
33
GT2
341
|
ENSINO; INTRANET |
32 |
|
TEORIA DOS NÓS |
30 |
|
LEITURA |
29 |
|
FONTES DE INFORMAÇÃO |
23 |
|
CULTURA |
20 |
|
COMPORTAMENTO |
19 |
|
DISCURSO; MEMÓRIA |
18 |
|
LINGUAGEM |
17 |
|
ACERVO; COMUNIDADES |
16 |
|
DOMÍNIO; ÉTICA; PÚBLICO |
15 |
|
ARQUIVÍSTICA |
14 |
|
ESTRUTURAS; SEMÂNTICA; SISTEMAS NUMÉRICOS |
13 |
|
ARQUIVOS; AUTORIA; LIVROS; METADADOS; PARADIGMA; SUJEITO |
12 |
|
BASES DE DADOS; CIÊNCIA DA INFORMAÇÃO; REVISTAS |
11 |
|
PERIÓDICOS CIENTÍFICOS; SIGNIFICADO |
10 |
|
ARTIGOS DE PERIÓDICOS; BIBLIOMETRIA; DIAGNÓSTICO; SENTIDOS; TERMINOLOGIA |
9 |
|
COLETA DE DADOS; ESCRITA; FILOSOFIA; MERCADO DE TRABALHO; REDES SOCIAIS; SOFTWARES |
8 |
|
ANÁLISE DE CONTEÚDO; ATITUDES; BIBLIOTECA UNIVERSITÁRIA; COMPETÊNCIA INFORMACIONAL; COMPUTADORES; ONTOLOGIA; POLÍTICAS PÚBLICAS; PRODUTIVIDADE |
7 |
|
ANÁLISE DO DISCURSO; BIBLIOTECA DIGITAL; CIÊNCIA DA COMPUTAÇÃO; |
6 |
|
EPISTEMOLOGIA; LEI DE LOTKA; LÓGICA; LÓGICA MODAL; PESQUISA CIENTÍFICA; RESPONSABILIDADE SOCIAL; RESUMOS; SOCIEDADE DO CONHECIMENTO |
5 |
Quadro 4 – Relação dos termos propostos na indexação automática com 5 ou mais ocorrências. * para cada um dos termos propostos relacionados na coluna anterior.
GT2
342
Observa-se que os termos propostos com maior número de ocorrências também são por demais genéricos como: Conhecimento, Pesquisa, Ciência, Sociedade, Informação, Biblioteca, Tecnologia, etc.
3.3 Resultados palavras-chave x termos propostos
O quadro a seguir relaciona os conceitos com 5 ocorrências ou mais que aparecem tanto como palavras-chave quanto como os termos propostos e seu respectivo número de ocorrências nas duas situações.
|
Número de |
Número de Ocorrências Termos propostos |
|
|
Conceitos coincidentes |
Ocorrências |
|
|
Palavra-chave |
||
|
BASES DE DADOS |
5 |
11 |
|
BIBLIOMETRIA |
14 |
9 |
|
BIBLIOTECAS |
15 |
11 |
|
BIBLIOTECAS DIGITAIS |
11 |
6 |
|
BIBLIOTECAS UNIVERSITÁRIAS |
16 |
7 |
|
BIBLIOTECONOMIA |
7 |
42 |
|
CIÊNCIA DA INFORMAÇÃO |
66 |
11 |
|
COMPETÊNCIA EM INFORMAÇÃO |
17 |
7 |
|
CONHECIMENTO |
12 |
166 |
|
DISCURSO |
7 |
18 |
|
ÉTICA |
5 |
15 |
|
FONTES DE INFORMAÇÃO |
6 |
23 |
|
INFORMAÇÃO |
36 |
64 |
|
LEITURA |
6 |
29 |
|
LIVROS |
6 |
12 |
|
MEMÓRIA |
7 |
18 |
|
METADADOS |
6 |
12 |
|
ONTOLOGIAS |
11 |
7 |
|
PRODUTIVIDADE DOS AUTORES |
5 |
7 |
|
REDES SOCIAIS |
7 |
8 |
|
TECNOLOGIA |
6 |
53 |
GT2
343
Quadro 5- Relação de conceitos coincidentes nas palavras-chave e nos termos propostos
Observa-se que os 21 conceitos indicados tanto como palavras-chave quanto como termos propostos indicam 30% de coincidência entre a indexação dos autores e a indexação automática dos artigos. Dentre esses conceitos, destaca-se o conceito Ciência da Informação com maior número de ocorrências enquanto palavra-chave, isto é, atribuído pelos autores, constituindo-se como um conceito indispensável em aproximadamente 35% do conjunto de 487 os artigos. Observa-se também, que os demais conceitos relacionados identificam o domínio da Ciência da Informação com o seu subdomínio mais tradicional, a Biblioteconomia, ao relacionar conceitos como Bibliotecas, Livros, Bibliometria, Fontes de informação, indicando poucos novos conceitos como Metadados, Ontologias e Redes sociais.
3.4 Resultados palavras-chave e termos propostos categorizados de acordo com os GTs do
ENANCIB A seguir, os 143 conceitos, com 5 ocorrências ou mais, seja como palavras-chave ou como termos propostos, são categorizados de acordo com as ementas dos grupos de trabalho do ENANCIB, na tentativa de se identificar os conceitos elementares do mapa conceitual e terminológico da Ciência da Informação. O ENANCIB – Encontro Nacional de Pesquisa em Ciência da Informação é um fórum de debates e reflexões, promovido pela ANCIB – Associação Nacional de Pesquisa em Ciência da Informação e organizado por um programa de pós-graduação na área, o qual tem por objetivo reunir os pesquisadores da Ciência da Informação organizados em Grupos de Trabalho (GTs) por temas de interesse para a pesquisa, conforme relacionados no site da entidade:
GT 1: Estudos Históricos e Epistemológicos da Ciência da Informação: Estudos Históricos e Epistemológicos da Ciência da Informação. Constituição do campo científico e questões epistemológicas e históricas da Ciência da informação e seu objeto de estudo - a informação. Reflexões e discussões sobre a disciplinaridade, interdisciplinaridade e transdisciplinaridade, assim como a construção do conhecimento na área. GT 2: Organização e Representação do Conhecimento: Teorias, metodologias e práticas relacionadas à organização e preservação de documentos e da informação, enquanto conhecimento registrado e socializado, em ambiências informacionais tais como: arquivos, museus, bibliotecas e congêneres. Compreende, também, os estudos relacionados aos processos, produtos e instrumentos de representação do conhecimento (aqui incluindo o uso das tecnologias da informação) e as relações inter e transdisciplinares neles verificadas, além de aspectos relacionados às políticas de organização e preservação da memória institucional. GT 3: Mediação, Circulação e Apropriação da Informação: Estudo dos processos e das relações entre mediação, circulação e apropriação de informações, em diferentes contextos e tempos históricos, considerados em sua complexidade, dinamismo e abrangência, bem como relacionados à
GT2
344
construção e ao avanço do campo científico da Ciência da Informação, compreendido em dimensões inter e transdisciplinares, envolvendo múltiplos saberes e temáticas, bem com contribuições teórico- metodológicas diversificadas em sua constituição. GT 4: Gestão da Informação e do Conhecimento nas Organizações: Gestão da informação, de sistemas, de unidades, de serviços, de produtos e de recursos informacionais. Estudos de fluxos, processos e uso da informação na perspectiva da gestão. Metodologias de estudos de usuários. Monitoramento ambiental e inteligência competitiva no contexto da Ciência da Informação. Redes organizacionais: estudo, análise e avaliação para a gestão. Gestão do conhecimento e aprendizagem organizacional no contexto da Ciência da Informação. Tecnologias de Informação e comunicação aplicadas à gestão. GT 5: Política e Economia da Informação: Políticas de informação e suas expressões em diferentes campos. Sociedade da informação. Informação, Estado e governo. Propriedade intelectual. Acesso à informação. Economia política da informação e da comunicação; produção colaborativa. Informação, conhecimento e inovação. Inclusão informacional e inclusão digital. GT 6: Informação, Educação e Trabalho: Campo de trabalho informacional: atores, cenários, competências e habilidades requeridas. Organização, processos e relações de trabalho em unidades de informação. Sociedade do Conhecimento, tecnologia e trabalho. Saúde, mercado de trabalho e ética nas profissões da informação. Perfis de educação no campo informacional. Formação profissional:
limites, campos disciplinares envolvidos, paradigmas educacionais predominantes e estudo comparado de modelos curriculares. O trabalho informacional como campo de pesquisas: abordagens e metodologias. GT 7: Produção e Comunicação da Informação em CT&I: Medição, mapeamento, diagnóstico e avaliação da informação nos processos de produção, armazenamento, comunicação e uso, em ciência, tecnologia e inovação. Inclui análises e desenvolvimento de métodos e técnicas tais como bibliometria, cientometria, informetria, webometria, análise de rede e outros, assim como indicadores em CT&I. GT 8: Informação e Tecnologia: Estudos e pesquisas teórico-práticos sobre e para o desenvolvimento de tecnologias de informação e comunicação que envolvam os processos de geração, representação, armazenamento, recuperação, disseminação, uso, gestão, segurança e preservação da informação em ambientes digitais. GT 9: Museu, Patrimônio e Informação: Análise das relações entre o Museu (fenômeno cultural), o Patrimônio (valor simbólico) e a Informação (processo), sob múltiplas perspectivas teóricas e práticas de análise. Museu, patrimônio e informação: interações e representações. Patrimônio musealizado:
aspectos informacionais e comunicacionais. GT10: Informação e Memória: Estudos sobre a relação entre os campos de conhecimento da Ciência da Informação e da Memória Social. Pesquisas transdisciplinares que envolvem conceitos, teorias e práticas do binômio ‘informação e memória’. Memória coletiva, coleções e colecionismo,
GT2
345
discurso e memória. Representações sociais e conhecimento. Articulação entre arte, cultura, tecnologia, informação e memória, através de seus referenciais, na contemporaneidade. Preservação e virtualização da memória social. O Quadro 6 relaciona os conceitos indicados tanto como palavras-chave quanto como termos propostos pelo SISA com os GTs do ENANCIB a partir de suas ementas .
|
Conceitos |
GTs |
|
Ciência, Ciência da informação; Biblioteconomia, Conhecimento, Compartilhamento de Conhecimento; Gestão do conhecimento; Interdisciplinaridade; Epistemologia; Ética; Ética informacional; Filosofia |
GT 1 |
|
Análise de conteúdo; Análise do discurso; Discurso; Domínio; Escrita; Estruturas; Indexação; Linguagem; Linguagens documentárias; Lógica; Lógica modal; Metadados; Ontologias; Organização da informação; Organização do conhecimento; Paradigma; Recuperação de informação; Resumos; Semântica; Sentidos; Significado; Terminologia |
GT 2 |
|
Comunidades; Cultura; Leitura; Livros; Mediação; Necessidades de informação; Público; Sociedade; Sociedade da informação ; Sociedade do Conhecimento; Sujeito; Usos de informação |
GT 3 |
|
Atitudes; Biblioteca escolar; Biblioteca universitária; Bibliotecas; Competência em informação; Competências; Comportamento; Estudo de usuários; Fluxos de informação; Fontes de informação; Gestão da informação; Inteligência Competitiva; Usuários |
GT 4 |
|
Acessibilidade; Acesso livre ; Biblioteca digital; Busca e uso de informação; Inclusão digital; Políticas públicas; Repositórios digitais; Responsabilidade social; Redes sociais; Teoria dos nós |
GT 5 |
|
Bibliotecários; Profissionais da informação; Educação; Educação a distância; Ensino; Pós-graduação |
GT 6 |
|
Análise de citações; Artigos de periódicos; Autoria; Bibliometria; Cientometria; Coleta de dados; Comunicação cientifica; Diagnóstico; Indicadores; Informetría; Lei de Lotka; Comunicação; Comunicação cientifica; Periódicos; Periódicos científicos; Periódicos eletrônicos; Pesquisa; Pesquisa científica; Pesquisa em Ciência da Informação; Produção científica; Produtividade; Revistas |
GT 7 |
|
Bases de dados; Computadores; Informação e Tecnologia;Inovação; Internet ;Intranet; Sistemas de informação; Sistemas numéricos; Software livre; Softwares; Tecnologia; Tecnologia da informação ;Usabilidade; Web 2 0; Web semântica |
GT 8 |
|
Acervo; Arquivística; Arquivos; Documentos; Memória; Papel |
GT 10 |
Quadro 6 - Palavras-chave e termos propostos categorizados pelos GTs do ENANCIB
GT2
346
Observa-se que a maioria dos conceitos relacionados podem ser categorizados como pertencentes aos GTs 7, 2, 8, 4 e 3, os quais representam o ciclo informacional e documentário, ou seja, produção, organização através do desenvolvimento de tecnologias de informação para mediação e circulação da informação; conceitos elementares da Biblioteconomia e da Documentação. Já os conceitos relacionados as questões epistemológicas, políticas e históricas, tratadas nos GTs 1,5 e 6 são em menor número. Destaca-se ainda que os conceitos relacionados às questões da Arquivologia são incipientes e que não há conceitos identificados às questões relativas ao patrimônio e aos museus objeto do GT 9. Aqui, pode- se chegar a três conclusões, uma de que não há trabalhos sobre essas questões, outra, que o instrumento terminológico adotado não contempla esses conceitos, ou ainda, os autores, ao generalizarem a sua indexação acabam por dificultar a recuperação de seus trabalhos. Por esse motivo, tomou-se a decisão de categorizar os artigos, como um todo, a partir dos dois processos de indexação.
3.5 Resultados dos artigos categorizados de acordo com os GTs do ENANCIB
O Quadro 7 apresenta a seguir a categorização dos artigos como um todo, a partir da análise comparativa: das palavras-chave atribuídas pelos autores, dos termos propostos, atribuídos pela indexação automática realizada pelo SISA, assim como de seus títulos e resumos, com as ementas dos GTs do ENANCIB:
|
Número de |
||
|
Grupo de Trabalho |
artigos |
% |
|
GT 1: Estudos Históricos e Epistemológicos da Ciência da Informação |
27 |
6 |
|
GT 2: Organização e Representação do Conhecimento |
75 |
15 |
|
GT 3: Mediação, Circulação e Apropriação da Informação |
31 |
6 |
|
GT 4: Gestão da Informação e do Conhecimento nas Organizações |
127 |
26 |
|
GT 5: Política e Economia da Informação |
41 |
8 |
|
GT 6: Informação, Educação e Trabalho |
42 |
9 |
|
GT 7: Produção e Comunicação da Informação em CT&I |
68 |
14 |
|
GT 8: Informação e Tecnologia |
57 |
12 |
|
GT 9: Museu, Patrimônio e Informação |
4 |
1 |
|
GT10: Informação e Memória |
15 |
3 |
GT2
347
Total
487
100
Quadro 6 – Categorização dos artigos como um todo de acordo com as ementas dos GTs do ENANCIB
Observa-se que a maioria, 26% dos artigos publicados, foi incluída no GT4 “Gestão da Informação e do Conhecimento nas Organizações”. Em segundo lugar, com 15% dos artigos publicados surge o GT 2 “Organização e Representação do Conhecimento”, em terceiro lugar encontra-se o GT 7 “Produção e Comunicação da Informação em CT&I” com 13%, seguido do GT 8 “Informação e Tecnologia” com 12%. Abaixo dos 10% dos artigos publicados estão o GT 6 “Informação, Educação e Trabalho” com 9%; o GT 5 Política e Economia da Informação com 8%; o GT 3 “Mediação, Circulação e Apropriação da Informação” com 7% ; o GT 1 “Estudos Históricos e Epistemológicos da Ciência da Informação” com 6%; o GT 10 “Informação e Memória” com 3% e por fim o GT 9 “Museu, Patrimônio e Informação” com apenas 1% dos artigos publicados. Observa-se que atualmente mais da metade das pesquisas, 54%, no domínio da Ciência da Informação, tem se concentrado nos subdomínios da gestão, organização e produção da informação. Por outro lado as pesquisas relacionadas às questões sociais, históricas e interdisciplinares da área como política, educação, trabalho, memória e patrimônio somam 34% e os trabalhos voltados para a interface com a tecnologia completam a amostra com 12%. Assim, poderíamos esboçar o início de um mapa conceitual e terminológico da Ciência da Informação, a partir do seu signo fundamental, a informação, com o seguinte esboço de suas principais categorias e suas relações com alguns termos coletados como exemplo:
GT2
348
Quadro 7: Esboço de Mapa conceitual da CI
4 CONSIDERAÇÕES FINAIS
A Ciência da Informação nasce sob o signo da interdisciplinaridade e o seu desenvolvimento tem oscilado entre o humano e o tecnológico e apesar da exigência de resolução de seus aspectos técnicos, os assuntos principais da área estão relacionados à esfera do social ao politico; ao social e ao cultural (SARACEVIC apud PINHEIRO; LOUREIRO, 1995, p.51). Ao contrário, os resultados obtidos nesta etapa da pesquisa demonstram que a produção científica publicada nas revistas da área continua voltada para as questões da organização e da gestão da informação sendo poucos os trabalhos com viés social e político. Da mesma maneira, os resultados demostram que apesar do domínio da Ciência da Informação envolver as áreas da Biblioteconomia e Documentação, Arquivologia e Museologia os conceitos elementares obtidos a partir da amostra considerada, e reunidos de acordo com as ementas que regem os grupos de pesquisa da área, referem-se em sua maioria as questões da Biblioteconomia com foco mais específico na organização e gestão da informação e do conhecimento nas organizações. Os resultados demonstram também que as questões sociais tem sido objeto de um número menor de trabalhos, assim como as questões interdisciplinares que levem em consideração não só as tradicionais unidades de informação como as bibliotecas, mas também os museus e os arquivos. Os resultados reforçam a concepção da informação como signo fundamental do domínio da Ciência da Informação, cujos processos teóricos e metodológicos para sua organização, representação,
GT2
349
recuperação e disseminação constituem o objeto de estudo. Por outro lado, não pode se deixar de considerar a função social e política da informação como fator de inclusão e de acesso ao conhecimento dentro da sociedade. Assim, infere-se que o mapa conceitual e terminológico do domínio da Ciência da Informação deve abranger não só as questões pragmáticas de organização e gestão da informação, mas deve incluir os conceitos relacionados aos processos de mediação, memória e apropriação da informação enquanto instrumento de transformação de uma sociedade. Como próxima etapa da pesquisa, a ser desenvolvida, além da categorização dos demais conceitos indicados com menor número de ocorrências, considera-se essencial um levantamento nas estruturas curriculares dos cursos de Biblioteconomia, Arquivologia e Museologia para se identificar quais conceitos que estão sendo trabalhados na formação dos novos profissionais. É imprescindível verificar se os conceitos ministrados em sala de aula refletem também apenas essa visão pragmática e organizacional da área. Assim, espera-se obter um mapa conceitual e terminológico da Ciência da Informação que não só apresente o estado atual da área, mas também indique suas lacunas, de maneira que possa orientar o ensino e pesquisa.
Abstract : Presents an exploratory study to collect concepts / terms in the field of information science in order to produce a terminological and conceptual map of the area. The framework for the elaboration of this instrument includes the theoretical terminology, as well as the principles and criteria for the preparation of a conceptual map and ontologies. The core collection of concepts / terms consists of articles published between 2008 and 2010 in journals listed in the domain Qualis. As a reference for categorization of these concepts / terms are used to working groups ENACIB representing the state of the art research in the country.
Keywords: 1. Conceptual map 2. Information Science
REFERÊNCIAS
BARROS, L. A. Curso básico de terminologia. São Paulo: EDUSP, 2004. BIOLCHINI, J.C de A Semântica na representação do conhecimento: do vocabulário controlado à ontologia. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, V, 2003, Belo Horizonte. Informação, conhecimento e transdisciplinaridade: Anais. Belo Horizonte:
Escola de Ciência da Informação da UFMG, 2003. 21 p CABRÉ, M. T. La terminologia hoy: concepciones, tendências y aplicaciones. Ciência da Informação, Brasília, v.24, n.3, p.289-298, set./dez. 1995. CABRÉ, M. T. La terminologia: teoria, metodologia e aplicaciones. Barcelona: Antártida/ Empúries, 1993 CUNHA, M. B. da; CAVALCANTI, C. R. de O. Dicionário de biblioteconomia e arquivologia. Brasília: Briquet de Lemos, Livros, 2008. FELBER, H. Manuel de terminologie. Paris: UNESCO, 1987.
GT2
350
FENDRICH, L J; PEREIRA, L. 2006. Ensinar e Aprender no Ensino Superior Através de Mapas Conceituais In: XIII SIMPEP - Bauru, SP, Brasil, 6 a 8 de Novembro.
FEITOSA, A. Organização da informação na web: das tags à web semântica. Brasília: Thesaurus,
2006
GIL LEIVA, I. La automatizacíon de la indización de documentos. Gijón (Asturias): Ediciones Trea, 1999. ISO. Terminologie - vocabulaire: ISO 1087. Geneve: ISO, 1990 ISO. Terminology work – principles and methods: ISO 704, Geneve: ISO, 2000. LOUREIRO, M. Organização da informação no ambiente virtual por meio de mapas conceituais: A importância da terminologia. Biblios. v.28, p.2-10, abr./jun., 2007. MOREIRO GONZALEZ, J. De los tesauros a los topic maps: nuevo estandar para la representación y la organización de la información. Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianópolis, n.18, 2º sem. 2004. PINHEIRO, L. V.R.; LOUREIRO, J.M.M. Traçados e limites da Ciência da Informação, Ciência da Informação, Brasília, v.24, n.1, p.42-53, jan./abr., 1995. ROVIRA, C. DigiDocMap conceptual maps editor and Topic Maps norms [en linea]. Hipertext.net, n. 3, 2005. Disponível em: http://www.hipertext.net Acesso em 31/01/2011. SMIT, J.W.; TÁLAMO, M de F. G. M; KOBASHI, N. Y. A determinação do campo científico da Ciência da Informação: uma abordagem terminológica. Datagramazero – Revista de Ciência da informação, v.5, n.1, fev. 2004. Disponível em: www.datagramazero.com.brAcessado em 15/04/2011. THELLEFSEN, T. Knowledge profile: the basis for knowledge organization. Library Trends, v.52, n.3, p. 507-514, winter, 2004
GT2
351
C O M U N I C A Ç Ã O
O R A L
A PRECISÃO NAS LINGUAGENS DE INDEXAÇÃO: UM ESTUDO COM A TEMÁTICA DA HOMOSSEXUALIDADE MASCULINA
Fabio Assis Pinho, José Augusto Chaves Guimarães
Resumo: Os estudos sobre a ética na Organização e Representação do Conhecimento, especialmente no Tratamento Temático da Informação, têm colaborado para sedimentar os referenciais teóricos e metodológicos da Ciência da Informação, que se justificam pelo pressuposto da inclusão social que, enquanto um metavalor, se situa entre o preconceito social e o proselitismo, formando um cenário em que três universos axiológicos convivem: o do documento ou informação, o do usuário e o do bibliotecário. Por isso, a indexação está ligada a uma dimensão ética porque deve preocupar-se com sua confiabilidade e utilidade em relação a determinadas comunidades discursivas ou domínios específicos. Nesse sentido, propõe-se, por meio de uma pesquisa exploratória e documental, com características qualitativas e indutivas, identificar a máxima especificidade terminológica que linguagens de indexação brasileiras permitem para termos relativos à homossexualidade masculina, analisando como corpus investigativo os termos atribuídos aos artigos científicos de Journal of Homosexuality, Sexualities e Journal of Gay & Lesbian Mental Health, entre os anos de 2005 a 2009. Do cotejo e análise dos termos e das linguagens de indexação brasileiras verifica-se uma aproximação de significados no contexto brasileiro, imprecisão terminológica, com indícios de preconceitos disseminados através do ‘politicamente correto’, representação inadequada da temática e a presença de figuras de linguagem.
Palavras-chave: Ética informacional. Representação do conhecimento. Figuras de linguagem.
1 INTRODUÇÃO
A Representação do Conhecimento, no âmbito da Organização e Representação do Conhecimento (ORC), especificamente na sua vertente do Tratamento Temático da Informação (TTI), vai muito além de um “fazer técnico” e as preocupações, cada vez mais, voltam-se para a dimensão social da área, seus impactos para os usuários e, como decorrência, o papel desempenhado pelo profissional 1 . Nesse contexto, especial importância assume o papel do profissional da informação em relação a uma atuação ética no que tange à concepção de um “bem fazer” e de um “bem atuar”, visto que as competências específicas para os profissionais que trabalham com o tratamento temático não se esgotam no como fazer, mas encontram terreno fértil de indagação no “porque” fazer e no “para que” fazer, principalmente porque é necessário levar em conta que tanto o produto quanto o processo
1 López-Huertas (2008), na condição de ex-presidente e atual vice-presidente da ISKO, delineia um cenário de tendências de pesquisa na área de Organização do Conhecimento, dando especial destaque às questões sociais.
GT2
352
de representação devem estar imbuídos da preocupação com a sua utilidade e sua adequação para determinada comunidade ou grupo-alvo 2 . É com esse cenário que se estabelece o tema deste trabalho, ou seja, os aspectos éticos na
representação do conhecimento, particularmente, no que tange à precisão. Sabe-se que o processo,
o instrumento e os produtos da representação do conhecimento não são neutros, uma vez que seus
idealizadores impõem uma visão de mundo particular, refletindo posições ideológicas e políticas. Por
isso, a possibilidade de ocorrer bias na representação do conhecimento é factível, e por esse motivo a necessidade de identificação de valores envolvidos, uma vez que eles são norteadores das atividades dos profissionais que trabalham na ORC. Entretanto, o que são essas biases? Na literatura de Língua Inglesa o termo bias é, por vezes, utilizado para designar alguma ocorrência de preconceito e o seu significado. De acordo com Hornby (1995, p. 104, tradução nossa), é “uma opinião ou sentimento que favorece fortemente um dos lados em um argumento ou uma coisa em um grupo, às vezes injustamente; um preconceito”. Ou seja, o entendimento do termo bias na Língua Inglesa versa sobre uma influência geralmente tendenciosa sobre algo ou alguém. Na Língua Portuguesa, bias é traduzido como tendência, inclinação, preconceito
e, também, viés. Poder-se-ia destacar, ainda, os sentidos de desvio, que, segundo Houaiss (2001, p.
1021-1022) são vários como, por exemplo: “mudança do caminho, da direção ou da posição normal,
[
Nesse sentido, desvios são
considerados afastamentos ou mudanças em relação àquilo que é considerado normal e, em relação a esse trabalho acrescenta-se, pela sociedade em relação aos seus valores e até comportamento. Dessa maneira, o entendimento de bias enquanto desvio versa sobre o sentido de que, no âmbito da representação do conhecimento, quando atividades ou produtos são constituídos tendo uma tendência
ou visão preponderante, isto é, um sentimento que venha a se sobrepor (e também a prejudicar) outros, subentende-se que está ocorrendo uma mudança, um afastamento ao tratamento igualitário que essa atividade ou produto deve representar. Esse entendimento baseia-se na explicação que Hjørland (2008, p. 256, tradução nossa) faz de bias, no que tange à ORC, como “é normalmente entendida como uma
ou seja, algo que deva ser
palavra com carga negativa, como algo a ser evitado ou minimizado [
afastado, mudado e, portanto, portador de desvios. Em vista do exposto, a problemática da pesquisa reside na incipiência de estudos verticalizados sobre os aspectos éticos na indexação, particularmente em relação à precisão terminológica, uma vez que encontra respaldo enquanto uma etapa do processo de Análise Documental (se adotada a corrente teórica francesa), da Indexação (corrente inglesa) ou da Catalogação de Assunto (corrente norte- americana) (GUIMARÃES, 2008).
Em um recorte para mais claramente identificar tal questão, tem-se o universo temático da homossexualidade masculina, cuja produção literária ainda padece de representação documental
]
afastamento dos padrões, [
]
qualquer fuga aos padrões normais [
]”.
]”,
2 Destaca-se aqui a força semântica do termo suitability (em inglês), valendo-se da metáfora da vestimenta, evidenciando o aspecto da adequação.
GT2
353
adequada, devido à ausência de um vocabulário controlado que seja voltado para esse domínio; tampouco existe, no momento, uma normalização vocabular que propicie uma satisfatória indexação de documentos relativos ao tema. Nesse caso, o uso de uma linguagem normalizada facilita a busca realizada pelo usuário e também permite uma maior precisão. O profissional bibliotecário ao indexar no intuito de buscar substitutos para o conhecimento estabelece rótulos, o mais das vezes permeado por
certa subjetividade. Sem dúvida, tal fazer está baseado em um contexto cultural e ideológico e, por isso, está sujeito que as crenças pessoais do profissional interfiram na representação do conhecimento que está em análise naquele momento. Dessa maneira, se estabelece o recorte deste trabalho, ou seja, os aspectos éticos na representação do conhecimento de temáticas relativas à homossexualidade masculina. A questão da homossexualidade masculina constitui um domínio do conhecimento que se materializa por meio de uma terminologia científica. Esse recorte leva em consideração a análise de domínio proposta por Hjørland e Albrechtsen (1995) e Hjørland (2002) que versa sobre o entendimento do objeto de estudo da Ciência da Informação
– a informação registrada e socializada – por meio da análise dos domínios do conhecimento como
um todo ou de comunidades discursivas, sendo como uma das abordagens os estudos terminológicos. Também leva em consideração a Teoria Comunicativa da Terminologia (TCT) de Cabré (2005), uma vez que a Terminologia se dedica à observação do comportamento dos termos e sua relação com o
conhecimento científico e, dessa maneira, aponta elementos teóricos e princípios práticos capazes de nortear a busca, a seleção e a ordenação de termos daquele domínio do conhecimento. Além disso, o recorte específico em relação à homossexualidade masculina se deve ao fato de que abranger outros assuntos relacionados resultaria em um excessivo alongamento de domínio e, por conseqüência, traria um prejuízo na análise, pela falta de especificidade. Dessa forma, foram excluídos termos relativos
a categorias como, por exemplo, lesbianismo, deixando-os quando necessário apenas a título de
explicação. De acordo com a situação comunicacional em que a terminologia é utilizada, ela pode ativar ou não um valor especializado. Esses valores mantêm um relacionamento polissêmico uns com os outros. Dessa forma, a análise deste trabalho deteve-se em termos oriundos de uma comunidade discursiva específica, isto é, homossexuais masculinos, e da materialização de seu discurso 3 na produção científica, através de palavras-chave atribuídas a artigos científicos. E o que dizer da produção de conhecimento sobre a homossexualidade? O termo ‘homossexual’ foi publicado no Brasil pela primeira vez, em 1906, na obra “Homossexualismo: a libertinagem no Rio de Janeiro” de José Ricardo Pires de Almeida. Mas foram necessárias mais oito décadas para que, em 1986, se tivesse uma obra de caráter antropológico sobre a homossexualidade masculina no Brasil,
com o título “Devassos no Paraíso” de João Silvério Trevisan. Atualmente, é possível encontrar muitas obras sobre a homossexualidade masculina, inclusive como foco de produção e de revistas científicas.
3 Discurso é a interatividade da língua. Para Bakhtin (1998, p. 225) o “Discurso não reflete uma situação, ele é uma situação. Ele é uma enunciação que torna possível considerar a performance da voz que o anuncia e o contexto social em que é anunciado”.
GT2
354
Esse fator é importante porque a Ciência da Informação, e mais notadamente a ORC, foca seus processos, instrumentos e produtos naquilo que Buckland (1991) denomina “informação-como- coisa”, ou seja, o documento e prioritariamente a documentação científica (LE COADIC, 2004). Faz- se importante também ressaltar o fato de que as linguagens de indexação são elaboradas a partir da produção científica, como bem destaca o princípio da “garantia literária” enunciado por Hulme (1911, 1912) e da comunidade discursiva. Para isso, leva-se em consideração o endosso do usuário, o princípio de uso (já preconizado por Cutter no século XIX) e o princípio da garantia do conhecimento (em inglês, knowledge warrant principle), ou seja, para que esse campo de domínio – homossexualidade masculina – possa ser organizado, é necessária uma produção intelectual, já que é a partir dessa realidade que os termos são identificados e disseminados por meio da terminologia estabelecida pela área. Atualmente, os estudos relativos à homossexualidade têm considerada visibilidade, o que roga ainda mais pela garantia de uso e pelo endosso do usuário porque, caso contrário, a indexação dessa produção documental cairia em um vazio, o que significa que a maioria desses documentos seria indexada sob o conceito de “homossexualidade”, reduzindo a preservação específica do seu conteúdo por dificuldades na recuperação, visto que a produção desse conhecimento não se limita a esse conceito. Nesse cenário, a questão de pesquisa que se apresenta em relação à problemática diagnosticada aborda a necessidade de identificar se as linguagens de indexação brasileiras representam, com precisão, os conteúdos específicos relativos à homossexualidade masculina, visto que, essas linguagens têm por objetivo representar o conteúdo de documentos científicos por meio de uma terminologia de especialidade e, dessa maneira, possíveis “desvios” podem interferir na precisão, decorrendo de preconceitos e figuras de linguagens como as metáforas, eufemismos e disfemismos, por exemplo. As figuras de linguagem são recursos lingüísticos sofisticados empregados como estratégia com intuito de se conseguir um determinado efeito seja em um texto ou em um diálogo, isto é, no sentido comunicativo envolvendo emissor-receptor. A revisão de literatura realizada auxiliou na explicação das figuras de linguagem no âmbito da representação do conhecimento, recorrendo-se aos estudos de Cabré (1995, 2005), bem como nos trabalhos de Hjørland e Albrechtsen (1995) e Hjørland (2002) sobre análise de domínio. Além disso, investigaram-se trabalhos sobre a homossexualidade, através do olhar da Ciência da Informação, como em Holder (2002) e Louro (2004), integrando-se à questão ética na representação do conhecimento. Portanto, o objetivo geral deste trabalho foi identificar a máxima especificidade terminológica que as linguagens de indexação brasileiras permitem para a representação de termos relativos à homossexualidade masculina.
2 REPRESENTAÇÃO DO CONHECIMENTO E A HOMOSSEXUALIDADE MASCULINA
A recuperação da informação não pode ser dissociada de duas etapas que a precede: o armazenamento e a indexação. Na etapa do armazenamento são tratados os aspectos físicos da armazenagem como, por exemplo, mídias, servidores que possam abrigar as informações. Na etapa da indexação são previstas questões de como serão realizadas a inserção e combinação de palavras, bem
GT2
355
como o destaque de assuntos principais e periféricos. Consequentemente, na recuperação são previstas as formas como ela acontecerá, ou seja, qual(is) o(s) modelo(s) que fará(ão) parte: booleano, probabilístico, vetorial. Um sistema de recuperação da informação agrega um conjunto de procedimentos que, através de um software gerenciador, permite a armazenagem, indexação e recuperação, disponibilizando para isso um índice de assuntos. A atividade de indexação deve ser realizada com o máximo de precisão possível, levando-se em consideração o contexto e o conteúdo informacional. Sob esse aspecto, Foskett (1973, p. 377) lança a seguinte questão: “será possível especificar todos os atributos de um dado conceito?”. Nesse sentido, entende-se que o substrato da precisão é a especificidade, ou seja, quanto mais específico o assunto 4 , mais precisa necessita ser a representação e, ainda, quanto menos específica a linguagem de indexação for, maior a dificuldade de usuários e indexadores no momento da indexação ou recuperação. E essa especificidade na representação será tanto maior quanto mais específico for o campo representado. No universo ora estudado, tem-se que as questões terminológicas em temáticas ligadas à homossexualidade masculina passam por questões culturais, sobretudo pelo discurso, em que o grupo busca solidificar sua identidade. Entretanto, como ficam as figuras de linguagem interpostas em uma subcultura que, por vezes, modifica os sentidos dos conceitos em seus discursos? O uso das figuras de linguagem, no âmbito da homossexualidade masculina, parte do princípio de que a identificação de uma terminologia está vinculada ao reconhecimento da natureza e dos propósitos daqueles que a utilizam em uma dada área, nesse caso, uma subcultura; ou seja, essas figuras são apropriadas no sentido de revestir- se de proteção contra um ambiente hostil e, por isso, tornam-se parte na esfera discursiva da construção de sua identidade. Os estudos sobre terminologia, enquanto um objeto de estudo, ou seja, o conjunto de termos de uma comunidade discursiva, encontram respaldo nos estudos de Cabré (1995; 2005). Nesse sentido, ao profissional da informação é pertinente entender as questões terminológicas nas quais suas atividades estão inseridas, particularmente, na representação do conhecimento, justamente porque isso se deve ao fato de que essa compreensão na maioria das vezes resultará em trabalhos de terminografia, em outras palavras, na prática de elaboração de vocabulários especializados (BARROS, 2004, p. 22). As pesquisas terminológicas e terminográficas resultam no conhecimento e na compreensão de uma área do conhecimento vinculando-se ao domínio de sua linguagem, ou seja, no seu núcleo específico, que é seu vocabulário que organizado e normalizado de forma lógica e semântica resulta na terminologia da área (KOBASHI; SMIT; TÁLAMO, 2001). Com base no entendimento de que a comunidade homossexual é reconhecida como uma comunidade discursiva e, portanto, objeto da análise de domínio, como justificar o seu estudo no âmbito da representação do conhecimento? Para Hjørland e Albrechtsen (1995, p. 400), o paradigma da análise
4 Em que pese o distanciamento acerca da discussão sobre o conceito de assunto, será adotada nesta tese a concepção de Hjørland
(2003, p. 98) que definiu o assunto como as potencialidades epistemológicas ou informativas do documento, sendo o trabalho dos indexadores identificá-las.
GT2
356
de assunto é social, trabalhando com vertentes da psicologia social, da Sociolingüística, da sociologia do conhecimento e está concatenada com a Ciência da Informação, inclusive porque essa última faz parte das Ciências Sociais. Além disso, o autor observa que a análise de domínio possui dois aspectos: o funcionalista e o realístico-filosófico, sendo o primeiro para entender as funções implícitas e explícitas da informação e comunicação; e o segundo, para entender os fatores que são externos às percepções subjetivas e individuais dos usuários. Um exemplo da figura de linguagem está materializado na palavra francesa phoque que significa, literalmente, foca em português, mas seu significado eufemístico/disfemístico é diferente nas duas línguas, ou seja, em francês é homossexual masculino e em português é jornalista iniciante ou recém-formado 5 . Já em espanhol seu significado eufemístico/disfemístico é de pessoa obesa. As mudanças semânticas no intuito de ajustar um significado estão presentes em alguns exemplos como o da palavra inglesa queer. O seu significado pode ser traduzido por estranho, ridículo, excêntrico, raro e extraordinário, contudo é sinônimo de homossexual podendo designar um comportamento excêntrico ou desviante. O significado dessa palavra possui duas matrizes, em que a primeira refere-se a uma série de expressões consolidadas no senso comum homofóbico, portanto, pejorativa; e a segunda refere-se ao contexto anglo-saxão cujo significado tem a ver com algo esquisito, insólito, raro, estranho. Holder (2002, p. 324) identificou, no contexto norte-americano, quatro significados para queer, a saber: pessoa bêbada ou alcoolizada, uma pessoa alienada mental (implicando uma condição inofensiva e suave), um homossexual masculino (tanto no substantivo como no adjetivo) e, por fim, notas de dinheiro falsas. O autor salienta que o primeiro significado a ela atribuído, o de uma pessoa alcoolizada, está obsoleto. Com os estudos envolvendo a “teoria queer”, Louro (2004), por usa vez, afirma que queer refere-se ao indivíduo marginalizado devido à sua orientação sexual por uma que seja predominante. Dessa maneira, o significado da palavra tornou-se positivo, uma vez que era pejorativo. De disfemística ela tornou-se eufemística, mas esconde uma carga de preconceito haja vista seus demais significados. Outro exemplo trata-se da palavra inglesa gay. Literalmente, podemos traduzi-la como alegre ou feliz. Holder (2002, p. 160) informa que, no século XIX, uma prostituta poderia ser chamada de uma moça ou senhora alegre ou feliz e que, até a década de 1960, gay era sinônimo de alegre com uma ligeira indicação de embriaguez ou intoxicação, porém, atualmente seu significado remete a uma pessoa de orientação homossexual. Em que pese o contexto norte-americano 6 , existem diversos eufemismos para designar o homossexual masculino com características femininas, como por exemplo, butterfly (termo que faz alusão ao inseto diurno – borboleta), sissy ou cissy (termos provavelmente originários de uma corrupção de sister via sissy ou sis - irmã), campy (afrescalhado, entretanto, sua origem é obscura, esse termo revela uma responsabilidade natural das quais se podem reprovar), cupcake (apesar de não muito
5 Interessante notar que o equivalente eufemístico em inglês para jornalista iniciante ou recém formado é cub cujo significado é filhote ou escoteiro novato, conhecidos como lobinhos.
6 Baseado, principalmente, em Holder (2002, passim).
GT2
357
clara, a explicação para esse termo vem da característica inofensiva, ou seja, um macho inofensivo, ineficaz), degenerate (significa deixar de ser capaz de funcionar como antes, dessa maneira, levando em consideração que o sexo funciona como a propagação da espécie, pode haver uma ligação com os homossexuais, entretanto, possui uma imagem de degradação e degeneração), divergence (aquele que se afasta da regra), effeminate (que possui características de mulher), fag (provavelmente por considerar os fumantes como afeminados), faggot (originário de fag, como verbo significa copular e, como substantivo, prostituta), freak (um evento irracional ou monstruoso), entre outros. Esses exemplos demonstram a carga negativa que as expressões ou a palavras carregam, dessa forma, em muitos casos é impossível separar o eufemismo do disfemismo, pois não há uma divisão nítida, caracterizada principalmente pelas mudanças de contexto lingüístico, dessa forma, o que é um eufemismo hoje pode ser um disfemismo amanhã. Acontece que muitas palavras, afastadas de seu significado original, são utilizadas com significados totalmente novos. Gay nos Estados Unidos é preferido ao invés de Homosexual, porque esse último remete a uma terminologia médica que designava o indivíduo como portador de uma patologia. Entretanto, homossexual é preferido no Brasil ao invés de gay, sendo este último utilizado muitas vezes com conotação pejorativa. Dessa maneira, gay será usado em um contexto mais politizado ao contrário de homosexual. Entende-se, então, que a terminologia parte de uma linguagem real, com dados oriundos da documentação, para dar conta da denominação especializada; por isso, baseia-se nas palavras daquela especialidade, materializadas através do registro funcional da base temática (CABRÉ, 1995, p. 7). No
que se refere à aplicação da terminologia, Cabré (1995, p. 12) explica que ela serve à representação e à transferência. Na função de representação, a terminologia serve a algumas áreas como a documentação,
a engenharia lingüística e, nesse sentido, seus objetivos versam sobre a organização do processo terminográfico. Em relação à documentação, a terminologia é um elemento-chave para representar
o conteúdo dos documentos e para acessá-los. Na função de transferência, a terminologia serve
fundamentalmente à comunicação direta, à mediação comunicativa e à planificação lingüística. Entende-se, dessa forma, que o estudo das figuras de linguagem existentes no universo da homossexualidade masculina com vistas à representação do conhecimento passa pela identificação de seu sistema lingüístico, do seu universo léxico, o que resulta em conjuntos terminológicos, visto que serão termos utilizados por aquele comunidade/subcultura, ou seja, um conjunto vocabular-cultural. Por isso, esse conjunto vocabular-cultural ou base léxica foi investigado no âmbito da produção científica.
3 MATERIAL E MÉTODO
O presente trabalho possui natureza exploratória e documental e, dessa forma, apresenta em sua dimensão aplicada, características qualitativas e indutivas, na medida em que desenvolve sua análise a partir de um corpus composto de palavras-chave extraídas de periódicos especializados em homossexualidade masculina (Journal of Homosexuality, Sexualities e Journal of Gay & Lesbian Mental Health), entre 2005 e 2009, situando-as em um universo específico, qual seja, de três abrangentes
GT2
358
linguagens de indexação brasileiras (Vocabulário Controlado Básico do Senado Federal, o Vocabulário Controlado da USP (Universidade de São Paulo) e a Terminologia de Assuntos da Fundação Biblioteca Nacional).
3.1 Corpus da Pesquisa Journal of Homosexuality dedica-se à pesquisa acadêmica sobre a homossexualidade, incluindo
os subtemas como práticas sexuais e papéis de gênero e sua diversidade cultural, histórica, interpessoal
e contextos sociais modernos. Além disso, os artigos publicados procuram explorar as implicações
políticas, sociais e morais da pesquisa sobre a sexualidade humana. Essa parte do corpus da pesquisa versou sobre os artigos publicados entre os anos de 2005 a 2009, o que corresponde aos volumes de número 48 a 56, em um total de 279 artigos, resultando em 544 palavras-chave. Sexualities é de alcance internacional e se estabeleceu como uma fonte de pesquisa e de publicação de artigos no âmbito dos estudos sobre a sexualidade humana. Nesse sentido, o escopo da revista, através de uma perspectiva interdisciplinar, cobre as áreas de Ciências Sociais, História Cultural, Antropologia Cultural, bem como, os estudos de gênero, feminismo e os estudos sobre gays e lésbicas. Essa segunda parte do corpus da pesquisa versou sobre os artigos publicados entre os anos de 2005 a 2009, o que corresponde aos volumes de número 8 a 12, em um total de 132 artigos, resultando em 172 palavras-chave. Journal of Gay & Lesbian Mental Health é um canal de comunicação científica interdisciplinar que agrega os profissionais e pesquisadores da área de saúde mental de gays, lésbicas, bissexuais, transexuais, transgêneros etc., publicando artigos, revisões, casos clínicos e revisões críticas dessa
literatura. Essa terceira parte do corpus da pesquisa versou sobre os artigos publicados entre os anos de 2005 a 2009, o que corresponde aos volumes de número 9 a 13, em um total de 108 artigos, resultando em 327 palavras-chave. Do corpus da pesquisa, ou seja, das três revistas científicas somaram-se 1705 palavras-chave candidatas à indexação e, desse total, destacaram-se 93 que estão diretamente ligadas ao universo homossexual masculino sonegando as demais por tratarem de questões que, de certa forma, ampliariam
o universo pesquisado.
3.2 Linguagens de Indexação Brasileiras
As linguagens de indexação brasileiras utilizadas para a ‘operação de tradução’ do corpus analisado foram: o Vocabulário Controlado Básico do Senado Federal, o Vocabulário Controlado da USP – Universidade de São Paulo – e a Terminologia de Assuntos da Fundação Biblioteca Nacional, que estão disponíveis publicamente pela internet. A escolha da primeira linguagem de indexação se deu pelo fato de que o Vocabulário Controlado Básico é utilizado para a indexação dos registros bibliográficos da rede de bibliotecas coordenada pela Biblioteca do Senado Federal. Esse Vocabulário é originado de tipos de literaturas diferentes pertencentes às bibliotecas da rede, cujos acervos variam de especialização. A escolha da segunda se deu por ser uma produção nacional emanada dos acervos de tal
GT2
359
universidade (39 bibliotecas da USP que pertencem ao Sistema Integrado de Bibliotecas), que representam uma parte da produção nacional e refletem o trabalho de profissionais brasileiros. A escolha da terceira foi motivada pelo fato de ela ter como base o Cabeçalho de Assunto da Biblioteca do Congresso Norte-Americano. Não se trata, no entanto, de uma tradução fiel, uma vez que os ajustes são elaborados pela Coordenadoria de Serviços Bibliográficos da Biblioteca Nacional e, além disso, inúmeros assuntos têm tratamento muito diferenciado na realidade brasileira em relação à norte-americana.
4 ANÁLISE DOS DADOS
A comparação entre as palavras-chave extraídas das revistas e as linguagens de indexação brasileiras traz consigo uma abordagem qualitativa e indutiva. As 93 palavras-chave destacadas das revistas foram comparadas, conforme o quadro 1, abaixo, às linguagens de indexação com intuito de diagnosticar a especificidade da temática no âmbito do instrumento. Logo em seguida, fez-se uma análise para identificar a adequação das palavras junto às linguagens.
|
Palavras-chave |
VCB Senado |
VCA USP |
Terminologia |
|
|
Federal |
FBN |
|||
|
1 |
Amor homoerótico |
- |
- |
- |
|
2 |
Anti-gay |
Homofobia |
||
|
3 |
Anti-homossexualidade |
Homofobia |
Homossexualidade |
Homofobia |
|
4 |
Atitudes anti-gay |
(Discriminação) |
||
|
5 |
Armário (Closet) |
- |
- |
- |
|
Homossexualidade |
||||
|
6 |
Assumir-se |
- |
- |
assumida |
|
7 |
Atitudes de apoio à ho- mossexualidade |
- |
- |
- |
|
8 |
Ativismo gay |
- |
Homossexuais (as- |
Movimento de |
|
pectos políticos) |
Libertação Gay |
|||
|
9 |
Bareback (Sexo sem pre- servativo) |
Comportamento |
||
|
sexual |
- |
- |
||
|
10 |
Bares gays |
- |
- |
- |
|
11 |
BDSM 1 |
- |
- |
Sadomasoquismo |
|
12 |
Bispos gays |
Ordenação de ho- |
||
|
- |
- |
mossexuais |
||
|
Homens |
||||
|
13 |
Bissexual |
- |
- |
bissexuais |
|
14 |
Bissexualidade |
- |
Bissexualidade |
Bissexualidade |
GT2
360
|
União Civil de |
|||||
|
15 |
Casamento gay |
- |
Pessoas do Mesmo Sexo |
Casamento entre homossexuais |
|
|
Homossexualidade |
|||||
|
16 |
Comunidade gay |
- |
(Aspectos sociais) |
- |
|
|
17 |
Coro gay |
- |
- |
- |
|
|
18 |
Couro (Leather) |
- |
- |
- |
|
|
19 |
Crossdresser |
- |
- |
Travestis |
|
|
20 |
Cruising 2 (Caçar) |
- |
- |
- |
|
|
Desenvolvimento da identidade gay |
Homossexualidade |
Homossexuais masculinos - iden- tidade |
|||
|
21 |
- |
(Psicologia) |
|||
|
Homossexuais |
Direitos dos ho- mossexuais |
||||
|
22 |
Direitos gays |
- |
(Aspectos legais) |
||
|
23 |
Dogging 3 (Banheirão) |
- |
- |
- |
|
|
24 |
Dois espíritos 4 |
- |
- |
- |
|
|
25 |
Drag Queen |
- |
- |
Travestis |
|
|
26 |
Efeminação |
- |
- |
- |
|
|
27 |
Efeminofobia |
- |
- |
- |
|
|
28 |
Estereótipo |
Estereótipos |
|||
|
- |
(Psicologia) |
- |
|||
|
29 |
Estigma |
- |
Estigma |
Estigma (Psicologia Social) |
|
|
30 |
Estudos gays |
- |
- |
Homossexualismo |
|
|
– |
Estudo e ensino |
||||
|
31 |
Estudos LGBT |
- |
- |
Homossexualismo |
|
|
– |
Estudo e ensino |
||||
|
32 |
Estupro masculino |
- |
Estupro |
Estupro |
|
|
33 |
Fag hag (mulher amiga do gay) |
- |
- |
- |
|
|
34 |
Família adotiva gay |
Adoção por ho- |
|||
|
- |
- |
mossexuais |
|||
|
35 |
Filmes gays |
- |
- |
- |
|
|
Jovens homosse- |
|||||
|
36 |
Frango 5 (Chicken) |
- |
- |
xuais |
|
|
Homossexualismo |
Homossexuais |
Homossexuais |
|||
|
37 |
Gay |
masculino |
(masculino) |
masculinos |
|
GT2
361
|
38 |
GLBT |
- |
- |
Minorias sexuais |
|
Homossexualismo |
Homossexuais |
Homossexuais |
||
|
39 |
Homens gays |
masculino |
(masculino) |
masculinos |
|
Homens que fazem sexo com homens |
Homossexualismo |
Homossexuais |
Homossexuais |
|
|
40 |
masculino |
(masculino) |
masculinos |
|
|
41 |
Homoerotismo |
- |
- |
- |
|
Homofobia |
||||
|
42 |
Homofobia |
Homofobia |
Homossexualidade |
Homofobia |
|
(Discriminação) |
||||
|
Homofobia |
||||
|
43 |
Homonegatividade |
Homofobia |
Homossexualidade |
Homofobia |
|
(Discriminação) |
||||
|
Homossexuais |
||||
|
44 |
Homossexual |
Homossexualismo masculino |
Homossexuais (masculino) |
Homossexuais masculinos |
|
Homossexualismo |
||||
|
45 |
Homossexualidade |
masculino |
Homossexualidade |
Homossexualismo |
|
46 |
Homossocialidade 6 |
- |
- |
- |
|
47 |
Identidade de gênero |
- |
Identidade sexual |
Identidade de gê- nero |
|
Homossexuais |
||||
|
48 |
Identidade gay |
- |
- |
masculinos - |
|
Identidade |
||||
|
49 |
Identidades queer |
- |
- |
Teoria Queer |
|
50 |
Imagem dos homossexu- ais |
- |
- |
- |
|
51 |
Intersexo |
- |
- |
- |
|
52 |
Intersexualidade |
- |
- |
- |
|
53 |
Inversão de gênero |
- |
- |
- |
|
54 |
LGBT |
- |
- |
Minorias sexuais |
|
55 |
Linguagem homofóbica |
Homofobia |
Homofobia |
Homofobia |
|
Jovens homosse- |
||||
|
56 |
Lolito (Dude) |
- |
- |
xuais |
|
Masculinidade |
||||
|
57 |
Masculinidade |
(Psicologia) |
Masculinidade |
Masculinidade |
|
58 |
Masoquismo |
Masoquismo |
Masoquismo |
Masoquismo |
|
Homossexuais nas |
||||
|
59 |
Militares gays |
- |
- |
forças armadas |
GT2
362
|
60 |
Movimento gay |
- |
Homossexuais (as- |
Movimento de |
|
pectos políticos) |
Libertação Gay |
|||
|
61 |
Não pergunte, Não fale |
- |
- |
- |
|
62 |
Orientação sexual |
- |
Orientação sexual |
Orientação sexual |
|
63 |
Pais gays |
- |
- |
Pai homossexual |
|
64 |
Parceiros gays |
Companheiros ho- |
||
|
- |
- |
mossexuais |
||
|
Casamento entre |
||||
|
65 |
Parceria civil |
- |
- |
homossexuais |
|
66 |
Parentalidade gay |
- |
- |
Pai homossexual |
|
67 |
Pederastia |
- |
- |
- |
|
68 |
Pedofilia |
- |
Pedofilia |
Pedofilia |
|
69 |
Política gay |
- |
Homossexuais (as- |
Movimento de |
|
pectos políticos) |
Libertação Gay |
|||
|
70 |
Pornografia |
Pornografia |
Pornografia |
Pornografia |
|
71 |
Preconceito anti-gay |
Homofobia |
Homofobia |
Homofobia |
|
72 |
Preconceito sexual |
Discriminação se- xual |
- |
Discriminação de sexo |
|
73 |
Prostituição masculina |
Prostituição |
Prostituição |
Prostituição mas- culina |
|
74 |
Psicologia LGBT |
- |
- |
- |
|
75 |
Queer |
- |
- |
Teoria Queer |
|
76 |
Relacionamento gay |
- |
- |
- |
|
77 |
Relacionamento românti- co entre o mesmo sexo |
- |
- |
- |
|
78 |
Sadismo |
Sadismo |
Sadismo |
Sadismo |
|
79 |
Sadomasoquismo |
- |
Sadomasoquismo |
Sadomasoquismo |
|
80 |
Saunas gays |
- |
- |
- |
|
81 |
Sexo em instalações pú- blicas |
- |
- |
- |
|
82 |
Sexualidade |
Sexualidade |
Sexualidade |
- |
|
83 |
Sodomia |
- |
- |
- |
|
84 |
Subcultura gay |
- |
- |
- |
|
85 |
Teoria Queer |
- |
- |
Teoria Queer |
|
86 |
Trabalho sexual mascu- lino |
Prostituição |
Prostituição |
Prostituição mas- culina |
GT2
363
|
87 Transexual |
- |
- |
Transexuais |
|
88 Transexualidade |
- |
Transexualismo |
Transexualismo |
|
89 Transexualismo |
Transexualismo |
Transexualismo |
Transexualismo |
|
90 Transgênero |
- |
- |
- |
|
91 Travesti |
- |
Travestis |
Travestis |
|
União Civil de |
|||
|
92 União civil gay |
- |
Pessoas do Mesmo Sexo |
Casamento entre homossexuais |
|
93 Ursos (Bears) |
- |
- |
- |
Quadro 1: Palavras-chave extraídas do corpus pesquisado e comparadas com as linguagens de indexação brasileiras.
Fonte: Elaborado pelos autores.
De acordo com o quadro comparativo, foi possível verificar que o Vocabulário Controlado Básico do Senado Federal foi receptivo para 22,58% (21) das palavras destacadas, o Vocabulário
Controlado da USP, por sua vez, conseguiu um índice de 40,86% (38) de incorporação das palavras
e a Terminologia de Assuntos da Fundação Biblioteca Nacional foi a que mais palavras conseguiu
abarcar, perfazendo um total de 63,44% (59). Essa primeira análise sugere que linguagens de indexação analisadas ainda não possuem uma adequação, tampouco uma especificidade suficiente para a representação da temática em questão. Além do mais, isso não se deve somente pela baixa proporção com a qual conseguem “traduzir” ou normalizar os termos, mas também por alguns fatores que se verificam, discutidos a seguir. Num primeiro momento, ressalta-se que a Terminologia de Assuntos da Fundação Biblioteca Nacional está baseada no Cabeçalho de Assunto da Biblioteca do Congresso Norte-Americano e esse
é um fator primordial para entender porque essa linguagem abarcou mais palavras que as outras. Como
o corpus da pesquisa foi composto por termos oriundos de revistas científicas norte-americanas, é
fácil entender que a adaptação de uma linguagem de indexação dessa mesma cultura linguística possa ser mais suscetível a uma indexação mais pertinente. Isso não ocorreu, no entanto, com a totalidade das palavras. O que ocorre, por vezes, é de a tradução dos termos para a cultura linguística brasileira necessitar de adaptação, como foi o caso de dude para lolito, dogging para banheirão, cruising para caçar e bareback para sexo sem proteção. À exceção desses termos, queer e hag fag permaneceram sem tradução. Em comparação com as outras duas linguagens, o percentual foi baixo para a indexação
e isso deve ser destacado quando se trabalha com a precisão na recuperação da informação. Num segundo momento, deve-se levar em consideração que, no contexto linguístico norte- americano, gay está livre da conotação pejorativa advinda do contexto médico-jurídico e é, por isso, aceitável pela comunidade falante, inclusive porque seu uso está intimamente ligado ao âmbito das lutas
GT2
364
para reconhecimento dessa subcultura. Por sua vez, homossexual carrega consigo, nessa ambiência linguística norte-americana, toda a carga pejorativa advinda do contexto médico e, especialmente, por realizar uma distinção primária através da sexualidade. Contudo, no contexto brasileiro, ao contrário do norte-americano, gay possui uma carga pejorativa e, nesse sentido, observa-se nas linguagens de indexação brasileiras a preferência pelo uso de homossexual ao invés de gay. Constata-se, mais especificamente no quadro 1, que gay possui correspondente em homossexuais masculinos nas linguagens analisadas. Como exemplo, verifica-se também que, das palavras destacadas, todos os substantivos que carregam consigo gay como qualificativo, ou seja, como adjetivo, possuem correspondente na linguagem de indexação como homossexual ou não possuem correspondente. Vejam-se os termos:
Ativismo gay, Bares gays, Bispos gays, Casamento gay, Comunidade gay, Coro gay, Direitos gays, Estudos gays, Família adotiva gay, Filmes gays, Homens gays, Identidade gay, Militares gays, Movimento gay, Pais gays, Parentalidade gay, Política gay, Relacionamento gay, Saunas gays, Subcultura gay, União civil gay. À exceção dos termos Ativismo gay, Movimento gay e Política gay, todos os outros que encontraram termos correspondentes o fizeram de forma a substituir gay por homossexual. A exceção se deu porque o cabeçalho proposto pela Terminologia de Assuntos da Fundação Biblioteca Nacional foi por Movimento de Libertação Gay, preservando o adjetivo da linguagem de indexação norte-americana. Com isso, percebe-se que não existe um entendimento em relação ao emprego de gay e de homossexual. Entende-se que, no contexto brasileiro, gay resulta em algo pejorativo, mas mesmo assim foi empregado. Ocorre que, no contexto norte-americano, gay tem caráter eufemístico, diferentemente do contexto brasileiro, no qual ele possui caráter disfêmico. Dessa maneira, a tradução não carregou consigo esses aspectos das figuras de linguagem. Homossexual, no contexto linguístico brasileiro, possui caráter ortofêmico. O multilinguísmo, enquanto um valor no âmbito da organização e representação do conhecimento, considera que deve haver um equivalente equânime nas linguagens de indexação multilíngues. Num terceiro momento, percebe-se, contudo, que as palavras destacadas representam a especificidade com a qual a temática tem se desenvolvido. Isso pode ser percebido pela representatividade com a qual essas palavras não encontraram correspondentes nas três linguagens de indexação brasileiras, isto é, 29 delas (31,18%) tenderiam a ter um termo mais geral para poder representá-las, perdendo em precisão. Nesse aspecto, chama-se a atenção para Efeminação, Efeminofobia, Pederastia e Sodomia, que possuem ligação direta com a questão homossexual e, por vezes, um entendimento inadequado da questão, consequência da discriminação. A presença de Efeminação, Pederastia e Sodomia em linguagens de indexação necessitará de explicações e direcionamento corretos, de forma a dirimir formulações incorretas sobre a questão, além de se destacar eticamente no processo de recuperação da informação pelo usuário.
GT2
365
Da mesma maneira, ocorre com os termos Amor homoerótico e Relacionamento romântico entre o mesmo sexo, que, de certa forma, podem ser considerados sinônimos e revelam um aspecto importante da homossexualidade, até então relegada ao simples ato sexual entre duas pessoas do mesmo sexo. Representá-los em linguagens de indexação é uma possibilidade de realizar essa diferença do que foi entendimento anteriormente para o que é atualmente, perfazendo uma questão ética. Outro ponto de destaque é o de Homossexualidade, que encontra respaldo em apenas uma linguagem de indexação – o Vocabulário Controlado de Assunto da USP. Nas outras duas linguagens (Senado e Biblioteca Nacional), o termo correspondente encontrado é Homossexualismo. Interessante notar que o radical da palavra juntamente com o sufixo –ismo não é o preferido justamente por refletir uma posição que não é a entendida atualmente. Ressalta-se novamente que esse sufixo remete a uma posição científica que atrelou ao conceito a ideia de patologia e que hoje não é mais entendida como tal. Portanto, ocorre nesse caso um exemplo típico de problema ético que deve buscar soluções dentro da política de gestão da linguagem de indexação. Destacam-se, também, as siglas como termos candidatos à indexação – GLBT e LGBT – que, em muitas linguagens, possuem restrições quanto à sua incorporação. De qualquer forma, é salutar que elas façam parte da linguagem de indexação porque essas siglas refletem a identidade da subcultura estudada. O seu teor representativo carrega consigo uma gama de informações que, por vezes, podem auxiliar o usuário no entendimento da formação da identidade desse grupo. Essa sigla congrega as várias expressões da sexualidade que compõe o universo homossexual – que não é homogêneo e que, por sua vez, busca reconhecimento junto à sociedade. São eles: gays, lésbicas, bissexuais, travestis, transexuais, trangêneros e intersexo. A mudança e a ampliação dessa sigla demonstram a complexidade e a especificidade do assunto que não cabe e não se restringe apenas sob o rótulo de homossexualidade. Essa especificidade é substrato da precisão. Num quarto momento, destacam-se as figuras de linguagens presentes nos candidatos à indexação, são elas: Armário, Assumir-se, Bareback, Couro, Cruising, Dogging, Dois espíritos, Fag hag, Frango, Lolito, Não pergunte, Não fale e Ursos. A exceção de Lolito e Frango, que encontraram respaldo na Terminologia de Assuntos da Fundação Biblioteca Nacional, nenhuma outra foi passível de inclusão na indexação. A hipótese mais provável é a presença do caráter figurativo, o que é muito comum nessa comunidade discursiva. Obviamente que não é possível subverter as categorias das linguagens de indexação, mas nenhuma das palavras retiradas dos artigos científicos conseguiu especificidade nas linguagens analisadas. Armário expressa a condição de um homossexual que não se assumiu publicamente para seus entes e amigos, condição essa muito comum quando da não aceitação da homossexualidade pela sociedade em geral. É uma metáfora para alguém que está escondido, trancado. Assumir-se ou Coming out (em inglês) é uma metáfora para o ato de sair do armário, ou seja, assumir publicamente sua orientação sexual. Bareback não possui uma tradução para o português, pois sua tradução literal – cavalgar sem
GT2
366
cela – apenas confundiria o sentido metafórico; assim, no contexto homossexual, significa a prática sexual sem o uso de preservativo. Couro ou Leather (em inglês) é uma categoria dentro do grupo homossexual para congregar aqueles indivíduos que possuem afinidades com esse material durante a prática sexual ou, ainda, que se estimulam sexualmente com esse material. É, pois, uma palavra que expressa um grupo de indivíduos. Cruising e Dogging, ambos sem tradução, têm significados eufemísticos. Cruising significa o ato de ir à busca de uma pessoa para práticas sexuais que, em português, também em sentido eufemístico, seria “caçar”. Dogging, cujo sentido eufemístico seria a prática sexual em lugares públicos, mesmo não possuindo um termo em português, aproxima-se, no universo homossexual, e também com sentido eufemístico, a “banheirão”. Dois espíritos, enquanto uma expressão eufemística, busca, no âmbito da cultura ameríndia, dar significado ao que se entenderia por homossexual, ou seja, uma pessoa que possui tanto o caráter masculino quanto o feminino. Fag hag, por sua vez, longe de ter um significado em português (fag = viado, hag = bruxa), é uma palavra eufemística que se refere a uma mulher que está em companhia constante de um homossexual masculino, seja por amizade ou relacionamento amoroso. Frango e Lolito, respectivamente, Chicken e Dude, em inglês, aproximam-se muito em seus significados, sendo um eufemismo que designa um homossexual masculino jovem. Não pergunte, não fale (Don´t ask, don´t talk, em inglês) é uma expressão eufemística que designa o ato sexual entre homossexuais que pertencem ao círculo militar e, por isso, é considerada uma expressão exclusiva que reflete a necessidade de esconder e dissimular a relação homossexual nessa ambiência. Ursos (Bears, em inglês) se trata de um eufemismo que congrega homossexuais masculinos que possuem determinadas características físicas e, dessa forma, buscam interesses comuns. Esse termo está no mesmo caminho de significação de Couro. Num quinto e último momento, destacam-se as palavras que representam grupos específicos dentro do universo homossexual. Grupos que buscam suas identidades dentro do aspecto da homossexualidade masculina, que são: BDSM, Couro, Drag Queen, Intersexo, Transexual, Transgênero, Travesti e Ursos. Cada palavra representa um agregado de indivíduos que possuem características formadoras de sua identidade dentro do grupo da homossexualidade masculina.
5 CONSIDERAÇÕES FINAIS
A indexação busca uma nova dinâmica para os registros do conhecimento que, por sua vez, resistem à cronologia e às categorias previsíveis e, por isso, deve ser a materialização de uma dinâmica de natureza ética, um fazer cujos procedimentos, instrumentos e produtos são perpassados por um vasto e cambiante universo de valores. Tais valores devem ser sempre trazidos à tona, mormente quando as pontes entre o conhecimento registrado e aqueles que se apropriarão desse conhecimento para gerarem outro refletem universos culturalmente distintos. No caso desta pesquisa, as linguagens de indexação brasileiras analisadas não são suficientemente precisas em relação à representação da temática da homossexualidade masculina, especialmente porque tal assunto não está devidamente estruturado nessas linguagens. Em relação à gay e homossexual, apesar de o primeiro não ser preferido nas linguagens de
GT2
367
indexação brasileiras, ele é usado e, dessa forma, constata-se uma incongruência. A falta de controle terminológico é percebida também quanto ao uso do qualificativo ‘pessoas do mesmo sexo’, entendido aqui como sinônimo para homossexuais. Vislumbrou-se que algumas palavras da temática analisada são figuras de linguagem que, por vezes, foram apropriadas pelo grupo com seus significados reconsiderados como, por exemplo, gay e queer. Significados como esses, que possuíam caráter pejorativo, são tomados com outro sentido, no intuito de minimizar uma ambiência hostil. As traduções para o contexto brasileiro foram realizadas de forma aproximada ao seu significado no contexto norte-americano. Nesse sentido, esta pesquisa destacou cinco momentos durante a comparação das palavras com as linguagens de indexação brasileiras. O primeiro refere-se à adequação ao contexto brasileiro que, por sua vez, encontrou uma aproximação de significados.
O segundo trouxe à tona a falta de precisão com a qual os termos são usados nas linguagens de
indexação. Em seguida, no terceiro momento, a especificidade da temática analisada apontou que
as linguagens de indexação brasileiras representam-na de forma inadequada e, por vezes, imprecisa.
No quarto momento, tem-se a presença de figuras de linguagem que são subjacentes à comunidade discursiva e que não encontram respaldo nas linguagens de indexação analisadas. Além disso, num quinto momento, verificou-se a presença figuras de linguagem representando categorias dentro da própria temática analisada. Portanto, esta pesquisa sugere que a falta de precisão das linguagens de indexação brasileiras pode prejudicar a recuperação da informação pelos usuários interessados na temática analisada. Esse usuário possui uma identidade de quem busca, usa ou produz informação, inclusive, como comunidade discursiva.
Abstract: The studies on ethics in Knowledge Organization and Representation, especially in the Subject Approach to Information, have collaborated to establish the theoretical and methodological aspects of Information Science which are justified by the assumption of social inclusion, as a metavalue, it situated itself between social prejudice and proselytize, creating a situation where three axiological universes coexist: the document or information, the user and the librarian. Therefore, the indexing is linked to an ethical dimension because it must concern itself with its reliability and usefulness in certain discourse communities or specific domains. In this direction, it is proposed through an exploratory and documental research with qualitative and inductive characteristics to identify the maximum specific terminological that Brazilian indexing languages allow for terms relating to male homosexuality, analyzing like investigative corpus the terms assigned to papers published in the Journal of Homosexuality, Sexualities and Journal of Gay & Lesbian Mental Health, between the years 2005 to 2009. From confrontation and analysis of terms and the Brazilian indexing languages there is an approximation of meaning in the Brazilian context, imprecision in the terminology, with indications of prejudices disseminate by ‘politically correct’, the biased representation of the thematic and the presence of figures of speech.
Keywords: Information ethics. Knowledge representation. Figures of speech.
REFERÊNCIAS
ALMEIDA, J. R. P. Homossexualismo: a libertinagem no Rio de Janeiro. Rio de Janeiro: Laemmert,
GT2
368
1906.
BAKHTIN, M. Questões de literatura e de estética: a teoria do romance. 4. ed. São Paulo: UNESP,
1998.
BARROS, L. A. Curso básico de terminologia. São Paulo: EDUSP, 2004. (Acadêmica, 54).
BUCKLAND, M. Information as thing. Journal of the American Society of Information Science, Washington, v. 42, n. 5, p. 351-360, 1991.
CABRÉ, M. T. La Terminología hoy: concepciones, tendencias y aplicaciones. Ciência da Informação, Brasília, v. 24, n. 3, 1995. Disponível em: <http://revista.ibict.br/ciinf/index.php/ciinf/ article/view/487>. Acesso em: 1 ago. 2011.
CABRÉ, M. T. La Terminología: representación y comunicación: elementos para una teoría de base comunicativa y otros artículos. Girona: Documenta Universitaria, 2005.
FOSKETT, A. C. A abordagem temática da informação. São Paulo: Polígono, 1973.
GUIMARÃES, J. A. C. A dimensão teórica to tratamento temático da informação e suas interlocuções com o universo científico da International Society for Knowledge Organization (ISKO). Revista Ibero-americana de Ciência da Informação (RICI), Brasília, v. 1, n. 1, p. 77-99, 2008.
HJØRLAND, B. Deliberate bias in knowledge organization? In: ARSENAULT, C.; TENNIS, J. T. (Org.). Culture and identity in knowledge organization. Würzburg: Ergon Verlag, 2008. p. 256- 261. (Advances in knowledge organization, 11).
HJØRLAND, B. Domain analysis in information science: eleven approaches – traditional as well as innovative. Journal of Documentation, London, v. 58, n. 4, p. 422-462, 2002.
HJØRLAND, B. Fundamentals of knowledge organization. Knowledge Organization, Würzburg, v. 30, n. 2, p. 87-111, 2003.
HJØRLAND, B.; ALBRECHTSEN, H. Toward a new horizon in information science: domain- analysis. Journal of the American Society for Information Science, Washington, v. 46, n. 6, p. 400-425, 1995.
HOLDER, R. W. How not to say what you mean: a dictionary of euphemisms. Oxford: Oxford University Press, 2002.
HORNBY, A. S. Oxford advanced learner’s dictionary. 5th. ed. Oxford: Oxford University Press,
1995.
HOUAISS, A. Dicionário Houaiss da Língua Portuguesa. Rio de Janeiro: Objetiva, 2001.
HULME, E. W. Principles of book classification. Library Association Record, London, v. 13, p. 354-358, 1911.
GT2
369
HULME, E. W. Principles of book classification. Library Association Record, London, v. 14, p. 39-46, 1912.
KOBASHI, N. Y.; SMIT, J. W.; TÁLAMO, M. F. G. M. A função da terminologia na construção do objeto da Ciência da Informação. DataGramaZero: Revista de Ciência da Informação, Rio de Janeiro, v. 2, n. 2, abr. 2001. Disponível em: <http://dgz.org.br/abr01/Art_03.htm>. Acesso em: 1 ago. 2011.
LE COADIC, Y.-F. A ciência da informação. 2. ed. rev. atual. Brasília: Briquet de Lemos/Livros,
2004.
LÓPEZ-HUERTAS, M. J. Some current research questions in the field of knowledge organization. Knowledge Organization, Würzburg, v. 35, n. 2/3, p. 113-136, 2008.
LOURO, G. L. Um corpo estranho: ensaios sobre a sexualidade e teoria queer. Belo Horizonte:
Autêntica, 2004.
TREVISAN, J. S. Devassos no paraíso. São Paulo: Max Limonad, 1986.
(Notas da Tabela)
|
1 |
Sigla para a expressão Bondage, Disciplina, Sadismo e Masoquismo. |
|
2 |
Ato de dirigir-se até uma localidade em busca de um parceiro sexual. |
|
3 |
Ato sexual em lugar público. |
|
4 |
Termo originário de tribos ameríndias que desempenham vários papéis de gênero. Muito comum em tribos |
indígenas nativas americanas e canadenses. Atualmente, o termo é usado pelos homossexuais para descrever a si próprios e o papel que reivindicam.
5 Homossexual masculino jovem.
6 Fortes laços de consenso entre os homens, que, quando se erotizam, dão lugar à homossexualidade.
GT2
370
COMUNICAÇÃO
ORAL
O BLOOD PROJECT: UMA INICIATIVA PARA ORGANIZAÇÃO DA INFORMAÇÃO EM BIOMEDICINA
Almeida, M.B.; Coelho, K.C.; Andrade, A.Q.; Carneiro, L.E.S.; Oliveira, J. A.; Mendonça, B.M.; Souza, R.R. 1
Resumo. A terminologia médica é abrangente e complexa, contendo ambiguidades e diferentes interpretações para termos especializados. Esse tipo de problema, dentre outros relacionados, tem sido abordado há anos pela Ciência da Informação. Apesar da variedade de vocabulários, tesauros e glossários disponíveis em biomedicina, observa-se a inexistência de iniciativas dedicadas à hematologia. O objetivo do presente trabalho é descrever uma pesquisa sobre vocabulários formais para hematologia, baseados em princípios ontológicos. Para tal, apresenta-se aqui o Blood Project, uma iniciativa que visa auxiliar na recuperação, uso e análise de dados sobre o sangue, bem como a integração com outras áreas médicas na busca por melhorias nos diagnóstico. O projeto, uma iniciativa interinstitucional em andamento, está organizado de acordo com os seguintes eixos temáticos:
organização da informação, aquisição de conhecimento, visualização da informação e segurança da informação. No presente artigo, descreve-se o projeto, discutem-se resultados parciais significativos, bem como expectativas para continuidade da pesquisa.
Palavras-chave: ontologias, representação da informação, recuperação da informação, hematologia, sangue humano
1- INTRODUÇÃO
O avanço das tecnologias da informação e da comunicação vem causando grande impacto na condução da prática médica. Sistemas de informação são capazes de manipular grandes volumes de
dados e de processá-los automaticamente, trazendo novos insights para pesquisadores e profissionais de saúde. O processamento e a recuperação da informação são dependentes da qualidade e da uniformidade dos dados registrados em prontuários e sistemas de informação clínicos, uma vez que
a terminologia médica é abrangente e complexa (KITANO, 2002). É comum, por exemplo, que o
mesmo termo tenha diferentes significados de acordo com o contexto, o que sabidamente dificulta
a interpretação e recuperação. Em um documento sobre células-tronco, o termo “pluripotente” pode
ter mais de um significado caso se faça referência a células em estado embrionário ou células adultas (GOLDSTEIN e SCHNEIDER, 2010). Este tipo de problema, dentre outros, tem sido enfrentados pela Ciência da Informação já há anos (BOWKER, 1998).
1 Todos os autores trabalharam igualmente.
GT2
371
Os esquemas de classificação utilizados em medicina têm um papel essencial na organização da informação médica. A Classificação Internacional de Doenças (CID) (OMC, 2010), por exemplo, permite realizar comparações entre taxas de mortalidade internacionais, contribuindo para o entendimento das causas de doenças. Com o advento da Internet e a disseminação massiva de dados, os esquemas de classificação, ainda que responsáveis em larga escala pela organização da informação médica, têm sido utilizados para fins para os quais não foram projetados, por exemplo, para organizar dados para o processamento automático de um volume de material produzido, diariamente, em medicina. Um exemplo comum é o uso de descritores como “outro” ou “não classificado”, comum em esquemas de classificação bibliográficos, os quais inserem ambiguidades e dificultam o processamento automático. De fato, existem diferenças entre instrumentos de organização da informação conforme se pretenda que sejam utilizados por pessoas ou por sistemas e computadores (ALMEIDA, SOUZA e FONSECA, 2011). Por exemplo, para interpretar a descrição correspondente a um código denominado CID-10 D72.8 – outros transtornos especificados dos glóbulos brancos – é preciso ter uma visão do todo sobre os transtornos dos glóbulos brancos listados no CID-10. Na presença de um especialista, tais questões parecem triviais. Entretanto, para criar definições úteis no contexto dos sistemas médicos rigor é necessário adicional na descrição de termos e relações. Situações desse tipo são comuns, como por exemplo, os itens D75 – outras doenças do sangue e dos órgãos hematopoiéticos, e D76 – algumas doenças que envolvem o tecido linforreticular e o sistema retículo-histiocítico. Nesse contexto, uma alternativa que tem sido adotada para representar a informação é uso de princípios formais, baseados em fundamentos ontológicos utilizados pela Filosofia. Em condições ideais, os termos são definidos sem superposições e ambiguidades, em um tipo de estrutura que se convencionou chamar de “ontologia” (AITKEN, WEBBER e BARD, 2004; BAKER et al 1999; KUMAR e SMITH, 2002). Ontologia é um termo com origens na Filosofia, que tem sido usado em Ciência da Informação para descrever um vocabulário formal composto por termos e relações organizados de acordo com princípios filosóficos. Ontologias são resultados de esforços de pesquisas interdisciplinares, e tem gerado modelos que podem ser usados em aplicações capazes de lidar automaticamente com a informação produzida massivamente em medicina (SMITH, 2003; GUARINO, 1998; SOWA, 2000). Neste contexto, o presente artigo descreve um projeto de pesquisa em andamento, denominado Blood Project, para organização da informação no campo da hematologia e hemoterapia. Para tal descrevem-se eixos temáticos do projeto, apresentam-se e discutem-se resultados parciais de pesquisa. Os eixos temáticos são: organização da informação via ontologias, aquisição do conhecimento de especialistas, aquisição de conhecimento 2 de documentos médicos, visualização da informação e segurança da informação. Nesse contexto, a mais importante atividade diz respeito ao desenvolvimento de ontologias.
2 A expressão “aquisição do conhecimento” é de uso comum na área de sistemas (vide seção 2.2).
GT2
372
O restante do presente artigo está organizado conforme segue: a seção 2 apresenta uma visão
geral do projeto; a seção 3 apresenta resultados parciais de pesquisa; a seção 4 discute os resultados parciais à luz de problemas verificados no contexto médico em estudo; a seção 5 apresenta considerações finais e expectativas de desenvolvimentos futuros.
2- VISÃO GERAL DO BLOOD PROJECT
O Blood Project 3 é uma iniciativa interinstitucional que envolve instituições nacionais (Fundação Hemominas 4 e Universidade Federal de Minas Gerais 5 ) e internacionais (New York Center
of Excellence of Bioinformatics and Life Sciences 6 ). O projeto tem por objetivos duas contribuições principais, uma de caráter social e outra de caráter científico.
A contribuição social reside no fato que os resultados serão utilizados por instituição de saúde
de utilidade pública, a Fundação Hemominas. Essa instituição é o segundo maior banco de sangue do país, responsável por serviços de hematologia e hemoterapia no estado de Minas Gerais. O resultado prático mais evidente é o vocabulário resultante da etapa de organização do conhecimento, bem como os desdobramentos provenientes do processo de seu desenvolvimento na instituição. Do ponto de vista científico, a contribuição para o campo da informação é representada por uma nova instância de pesquisa que relaciona medicina e organização da informação. O projeto consiste de cinco eixos temáticos, os quais norteiam a pesquisa:
|
1. |
Organização da informação: consiste no desenvolvimento de uma ontologia sobre aspectos básicos da fisiologia do sangue humano, produtos do sangue, documentos da área de hematologia, processos de hemoterapia, dentre outros; |
|
2. |
Aquisição de conhecimento de especialistas: pesquisa conduzida com especialistas em hematologia (médicos, biólogos, pesquisadores, estudantes e professores); |
|
3. |
Aquisição do conhecimento de textos: uso de técnicas de processamento de linguagem natural e estabelecimento de parâmetros específicos para a literatura sobre sangue; |
|
4. |
Visualização da informação: pesquisa e desenvolvimento de ferramentas centradas no usuário, visando processos de avaliação e alinhamento de ontologias; |
|
5. |
Segurança da informação: identificação de problemas de segurança de dados em uma instituição de saúde, do ponto de vista da tríade pessoas-processos-tecnologia. |
|
6. |
|
No restante da presente seção, esses eixos temáticos são descritos de acordo no escopo do desenvolvimento do projeto. A seção 3 descreve resultados parciais obtidos em cada caso.
|
3 |
Disponível na Internet em: <http://mba.eci.ufmg.br/blood/>. Acesso em: 22/04/2011. |
|
4 |
Disponível na Internet em: < http://www.hemominas.mg.gov.br >. Acesso em: 28/07/2011. |
|
5 |
Disponível na Internet em: <http://www.ufmg.br>. Acesso em: 1/08/2011. |
|
6 |
Disponível na Internet em: <http://www.bioinformatics.buffalo.edu/>. Acesso em: 1/08/2011. |
GT2
373
2.1- Organização da informação: a ontologia do sangue
A Blood Ontology 7 (BLO) é um vocabulário formal, em desenvolvimento, abrangendo o conhecimento especializado sobre hematologia, hemoterapia, e doenças relacionadas ao sangue humano. A criação de um conjunto específico de recursos de informação sobre o sangue objetiva lidar com a complexidade e a variedade das questões presentes nesse contexto. Além disso, visa proporcionar uma infra-estrutura de sistemas para auxiliar especialistas no âmbito institucional e profissional. Para lidar com a complexidade do assunto, a BLO foi organizada em um conjunto de sub-vocabulários distintos, conforme segue:
BLO-Core: ontologia para representar o conhecimento básico essencial, necessário para lidar com hematologia ;
BLO-Management: ontologia para representação dos processos da hemoterapia, abrangendo serviços usuais em bancos de sangue;
BLO-Products: ontologia para representar os produtos originados da manipulação do sangue humano, os quais são usados em hospitais e unidades de saúde;
BLO-Administrative: ontologia que representa a variedade de documentos oficiais relacionados ao sangue, bem como sua manipulação e uso.
O desenvolvimento da BLO adota os seguintes pressupostos como diretrizes de desenvolvimento: alinhamento com iniciativas internacionais, reuso de informações, aquisição de conhecimento com especialistas e uso de princípios ontológicos. A premissa de alinhamento com iniciativas internacional fomenta a integração da terminologia brasileira à internacional. A BLO se fundamenta em experiências anteriores bem consolidadas com destaque para aquelas pertencentes ao OBO Foundry 8 , um repositório digital que reúne mais de oitenta vocabulários biomédicos (dados de 2011). Os recursos OBO são submetidos à auditoria e verificação, constituindo-se finalmente em fontes relevantes para o projeto de sistemas de recuperação da informação médica. Exemplos de vocabulários formais nesse estágio são a Gene Ontology 9 , a Protein Ontology 10 e a Cell-Type Ontology 11 . A fundamentação ontológica está implícita na adoção da Basic Formal Ontology (GRENON, SMITH e GOLDBERG, 2004) como modelo, uma iniciativa internacional criada para uniformizar a terminologia de pesquisa científica biomédica. O nível de formalidade adotado é variável, exibindo desde um estágio semi-formal, adequado à fase de aquisição de conhecimento; até um estágio semi- formal para sistemas (ALMEIDA, 2006).
|
7 |
Disponível na Internet em : <http://mba.eci.ufmg.br/BLO/>. Acesso em: 20/11/2010. |
|
8 |
Disponível na Internet em : <http://www.obofoundry.org/ >. Acesso em: 30/10/2010. |
|
9 |
Disponível na Internet em : <http://www.geneontology.org/>. Acesso em: 22/10/2010. |
|
10 |
Disponível na Internet em: <http://pir.georgetown.edu/pro/> . Acesso em: 23/10/2010. |
|
11 |
Disponível na Internet em: <http://www.obofoundry.org/>. Acesso em: 3/11/2010. |
GT2
374
O reuso de informações é possível através da abordagem experimental denominada Minimal Information to Reference External Ontology Terms (MIREOT). O MIREOT (COURTOT et al., 2009) foi desenvolvido como parte do projeto da Ontology for Biomedical Investigations (OBI CONSORTIUM, 2010) e oferece ferramentas para interligar conjuntos de dados biomédicos. A FIG. 2 apresenta tela do Ontofox 12 , o qual implementa a abordagem MIREOT em uma interface web.
Fig. 1: Tela do OntoFox utilizado para reuso de dados
2.2- Aquisição de conhecimento de especialistas
Investigar como o conhecimento produzido por especialistas é traduzido em conhecimento de um campo científico, bem como os meios para organizá-lo e representá-lo é atividade essencial no âmbito da pesquisa. A expressão “aquisição de conhecimento” tem sido empregada desde a década de 1980 para se referir as formas de se obter expertise para representação em sistemas especialistas (BOOSE e GAINES, 1989; MILTON et al, 2006). Compreende um conjunto complexo de atividades que empregam teorias e métodos provenientes de campos diversos, com destaque para Ciência da Computação (NEWELL e SIMON, 1975), Ciência Cognitiva (HAWKINS, 1983), Linguística (HARRIS, 1976), Semiótica (CAMPBELL, 1998) e Psicologia (KELLY, 1955). A aquisição de conhecimento no Blood Project consiste das seguintes atividades: i) a coleta de termos a partir da visão de especialistas; ii) organização preliminar do conhecimento médico; iii)
12 Disponível na Internet em: <http://ontofox.hegroup.org/>. Acesso em: 10/12/2010.
GT2
375
conexão entre os termos via relacionamentos hierárquicos e partitivos; iv) validação de termos por especialistas.
Fig. 2: tela do BLO-KAE 13 (Blood Ontology Knowledge Acquisition Environment)
Um roteiro experimental para aquisição, foi inicialmente proposto, ao longo do qual foram identificadas questões e problemas peculiares da biomedicina, com o objetivo de propor melhorias. O roteiro de tarefas para AC contempla três fases principais: i) levantamentos: compreende identificação de especialistas, do conhecimento que produzem e das fontes científicas das quais fazem uso; ii) contatos: consiste de entrevistas com especialistas, utilizando como parâmetro um template do Protegé- Frames baseado em Scheuermann et al (2009); iii) validação: utiliza ferramentas colaborativas wiki para análise de termos candidatos à ontologia, bem como de suas definições (FIG. 2).
2.3- Aquisição do conhecimento de textos
O fluxo de informações nas instituições de saúde, em geral, está registrado em papel ou meios digitais na forma de um registro eletrônico do paciente. Apesar do uso de registros eletrônicos não ser ainda uma realidade em muitas instituições, é possível observar tendências no sentido de adotar um padrão, por exemplo, no Brasil para prontuários médicos (ver OpenEHR 14 ). Uma das vantagens do armazenamento digital é a facilidade nas buscas e consultas, possibilitando melhorias na recuperação da informação. Sistemas de informação das instituições de saúde, em geral, apresentam restrições que limitam a recuperação automática, a qual é uma quase exigência frente ao grande volume de dados a tratar. Uma restrição, por exemplo, reside no fato de que registros eletrônicos tais como anamnese, resultado
|
13 |
Disponível na Internet em: <http://mbaserver.eci.ufmg.br/BLO-wiki/>. Acesso em: 1/08/2011. |
|
14 |
Open Eletronic Health Records. Disponível em: <http://www.openehr.org/>. Acesso: 22/08/2010. |
GT2
376
dos exames laboratoriais, laudos e prescrições, estão registrados em texto, sob a forma de narrativas, e não em uma forma estruturada. Segundo Friedman e Hripcsak (1999), há duas abordagens principais para extrair e representar informação de narrativas médicas: i) abordagem manual, na qual pessoas capacitadas extraem dados e os correspondem com os descritores de terminologia médica (por exemplo, o SNOMED Clinical Terms) 15 ; ii) abordagem automática, em que sistemas de processamento de linguagem natural (PLN) extraem dados de registros médicos. No âmbito do projeto, as duas abordagens têm sido aplicadas em momentos distintos, a partir da possibilidade de lidar com registros eletrônicos ou não. A arquitetura apresentada na FIG.3 descreve a inserção das técnicas de PLN no escopo de pesquisa do Blood Project. Cabe observar que os tipos de dados da parte inferior da figura permanecem na forma de textos, e sujeitos a tratamento via PLN.
Fig. 3: Arquitetura de sistema de informação médico, centrada em registros
2.4- Visualização da informação
As técnicas de visualização de informação recebem diferentes denominações de acordo com o campo de pesquisa em que são empregadas: visualização científica, visualização geográfica, visualização de negócios, visualização de software, dentre outras. As principais modalidades de técnicas para visualização são as bidimensionais (LUZZARDI, 2003), tridimensionais (KATIFORI et al. 2007), multidimensionais (GRÉGIO, FILHO e MONTES, 2009), e hierárquicas (LIMA, 2007). Nessa última, incluem-se as técnicas de visualização de ontologias. Softwares para visualização de ontologias têm proliferado junto ao desenvolvimento crescente de ontologias. Exemplos de ferramentas desse tipo são plug-ins do editor de ontologias Protégé como
15 Recurso da US National Library of Medicine. Disponível em: <http://www.nlm.nih.gov/research/umls/Snomed/
snomed_main.html>. Acesso: 20/02/2010.
GT2
377
o Ontoviz, o Jambalaya e o TGViz; além de softwares como o OntoSphere, o OntoTrack, o GoSurfer
e o Ozone (KATIFORI et al., 2007). No âmbito do projeto, tem sido desenvolvida e testada uma ferramenta para alinhamento e avaliação de ontologias, como o objetivo de auxiliar o responsável pela construção da ontologia. Trata-se de uma ferramenta orientada ao usuário, que faz uso de teorias de diversas áreas, como Ciência da Informação, Computação e Ciência Cognitiva.
2.5- Segurança da informação
Segurança da informação é uma questão multifacetada, que inclui variáveis diversas interagindo em um ambiente único. Uma instituição demanda confidencialidade frente aos riscos, ameaças e vulnerabilidades, sem perder a disponibilidade da informação. A tecnologia da informação está envolvida na maioria das soluções para a segurança da informação. Sistemas, contudo, são projetados, implementados e operados por pessoas. O fator humano é determinante nas formas como os sistemas de informação são usados nos processos institucionais (LACEY, 2009). De fato, são pessoas que proporcionam segurança física, concedem acesso aos sistemas, causam, relatam e gerenciam a resposta das instituições frente às violações e incidentes de segurança. Uma proposta efetiva de segurança da informação é uma abordagem abrangente. Segundo Sveen, Torres e Sarriegi (2009), o desenvolvimento de um plano estratégico de segurança da informação efetivo depende de três aspectos: i) pessoas, como formadoras da cultura organizacional; ii) processos, como condutores do fluxo informacional; e iii) tecnologias, ferramentas que sustentam processos e necessidades dos usuários. No âmbito do Blood Project, a pesquisa em segurança da informação biomédica avalia documentos participantes de processos, pessoas envolvidas e a tecnologia que permeia toda a instituição de saúde. Consiste de três etapas principais: i) organização de dados registrados em documentos e sistemas, compreendendo a organização dos documentos e dos relatórios gerados por sistemas, por conteúdo e proveniência; padronização de documentos; e redesenho de processos; ii) organização da informação especializada, atividade em que se obtém com especialistas as informações sobre suas atividades, sobre os documentos que utilizam, sobre as práticas organizacionais e pesquisas científicas em andamento; iii) criação de terminologia preliminar sobre segurança, etapa, na qual, os dados são obtidos agrupando-se termos candidatos a conceitos e verbos candidatos às relações na ontologia.
3- RESULTADOS
A presente seção descreve resultados parciais de pesquisa de cada eixo temático do projeto, obtidos até a data de publicação do presente artigo. Os resultados são apresentados de acordo com os tópicos que descrevem o projeto na seção 2.
GT2
378
3.1- Resultados sobre a organização da informação
O desenvolvimento da BLO é um projeto de longo prazo, e se encontra na fase de aquisição
de conhecimento. O conhecimento de especialistas tem sido reunido e organizado em uma estrutura
preliminar semi-formal. As métricas do vocabulário apontam quase mil termos e relações definidos no subconjunto denominado BLO-Core (FIG.4).
O conteúdo do vocabulário objeto de pesquisa é especializado em quatro temas principais
conforme descrito na seção 2:
BLO-Core: contém dados sobre aspectos fisiológicos essenciais para a prática da hematologia, como por exemplo, DNA e RNA, genes, proteínas, aminoácidos, bases, enzimas; além das bases moleculares, imunológicas e celulares do sangue;
BLO-Management: abrange processos que tem lugar em bancos de sangue, ao longo das atividades de manipulação do sangue, por exemplo, sistemas de qualidade para bancos de
sangue, processo de seleção de doadores, coleta de sangue; procedimentos de teste sanguíneo e sorologia de grupos sanguíneos (AABB, 2005).
BLO-Products: inclui produtos derivados do processamento de sangue em escala mundial, como por exemplo, concentrado de células vermelhas, plasma fresco e congelado, concentrado de plaquetas, crioprecipitados (ICCBBA, 2010).
BLO-Administrative pesquisa a documentação oficial de interesse de bancos de sangue, como por exemplo, políticas de agências regulatórias (Organização Nacional de Acreditação 16 ), legislação (Ministério da Saúde), documentos de associações profissionais, sistemas de classificação e padrões (ISBT-128) 17 .
Fig. 4: Tela de resultados da ontologia com dados sobre anemia hemolítica
|
16 |
Disponível em: <https://www.ona.org.br/>. Acesso em: 15/03/2011 |
|
17 |
Disponível em: <http://iccbba.org/>. Acesso em: 20/02/2010. |
GT2
379
3.2- Resultados da aquisição de conhecimento com especialistas
A aquisição de conhecimento de especialistas tem sido realizada, na verdade, ao longo de todo o projeto. Não se trata de uma etapa definida, mas sim que ocorre simultaneamente a outras. A atividade gera dados para desenvolvimento da etapa de organização da informação (FIG. 5), tendo como resultado quase mil termos e definições, conforme citado na seção 3.1.
Fig.5: template do Protegé-Frames com dados parciais sobre a doença do sangue
A atividade resulta ainda em um mapeamento das competências dos principais especialistas da instituição (FIG.6), bem como um levantamento de problemas comuns à atividade. No estágio atual, os primeiros entrevistados são especialistas do grupo de pesquisa sobre HTLV (vírus linfotrópico de células T humanas) da Fundação Hemominas.
|
Experts (*) |
A. B.C.F. |
M.A R. |
D.U.G. |
E.F.B. |
|
Formação |
Médico |
Médico |
Médico |
Veterinário |
|
Atuação |
Pesquisa |
Pesquisa e |
Pesquisa e |
Pesquisa e |
|
Medicina |
Ensino |
ensino |
||
|
Especiali-dade |
Hemoterapia |
Infectologia |
Infectologia |
Microbiologia |
|
Virologia |
Epidemiologia |
Med. Tropical |
Virologia |
|
|
Epidemiologia |
Epidemiologia |
Otoneurologia |
- |
|
|
Linhas de |
||||
|
Pesquisa |
Hematologia |
Infectologia |
Infectologia |
- |
|
Virologia |
- |
- |
Virologia |
Fig. 6: Extrato do levantamento de especialistas para atividade de AC
(*) os especialistas são aqui identificados por códigos
Exemplos de dificuldades encontradas ao longo da pesquisa, os quais têm sido registrados para estudos sobre usos e necessidades de informação de especialistas em medicina, são: i) a curva de aprendizado na biomedicina é longa e complexa; ii) o assunto é multidisciplinar e os especialistas atuam em subdomínios: existem poucos especialistas para consulta e eles são super-especializados;
GT2
380
iii) entidades de alto nível da ontologia nem sempre encontram respaldo no dia a dia do especialista, o que dificulta o diálogo.
3.3- Resultados da aquisição do conhecimento em textos
O uso de técnicas de PLN no Blood Project ainda é incipiente. Até o momento, os termos usados nas ontologias em desenvolvimento são provenientes de técnicas manuais, conforme mencionado na
seção 2.2 e 2.3. Os resultados parciais significativos, referentes à aquisição de textos, correspondem ao conjunto de observações realizadas ao longo dos experimentos sobre a especificidade do domínio da hematologia para fins de extração automática. Cabe destacar as seguintes observações:
Os vocabulários especializados médicos apresentam menos variações que narrativas, do ponto
de vista sintático de complexidade semântica;
Uma prática comum em vocabulários médicos consiste em criar novos termos para designar
as descobertas dos cientistas, como uma nova célula ou um novo vírus;
Textos médicos têm caráter eminentemente descritivo e narrativo, são compostos por um número de termos técnicos de uso restrito e super-especializados por domínio, evidenciando a necessidade de vocabulários específicos por área.
3.4- Visualização da informação
O protótipo previsto para auxílio na avaliação e alinhamento de ontologias está em teste.
A programação da ferramenta envolve as linguagens Python, C++ e JavaScript, e no servidor de
aplicativos Zope. Consiste de dois módulos distintos e independentes: um módulo local e um módulo de interface web.
O módulo local proporciona pesquisa na ontologia ao traduzir a estrutura Ontology Web
Language (OWL) em Java Script Object Notation, um formato de intercâmbio, e enviar os dados
à interface de visualização. O módulo local também faz uso da biblioteca libxml2 (do C++), a qual
executa o parser do arquivo OWL carregado pelo módulo de interface web. O arquivo de entrada é um arquivo texto, transformado em estrutura de dados (árvore) e consultado por métodos desenvolvidos em Python. O módulo de interface web é responsável por carregar a ontologia, pela apresentação dos dados
(forma textual e gráfica) e pelo recebimento dos termos de busca. Além disso, transmite dados para
o módulo local, onde são processados pelo parser. O módulo interface web é composto por sub-
módulos de busca, de apresentação dos dados textuais e gráficos, fazendo uso do Zope e JavaScript
(Infoviz ToolKit). Uma tela do estágio de desenvolvimento das técnicas de visualização no projeto, mostrando exemplo de duas ontologias sendo alinhadas, é apresentada na Fig.7:
GT2
381
Fig. 7: tela do protótipo com alinhamento experimental
3.5- Resultados sobre segurança da informação
A pesquisa sobre segurança na informação se encontra em estágio que se convencionou chamar de “terminológico” (ALMEIDA, 2006), ou seja, um estágio de organização preliminar de dados. A Fig. 8 resume as entidades consideradas básicas sobre segurança, além de uma descrição obtida no âmbito da organização de saúde.
|
Entidade |
Descrição |
|
Organização |
Organização é uma entidade social composta por recursos materiais e humanos, e caracterizada por objetivos, procedimentos de controle e limites. Ex. pública, privada. |
|
Atributo de |
Atributo de segurança caracteriza um ativo e diz respeito a requisitos de segurança sobre tal ativo. Pode ser um atributo de confidencialidade, ou de integridade. |
|
segurança |
|
|
Ativo |
Ativo é um bem da organização, seja físico ou imaterial, utilizado pelos seus membros para alcançar os objetivos estipulados. Ex. um, um sistema, um documento. |
|
Controle |
Controle é um procedimento sistematizado para atenuar vulnerabilidades, bem como para estabelecer medidas preventivas e corretivas com vistas à proteção de ativos. |
|
Ameaça |
Ameaça é uma possibilidade de dano aos ativos da organização, que afeta atributos de segurança e explora vulnerabilidades. Ex. de origem humana ou natural. |
|
Vulnera- |
Vulnerabilidade é a situação caracterizada por falta de medidas de proteção e que possui um grau de severidade associado. Pode ser administrativa, técnica ou física. |
|
bilidade |
Fig. 8: Exemplos de termos e definições da ontologia de segurança
O conjunto terminológico, resultado parcial da pesquisa, é composto por mais de cento e sessenta termos representativos de conceitos no domínio da segurança da informação, bem como relações. Os termos estão distribuídos da seguinte forma: quinze tipos de ativo (por ex., móvel, sistema), quatro tipos de organização (por exemplo, pública), quinze tipos de atributos de segurança
GT2
382
(por ex. confiabilidade), mais de cinquenta tipos de ameaças (por ex., controle de servidores), e mais de quarenta tipos de vulnerabilidades (por ex. término de contrato de trabalho de colaborador).
4- DISCUSSÃO
Uma vez apresentados os eixos temáticos e os principais resultados parciais de pesquisa, cabe
agora discutir resultados e questões, destacando alguns dos problemas que justificaram a iniciativa. O restante da presente seção se ocupa dessa tarefa. Os tópicos em que o projeto foi organizado refletem questões inerentes à atividade de organização da informação, mas também necessidades específicas do contexto, ou seja, o domínio do conhecimento inserido no ambiente da instituição. Algumas dessas necessidades têm sido intensificadas devido a nova realidade, como por exemplo, o já mencionado aumento expressivo do volume de dados em medicina. Nesse sentido, as instituições têm exigido sistemas mais sofisticados em relação àqueles disponíveis há alguns anos. É preciso também destacar além da necessidade de tratamento automático, a crescente valorização do ser humano nas instituições, seja na aquisição de conhecimento, seja como elemento desencadeador de incidentes ou soluções em segurança, seja para
o uso de ferramentas (como as ferramentas de visualização) para auxiliar na busca por um consenso
científico. Cabe destacar que o desenvolvimento da ontologia tem sido o aspecto mais importante do trabalho, uma vez que para sua produção é necessário criar novas atividades ou incrementar as existentes no âmbito da instituição. Na verdade, construir uma ontologia, no sentido amplo, não considerando apenas o artefato computacional, mas considerando o conjunto de atividades, promove
a integração de importantes forças presentes na instituição (ALMEIDA e BARBOSA, 2009). Constata-se ainda, ao longo do projeto, que apesar da importância do sangue humano no âmbito da prática e da pesquisa médica, dados sobre a hematologia e hemoterapia continuam espalhados por diversas fontes distintas e heterogêneas. A iniciativa apresentada promove integração, facilitando a recuperação da informação por médicos, biólogos, pesquisadores e pessoal técnico em bancos de sangue.
Vocabulários formais biomédicos têm a importante função de definir consensualmente o significado de termos utilizados na prática e pesquisa médica (SMITH, 2006). Isso é possível justamente pela aquisição de conhecimento realizada diretamente com especialistas. Uma vez definidos e formalizados, os termos são organizados em uma estrutura computacional que possibilita
a recuperação automática da informação. Esquemas de classificação adotados em hematologia, como o já mencionado ISBT-128, nem sempre possibilitam representações ideais para processamento por sistemas automáticos. Tais esquemas mantêm uma interpretação “implícita” para o significado de códigos numéricos, tornando imprescindível a intervenção de especialistas e limitando as possibilidades de recuperação automática. Por exemplo, em um “distúrbio hemorrágico causado por anticorpos anti-fosfolípides”, a entidade
GT2
383
“distúrbio hemorrágico” é uma entidade complexa, constituída a partir de outros fatos elementares. Em um esquema de classificação, tal distúrbio pode ser considerado um tipo de “desordem”, ou uma “patologia relacionada a proteínas”, ou “desordem de sangue”, dentre outras possibilidades. Observa-se, entretanto, que conhecimento altamente especializado é necessário para entender este tipo de noção e que uma classificação ad-hoc pode comprometer a qualidade da representação. Tal conhecimento é obtido com um especialista, e é transposto na forma adequada a sistemas através de atividades já apresentadas no projeto. No caso apresentado, fatos implícitos ao conhecimento médico precisam ser explicitados visando tratamento automático, como por exemplo:
O sangramento é uma condição a qual um organismo humano pode ser submetido;
O sangramento pode ser causado por um distúrbio;
O sangramento pode ter consequências graves para seres humanos;
A proteína anti-fosfolípides é um anticorpo;
As proteínas são macromoléculas compostas de aminoácidos;
Os sangramentos podem ser causados por anticorpos da proteína anti-fosfolípides, ou de forma genérica, pelos anticorpos;
Manter todo esse conhecimento não é tarefa simples. Em muitos casos, não se percebe a complexidade da tarefa em função da presença de um especialista. Embora os esquemas de classificação no domínio médico são suficientes para a recuperação da informação por especialistas, nem sempre eles proporcionam a representação adequada para uso por sistemas automáticos. Apesar da variedade de vocabulários em desenvolvimento na biomedicina (SMITH et al., 2007), observa-se a inexistência de iniciativa dedicada exclusivamente a bancos de sangue. O Blood Project preenche esta lacuna ao propor vocabulários temáticos distintos, usados de acordo com necessidades específicas, mantendo a conexão com o conhecimento médico produzido internacionalmente através de outros vocabulários biomédicos fundamentais. Além disso, a ontologia desenvolvida no âmbito do projeto serve a diversos fins, como: fonte para desenvolvimento de sistemas interoperáveis, base de conhecimento para inferências computacionais, recurso educacional, repositório para registro de dados clínicos, dentre outros. Na investigação científica, o Blood Project foi concebido para se alinhar às pesquisas em omics, seguindo os mesmos princípios de anotações e descoberta de biomarcadores como os praticados no âmbito do PRO e GO já mencionados. Repositórios baseados em omics (por exemplo, PharmGKB 18 , EPO-KB 19 ) vêm recebendo uma atenção crescente como recursos para a pesquisa de questões patológicas. Na pesquisa em omics também existem iniciativas relacionadas com o proteoma do plasma, tais como o Plasma Proteome DataBase (PPD) 20 .
18 Pharmacogenomics Knowlegde base. Disponível em: http://www.pharmgkb.org/ Acesso: 25/10/2010
19 Empirical Proteomics Ontology Knowledge Base. Disponível em: http://www.dbmi.pitt.edu/EPO-KB Acesso: 25/10/2010
20 Plasma Proteome Database. Disponível em: http://www.plasmaproteomedatabase.org/ Acesso: 25/10/2010
GT2
384
Cabe ainda citar que o Blood Project considera a perspectiva dos fluidos humanos. A realização de diagnósticos utilizando fluidos não é uma novidade na medicina, como por exemplo, investigação
envolvendo a saliva e o sangue (YAN et al., 2009). No contexto de fluidos, a ontologia desenvolvida está conectada à Saliva Ontology (SALO) 21 , um vocabulário formal sobre saliva utilizada para recuperar e a integrar dados relativos à salivaomics entre vários campos de pesquisa (AI, SMITH e WONG, 2010). Investigam-se ainda tecnologias de diagnóstico salivar (clinicamente utilizadas) no escopo de atuação do grupo de pesquisa Salivaomics da University of California 22 .
O Blood Project ainda se vale de pesquisas em hematologia conduzidas pela Fundação
Hemominas, as quais enfatizam doenças do sangue como Von Willebrand, anemia falciforme, dentre outros. Além disso, um dos grupos de pesquisa da Fundação Hemominas tem concentrado seus esforços em pesquisas relacionadas ao histórico, diagnóstico e tratamento da infecção do vírus T-linfotrópico humano (HTLV). Esse cenário colaborativo é determinante para alcançar consenso entre vocabulários representativos do domínio de conhecimento da hematologia e adequados para ser utilizado em sistemas de informação automatizados.
5- CONSIDERAÇÕES FINAIS
O presente trabalho descreveu o Blood Project, uma iniciativa de longo prazo, em curso, e
desenvolvida com o objetivo de facilitar o acesso, uso e análise de dados sobre o sangue. Trata-se de uma iniciativa dedicada a atividades de hemoterapia e hematologia, conectando pesquisa e prática. A abordagem teórica contempla a colaboração com iniciativas internacionais, objetivando melhorias para o diagnóstico de doenças. A abordagem prática compreende a representação dos processos em bancos de sangue.
A importância desse tipo de projeto, sobre conhecimento especializado em medicina, reside
na constatação de que apesar de toda a evolução muitos processos biológicos não são completamente compreendidos. Em muitos casos, por causa dos limites da ciência, em outros por deficiências na organização da informação. Como explica Vickery (1997), existe uma grande proximidade entre os trabalhos na Ciência da Informação e na pequisa em ontologias, o que sugere benefícios no caso de colaboração entre as áreas. Expectativas de trabalhos futuros na continuidade do projeto envolvem: a especialização da ontologia de sangue por tipos de doenças; a conclusão e testes com usuários das ferramentas de visualização; o uso de técnicas para extração automática de termos (o que não significa abrir mão da organização intelectual); pesquisa quantitativa com funcionários da instituição de saúde envolvida para a definição dos fatores intervenientes na segurança da informação biomédica.
21 Saliva Ontology. Disponível em: http://www.skb.ucla.edu/SALO/ Acesso: 25/10/2010
22 Salivanomics. Disponível na Internet em http://www.hspp.ucla.edu/ Acesso: 25/10/2010
GT2
385
Agradecimentos
Essa pesquisa conta com o apoio da Fundação Hemominas (Belo Horizonte – MG).
Abstract. The medical terminology is comprehensive and complex, being plenty of ambiguity and different interpretations to specialized terms. This sort of problem, in addition to similar others, has been approached for years within the Information Science field. Despite the variety of vocabularies, thesaurus and glossaries available within biomedicine, we observe the lack of initiatives devoted to hematology and blood transfusion. The goal of this paper is to describe research about biomedicine formal vocabularies, which are based in ontological guidelines. Thus, we here present the Blood Project, an enterprise designed to facilitate the processes of retrieval, usage and analysis of data about blood, as well as to foster collaboration with other medical fields seeking for diagnostics improvements. The project, an underway inter-institutional initiative, is ordered according to themes as follows: information organization, knowledge acquisition, information visualization, and information security. In this paper, we describe the Blood Project, argue valuable findings, and offer our prospects for future work.
Key-words: ontologies, information representation, information retrieval, hematology, human blood
REFERÊNCIAS
AITKEN, J. S.; WEBBER, B. L.; BARD, J. B. Part-of relations in anatomy ontologies: a proposal for RDFS and OWL formalisations. Proceedings of the Pacific Symp Biocomput. 2004, p.166-77.
ALMEIDA, M. B. Um modelo baseado em ontologias para representação da memória organizacional. 316f. Tese (Doutorado em Ciência da Informação) - Escola de Ciência da Informação, Universidade Federal do Minas Gerais, Belo Horizonte, 2006.
ALMEIDA, M. B.; BARBOSA, R. R. Ontologies in knowledge management support - a case study. Journal of the American Society for Information Science and Technology, v. 60, n.10, p. 2032- 2047, 2009.
ALMEIDA, M. B.; SOUZA, R. R.; FONSECA, F. Semantics in the Semantic Web: a critical evaluation. Knowledge Organization Journal, v. 38, n.3, p. 187, 203, 2011
AMERICAN ASSOCIATION OF BLOOD BANKS. AABB Homepage. 2005. Disponível em:
<http://www.aabb.org/>. Acesso em: 20/11/2009.
AI, J.; SMITH, B. WONG, D. T. Saliva Ontology: an ontology-based framework for a Salivaomics Knowledge Base. BMC Bioinformatics. v. 11.2010;11:302, 2010.
BAKER, P.G.; et al. An ontology for bioinformatics applications. Bioinformatics. v. 15, p. 510-20,
1999
BOWKER, G. C. The history of information infrastructures: The case of the international classification ofdiseases. Information Processing and Management, v. 32, n.1., p. 49-62, 1996.
BOOSE, J. H; GAINES, B. R
state of the artg. 1989. Disponível em: <http://www.springerlink.com/content>.Acesso em: 20/10/2010.
Knowledge Acquisition for Knowledge-Based Systems: Notes on the
GT2
386
CAMPBELL K. E. et al. Representing thoughts, words, and things in the UMLS. Journal of the Americam Medical Information Association., v. 5, n. 5, p. 421–31, 1998.
COURTOT, M
Nature Precedings, v.6. 2009.
et al. MIREOT: the Minimum Information to Reference an External Ontology Term.
FRIEDMAN, C.; HRIPCSAK G. Natural language processing and its future in medicine. Academic Medicine, v. 74, n. 8, Agosto, 1999.
GOLDSTEIN, L.S.B.; SCHNEIDER, M. Stem Cells. Indianapolis: Wiley, 2010. 421 p.
GRENON, P.; SMITH, B; GOLDBERG, L. Biodynamic ontology: applying BFO in the biomedical domain. 2004. Disponível em: <http://ontology.buffalo.edu/medo/biodynamic.pdf>. Acesso em: 22/02/2008.
GRÉGIO, A. R. A., FILHO, B. P. C. e MONTES, R. S.
dados aplicadas à segurança da informação. 2009. Disponível em: <http://www.ppgia.pucpr.
br/˜maziero/lib/exe/fetch.php/ceseg:2009-sbseg-mc5.pdf>. Acesso em: 20/01/2009.
Técnicas de visualização de
GUARINO, N. Formal Ontology and Information Systems. 1998. Disponível em: <http://citeseerx. ist.psu.edu/>. Acesso em 4/10/2009.
HARRIS, Z. On a theory of Language. The Journal of Philosophy, v. 73, n. 10, p. 253-276, 1976.
HAWKINS, D. An analysis of expert thinking. International Journal of Man-Machine Studies. v. 18, p. 1-47, 1983.
ICCBBA. ISBT-128: Standard Terminology for Blood, Cellular Therapy, and Tissue Product Descriptions. 2010. Disponível em: <http://www.iccbba.org/ >. Acesso em 3/09/2010
KELLY, G. The psychology of personal constructs. New York: Norton, 1955. 152 p.
KATIFORI, A. et al. Ontology visualization methods. ACM Computer, v.50, n. 5, 2007.
KITANO, H. Computational systems biology. Nature, v.420. p.:206-210, 2002.
KUMAR A; SMITH B. The ontology of blood pressure; a case study in creating ontological partitions in biomedicine. 2002. Disponível em: <http://citeseer.ist.psu.edu/696679.html>. Acesso em 22/10/2010.
LACEY, D.(2009). Managing the human factor in information security. New York: Wiley, 2009.
384p.
LIMA, G. B. A. Gerenciamento do conteúdo semântico no protótipo mapa hipertextual-mhtx:
perspectivas. Anais do VII ENANCIB, 2007.
MILTON, N. R. Knowledge acquisition in practice: a step-by-step guide. Cranfield: Springer, 176p, 2007.
GT2
387
NEWELL, A; SIMON, H.A. Computer science as empirical inquiry: symbols and search. 1975. Disponível em: <http://citeseerx.ist.psu.edu/>. Acesso: 2 ago. 2010
OBI Consortium. Ontology for Biomedical Investigations. 2010. Disponível em: <http://obi- ontology.org/page/>. Acesso em 19/02/2011.
ORGANIZAÇÃO MUNDIAL DE SAÚDE (OMC). Classificação Internacional de Doenças (CID). 2008. Disponível em: http://cid10.datasus.gov.br/webhelp/cid10.htm/. Acesso em
19/02/2011.
SCHEUERMANN, R et al. Toward an ontological treatment of diasease and diagnosis. Proceedings of the 2009 Summit on Translational Bioinformatics, San Francisco, CA, pp. 116-120.
SVEEN, F. O.; TORRES, J. M.; SARRIEGI, J.
International Journal of Critical infrastructure Protection, v.2, p.95-109, 2009.
Blind Information Security Strategy.
SMITH, B. Ontology and information systems. 2003. Disponível em: <http://ontology.buffalo. edu/ontology_long.pdf>. Acesso em 19/02/2011.
SMITH, B. From concepts to clinical reality: An essay on the benchmarking of biomedical terminologies. Journal of Biomedical Informatics. V. 39, p. 288-298, 2006.
SMITH, B. et al. The OBO Foundry: coordinated evolution of ontologies to support biomedical data integration. Nature Biotechnology. v.25, p.1251-1255, 2007.
SOWA, J. F. Ontology. 2000. Disponível na Internet em: <http://www.jfsowa.com/ontology/>. Acesso em: 23/12/2008.
YAN, W. et al. Systematic comparison of the human saliva and plasma proteomes. Proteomics Clinical Applications. 2009 v. 3, p. 116-134, 2009.
GT2
388
COMUNICAÇÃO
ORAL
INDICADORES DE QUALIDADE DA INFORMAÇÃO EM SISTEMAS BASEADOS EM FOLKSONOMIA: UMA ABORDAGEM SEMIÓTICA
Juliana de Assis e Maria Aparecida Moura
Resumo: Este estudo teve por objetivo geral identificar, sistematizar e analisar as concepções que norteiam a composição dos indicadores de qualidade da informação em ambientes digitais colaborativos a fim de compreender o lugar atribuído à linguagem na validação dos conteúdos informacionais. A hipótese inicial considerou que ante o aspecto colaborativo das práticas de organização da informação contemporâneas, redes sociais criadas e potencializadas pelos Sistemas Baseados em Folksonomia contribuam para a formalização de indicadores de qualidade da informação. Foi utilizada na construção da metodologia uma triangulação de métodos e teorias, mediante o uso da Semiótica de matriz peirciana enquanto arcabouço teórico que possibilita a observação e compreensão dos fenômenos de linguagem e significação; da Netnografia como instrumento de identificação dos interesses, discursos e pertencimentos dos sujeitos e de caracterização das práticas informacionais desenvolvidas pelos mesmos; da Análise de Redes Sociais como auxilio teórico e metodológico que propicia o estabelecimento de recortes necessários ao universo empírico e a compreensão das dimensões estruturais e relacionais que constituem as formas de organização e atuação dos atores sociais no contexto digital. As unidades de observação empírica foram comunidades virtuais de prática, em âmbito nacional e internacional, que se agregam em torno dos temas Saúde e Jogos Digitais nos serviços de social bookmarking Delicious, Diigo e Stumble Upon. Foram visualizados e descritos como indicadores de qualidade da informação: a colaboração, a integração, a personalização, a renovação e a sedimentação da linguagem, o compromisso ontológico, a concepção semiósica e a relevância. Foram apontadas dimensões semióticas nesses ambientes. Concluiu-se que os agenciamentos da linguagem contribuem para o modo como o sujeito percebe e constrói a qualidade da informação por meio da proposição de percursos de significação, da captação e reprodução destes através de cenários semióticos e das ações colaborativas em que se destaca a curadoria de conteúdos.
Palavras-chave: Semiótica. Qualidade da Informação. Folksonomias. Colaboração. Redes sociais. Indicadores.
Abstract: The study is aimed at performing the identification, systematization and the analysis of concepts that guide the composition of information quality indicators in digital environments in order to approach the role given to language when validating informational content. The initiative hypothesis states that considering the collaborative characteristic of contemporary strategies for information organization, social networks that were created and maximized by Folksonomy Based- Systems should contribute to formalizing information quality indicators. It was used a triangulation of methods and theories through the use of Peircean Semiotics as a theoretical matrix that enables the observation and understanding of the phenomena of language and meaning; Netnography as an instrument for identifying interests, discourses and affiliations of the subjects and characterization of their informational practices. Social Network Analysis is used as a theoretical support to the
GT2
389
methodology that provides the establishment of necessary cuts to the empiric universe and the understanding of structural and relational dimensions that constitute ways of organization and interaction of social actors on digital environments. The empirical observation units are virtual communities of practice that congregate around themes such as Health and Digital Games in social bookmarking services Delicious, Diigo and Stumble Upon. The study describes and elucidates integration, personalization, renewal of language, sedimentation of language, ontological commitment, semiotic conception and relevance as quality indicators. Semiotics dimensions were highlighted in Folksonomy Based-Systems. In conclusion, the language contributes to the way the subject perceives and construes information quality through the proposal of signifying process, by capturing and reproducing those through semiotic scenarios and collaborative actions in which the content curation is highlighted
Keywords: Semiotics. Information quality. Folksonomy. Collaboration. Social networks. Indicators.
1 INTRODUÇÃO
Em um contexto de discussões crescentes na área de Ciência da Informação (CI) sobre a diversificação das ferramentas utilizadas para a organização e o compartilhamento de conteúdos informacionais no âmbito da Web 2.0, este trabalho buscou uma aproximação entre a Semiótica de matriz peirciana e a CI no que tange à abordagem e explicação dos fenômenos informacionais. As formas contemporâneas de produção, validação e uso da informação em contextos digitais, desafiam a dimensão social da CI, tanto no entendimento, quanto na sistematização de suas manifestações a partir da concepção do usuário enquanto o elemento ativo das alterações e remodelagens do ciclo informacional. A consolidação dos espaços digitais colaborativos de criação e compartilhamento de recursos informacionais tem se refletido na constante produção de inovações e na multiplicidade das funções desempenhadas pelos sujeitos, que alternam ou sincronizam papéis de produtores, validadores e consumidores de conteúdos. Assim, não apenas denominados “usuários”, estes sujeitos são visualizados, principalmente após a emergência da fase “2.0” da web, como atores que se articulam através das redes sociais mediadas por computadores caracterizadas, sobretudo, pelo imbricamento estrutural 1 . Na concepção de aplicações e serviços Web 2.0 percebem-se, além do apelo mercadológico, inúmeras tentativas que objetivam estimular e potencializar as interações sociais on-line. Desse modo, a noção de rede, conceito elementar aos seres vivos, tanto em aspectos biológicos, quanto em aspectos sociais, ganha centralidade enquanto instrumento de análise e considerações relacionadas à redefinição de seus efeitos sobre a produção e disseminação da informação no âmbito da apropriação de novas Tecnologias de Informação e Comunicação (TICs) fazem-se necessárias. A problemática na qual esta pesquisa se insere, questionou se as abordagens convencionais do conceito de qualidade da informação atendem a um contexto caracterizado pela interatividade,
|
1 |
Conceito oriundo da metodologia de ARS que denota a participação de um indivíduo em diversas redes sociais on- |
|
line . |
|
GT2
390
colaboração e trocas simbólicas constantes, mediadas pela arquitetura de redes sociais, no qual o usuário passa a atuar como sujeito, que não apenas utiliza, mas também produz, remodela e qualifica os conteúdos através da linguagem. Foram consideradas abordagens convencionais da qualidade da informação, aquelas que emergem de estudos cuja característica preponderante é a listagem de uma grande quantidade de critérios originários de pesquisas quantitativas e centradas no sistema. Destaca-se nestes estudos, a influência de uma perspectiva top-down, na qual há um modelo dominante de validação de publicações científicas em que o conteúdo é avaliado e qualificado por especialistas e entidades para depois ser publicado aos usuários finais. Contudo, as redes telemáticas e os dispositivos computacionais se mostram cada vez mais integrados e ubíquos no cotidiano das pessoas. Através de dispositivos como smartphones e câmeras
digitais elas produzem textos, fotos e vídeos com possibilidades de publicação e replicação instantâneas na web. Isso altera a cadeia de validação e a eficácia de um modelo dominante em que o sujeito não é visto como criador e validador e sim como mero usuário. Argumenta-se que a preocupação com as alterações nos modos de produção, disseminação e validação dos conteúdos informacionais à luz do constante desenvolvimento e apropriação das TICS se reflete no grande percentual de artigos de revisão identificados na literatura sobre a qualidade da informação. Dentre os quais destacamos: Nehmy e Paim (1998); Eppler e Wittig (2000); Knight e Burn (2005) e Parker et al. (2006). A partir da observação desse cenário e do desenvolvimento de uma revisão de literatura que estabeleceu um panorama dos estudos sobre a qualidade da informação na web, foram feitos os questionamentos norteadores desta pesquisa. Como os agenciamentos da linguagem contribuem para
o modo como o sujeito percebe a qualidade da informação? Seria possível abordar a qualidade da
informação em sua dimensão sígnica? Acredita-se nessa possibilidade se a mesma for considerada como um processo no qual os sujeitos desempenham um papel crucial. Ante o aspecto colaborativo das práticas de organização da informação, no qual a dimensão da linguagem aparece como um vetor estratégico para que o conteúdo informacional atue como um
catalisador das relações sociais, considerou-se a possibilidade de que as redes sociais contribuam para
a formalização de novos indicadores de qualidade da informação. Assim, esta pesquisa teve como objetivo geral identificar, sistematizar e analisar as concepções que norteiam a composição dos indicadores de qualidade da informação em ambientes digitais colaborativos que adotam a folksonomia, com o objetivo de compreender o lugar atribuído à linguagem na validação dos conteúdos. A folksonomia é vista como o resultado da indexação social e uma alternativa às formas
tradicionais de organização da informação em ambientes digitais. O termo, cunhado pelo arquiteto da
informação Thomas Vander Wal em 2004, designa uma classificação popular resultante da ação de se
GT2
391
atribuir uma tag 2 a um determinado conteúdo, dotado de uma URL, em ambientes abertos, para fins de recuperação da informação (VANDER WAL, 2007). Os sistemas ou aplicações que adotam folksonomias denotam a maximização da autonomia dada aos sujeitos e manifestam o potencial das redes sociais na produção de metadados agregados de contextualizações que organizam e compartilham os conteúdos e viabilizam conexões entre os atores sociais. Esses sistemas se enquadram num movimento de aperfeiçoamento constante, a partir da incorporação das experiências de seus usuários, além de explorarem o mercado voltado para o aproveitamento da inteligência coletiva e para o marketing viral e segmentado. Eles seguem uma tendência de personalização da recuperação da informação na web. Ressalta-se que as pesquisas não apontam consensos sobre a denominação de sistemas e aplicações que viabilizam e utilizam a folksonomia. São citados na literatura de diversas maneiras, dentre as quais destacamos: Ferramentas de Social Bookmarking 3 , Sistemas de Etiquetagem Social 4 , Sistemas de Etiquetagem Colaborativa 5 , Sistemas de Classificação Social 6 e Sistemas de Classificação Distribuída 7 . Contudo, neste trabalho, optou-se por denominá-los Sistemas Baseados em Folksonomia (SBFs) conforme (NORUZI, 2006) e (BASSO; SILVA 2008). A partir da observação das folksonomias intuiu-se que o surgimento de alterações nas formas de validação e mediação dos conteúdos informacionais nos contextos digitais colaborativos, evidencie potencialidades que contribuam para uma nova abordagem da qualidade da informação que considere a atuação das redes sociais na web e as manifestações da linguagem. Acredita-se que estudos sobre a composição de indicadores de qualidade da informação na web forneçam elementos inovadores para a concepção de ferramentas que considerem a fluidez e a mutabilidade da informação no meio digital, bem como a variedade de papéis que são desempenhados pelos sujeitos enquanto produtores, mediadores e consumidores desta. O percurso investigativo sintetizado neste trabalho apontou que as pesquisas sobre a qualidade da informação na web necessitam de abordagens que reconheçam esse ambiente como um espaço de articulação dos processos de significação e de evidenciação das dinâmicas de produção e compartilhamento de significados. Ele permitiu destacar que a principal contribuição da Semiótica peirciana aos estudos sobre qualidade da informação é evidenciar que os mesmos devem enfocar os processos e não os produtos finais.
2 QUADRO TEÓRICO-METODOLÓGICO
Na relação das folksonomias com a qualidade da informação, observou-se a saliência de três
|
2 |
Uma tag é uma palavra-chave extraída da linguagem natural de modo intuitivo. |
|
3 |
Social Bookmarking Tools (VAN HOOLAND, 2006). |
|
4 |
Social Tagging Systems (TRANT, 2009). |
|
5 |
Collaborative Tagging Systems (KIPP; CAMPBELL, 2006). |
|
6 |
Social Classification Systems (FEINBERG, 2006). |
|
7 |
Distributed Classification Systems (PIKER, 2009) |
GT2
392
elementos principais: as redes sociais, a linguagem e a colaboração. Buscou-se uma abordagem
integrativa desses fenômenos com os propósitos de descrição, explicação e interpretação. Entretanto
o estado da arte de um campo de conhecimento ou de uma temática dentro deste
campo é que irá delinear as possibilidades e limites da descrição, da explicação e da interpretação” (FROTA, 2007, p. 49). Devido ao tipo de questionamento proposto e às características do universo empírico, optou- se pela pesquisa qualitativa e pela triangulação de métodos e teorias. A pesquisa qualitativa é uma modalidade de investigação científica que se volta para a abordagem de fenômenos em que a
subjetividade, a significação, as estruturas e processos sociais se fazem presentes, constituindo um nível da realidade em que dificilmente se obtém compreensão com o uso de abordagens quantitativas (MINAYO, 2009). Já a triangulação de métodos é indicada por Flick e Costa (2009) quando a insuficiência de uma abordagem metodológica ante a uma questão de caráter complexo exige o uso de dois ou mais métodos de pesquisa. A triangulação desenvolveu-se mediante articulações teóricas e metodológicas da Semiótica, da Netnografia e da Análise de Redes Sociais. A Semiótica de Charles Sanders Peirce é uma Teoria da significação concebida com elevado
nível de generalização e abstração. Enquanto abordagem teórica, ela é “[
possíveis de signos, verbais, não-verbais e naturais, seus modos de significação, de denotação e de informação; e todo o seu comportamento e propriedades” (SANTAELLA; NÖTH, 2004, p.76). O signo é uma entidade abstrata que exerce diferentes formas de mediação. De modo genuíno, ele representa algo para alguém de alguma maneira ou intensidade (CP 2:228). Como perspectiva metodológica, a Semiótica fornece as categorias que possibilitam a análise dos processos de significação e cognição (SANTAELLA, 2002). Foram utilizadas neste estudo categorias semióticas que subsidiaram desde a escolha das ferramentas até a análise dos dados obtidos. Tais conceitos foram: semiose, experiência colateral, concepção semiósica e cenário semiótico. Por semiose, entende-se a dinâmica de caráter infinito em que ocorre a geração de signos mais
desenvolvidos a partir da ação de signos anteriores. Este processo pode ser moldado pela experiência
uma prévia familiaridade com aquilo que o signo denota”
colateral que nas palavras de Peirce é “[
o estudo de todos os tipos
salienta-se que “[
]
]
]
(CP 7:179). Ou seja, os processos de significação produzidos na mente de um sujeito ao se deparar com determinado signo tendem a ser infinitos e são moldados pela experiência ou conhecimento anterior que ele possa ter em relação ao que o signo representa. Numa perspectiva que se originou de um estudo semiótico do processo criativo, a concepção semiósica “É o modo como um primeiro sujeito tenta intervir na semiose do outro por intermédio da interação deste intérprete com uma dada estrutura semiósica construída pelo primeiro” (MOURA, 2002, p.65), neste sentido, a concepção semiósica é caracterizada pela intencionalidade de um sujeito ao conceber uma estrutura ou cenário semiósico com vistas a intervir na semiose do outro com o qual estabelece interação. Já o cenário semiótico,
GT2
393
“é a representação de uma estrutura genérica ou um modelo controlado para a especificação e a modelagem de um produto de informação” (STOCKINGER, 1999, p. 146). Ele é o contexto no qual são geradas as condições de acesso aos conteúdos informacionais baseadas no estímulo à sensibilidade dos sujeitos propondo um percurso de significação. Desse modo, manifesta-se nos arranjos sígnicos gerados tanto por desenvolvedores quanto pelos usuários do sistema ao descreverem e qualificarem os conteúdos através de tags e comentários. A abordagem semiótica dos processos interpretativos inerentes às práticas informacionais que ocorrem atualmente na web ressalta o hibridismo das manifestações sígnicas bem como as constantes marcas de semioses deixadas pelos sujeitos no meio digital. Como os sujeitos e a identificação de seus interesses, universos, discursos e pertencimentos, são fatores que compõem as articulações que eles desenvolvem nas redes sociais, julgou-se pertinente o uso da Netnografia como ferramenta auxiliar com propósitos de observação, monitoramento e registro. A Netnografia é um método de pesquisa qualitativa adaptado da Etnografia, e por isso, se volta para o estudo de culturas e comunidades que emergem da comunicação mediada por computadores (KOZINETS, 2002). As dimensões das estruturas e relações que constituem as formas de organização dos sujeitos informacionais no contexto digital foram abordadas com o aporte teórico e metodológico da Análise de Redes Sociais (ARS). Por sujeito informacional, entende-se um sujeito social que manifesta a sua subjetividade através do estabelecimento de identidades e percursos informacionais (MOURA 2009a). Ele é visto como um sujeito social pragmático, uma vez que constrói suas relações pela via da linguagem e do compartilhamento de significados. Já a ARS é uma abordagem metodológica que possibilita destacar os tipos de relações possíveis entre os atores e a atuação destes em papéis sociais e posições na estrutura da rede que empoderam a análise qualitativa e apontam indivíduos centrais em determinados processos e fluxos de informação. De acordo com Marteleto (2001)
A análise de redes estabelece um novo paradigma na pesquisa sobre a estrutura social. Para estudar como os comportamentos ou as opiniões dos indivíduos dependem das estruturas nas quais eles se inserem, a unidade de análise não são os atributos individuais (classe, sexo, idade, gênero), mas o conjunto de relações que os indivíduos estabelecem através das suas interações uns com os outros. A estrutura é apreendida concretamente como uma rede de relações e de limitações que pesa sobre as escolhas, as orientações, os comportamentos, as opiniões dos indivíduos. (MARTELETO, 2001, p.72)
Tal análise estrutural forneceu elementos metodológicos e teóricos para se pensar a qualidade da informação sob uma perspectiva que incorpora os efeitos das dinâmicas e das formas de compartilhamento que se dão ao longo das redes sociais e comunidades virtuais de prática, que são grupos informais ou formalizados que compartilham competências e experiências com certa regularidade (WELSER et al. 2007), O desenvolvimento da metodologia da pesquisa apresentou algumas dificuldades, como a
GT2
394
escolha das ferramentas a serem analisadas, devido às instabilidades das mesmas; a delimitação de um universo amplo de significações e sujeitos e a natureza tênue das mediações entre pesquisador e sujeitos da pesquisa. Após observações sistemáticas que tiveram como foco: as ferramentas, os sujeitos e a linguagem; as unidades de observação empírica foram definidas a partir da identificação e da formalização de comunidades virtuais de prática que se agregam pelo uso das ferramentas Delicious 8 , Diigo 9 e Stumble Upon 10 . A fim de promover a delimitação desse universo gigantesco de usuários, comunidades e tags foram definidos:
• Assuntos – “Jogos digitais” por ser específico e com ampla atuação de um público mais adepto à cibercultura e “Saúde”, por ser genérico e possuir um público que agrega diversos interesses e níveis de atuação no ciberespaço.
• Critérios para a definição dos sujeitos da pesquisa - frequência de utilização, tamanho da coleção pessoal, tamanho da rede pessoal, quantidade e qualidade das tags 11 , posições de centralidade.
A posição dos atores sociais na estrutura da rede pode ser analisada através da centralidade destes. Para tanto, foram consideradas três modalidades de centralidade descritas por Marteleto
(2001):
Centralidade de informação: remete ao indivíduo cujo posicionamento possibilite o recebimento de informações oriundas de várias partes da rede.
•
• Centralidade de proximidade: atribuída ao indivíduo que devido ao seu posicionamento percorre o menor caminho para acessar toda a rede.
• Centralidade de intermediação: atribuída a indivíduos cuja posição na rede o possibilita atuar como intermediário (ponte) nas mediações informacionais.
Como técnicas de coleta de dados foram empregadas a pesquisa bibliográfica, a observação participante, o questionário semi-estruturado, a entrevista e o monitoramento de tags; auxiliado pelo uso das ferramentas Google Trends e Google Insight, que possibilitam testar regularidades e tendências na linguagem a exemplo do que foi proposto por Moura (2009). As atividades de coleta de dados foram divididas em etapas de monitoramento que cobriram a escolha das ferramentas supracitadas, a observação e delimitação do selecionado de sujeitos da
8 O Delicious foi criado em 2003 pelo engenheiro Joshua Schachter e adquirido em 2005 pela Yahoo Company. É considerado o precursor dos serviços Web 2.0 que possibilitam a gestão e o compartilhamento de links favoritos.
9 O Diigo é um serviço, lançado em 2005, que oferece uma plataforma para a gestão e o compartilhamento de conteúdos e atua como uma ferramenta voltada para a pesquisa e a colaboração científica.
10 O Stumble Upon é um serviço criado em dezembro de 2001 pelos empresários Garrett Camp e Geoff Smith, enfatiza a validação
e o compartilhamento de conteúdos através da navegação social.
11 Por qualidade da tag, considerou-se o potencial representativo do termo em relação ao assunto.
GT2
395
pesquisa e a análise da linguagem compartilhada pelos mesmos. A sistematização dessas atividades é apresentada no quadro abaixo:
QUADRO 1 Sistematização das atividades de coleta de dados.
|
Atividade |
Objetivo |
Instrumento (s) |
Produto (s) |
|
|
Monitoramento de usuários e serviços de social bookmarking |
Identificar os SBFs, as comunidades virtuais de prática |
Unidades de |
||
|
Sites de social bookmarking, blogs e outras páginas da web. |
observação |
|||
|
e |
os sujeitos da pesquisa. |
empírica |
||
|
Criação e preenchimento de formulários de banco de dados |
Armazenamento dos dados referentes aos sujeitos da pesquisa. |
Banco de |
||
|
Software Microsoft Access |
dados e |
|||
|
backups |
||||
|
Formalização das redes sociais |
Identificar grupos, tipos de laço |
Software Yed Graph Editor. |
Grafos de rede |
|
|
e |
medidas de centralidade. |
|||
|
Aplicação de |
Captar universos de origem, práticas informacionais e noções de qualidade da informação. |
Ferramenta de construção e distribuição de formulários do Google Docs. |
Dados e |
|
|
questionário semi- |
gráficos da |
|||
|
estruturado |
pesquisa |
|||
|
Identificar acordos semânticos |
Site TagcloudGenerator, Google Trends, Google |
Laços sociais e indicadores de qualidade da informação |
||
|
Levantamento da |
relações entre colaboração e linguagem. e |
Insights, nuvens de tags e perfis dos sujeitos da pesquisa. |
||
|
terminologia |
||||
|
Realização de |
Compreender as práticas colaborativas e as concepções de qualidade da informação. |
|||
|
entrevistas em profundidade |
Ferramentas de bate-papo do Facebook, Skype e Gtalk. |
Dados da pesquisa |
||
Fonte: (ASSIS, 2011).
Após a fase de monitoramento que possibilitou a identificação e a escolha dos sujeitos da pesquisa, foram enviados questionários para 73 atores sociais. No selecionado brasileiro, cujos integrantes são usuários do Delicious, houve uma taxa de retorno de 50%. E no selecionado internacional, cujos integrantes são usuários do Diigo e do Stumble Upon, houve uma taxa de retorno de cerca de 20%. Os resultados foram codificados e sistematizados através de gráficos gerados no software Excel. O desenvolvimento e a análise dos questionários possibilitaram identificar práticas informacionais e iniciar a investigação sobre a relação entre colaboração e qualidade da informação. A fim de verticalizar algumas noções de qualidade da informação, bem como a relação destas com a colaboração, foram feitas entrevistas através de serviços de mensagens instantâneas oferecidos pelo Gtalk e pelo Skype. Inicialmente, foram selecionados seis atores sociais, mas devido à indisponibilidade de alguns em participar das entrevistas, manifesta pela demora em responder às
GT2
396
solicitações, agendamentos não cumpridos e o não retorno aos convites enviados, foram efetivamente entrevistados quatro deles. Ressalta-se que graças à delimitação precisa, proporcionada pelos critérios de recorte e pela ARS, mesmo com quatro entrevistados foi possível observar o critério de saturação nas respostas obtidas. A composição do universo empírico da pesquisa foi constituída por 149 usuários, distribuídos pelos três SBFs da seguinte maneira:
Delicious
Diigo
Stumble Upon
GRÁFICO 1 – Composição do selecionado de sujeitos da pesquisa por SBF.
Fonte: (ASSIS, 2011).
De modo simultâneo à identificação dos sujeitos e à formalização de comunidades virtuais de prática, foi realizado o monitoramento de tags, que teve como propósito observar a dinâmica e a evolução da linguagem utilizada para representar e validar os conteúdos informacionais. Este procedimento foi desenvolvido em três etapas:
• Nível pessoal: baseado na observação das tags mais utilizadas por um sujeito e de todas as tags que ele possui no perfil.
• Nível coletivo: observação e representação da co-ocorrência de uso e de frequência das tags ao longo dos perfis dos atores que se encontravam em posições de centralidade.
• Nível global: observação e o monitoramento do grau de maturidade da linguagem através do Google Trends e do Google Insight.
Salienta-se que a terminologia visualizada no nível de monitoramento coletivo constitui modelos conceituais dos assuntos Jogos Digitais e Saúde que emergiram dos acordos estabelecidos pelos sujeitos em colaboração e percebeu-se tanto a consolidação de termos, quanto a inclusão de novidades nessas áreas. Nesta etapa do percurso metodológico intentou-se captar a influência que a colaboração exerce
GT2
397
sobre a linguagem utilizada na organização da informação. O uso das ferramentas Google Trends
e Google Insights para analisar as tags mais utilizadas pelos atores centrais visou correlacionar a
linguagem utilizada pelos usuários da web para representar suas necessidades informacionais com a que é utilizada para representar e compartilhar os conteúdos através dos SBFs.
3 RESULTADOS
A colaboração foi destacada pelos respondentes como um elemento que leva à obtenção de conteúdos de qualidade. Os sujeitos adicionam pessoas às redes sociais que mantêm nos SBFs em função da qualidade do conteúdo compartilhado por elas. Além disso, quando aderem a algum grupo ou tópico nesses ambientes, a principal expectativa é a obtenção de conteúdos de qualidade. Dentre os respondentes, 84% apontaram que o espaço colaborativo contribui para a melhoria da qualidade da informação. Tal apontamento corrobora com Neus (2001) no tocante ao papel desempenhado pelas comunidades virtuais na validação dos conteúdos e no estabelecimento de padrões implícitos e explícitos de qualidade. Por isso, o estudo de como os sujeitos concebem a qualidade da informação a partir desses ambientes, preconiza a observância da dinamicidade que eles apresentam e incorpora o caráter relativo da própria noção de qualidade. Considera-se que existe uma dinâmica relacionada não apenas aos cenários semióticos e à
própria estrutura de redes sociais, mas também aos laços relacionais estabelecidos entre os atores e
à experiência colateral que é explorada pelos desenvolvedores ao captarem e proporem percursos de
significação. Nesse sentido, quanto maior é a familiaridade dos sujeitos com os arranjos sígnicos que o cercam, maior é a capacidade dos SBFs em contribuírem com a organização e a recuperação da informação de uma forma que se aproxime das exigências e necessidades de cada usuário. Por propiciarem a atuação de comunidades virtuais de prática, percebeu-se nesses ambientes um compartilhamento simbólico em que as concepções de relevância tornam-se implícitas nas práticas e nas trocas que os sujeitos efetuam por intermédio dos sistemas. A relevância apontada pelos sujeitos não se configura como um produto comercializável, ela
é uma relevância pessoal que pode se tornar coletiva ao longo das redes sociais. Ou seja, o que é
considerado relevante para um ator social frequentemente é relevante para aqueles que estabelecem laços relacionais com o mesmo. A relevância é definida de acordo com o conceito atinência (aboutness), que nos estudos de Fairthorne (1969) e Begthol (1986) é referenciado como o resultado de um processo de atribuição de sentido a um conteúdo informacional de modo objetivo. Apesar do conteúdo, ou objeto informacional, gerar várias significações ao longo do tempo e dos contextos em que é acessado, ele é representado de um modo específico para reduzir esse amplo escopo de significações. Percebeu-se que a relevância exerce um papel fundamental na curadoria de informações que esses sujeitos realizam na rede. Devido à essa estrutura multidimensional, a variedade de significações
GT2
398
que o conceito de atinência visa limitar é expandida de acordo com os perfis e necessidades dos sujeitos.
Quem acompanha minhas atualizações na web se identifica com as informações que compartilho, isto é, com o fragmento de pessoa que esses dados compartilhados desenham. Para meus “leitores”, se é que se pode usar esse termo nesse caso, (talvez seguidores fosse mais adequado), a informação mais relevante, no que me diz respeito, é aquela que de fato tem a ver com o meu perfil. Se eu passar a propagar informações que não tem a ver com meu perfil, estarei desvirtuando essa imagem, ainda que fragmentada. E, como editor, como hub de conteúdos, acabarei perdendo relevância para meu seguidor. Assim, só posso te responder com uma frase meio ridícula: relevante é tudo aquilo que eu considero relevante. (Sujeito A1, grifos nossos)
A curadoria digital é um ato de síntese e interpretação com o propósito de apresentar um registro completo relacionado a um conceito (BECKLAND, 2010). Ela é uma atividade exercida por vários hubs nas redes analisadas. Os hubs são atores sociais centrais, que se caracterizam pelo recebimento de uma grande quantidade de apontamentos pelos demais atores. Ao salvarem conteúdos relevantes para si eles também atendem às concepções de relevância daqueles que os seguem. Constata-se que a atribuição de relevância, figura como uma concepção semiósica de um ator para outro. Essa afirmação corrobora com Moura (2002) apud Ziller (2005)
ao conceber semiosicamente uma informação, o indivíduo que elabora essa
informação deve aproximar-se do usuário e quanto maior for a semelhança entre o usuário concreto e as estratégias que configuram o leitor-modelo, determinadas por quem concebe a informação, maiores as possibilidades de se atingir efetivamente o usuário com uma informação de qualidade. (ZILLER, 2005, p.86)
] [
As autoras se referem à concepção semiósica que ocorre no âmbito da produção de um conteúdo enquanto o presente estudo apontou a repercussão desse fenômeno de significação no âmbito da representação dos conteúdos. Em ambos, a concepção semiósica se manifesta como uma modelagem sígnica. Ocorre que no contexto digital colaborativo que se analisou, as dinâmicas das redes sociais acentuam a proximidade de modelos sígnicos entre os sujeitos ou estabelecem modelos sígnicos compartilhados. A aproximação e o compartilhamento de modelos sígnicos são representados pelas práticas de curadoria digital. Nos SBFs, a curadoria digital apresenta ênfase na qualificação e compartilhamento de conteúdos, ou seja, é privilegiada a dimensão de uma prática que visa promover a agregação de valor aos objetos informacionais e a disseminação dos mesmos como uma maneira de superar a grande quantidade de conteúdos informacionais disponíveis e a escassez do tempo e da atenção para avaliá-los. Nesse sentido, as redes sociais atuam como filtros e alguns atores sociais desempenham o papel de curadores de conteúdo.
GT2
399
3.2 Dimensões semióticas dos SBFs e indicadores de qualidade da informação
A fase de monitoramento da terminologia propiciou testes relacionados ao efeito da colaboração
na sedimentação e na renovação da linguagem.
As tags são entidades que figuram as trocas geradas pelos laços cognitivos entre os atores sociais (MIKA, 2007). Ou seja, elas remetem à ligação gerada a partir do compartilhamento de narrativas, linguagens e signos comuns promovendo a troca de conhecimentos. São nas comunidades virtuais de prática símbolos, ou representações, comuns a um grupo. Por isso, a consolidação e a renovação de uma determinada terminologia denotam os movimentos de qualificação dos conteúdos representados por ela.
A partir das categorias fenomenológicas de Peirce desenvolveu-se a seguinte descrição dos
sistemas folksonômicos em relação à qualidade da informação enquanto processo:
QUADRO 2 Dimensões semióticas dos SBFs
|
CATEGORIA |
DIMENSÃO |
MANIFESTAÇÃO |
|
Primeiridade |
Espaço social semântico |
Estruturas sugestivas |
|
Secundidade |
Rede social |
Estruturas relacionais |
|
Terceiridade |
Linguagem |
Estruturas simbólicas |
Fonte: (ASSIS, 2011).
As folksonomias, enquanto espaços sociais semânticos, manifestam-se como estruturas sugestivas que se originam da incorporação dos percursos de significação desenvolvidos pelos sujeitos. Espaços sociais semânticos são o conjunto das representações objetivas, subjetivas e práticas dos conteúdos informacionais (QIN, 2008). Definidos pelos arranjos das coleções pessoais, das tags e
da arquitetura da participação, eles influenciam os processos de significação. Por isso, correlacionam- se ao nível da Primeiridade, visto que esta é a categoria fenomenológica que descreve os signos, ou os cenários sígnicos, dotados de um elevado potencial sugestivo.
Já a dimensão de rede social, posiciona-se num nível de secundidade, ação e reação, dada pelo
caráter relacional dessas estruturas. As posições estruturais e os papéis desempenhados pelos atores, os laços estabelecidos e os fluxos gerados pela arquitetura de redes são elementos pertinentes ao entendimento da formação de consensos e implicam na existência de acordos tácitos e explícitos
previamente estipulados como marcos de regulação e mobilidade dos padrões de qualidade da informação. As folksonomias como expressões de linguagem, possuem como análoga a Terceiridade peirciana e dessa forma, caracterizam-se pela presença das duas dimensões supracitadas, pela
GT2
400
sobreposição do simbólico, pela renovação e pela expansão. A linguagem viabiliza um sistema em que ocorre a integração de cenários semióticos e redes sociais. Ela exerce a função de mediadora das ações colaborativas e da construção da qualidade da informação. As redes sociais e os cenários semióticos são mediadores na construção da qualidade da informação de modo colaborativo. Nesse sentido, a colaboração promove curadoria e segmentação de conteúdos num ambiente em que se observa a integração como a configuração que interliga cenários semióticos e redes sociais em um único sistema ou ferramenta e viabiliza a personalização como uma tendência que norteia a obtenção de produtos sígnicos de modo adaptado às necessidades e perfis. Por isso colaboração, integração e personalização, assim como a renovação e a sedimentação da linguagem, são indicadores de qualidade da informação. Considerando a relação dos sujeitos com os cenários semióticos, ou seja, com as trilhas de significado implementadas por eles, o compromisso ontológico, definido como a relação entre o sujeito e sua representação e a concepção semiósica enquanto uma modelagem sígnica, são indicadores que confluem para a obtenção de relevância, visto que ela é definida como grau de aplicabilidade e utilidade de um conteúdo informacional em relação a um determinado assunto. Assim, o compromisso ontológico, a concepção semiósica e a relevância são também índices desse movimento interpretativo pelo qual os sujeitos concebem a qualidade da informação na web.
QUADRO 3 Indicadores de qualidade da informação em SBFs.
Fonte: (ASSIS, 2011)
|
INDICADOR |
DEFINIÇÃO |
MEDIAÇÃO |
|
|
Colaboração |
. |
Ação em que ocorre a mediação da linguagem no |
|
|
compartilhamento de símbolos e significados comuns. |
Redes sociais |
||
|
Integração |
. Configuração que interliga cenários semióticos e redes sociais em um único sistema ou ferramenta. |
||
|
Personalização |
. Tendência que norteia a formulação de produtos sígnicos de modo adaptado a necessidades e perfis. |
Redes sociais e Cenários semióticos |
|
|
. |
Consolidação de uma determinada terminologia. |
||
|
Sedimentação da |
|||
|
linguagem |
|||
|
. |
Inclusão do novo que promove a expansão da terminologia. |
||
|
Renovação da |
|||
|
linguagem |
|||
GT2
401
|
Compromisso |
. |
Relação entre o sujeito e sua representação. |
|
|
ontológico |
|||
|
Concepção |
. |
Modelagem sígnica. |
Cenários |
|
semiósica |
semióticos |
||
|
Relevância |
Grau de aplicabilidade e utilidade de um conteúdo em relação a um determinado assunto. . |
||
Tal movimento (indicadores como índices de um processo) escapa às tentativas de quantificação promovidas pelas pesquisas convencionais sobre a qualidade da informação visto que os números não revelam a complexidade que envolve as concepções, nem tão pouco as formas de interação entre os sujeitos e as manifestações dos mesmos no contexto digital. Sob esta perspectiva, os modelos de qualidade da informação propostos, são um recorte arbitrário e operacionalizável de um universo multidimensional e complexo de significações, sendo criados para contextos e propósitos específicos e desse modo, propensos a sofrerem desatualizações. Assim, ao invés de propor um modelo conceitual que aponta uma listagem de critérios que visam avaliar a qualidade da informação, este estudo a evidencia como um processo caracterizado pela geração e pelo compartilhamento de significados.
4 CONCLUSÕES
Considera-se que as abordagens convencionais do conceito de qualidade da informação não atendem a um contexto interativo, colaborativo e permeado por trocas simbólicas constantes mediadas pela arquitetura de redes sociais em que o modelo de usuário passivo dá lugar a um sujeito informacional que não apenas utiliza, mas também produz, remodela e qualifica os conteúdos informacionais através da linguagem. Os estudos sobre qualidade da informação devem enfocar os processos e não os produtos finais. Conclui-se que os agenciamentos da linguagem contribuem para o modo como o sujeito percebe e constrói a qualidade da informação por meio das ações colaborativas, da proposição de percursos de significação e da visualização e reprodução destes através de cenários semióticos. Ressalta-se que a metodologia possibilitou caracterizar as práticas informacionais, identificar os tipos de laços estabelecidos entre os atores sociais e a terminologia gerada pelos mesmos. E ainda apontar a influência que a colaboração exerce sobre a linguagem utilizada na organização da informação. Dadas as contingências atuais e a natureza dos fenômenos envolvidos, as metodologias desenvolvidas no âmbito da Organização e Uso da Informação (OUI) necessitam incorporar experimentos pautados pela diversidade, inovação e integração sem, contudo, preterirem o rigor necessário ao percurso de descrição, explicação e interpretação que preconiza a formalização do conhecimento científico.
GT2
402
REFERÊNCIAS
ASSIS, Juliana de. Indicadores de qualidade da Informação em sistemas baseados em folksonomia: uma abordagem semiótica. Orientadora: Maria Aparecida Moura. 2011. 209f. Dissertação (Mestrado em Ciência da Informação) – Escola de Ciência da Informação, Universidade Federal de Minas Gerais – UFMG, Belo Horizonte, 2011.
BASSO, Carlos A. M.; SILVA, Sérgio R. P. da. Uma proposta para a evolução de ontologias a partir de folksonomias. In: WORKSHOP DE TESES E DISSERTAÇÕES (WTD), 8., 2008, Vila Velha-ES. Anais do Simpósio Brasileiro de Sistemas Multimídia e Web (WebMedia), 14., 2008. p.197-200.
BECKLAND, Jamie. Social Media Content Curators Are Not “Just Filters”. 2010. Disponível em: <http:// jamiebeckland.com/2010/04/social-media-content-curators-are-not-just filters/#axzz1IlgE5Mu6>. Acesso em:
10 mar. 2010.
BEGHTOL, Clare. Bibliographic classification theory and text linguistics: aboutness analysis, intertextuality and the cognitive act of classifying documents. Journal of documentation, v.42, n.2, p.84-113, 1986.
EPPLER, Martin; WITTIG, Dorte. Conceptualizing information quality: a review of information quality frameworks from the last ten years. In: CONFERENCE ON INFORMATION QUALITY, 2000. Proceedings…, 2000. p.83-96. [on line].
FAIRTHORNE, R.A. Content analysis, specification, and control. Annual Review of Information Science and Technology, v. 4, p. 73-109, 1969.
FEINBERG, M. An examination of authority in social classification systems. Advances in Classification Research, v.17. In: FURNER, Jonathan; TENNIS, Joseph T. (Ed.) ASIST & T. CLASSIFICATION RESEARCH WORKSHOP, 17., 2006. Proceedings, Austin, 2006.
FLICK, Uwe.; COSTA, Roberto Cataldo. Desenho da pesquisa qualitativa. Porto Alegre: Artmed, 2009. 164
p.
FROTA, Maria Guiomar da Cunha. Desafios teórico-metodológicos para a ciência da informação: descrição, explicação e interpretação. In: REIS, Alcenir Soares dos.; CABRAL, Ana Maria Rezende (Org.). Informação, cultura e sociedade: interlocuções e perspectivas. Belo Horizonte: Novatus, 2007. p. 49-59.
HINE, C. Virtual methods and the sociology of cyber-social-scientific knowledge. In: HINE, Christine (Org.).Virtual methods. Oxford: Berg, 2005. [Issues in Social Research on the Internet].
KIPP, M. E.; CAMPBELL, D. G. Patterns and inconsistencies in collaborative tagging systems:
an examination of tagging practices. In: AMERICAN SOCIETY Of INFORMATION SCIENCE & TECHNOLOGY ANNUAL CONFERENCE 2006, Austin, Texas (US), 2006
KOZINETS, R. The field behind the screen: using netnography for marketing research in online communities. Journal of Marketing Research, v.29, n.1, p.61-72, Feb. 2002.
KNIGHT, Shirlee-ann; BURN, Janice. Developing a framework for assessing information quality on the World Wide Web. Informing Science Journal, v.8, p.161-172, 2005.
MARTELETO, Regina. Análise de redes sociais: aplicação nos estudos de transferência da informação. Ciência da Informação, Brasília, v.30, n.1, p.71-81, jan./abr. 2001. Disponível em: <http://dici.ibict.br/ archive/00000204/01/Ci[1].Inf-2004-261.pdf>. Acesso em: 14 jun. 2009.
GT2
403
MINAYO, Maria Cecília de Souza. O desafio da pesquisa social. In: MINAYO, Maria Cecília de Souza; DESLANDES, Suely Ferreira; GOMES, Romeu (Org.). Pesquisa social: teoria método e criatividade. Petrópolis: Vozes, 2009. p.9-29.
MIKA, Peter. Social networks and the semantic web. New York: Springer, 2007. 234 p.
MOURA, Maria Aparecida. Semiótica e mediações digitais: criação e recepção de hipermídias. Orientador:
Arlindo Machado. 2002. 208f. Tese (Doutorado em Comunicação e Semiótica) – Pontifícia Universidade Católica de São Paulo, São Paulo, 2002.
MOURA, Maria Aparecida. Informação, ferramentas ontológicas e redes sociais AD HOC: a interoperabilidade na construção de tesauros e ontologias. Revista informação e sociedade, v. 19, n.1, p. 59-73, 2009.
NEUS, Andréas. Managing information quality in virtual communities of practices. In: PEIRCE, E.; KATZ- HAAS, R. Proceedings of the 6th International Conference on Information Quality at MIT. Boston, MA:
Sloan School of Management, 2001.
NORUZI, Alireza. Folksonomies: why do we need controlled vocabulary?. E- prints in Library and Information science, 2006. p.7. Disponível em: <http://eprints.rclis.org/archive/ 00011286/>. Acesso em: 28 nov. 2007.
NEHMY, Rosa Maria Quadros; PAIM, Isis. A desconstrução do conceito de qualidade da informação. Ciência da Informação, Brasília, v.27, n.1, p.36-45, jan./abr. 1998. Disponível em: <http://www.scielo.br/scielo. php?script=sci_arttext&pid=S0100-19651998000100005>. Acesso em: 12 ago. 2009.
PEIRCE, Charles Sanders. Collected papers of Charles Sanders Peirce. [on line]. Disponível em: <http:// www.textlog.de/charles_s_peirce.html>. Acesso em: 15 mar. 2011.
PARKER, M. B. et al. An evaluation of information quality frameworks for the World Wide Web. 2006. Disponível em: <http://eprints.ecs.soton.ac.uk/12908/1/WWW2006_MParker.pdf>. Acesso em: 21 jun. 2009.
PIKER, Samuel. An evaluation of Flickrs distributed classification system, from the perspective of its members, and as an image retrieval tool in comparison with a controlled vocabulary. Computing Research Repository. 2009. Disponível em: <http://arxiv.org/abs/0912.1767>. Acesso em: maio 2010.
QIN, Jian. Folksonomies and taxonomies: where the two can meet. In: NKOS WORKSHOP, Washington. Set. 2008. Disponível em: <http://nkos.slis.kent.edu/2008workshop/JianQin.pdf>. Acesso em: 21 mar. 2011.
SANTAELLA, Lúcia. Semiótica aplicada. São Paulo: Cengage Learning, 2002. 186p.
SANTAELLA, Lúcia; NOTH, Winfried. Comunicação e semiótica. São Paulo: Hacker, 2004. 250p.
STOCKINGER, Peter. Les nouveaux produits d’ information: conception et sémiotique du document. Paris:
Hermes, 1999.
TRANT, Jennifer. Studying social tagging and folksonomy: a review and framework. Journal of digital information, v.10, n.1, 2009. Disponível em: <http://dlist.sir.arizona.edu/2595/01/trant-studyingFolksonomy. pdf>. Acesso em: 12 set. 2009.
VAN HOOLAND, Seth. From spectator to annotador: possibilities offered by user-generated metadata for digital cultural heritage collections. Bruxelles, p.1-15. Sept. 2006. Disponível em: <http://homepages.ulb.
GT2
404
ac.be/~svhoolan/Usergeneratedmetadata.pdf>. Acesso em: maio 2010.
VANDER WAL, Thomas. Folksonomy coinage and definition. Feb. 2007. Disponível em: <http://www. vanderwal.net/folksonomy.html>. Acesso em: 12 ago. 2010.
WELSER, Howard T et al. Visualizing the signatures of social roles in online discussion groups. Journal of Social Struture, v.8, 2007. Disponível em: <http://www.cmu.edu/joss/content/articles/volume8/Welser/>. Acesso em: 18 abr. 2009.
ZILLER, Joana. Qualidade da informação em web jornais: a demanda e a tradução intersemiótica. 2005. 250f. Dissertação (Mestrado em Ciência da Informação) – Escola de Ciência da Informação, Universidade Federal de Minas Gerais, Belo Horizonte, 2005.
GT2
405
COMUNICAÇÃO
ORAL
A IMPORTÂNCIA DOS PRESSUPOSTOS ONTOLÓGICOS COMO BASE PARA O USO ARTICULADO DE ONTOLOGIAS NO CONTEXTO DA WEB SEMÂNTICA
Linair Maria Campos, Maria Luiza Almeida Campos, Maria Luiza Machado Campos e Miguel Gabriel Prazeres de Carvalho
Resumo: A adoção de ontologias tem aumentado nos últimos anos, tendo como uma de suas motivações a necessidade de descrever recursos de forma a apoiar sua interoperabilidade, notadamente na área de Biomedicina. Recentemente, as iniciativas de web semântica reforçam essa tendência, com o crescimento exponencial das publicações de dados interligados, que se apóiam fortemente no uso de descritores, vocabulários e ontologias de diversas origens e temáticas. Nesse cenário, onde a dinâmica ou urgência da criação desses vocabulários por vezes suplanta a adoção de práticas sistemáticas para sua organização, observamos uma carência na explicitação dos princípios que norteiam a sua construção. Especialmente se considerarmos a necessidade do uso articulado desses vocabulários, construídos de forma independente, e muitas vezes descentralizada, onde a identificação da natureza dos conceitos envolvidos é elemento chave para se evitar ambigüidades nas correspondências a serem efetuadas entre eles. O objetivo desse trabalho é ajudar a divulgar e esclarecer a importância dos pressupostos ontológicos no uso de ontologias no contexto da web semântica, e situar sua diferença em relação aos pressupostos comumente adotados pelo cientista da informação no âmbito da classificação bibliográfica. Como resultado, temos um conjunto proposto de pressupostos ontológicos básicos a serem adotados pelo cientista da informação como ponto de partida na organização de ontologias. O apoio a esta tarefa pode se constituir em um importante nicho de atuação para a Ciência da Informação, que já vem trabalhando há décadas na organização de taxonomias, tesauros e vocabulários controlados, com uma valiosa experiência acumulada.
Palavras-chave: Construção de Ontologias. Pressupostos ontológicos. Ontologias de fundamentação. Web Semântica. Dados Ligados.
Abstract: The adoption of ontologies has increased in recent years, having as one of its motivations the need to describe resources in order to help their interoperability, especially in the area of Biomedicine. Recently, the semantic web initiatives reinforce this trend, with the exponential growth of publication of linked data, which relies heavily on the use of vocabularies from different sources and topics. In this scenario, where the dynamics or urgency of creating these vocabularies often supplants the adoption of systematic practices for their organization, we observed little support to explicit the principles that guide their construction. Especially considering the need to articulate these vocabularies, independently constructed and often maintained decentralized, the identification of the nature of the concepts involved is a key element to avoid ambiguities when making correspondences between them. The aim of this work is to help disseminate and explain the importance of ontological assumptions in the use of ontologies in the context of semantic web, and to discuss differences to assumptions commonly adopted by the information scientist in the scope of bibliographical classification. The result is a proposed set of basic ontological assumptions, to be adopted by an information scientist
GT2
406
as a starting point to organize ontologies. Support for this task may represent an important niche for Information Science, which has been working for decades on the organization of taxonomies, thesauri and controlled vocabularies, accumulating a valuable experience.
Keywords: Ontology engineering. Ontological Assumptions. Foundational ontologies. Semantic Web. Linked Data.
1 INTRODUÇÃO
Informações originalmente publicadas na web eram formadas principalmente por conteúdos na forma de hipertexto e hipermídia, permitindo uma navegação pelos links existentes e buscas por palavras- chave. Se por um lado esse tipo de estrutura contribuiu para a sua popularidade e para o crescimento vertiginoso de informações publicadas na web, por outro lado esse crescimento, desordenado, tem trazido problemas para a sua recuperação (HORROCKS, 2008). Em especial se considerarmos que esses conteúdos, potencialmente articuláveis, se encontram isolados em silos de informação. Nesse contexto, o desafio que se coloca é sua articulação, de forma dinâmica e inteligente, de modo a potencializar seu valor, combinando informação e serviços de múltiplas fontes, de forma automática. Em outras palavras, almeja-se integrar os silos de informação em redes de informação, promovendo suaa interoperabilidade semântica e lançando a fundação para a recuperação mais precisa dessas informações, como forma de tentar minimizar o problema, recorrente, da explosão informacional. O que nos remete ao passado recente do avanço da literatura científica do pós-guerra e das idéias inovadoras de Paul Otlet, que já nos idos da década de 1930, antecipava a web dos dias atuais:
Tudo no universo, e tudo do homem, poderia ser registrado à distância, à medida que estiver sendo produzido. Desta forma, uma imagem em movimento do mundo será estabelecida, um verdadeiro espelho de sua memória. De longe, todos vão ser capazes de ler textos, ampliados e limitados ao assunto desejado, projetados em uma tela individual. Assim, da sua poltrona todos seriam capazes de contemplar a criação, como um todo ou parcialmente. (OTLET, 1935).
A web semântica, através de ontologias e tecnologias especificamente voltadas para a combinação (mashups) de informações, recria uma rede significativa de ligações, tal como projetado por Otlet: a materialização de ligações com significado que antes somente era percebida por um sujeito cognoscente 1 e que hoje pode ser passível de interpretação pela máquina. A web semântica surgiu para resolver problemas da web atual, também conhecida como web sintática, onde os computadores somente fazem a apresentação do conteúdo deixando a cargo do usuário a interpretação das informações (BREITMAN, 2005). Essa web é representada pelas assim chamadas web 1.0 e web 2.0. Na web 1.0 surgem os grandes portais de informação, porém cujo conteúdo não era criado de forma colaborativa. Já a web 2.0 foi marcada pela geração de conteúdos para web com a participação colaborativas dos usuários, podendo ser exemplificada pela utilização das redes sociais como o Facebook e também de ferramentas
1 Sujeito que detém o conhecimento.
GT2
407
de geração colaborativa do conteúdo como a Wikipédia. A web 3.0, também considerada por alguns autores (BREITMAN, 2005) como a própria web semântica, é na verdade um conjunto de tecnologias semânticas integradas ou que facilitam a criação de aplicações web em larga escala (HENDLER, 2009). Surgiu da necessidade de promover a interligação da grande quantidade de conteúdo da Web 2.0, e para isso conta com o auxílio de diversas tecnologias para interligação dos conteúdos como, por exemplo, ontologias e metadados para sua descrição, agentes inteligentes para realização de buscas e formalismos como o RDF para ligação entre os diversos tipos de recursos (BREITMAN, 2005). Na web semântica, ontologias podem ajudar a aumentar a semântica associada à representação de conteúdos de natureza diversa na web, contribuindo para o entendimento comum de conceitos e para a explicitação do conhecimento de diferentes domínios. Entretanto, considerando a natureza espontânea e social da web, a tendência é a utilização de diversos vocabulários, para descrever recursos de temáticas distintas, onde a facilidade de uso é um atrativo para a sua aceitação (ALLEMANG, HENDLER, 2008). Assim a semântica é desejada, mas a criação de vocabulários simples parece ser uma tendência nesse cenário mais geral de uso da web. Isso contrasta com o uso de ontologias para descrever conteúdos de uma área específica como a Biomédica, por exemplo, onde é possível considerar a adoção de um conjunto controlado de vocabulários, geralmente complexos, desenvolvidos sob a coordenação de algum órgãoresponsável por sua manutenção e gerência. Nesse cenário de uso de múltiplos vocabulários independentes e de temáticas variadas para apoiar a integração de informações, existem várias questões a serem resolvidas. Essas questões dizem respeito a problemas já discutidos no âmbito das iniciativas de reúso de ontologias e de linguagens documentárias, tais como a compatibilização de termos semelhantes com nível de detalhe diferente, com sentidos não exatamente iguais, ou com nomenclatura homônima, e, ainda presentes em estruturas hierárquicas conflitantes (NEVILLE, 1972) (DING, et al., 2006). Outro aspecto importante é identificar e explicitar, para fins computacionais, a semântica associada aos conteúdos disponíveis. Por exemplo, ao encontrar em uma página o texto “ João ensina Lógica”, é desejado fornecer para as ferramentas de software subsídios para que estas reconheçam que João é um professor e que Lógica é uma disciplina da graduação de um curso em uma dada instituição. Além disso, é importante estabelecer que João ministra aulas (ensina) dessa disciplina. É preciso identificar a natureza dos conceitos e suas relações e quanto mais rica for essa identificação, mais conhecimento se pode obter. No caso acima, por exemplo, dependendo da semântica explicitada através da identificação dos conceitos e suas relações, seria possível inferir (ou seja, deduzir sem que esteja explicitamente informado dessa forma) que João faz parte do corpo docente da graduação de um certo curso naquela determinada instituição. Para isso, por exemplo, é preciso definir quais as características que identificam um docente e uma disciplina, de modo a poder atribuir a “João” o tipo docente (sinônimo de professor) e a “Lógica” o tipo disciplina, de modo a depois relacionar um a outra, o que pode ser apoiado pelo uso de ontologias. Para promover uma integração semântica de dados descritos por ontologias, é importante
GT2
408
compreender as noções que são adotadas como pressupostos básicos para a estruturação e definição dos conceitos dessas ontologias, ponto central do presente artigo. O desafio é como criar simplicidade
a partir de noções complexas. O restante do texto está estruturado da seguinte maneira: na seção 2 apresentamos os cenários de uso de ontologias na web; na seção 3 um conjunto de pressupostos ontológicos básicos, que podem ser utilizados como ponto de partida para a descrição semântica de recursos na web; na seção 4 os trabalhos relacionados e, por fim, na seção 5 as nossas conclusões.
2 CENÁRIOS DE USO DE ONTOLOGIAS NA WEB SEMÂNTICA
A iniciativa de Dados Interligados vem como resposta para a interligação semântica de recursos descritos na web, e, para isso, Tim Berners-Lee 2 , propõe que sejam adotados os seguintes princípios:
(1) uso de URIs como nomes para coisas; (2) uso de URIs via http, de modo que as pessoas possam buscar por esses nomes na web; (3) Quando alguém procurar por uma URI, que se forneça informação útil, usando padrões (RDF, SPARQL); (4) Inclusão de associações com outras URIs, de modo que as pessoas possam descobrir mais coisas. Esses princípios trazem como um diferencial o uso de URIs via http, que na prática se constituem em um mecanismo para atribuir a cada coisa (concreta, abstrata, ou ainda um conceito qualquer) na web um identificador único. Diferente das URLs, que se propõem a ser endereços para recursos, por exemplo, o endereço da página web de uma pessoa, a URI via http permite que se referencie a pessoa em si. Existe também a idéia básica de fornecer informação útil, que pode ser trabalhada para que sejam divulgados dados efetivamente relevantes sobre o recurso descrito. Além disso, a proposta de incluir lligações para outras URIs, fornece as bases para a almejada integração de dados, cruzando a fronteira dos silos de informação e enriquecendo o resultado final a ser apresentado ao usuário final. Essas ligações podem ser de diversos tipos, não só ajudando na sua caracterização (ex: professor x ministra disciplina d), mas também a traçar sua identidade (ex: professor x é o mesmo que professor y)
e ainda a estabelecer mapeamentos com outros vocabulários mais conhecidos que possuem descritores
semelhantes aos que estiverem sendo usados para descrever o recurso. Dados interligados, se disponíveis livremente na web usando padrões não proprietários, são denominados de Dados Abertos Interligados (em inglês Linked Open Data, ou LOD). A publicação de LOD parece ser uma tendência de fato, conforme se pode observar pelo crescimento constante dos acervos sendo disponibilizados, assim como de iniciativas, como a incubadora do W3C 3 , que buscam agregar comunidades relativas a bibliotecas e áreas afins, promover e discutir estudos de caso bem sucedidos de como colocar em prática a publicação de seus dados, ligando-os a uma “nuvem de dados abertos interligados” (Figura 1). A interligação de dados abertos na web 3.0 traz a estes valor agregado, aumentando assim
2 http://www.w3.org/DesignIssues/LinkedData.html
3 http://www.w3.org/2005/Incubator/lld/
GT2
409
a sua utilidade. Porém, devido aos problemas de compatibilidade mencionados anteriormente, deve-se incentivar o reúso de vocabulários já existentes. Para favorecer o reúso, é fundamental que se explicite, tanto quanto possível, o compromisso ontológico dos vocabulários. O compromisso ontológico é definido, no contexto desse trabalho, como um acordo partilhado por uma comunidade sobre o significado consensual pretendido para a ontologia, não só considerando sua compreensão por pessoas, como também pelos agentes de software, contribuindo para aumentar a semântica dos conceitos descritos.
Figura 1: Nuvem de dados abertos interligados, em 2007 e 2010. Adaptado de: Heath e Bizer (2011).
A explicitação do compromisso ontológico favorece o reúso na medida em que permite capturar o significado (embora aproximado) do conceito, que vai além do que é possível representar através de sua nomenclatura, e permite ainda compreender de forma mais precisa a natureza das suas relações com outros conceitos, favorecendo a integração semântica de dados. (TODOR, PASCHKE, HEINEKE, 2010). Na web semântica, ontologias vêm sendo utilizadas no contexto de dados abertos interligados para descrever recursos diversos, que incluem as iniciativas voltadas para a divulgação de dados governamentais, de ciências biológicas, de publicações científicas e, ainda, serviços bibliográficos de modo geral (HEATH e BIZER, 2011). Esses dados publicados como LOD fornecem uma visão integrada que permite o cruzamento dinâmico de informações que antes estariam dispersas dificultando sua visão crítica. Por exemplo, dados abertos ligados publicados pelo governo inglês permitem à população acompanhar de forma dinâmica o uso de verbas públicas, consolidando informações de origens distintas sobre o tipo e área da despesa, a entidade contratante e o fornecedor, o valor da verba, dentre outros 4 . Na área Biomédica, iniciativas de LOD têm se aproveitado da abundância de dados publicados, não só relativos a experimentos em si, bem como a literatura científica associada. Como exemplo, podemos citar o projeto ChemCloud (TODOR, PASCHKE e HEINEKE, 2010), que integra dados de elementos químicos e publicações científicas, dentre outros, à DBpedia, permitindo uma melhor classificação dos conceitos relativos a compostos químicos, bem como da sua descrição em outros idiomas e o uso de sinônimos.
4
http://data.gov.uk/
GT2
410
No que diz respeito aos serviços bibliográficos, destaca-se a crescente mobilização de profissionais ligados à área da biblioteconomia de alguns países, tais como, Inglaterra, Alemanha, Suécia e Estados Unidos e Espanha (PESET, FERRER-SAPENA e SUBIRATS-COLL, 2010), cujos esforços têm resultado na publicação de grandes bases de dados bibliográficos em LOD (HEATH e BIZER, 2011) (SÖDERBÄCK e MALMSTEN, 2009).Adescrição desses dados, entretanto, idealmente deveria seguir um modelo rico de interligações, como sugere Tim Berners-Lee, com informações úteis agregadas e com conexões a recursos externos disponíveis na web de dados. O que se observa em um primeiro momento, no entanto, é que nem sempre isso ocorre. Em algumas iniciativas, adota-se o uso de um conjunto limitado de descritores com poucas interligações com recursos externos, o que parece sugerir uma intenção inicial de se privilegiar a disponibiização do dado. Sua descrição e interligação mais elaborada seriam postas em prática em um momento futuro, após um amadurecimento maior:
Quando se trata da melhoria da gestão da informação, a ligação entre diferentes bases de dados, possibilitada pelos dados ligados, mostra-se muito promissora para a cooperação e interoperabilidade entre bibliotecas, bem como para preencher a lacuna entre as bibliotecas e outras organizações de conhecimento. Isto é algo que nós apenas começamos a explorar.
) (
que a adição futura de um número substancial de links proporcionará possibilidades
interessantes para nós, assim como para os outros. (SÖDERBÄCK e MALMSTEN,
Embora neste momento só tenhamos alguns links para a dbpedia, esperamos
2009, p. 2).
É através da descrição e interligação mais elaborada dos dados que se viabiliza a recuperação de informação mais rica e precisa, através do uso desses descritores e de suporte a inferências, como explicado a seguir.
2.1 Ontologias como apoio à inferência de conhecimento
Ontologias apresentam um diferencial semântico em relação às linguagens documentárias, pois estas últimas são voltadas basicamente para a representação e recuperação de informação, fornecendo um vocabulário padronizado, cujo sentido não é explicitado com vistas a ser tratado computacionalmente. As ontologias, por outro lado, se apóiam em mecanismos de representação baseados em lógica e que permitem definir, através de axiomas, os conceitos nela contidos e suas relações. As relações também possuem atributos que facilitam a descoberta de conhecimento. Esses atributos indicam, por exemplo, se a relação é inversa (ex: filho de e pai de), ou simétrica (ex: irmão de), ou ainda transitiva (ex:
pré-requisito de), dentre outros. Porém o uso de tais recursos depende da forma de modelagem dos conceitos na ontologia, podendo ser utilizados em maior ou menor escala. Para que o seu potencial seja plenamente realizado, as ontologias na web semântica devem lançar mão de seus recursos formais, de modo que permitam explicitar conceitos de diferentes graus de expressividade e dar conta de requisitos computacionais complexos (DING, et al., 2006). Nesse sentido, espera-se que seja possível expressar não só a identidade dos conceitos e seus atributos, mas também as
GT2
411
suas relações com outros, e que dependem do contexto onde os dados abertos estão inseridos. Algumas dessas relações expressam aspectos dinâmicos, como, por exemplo, o papel que uma pessoa exerce e que pode mudar com o tempo, enquanto outras podem ser influenciadas pelo contexto social. Estas últimas colocam em destaque a interação das pessoas com os recursos descritos pelas ontologias, podendo, de acordo com o perfil e contexto do usuário, sugerir associações com outros recursos potencialmente de interesse (MENDES et al., 2010). Cabe observar que a interligação de recursos de LOD pode se dar no nível das instâncias, onde basicamente se apontam relações de identidade entre indivíduos ou no nível do esquema, indicando relações de subclasse e axiomas que não envolvem noções individuais (JAIN et al., 2010). Essas últimas são as mais raras e que possuem maior potencial semântico. Saber explorar o potencial semântico que as ontologias fornecem, e trazer conhecimentos novos para o usuário que consome os dados abertos interligados, esse é o desafio a ser enfrentado na web 3.0, e essa é a oportunidade criada para o cientista da informação. Nossa proposição é que para utilizar plenamente o potencial semântico das ontologias, em especial considerando seu reúso e uso combinado, é importante conhecer e explorar os aspectos epistemológicos e ontológicos que fundamentam esses vocabulários, conforme explicado a seguir.
3 PRESSUPOSTOS ONTOLÓGICOS BÁSICOS
O potencial semântico de uma dada ontologia é medido pelo modelo conceitual associado, e este está fundamentalmente relacionado com o compromisso ontológico passível de ser representado por este modelo, onde aspectos epistemológicos e ontológicos convivem. Nesta perspectiva, a abordagem epistemológica nos coloca diante de questões que visam responder sobre a natureza do conhecimento de um dado domínio, colocando o foco na discussão da relação entre conhecedor e o que pode ser conhecido. Já a abordagem ontológica pretende identificar qual é a forma e a natureza da realidade e, portanto, o que é que se pode saber sobre ela. Ambas as abordagens são temas de discussão desde os estudos filosóficos na Antiguidade Clássica, e também, como a literatura da Ciência da Informação tem evidenciado, estas questões já vem sendo tema de pesquisa de diversos estudiosos na atualidade (DOUSA, 2010; GNOLI e POLI, 2004). Assim, a perspectiva epistemológica diz respeito à natureza do conhecimento, ou seja, a maneira como a realidade é percebida, medida e compreendida. Ela fornece bases teóricas para as ontologias, em especial as de fundamentação, e influenciam as escolhas que se encontram representadas nos conceitos nelas presentes :
Ontologia não é epistemologia, mas tem uma relação complexa com a epistemologia. Ontologia versa primariamente sobre as entidades, relações e propriedades do mundo, as categorias de coisas. Epistemologia versa sobre as entidades percebidas do mundo e as que se acreditam existir, suas relações e propriedades, i.e., maneiras de conhecer ou verificar coisas. (POLI e OBRST, 2009, p. 3).
Dessa forma, a perspectiva epistemológica é apoiada por crenças sobre a natureza da realidade e da verdade, que podem ser adotadas a partir de um acordo em um dado domínio, a partir de pressupostos
GT2
412
ontológicos, ou seja, diferente da perspectiva epistemológica a perspectiva ontológica permitiria estabelecer quais classes de conceitos seriam admissíveis, suas relações e sua modelagem em relação a aspectos tais como existência no espaço e tempo. Por motivos de limitação de espaço, a seguir apresentamos um subconjunto de pressupostos ontológicos, que se mostrou útil para a definição de um recorte de domínio de conhecimento na área Biomédica (CAMPOS, 2011).
Universais e Particulares A noção de universais está ligada à idéia de que existem categorias básicas de coisas que são comuns, ou compartilhadas por diferentes objetos. Por exemplo, dois objetos diferentes que possuem a mesma cor, possuem algo em comum. Considerando que universais existem, podemos definir universais como “padrões de características que podem ser instanciados em um número de diferentes indivíduos”. (GUIZZARDI, FALBO, GUIZZARDI, 2008). Esses indivíduos, por sua vez, existem na realidade, possuindo uma identidade única e são chamados de particulares (GUIZZARDI, FALBO, GUIZZARDI, 2008). Desta forma, a noção de universal diz respeito ao que é comum a vários indivíduos que são denominados particulares. Os particulares podem ser concretos (por exemplo, uma cadeira) ou abstratos (por exemplo, um número), enquanto que os universais são sempre conceitos abstratos. A distinção entre universais e particulares tem sido usada em ontologias de topo para o estabelecimento mais coerente de relações lógicas (gênero-espécie e partitivas), que são usadas para estruturar as hierarquias dessas ontologias (SMITH, KUMAR, BITTNER, 2005). Ou seja, para definir essas relações é necessário levar em conta não só os universais, mas também os particulares, pois essa análise revela aspectos da semântica da relação (SMITH et al., 2005). Por exemplo, podemos dizer que os ovários são parte_de ser humano, mas não podemos dizer que ser humano tem_parte ovário, pois existem seres humanos homens e mulheres e, no primeiro caso, eles não possuem ovário. Na Ciência da Informação a noção de universais e particulares também é trabalhada, embora com terminologia por vezes distinta. Dahlberg (1978) menciona a distinção entre objetos individuais e objetos gerais, e considera que os objetos gerais prescindem das formas do tempo e do espaço:
) (
uma unidade inconfundível (coisas, fenômenos, processos, acontecimentos, atributos,
etc) pode-se falar de objetos individuais. Pode-se dizer que o que caracteriza os objetos individuais é a presença de formas no tempo e espaço. Os objetos individuais estão aqui
) Mas, além
dos objetos individuais (
correspondem os
chamados conceitos gerais (
prescindem das formas do tempo e do espaço. A estes objetos (
podemos referir-nos a objetos gerais que, de certo modo,
e agora. Ex.: esta casa, esta mesa, este automóvel, esta partida de futebol. (
toda vez que o objeto é pensado como único, distinto dos demais, constituindo
)
)
).
(DAHLBERG, 1978, p.101).
Continuantes e Ocorrentes
GT2
413
A idéia de ocorrentes e continuantes está baseada na discussão epistemológica sobre a questão da persistência e da mudança ao longo do tempo, tratada pelas correntes filosóficas do endurantismo e do perdurantismo (MUIS, 2005). Organismos, células e moléculas são exemplos de entidades cuja natureza é continuante (ou endurante). Por exemplo, uma célula não existe por intervalos de tempo descontínuos. E, ainda, durante sua existência ela se manifesta por completo, continuamente, em todos os intervalos de tempo. De acordo com Grenon, Smith e Goldberg (2003) “isto significa que embora nós segmentemos o intervalo de tempo durante o qual um continuante existe, nós achamos esse mesmo continuante em cada segmento.”. Além disso, as partes de um continuante são sempre continuantes. Exemplos de ocorrentes (ou perdurantes) são: eventos, processos, atividades. De acordo com Grenon, Smith e Goldberg (2003) “Isto significa que se nós segmentamos o intervalo de tempo durante o qual um ocorrente ocorre então nós segmentamos também o ocorrente.”. Além disso, as partes de um ocorrente são sempre ocorrentes, embora os continuantes possam participar de ocorrentes.
A noção de dependência De forma simplificada, a noção de dependência nos remete a algumas questões, a saber: (i) se a existência de um indivíduo implica na existência de outro indivíduo específico (dependência rígida); (ii) se a existência de um indivíduo implica na existência de algum indivíduo que pertença a uma classe específica (dependência genérica); (iii) se a existência de um indivíduo que pertence a uma determinada classe implica na existência de um indivíduo diferente pertencente a uma classe diferente (dependência de classe) (GUARINO, 1997). Uma outra questão relacionada à noção de dependência é a situação em que a existência de uma entidade depende da existência simultânea de outra, denotando um acoplamento forte entre elas. Desta forma, universais (e particulares) que não dependem de simultaneamente de outros para existir, são denominados de substanciais e os que dependem simultaneamente de outros são denominados de modo. Um modo denota a instanciação de uma propriedade, sendo que um modo só pode existir em outros indivíduos (é inerente a esses indivíduos). Exemplos de universais substanciais são:
maçã, planeta e pessoa, e de universais de modo são: cor, carga elétrica e dor de cabeça (GUIZZARDI, FALBO, GUIZZARDI, 2008).
As noções de qualidade, propriedade e atributo A noção de qualidade e outras relacionadas, no contexto da análise ontológica, dizem respeito a aspectos das entidades, que intuitivamente podemos exemplificar por conceitos, tais como: vermelho, alto, pesado, dentre outros, sendo alvo de estudos diversos na literatura, como, por exemplo, seus tipos e modos de formalização (MASOLO et al., 2002) (GRENON, SMITH, 2004). Entretanto, como destaca Mizoguchi (2000), observamos o uso de terminologias distintas para a noção de atributo, por vezes utilizadas de forma ambígua.
GT2
414
A noção de atributo na filosofia é encontrada na literatura como sinônimo de propriedade (OLIVER, 1996), ou como generalizador dos conceitos de qualidade e propriedade (SMITH, 1990), ou ainda sendo intuitivamente associada a adjetivos utilizados para caracterizar entidades (JONES, 1949). Nesse contexto, observa-se uma diferenciação entre entidades substanciais e seus atributos, sendo que os últimos são existencialmente dependentes dos primeiros (CHAPPELL, 1997). Na Ciência da Computação, observamos que a noção de atributo como propriedade também envolve a distinção entre atributo de instâncias e de classes:
Atributos de instância descrevem instâncias de conceitos, de onde eles tomam seus valores. Estes atributos são definidos em um conceito e herdados pelos seus conceitos subordinados e instâncias. Por exemplo, a data de um Contrato é própria de cada instância. Atributos de classe descrevem conceitos e tomam seus valores a partir do conceito onde são definidos (…) não são herdados nem pelas subclasses nem pelas instâncias. Um exemplo é o atributo Primeiro Nome como parte de uma Pessoa Natural. (GÓMEZ-PÉREZ, ORTIZ-RODRÍGUEZ, VILLAZÓN-TERRAZAS, 2006, p.308).
Considerando que a noção de atributo tem sido ligada às noções de qualidade e propriedade (LEVINSON, 1978), cabe observar que existe uma distinção entre estas últimas, envolvendo, dentre outras, a questão epistemológica da existência de universais. Para ajudar a diferenciar propriedade de qualidade, pode-se usar o aspecto da quantificação (LEVINSON, 1978). Nesse contexto, uma qualidade é quantificável, ou seja, pode ser medida, enquanto que uma propriedade não pode. Desta forma, por exemplo, a propriedade de uma entidade ter uma
altura, ou ter uma cor, não pode ser medida, mas a altura de uma entidade, ou a sua vermelhidão , que
é uma qualidade, esta pode ser medida:
É a minha afirmação de que “ser azul” e “azul” designam entidades distintas, sendo a primeira uma propriedade e sendo esta última o que vou chamar de qualidade. Uma
diferença entre ser azul, ser paciente, ser caridoso, etc, e azulidão, paciência, caridade,
é que o último parece admitir quantificação, enquanto que o primeiro não. Nós
podemos falar de uma abundância de caridade em uma comunidade, de mostrar muita paciência, de uma gravata possuir mais vermelhidão do que outra - mas não de uma abundância de ser caridoso, ou de exibir muita quantidade de ser paciente, ou ter muita quantidade de ser vermelho (LEVINSON, 1978).
A diferenciação entre propriedades e qualidades (JONES, 1949) pode estar centrada na questão da particularização de características:
Uma importante conseqüência desta diferenciação (…) é que qualidades admitem particularização, enquanto propriedades não. O que tenho em mente com isso é, por exemplo, “ a tenacidade do João” pode designar uma entidade que pertence necessariamente apenas ao João, e da qual todos os outros objetos que não o João são excluídos logicamente de possuir, enquanto que “João sendo tenaz” nunca designa uma entidade com tais características. Em outras palavras, se existem “particulares abstratos” eles são derivados de qualidade, não de propriedade (LEVINSON, 1978).
Nesse sentido, propriedades são existencialmente dependentes dos objetos que as possuem. “Se
x é uma propriedade e y é um objeto possuindo x, então, necessariamente, x existe apenas se y existir”
etc, (
)
GT2
415
(LOWE, 1998, p.139). Associada à noção de propriedade está o conceito de trope, discutido a seguir. O problema dos universais e a noção de trope A questão epistemológica da existência dos universais é desdobrada na filosofia como o problema dos universais e diz respeito à crença de se existem (ou não) universais que instanciem as propriedades, ou seja, se uma mesma propriedade está presente em diferentes particulares ou se a propriedade de cada particular é única e inerente a este particular, não estando presente em outros particulares:
Aqui estão cinco diferentes triângulos equiláteros pretos: ppppp. São eles cinco
instâncias (particulares) de uma e da mesma cor universal, preto, ou são eles, ao contrário do que a linguagem natural pode sugerir, meramente cinco particulares? São eles cinco instâncias (particulares) de uma e da mesma forma geométrica universal, triangularidade equilateral, ou são eles meramente cinco particulares? Este é o problema dos universais.
Se há um universal triangularidade equilateral, então esta entidade singular iria aqui de alguma forma existir em cinco lugares e em cinco particulares ao mesmo tempo. É literalmente um-em-muitos. Coisas individuais ordinárias e instâncias de propriedades, por outro lado, existem apenas em um lugar de cada vez e são, podemos dizer, um-em- um. (JOHANSSON, 2009, p. 7).
(
)
A questão de propriedades em relação ao conceito de universais e particulares nos remete à noção de trope. Um trope pode ser definido como uma instância de uma propriedade de uma entidade específica (ou seja, como um particular), sendo possível se estabelecer relações de semelhança entre tropes, e não sendo necessário o compromisso de assumir a existência de universais (GUIZZARDI, MASOLO, BORGO, 2006):
Então alguém alega que a “brancura” de um pedaço específico de papel que alguém está segurando é um trope (uma propriedade localizada ou uma qualidade individual) enquanto que o universal “branco” de fato não existe (BORGO, VIEU, 2008).
Por outro lado, existem autores que afirmam não haver incompatibilidade entre as noções de tropes e a existência de universais (LOWE, 2002), sendo que Guizzardi, Mazolo e Borgo (2006) defendem a idéia da fusão das duas noções:
(…) a e b possuem a propriedade de serem vermelhos porque o trope avermelho e o trope bvermelho são ambos instâncias do universal Vermelho. Neste caso, universais existem, mas eles são instanciados apenas pelos tropes (GUIZZARDI, MAZOLO E BORGO, 2006).
Neste caso, entende-se não só que o trope é uma entidade abstrata, que depende do particular para existir, mas ainda que reflete uma característica cuja intensidade (abstração) é fornecida por um universal que o trope instancia. Ao considerarmos propriedades como universais, estamos dizendo que uma propriedade pode ser instanciada para dois particulares distintos, exemplificando exatamente a mesma propriedade, ou seja, exemplificando um único universal. De acordo com essa perspectiva, admite-se a existência de uma variedade de tipos ou categorias de atributos (LOUX, 1972). Ao contrário, se considerarmos propriedades como particulares, então não vai haver duas propriedades iguais, não importa o quão semelhantes elas sejam, da mesma forma que não existem dois indivíduos iguais (SEMY, PULVERMACHER, OBRST, 2004).
GT2
416
As noções de identidade, rigidez, unidade As noções de identidade e unidade, como discutidas na filosofia e ciências cognitivas, têm sido tratadas na literatura de ontologias por diversos autores (GUARINO, 1999) (GUIZZARDI e HALPIN, 2008), fornecendo apoio para a formação de hierarquias mais claras e para tornar o compromisso ontológico explícito, facilitando o reúso. Identidade diz respeito a estabelecer as características únicas que distinguem uma determinada instância de uma classe das outras instâncias (GUARINO e WELTY, 2000). Termos que fornecem critérios de identidade são denominados de sortais. Diretamente ligada ao conceito de identidade está a noção de rigidez. Uma propriedade é considerada rígida se é aplicável a todas as instâncias de uma entidade ao longo do tempo (GUARINO e WELTY , 2000), durante toda a sua existência. Por exemplo, costumamos tomar a propriedade de ser pessoa como rígida, pois podemos entender que uma entidade nunca deixa de possuir a propriedade de ser pessoa enquanto existir. Por outro lado, e propriedade de ser estudante não é rígida, pois um indivíduo não é necessariamente estudante ao longo de toda a sua existência (GUARINO e WELTY, 2000). Guizzardi e colegas, por sua vez, definem rigidez de forma semelhante:
Em termos simples, um tipo T é considerado rígido se toda instância x de T é necessariamente (no senso modal) uma instância de T. Em outras palavras, x não pode deixar de instanciar T sem deixar de existir (GUIZZARDI e GUIZZARDI,
2010).
Em outras palavras, uma instância de um conceito rígido não pode cessar de ser uma
instância desse conceito sem perder sua identidade (
rígidos são Pessoa, Cachorro, e Planeta (…) (GUIZZARDI, PIRES, SINDEREN,
. Exemplos de conceitos
)
2002).
Guarino e Welty (2000) alertam ainda para a distinção entre carregar (ou ser portador de) uma condição de identidade e de fornecer esta condição. Nesse sentido, podemos dizer que propriedades rígidas fornecem uma condição de identidade, enquanto que propriedades que não são rígidas apenas carregam essa condição. Unidade, por outro lado, diz respeito a estabelecer quais as partes que caracterizam uma determinada instância de uma entidade, formando um todo (possuindo uma condição de unidade), através de uma relação de unificação que une essas partes, e é válida para todas as instâncias dessa entidade. Guarino e Welty (2000) propõem a noção de todo como sendo essencial, ou seja, perdurando para uma entidade durante toda a sua existência.
As noções de tempo e espaço A noção de espaço é multifacetada, envolvendo características como as de adjacência, contato e separação, as quais dizem respeito aos limites do espaço (SMITH e VARZI, 2000). Essas características são importantes para determinadas ontologias, como, por exemplo, as da área biomédica, devido à natureza dos processos biológicos que ocorrem em nível molecular e celular. Para estes, pode ser relevante descrever informações de diferentes níveis de granulosidade, tais
GT2
417
como a superfície da célula onde determinado processo ocorre, ou o local onde uma molécula permite ligação com outra (binding site). A localização no espaço pode ser considerada como um tipo de qualidade, do mesmo modo que a cor de um objeto (BATEMAN e FARRAR, 2004). Dessa forma, existe a noção de uma região do espaço que se pode associar a um objeto ou evento para determinar sua localização espacial. Esta pode mudar com o tempo, embora o objeto não possa ser separado de sua localização, o que caracteriza uma dependência espacial entre o espaço como qualidade e a entidade que possui essa qualidade. Por outro lado, o espaço pode ser considerado como uma entidade continuante que pode ser decomposta em partes. Nesse caso, alinhado com essa visão, o conceito de região do espaço pode ser usado para definir entidades as quais existem de forma independente das coisas que podem estar localizadas nelas. Essas entidades podem mudar com o tempo. Nesse caso, são exemplos de regiões do espaço: o espaço ocupado por um tomate em um determinado tempo, o espaço que foi ocupado pelo tomate em um determinado tempo, mas que agora está vazio devido ao fato de o tomate ter sido movido, e a soma total de todo o espaço do universo (SMITH, KUMAR e BITTNER, 2005). Uma outra forma de encarar a espacialidade é sob a perspectiva da localização relativa entre entidades. Sob essa perspectiva, existem entidades que possuem natureza espacial, mas cujas instâncias não são regiões espaciais. Como exemplo, podemos citar é a cavidade onde se localiza o cérebro, o qual fornece uma forma espacial em relação ao cérebro, sendo ocupada por este (PISANELLI, 2004, p.25). Como podemos observar, a noção de espaço está também ligada à noção de tempo, uma vez que a realidade, onde se inserem os espaços, é dinâmica (GRENON e SMITH, 2004). Mais precisamente, capturar aspectos de espaço-tempo é particularmente importante para determinados fins, como, por exemplo, para descrever a natureza dinâmica dos processos biológicos, que se desdobram não só no espaço, mas também no tempo. De forma semelhante às regiões do espaço, regiões do espaço-tempo são entidades que existem de forma independente dos processos que podem estar situados nela. Nesse contexto, uma região de espaço-tempo pode ser contínua ou descontínua. O espaço-tempo contínuo pode ser útil, por exemplo, para situar a localização espaço-temporal do desenvolvimento de um feto, ou da vida de um organismo. Já o espaço-tempo descontínuo pode ser útil, por exemplo, para situar o espaço-tempo de cada excreção realizada por um microorganismo ao longo de um dia. O tempo também pode ser considerado de maneira semelhante, porém de forma independente do espaço e pode ainda ser encarado de dois modos: para caracterizar tempo contínuo, como, por exemplo, o intervalo de tempo em que ocorre uma divisão celular, ou descontínuo, tal como o tempo ocupado por cada excreção de um vacúolo em um microorganismo ao longo de um dia. É possível ainda contemplar aspectos de localização no tempo de maneira semelhante às de espaço, ou seja, como aspectos de qualidade. Dessa forma, existe a noção de uma região do tempo que se pode associar a um objeto ou evento para determinar sua localização no tempo (GANGEMI et al., 2002). Para que a obtenção de inferências mais precisas é fundamental que a ontologia seja modelada
GT2
418
levando em conta os princípios comentados na presente seção, e as implicações lógicas que estes trazem, conforme explicado anteriormente. Nesse sentido, ontologias de alto nível podem ser consideradas úteis para guiar a estruturação e o mapeamento de ontologias de domínios específicos, conforme explicado a seguir.
4 TRABALHOS RELACIONADOS
Ontologias de alto nível, como, por exemplo, a UFO (GUIZZARDI e HALPIN, 2008), a DOLCE (GUARINO, 1997) e a BFO (SMITH, KUMAR e BITTNER, 2005), fornecem perspectivas de modelagem fundamentadas por escolhas ontológicas (notadamente as de rigidez e identidade, existência ao longo do tempo, unidade, dependência, e qualidades) que buscam formalizar a natureza das suas entidades. A UFO, assim como a DOLCE, possui um modelo mais rico em detalhes e com maior flexibilidade para modelar determinados aspectos, como, por exemplo, o da qualidade e o do encadeamento de processos no tempo, porém para isso assume o compromisso com a existência de entidades abstratas, que não possuem correspondente no mundo real. A BFO, em contrapartida, apresenta um modelo menos detalhado, porém bastante aderente com as entidades que se observam no mundo real, com um viés estritamente científico e, até onde pudemos perceber, adequado para as necessidades de comunidades científicas, notadamente a biomédica. Iniciativas de representações conceituais utilizando ontologias de alto nível como a UFO (GUIZZARDI, MASOLO e BORGO, 2006; GUIZZARDI e GUIZZARDI, 2010) podem ser utilizadas como aprendizado para modelar a descrição de recursos nas iniciativas de LOD. Um exemplo de ontologia de alto nível sendo usada em LOD pode ser encontrada no trabalho de Janik, Scherp, e Staab (2010), que descreve a interligação de dados de músicas (álbuns e suas trilhas) com as de programas da BBC (rede de notícias inglesa), em uma estrutura denominada pelos autores de “rede de ontologias”, onde ontologias de domínio e nucleares 5 , estão compatibilizadas entre si, sendo que a ontologia DOLCE fornece soluções de modelagem para intermediar essa compatibilização. O apoio de esquemas classificatórios como o utilizado pela Wikipédia também tem sido usado como solução para interligar dados LOD no nível do esquema, como é o caso do sistema BLOOMS, de Jain et al. (2010) . Os autores, entretanto, destacam que poderiam ter usado ontologias de alto nível em vez das categorias hierárquicas da Wikipédia, tendo optado por estas últimas devido ao fato de serem mais intuitivas. A questão da simplicidade de uso em contraste com a necessidade de uma semântica mais precisa, parece ser um desafio a ser vencido para concretizar a web semântica, entretanto, para que se criem soluções simplificadas, é preciso antes compreender o complexo.
5 CONCLUSÕES
5 De acordo com os autores, ontologias nucleares fornecem uma definição precisa do conhecimento estruturado dentro de um campo específico que perpassa vários domínios de aplicação.
GT2
419
A web 3.0 traz desafios e oportunidades, para tornar realidade a promessa de interligar de maneira útil os imensos silos de informação disponíveis na web. Para isso, espera-se que esses dados sejam publicados de forma aberta e descritos e articulados de forma mais semântica, permitindo que agentes de software possam revelar, através de inferências, novos conhecimentos e também possam recuperar informação relevante, de forma mais precisa. Na web 3.0 as ontologias desempenham papel central, não só para definir a identidade dos dados, disponíveis como recursos, mas também para articulá-los entre si, o que levanta questões como as da compatibilização de conceitos, temática amplamente estudada na Ciência da Informação e também na Ciência da Computação. No centro dessas questões, está a discussão sobre os pressupostos epistemológicos e ontológicos que fundamentam, ou deveriam fundamentar a construção de ontologias, e que possuem uma complexidade de entendimento que contrasta com a necessidade de gerar vocabulários que sejam tão simples quanto possível, naturalmente dependendo do domínio considerado e propósito. Nesse contexto, o presente trabalho apresenta como contribuição uma descrição sumária dos conceitos básicos que estão representados nas ontologias de fundamentação. Estes podem ser usados pelo cientista da informação como instrumental e ponto de partida para a modelagem que deveria preceder a publicação de dados abertos ligados, oferecendo assim uma camada semântica mais rica, e cujo propósito é diferente daquele das linguagens documentárias. Por outro lado, a larga experiência da Ciência da Informação no desenvolvimento e compatibilização dessas linguagens documentárias, traz ao cientista da informação um diferencial de vivência que não pode ser desperdiçado. É preciso, entretanto, que esse profissional abrace novas formas de representação da informação, mais complexas, e que envolvem as noções filosóficas apresentadas de forma sumária no presente trabalho.
REFERÊNCIAS
ALLEMANG, D., HENDLER, J. Semantic web for the working ontologist: modeling in RDF, RDFS and OWL, Elsevier, MA, USA, 2008.
BATEMAN, J. A.; FARRAR, S. Towards a generic foundation for spatial ontology. In:
PROCEEDINGS OF THE THIRD INTERNATIONAL CONFERENCE ON FORMAL ONTOLOGY IN INFORMATION SYSTEMS (FOIS-2004), Amsterdam, p. 237-248, 2004.
Foundational choices in DOLCE. In R. Poli, Healy M., and Kameas A.,
editors, Theory and Applications of Ontology, v. 2, C.12. Springer Verlag, 2008.
Artifacts in formal ontology. In Handbook of the Philosophy of the
Technological Sciences, v. 2: Artifact ontology and artifact epistemology. Elsevier, 2008.
BREITMAN, K.K. Web Semântica: A Internet do Futuro. LTC: Rio de Janeiro, 2005.
CAMPOS, L. M. Diretrizes para definição de recorte de domínio no reúso de ontologias biomédicas: uma abordagem interdisciplinar baseada na análise do compromisso ontológico. Tese de Doutorado em Ciência da Informação. Convênio UFF/IBICT, 2011, 323p.
CHAPPELL, V. Descartes’s ontology, 1997. Topoi v.16, n.2. Disponível em <http:// www.springerlink.
BORGO, S.; MASOLO, C
BORGO, S.; VIEU, L
GT2
420
com/content/x85m25277v5l4g68/fulltext.pdf>. Acesso: 25 jan. 2011.
DAHLBERG, I. Teoria do conceito. Ciência da Informação, v. 7, n. 2, p. 101-07, 1978.
DING, L., KOLARI, P., DING, Z., AVANCHA, S., Using Ontologies on the Semantic Web: A Survey, Ontologies, p.79-113, Springer, 2006.
DOUSA, T. M. – The simple and the complex in E.C. Richardson’s theory of classification: observations on an early KO model of the relationship between ontology and epistemology. In: Paradigms and conceptual systems in knowledge organization, p. 15-22, 2010.
GANGEMI, A.; GUARINO, N.; MASOLO, C.; OLTRAMARI, A. Sweetening ontologies with Dolce. In: PROCEEDINGS OF THE 13TH INTERNATIONAL CONFERENCE – EKAW, Lecture Notes in Artificial Intelligence, v. 2473, p. 166–181. Berlin: Springer, 2002.
GNOLI, C., POLI, R. Levels of reality and levels of representation. Knowledge Organization, v. 31, n.3, p. 151-160, 2004.
GÓMEZ-PÉREZ, A.; ORTIZ-RODRÍGUEZ, F.; VILLAZÓN-TERRAZAS, B.: Legal Ontologies for the Spanish eGovernment. In: Current Topics in Artificial Intelligence, p. 301-310. Springer, Heidelberg, 2006.
GRENON, P.; SMITH, B. SNAP and SPAN: Prolegomenon to geodynamic ontology, In: Spatial Cognition and Computation, 2004.
GRENON, P.; SMITH, B.; GOLDBERG, L. Biodynamic Ontology: Applying BFO in the Biomedical Domain, In: PROCEEDINGS OF THE WORKSHOP ON MEDICAL ONTOLOGIES, Rome, Italy,
2003.
GUARINO, N. Some Organizing Principles for a Unified Top-Level Ontology. National Research Council LADSEB-CNR Int. Rep. 02/97, March 1997.
GUARINO, N. The Role of Identity Conditions in Ontology Design. In PROCEEDINGS OF IJCAI-99 WORKSHOP ON ONTOLOGIES AND PROBLEM-SOLVING METHODS: LESSONS LEARNED AND FUTURE TRENDS. Stockholm, Sweden, 1999.
GUARINO, N.; WELTY, C. Towards a methodology for ontology based model engineering. In:
PROCEEDINGS OF THE ECOOP WORKSHOP ON MODEL ENGINEERING, 2000.
GUIZZARDI, G.; FALBO, R.; GUIZZARDI, R. S. S . A importância de Ontologias de Fundamentação para a Engenharia de Ontologias de Domínio: o caso do domínio de Processos de Software. Revista IEEE América Latina, v. 6, n.3, p. 244-251, 2008a.
GUIZZARDI, G.; HALPIN, T.: Ontological Foundations for Conceptual Modeling, Applied Ontology, v.3, n.1-2, p. 91-110, 2008.
GUIZZARDI, G.; MASOLO, C.; BORGO, S. In the Defense of a Trope-Based Ontology for Conceptual Modeling: An Example with the Foundations of Attributes, Weak Entities and Datatypes, 25th Intl. Conf. on Conceptual Modeling, Berlin, 2006.
GUIZZARDI, G.; PIRES, L.F.; SINDEREN, M.J. On the role of Domain Ontologies in the design of Domain-Specific Visual Modeling Languages. In: PROCEEDINGS OF THE. 2ND WORKSHOP ON DOMAIN-SPECIFIC VISUAL LANGUAGES. OOPSLA, 2002.
GUIZZARDI, R.S.S.; GUIZZARDI, G. Ontology-Based Transformation Framework from Tropos to AORML. Social Modeling for Requirements Engineering, Cooperative Information Systems
GT2
421
Series, MIT Press, Boston, 2010.
HEATH, T., BIZER, C. Linked Data: Evolving the Web into a Global Data Space. Synthesis Lectures on the Semantic Web: Theory and Technology, Morgan&Claypool, 2011.
HENDLER, J. Web 3.0 Emerging, Computer, v. 42, n.1, p 88-90, January, 2009.
HORROCKS, I
58-67, December 2008.
JAIN, P., HITZLER, P., SHETH, A.P., VERMA, K., E YEH, P.Z. Ontology Alignment for Linked Open Data. In: PROCEEDINGS OF INTERNATIONAL SEMANTIC WEB CONFERENCE., p. 402-417, 2010.
JANIK, M., SCHERP, A., STAAB, S. The Semantic Web: Collective Intelligence on the Web. In:
Informatik Spektrum, Springer, 2011.
Ontologies and the semantic web. Communications of the ACM, v.51, n.12, p.
JOHANSSON, I., Roman Ingarden and the Problem of Universals. Metaphysica. International Journal for Ontology and Metaphysics, v. 10, p. 65-87, 2009.
JONES, J. R. Are the Qualities of Particular Things Universal or Particular. The Philosophical Review, v. 58, n. 2, p. 152-170, 1949.
LEVINSON, J., Properties and Related Entities. Philosophy and Phenomenological Research, v 39, n. 1, p. 1-22, 1978.
LOUX, M. J. Recent Work in Ontology. American Philosophical Quarterly, v.9, p. 119-138, 1972.
LOWE, E. J. A Survey of Metaphysics, Oxford: Oxford University Press, 2002.
LOWE, E. J. The Possibility of Metaphysics: Substance, Identity, and Time. Oxford University Press, USA, 1998.
MASOLO, C., BORGO, S., GANGEMI, A., GUARINO, N., OLTRAMARI, A., SCHNEIDER, L.:
WonderWeb Deliverable D17, 2002.
MENDES P.N., KAPANIPATHI P., CAMERON D., SHETH A.P., Dynamic Associative Relationships on the Linked Open Data Web, In: PROCEEDINGS OF THE WEB SCIENCE, 2010.
MIZOGUCHI, R. Yet another top-level ontology: Yato. In: PROCEEDINGS OF THE SECOND INTERDISCIPLINARY ONTOLOGY MEETING, p. 91–101, 2000.
MUIS, R. Review of Four-Dimensionalism: An Ontology of Persistence and Time, Ars Disputandi,
2005.
NEVILLE, H. H. Thesaurus reconciliation. Aslib Proceedings, v.11, n.24, p. 620-626, 1972.
OBO. Open Biomedical Ontologies, 2009. Disponível em: <http://obo.sourceforge.net.>. Acesso em 24 jan. 2011.
OLIVER, A. The Metaphysics of Properties. Mind, New Series, v. 105, n. 417, p. 1-80, 1996.
OTLET, P. Monde: essaie d’universalisme - connaissance du monde; sentiment du monde;action organisée et plan du monde,Brussels,Editions Mundaneum, p.390-391, 1935.
PISANELLI, D.M. Ontologies in Medicine. Amsterdam, IOS Press, 2004.
SEMY, S.K.; PULVERMACHER, M.K.; OBRST, L.J. Toward the Use of an Upper Ontology for U.S. Government and U.S. Military Domains: An Evaluation, MITRE TECHNICAL REPORT,
GT2
422
2004.
SMITH B.; KUMAR A.; BITTNER T. Basic Formal Ontology for Bioinformatics. Journal of Information Systems. p.1-16, 2005
SMITH, A.D. Of Primary and Secondary Qualities. The Philosophical Review, v. 99, n. 2, p. 221- 254, 1990.
SMITH, B.; VARZI, A. C. Fiat and Bona Fide Boundaries. Philosophy and Phenomenological Research, v.60, n. 2, p. 401–420, 2000.
SMITH, B; CEUSTERS, W; KLAGGES, B; KOHLER, J; KUMAR, A; LOMAX, J; MUNGALL, C.J.; NEUHAUS, F.; RECTOR, A; ROSSE, C. Relations in Biomedical Ontologies.Genome Biology, v.6. n.46, 2005.
SÖDERBÄCK, A., MALMSTEN, M. LIBRIS – Linked Library Data. In: Nodalities Magazine, n. 5, January, 2009.
TODOR, A., PASCHKE, A., HEINEKE, S. ChemCloud: Chemical e-Science Information Cloud. In: PROCEEDINGS OF CoRR, 2010.
PESET, F., FERRER-SAPENA, A., SUBIRATS-COLL, I. Open data y Linked open data: su impacto en el área de bibliotecas y documentación. El Profesional de la Información, vol. 20, n. 2, p. 165- 174, 2011.
GT2
423
COMUNICAÇÃO
ORAL
O VOCABULÁRIO CONTROLADO COMO INSTRUMENTO DE ORGANIZAÇÃO E REPRESENTAÇÃO DA INFORMAÇÃO NA FINEP
Tatiana Almeida Rosali Fernandes Souza
Resumo: A Financiadora de Estudos e Projetos (FINEP), como empresa nacional de financiamento, possui potencial relevante de dados das propostas recebidas de pesquisa e desenvolvimento em ciência, tecnologia e inovação no país. Como tal, se caracteriza como sistema de recuperação da informação. O trabalho analisa o Vocabulário Controlado FINEP (VCF) enquanto instrumento de organização e representação da informação das propostas de financiamento. A análise do VCF é feita por abordagem histórico-metodológica da construção do vocabulário, ressaltando aspectos da concepção e das etapas de desenvolvimento do instrumento, destacando as principais mudanças no tempo. Investiga a viabilidade de aplicação do processo de categorização dos descritores em uso como contribuição para avaliação e reestruturação do vocabulário e conclui sobre a viabilidade de aplicação do método de categorização no VCF, destacando a importância fundamental da definição dos descritores nesse processo.
Palavras-chave: Sistema de Recuperação da Informação. Vocabulário Controlado. Categorização.
Abstract: The Financial National Agency (FINEP) has relevant data originated from research proposals on fields in science, technology and innovation. As such FINEP may be characterized as an information retrieval system. This work analyses the FINEP Controlled Vocabulary (VCF) as an instrument of organization and representation of information originated from the research proposals received. The VCF analyses are based on a historical and methodological approach on the vocabulary construction, pointing out aspects of its conception and improvements over time. It investigates the feasibility of applying classification methods for descriptors in use, aiming to contribute to the present vocabulary. Results indicate advantages of applying categorization methods on the controlled vocabulary, and emphasize the fundamental role played by the descriptor’s definition as an effective element to the whole process.
Palavras-chave: Information Retrieval Systems. Controlled Vocabulary. Categorization.
1 INTRODUÇÃO
O volume informacional gerado nos dias atuais desafia os profissionais de informação no que diz respeito ao armazenamento e ao tratamento da informação. Como representar o conteúdo de forma satisfatória de modo a permitir que os usuários tenham acesso a informações relevantes? A organização do conhecimento assume cada vez mais um papel estratégico nas tomadas de decisão pelas Empresas.
GT2
424
Somente com a modernização dos instrumentos que auxiliam essa organização será possível adequar- se às rápidas mudanças no crescimento da importância do uso e da capacidade de recuperação da informação. Além disso, um dos maiores problemas enfrentados pelas grandes empresas hoje em dia é
a quantidade de informação produzida por seus departamentos e serviços. A gestão da informação
pressupõe a atuação dos profissionais de informação como mediadores entre a informação localizada nos estoques informacionais (qualquer que seja o tipo de documento, formato ou suporte) e os seus usuários (entendidos como indivíduos que buscam informação para uma necessidade específica). O
aumento da informação em circulação nas empresas traz diversos problemas relacionados ao tratamento
e à recuperação de informação, sendo necessários estudos para aprimorar os instrumentos de busca. A
conjuntura atual de produção de informação representa um desafio em relação ao acesso. Numa empresa como a Financiadora de Estudos e Projetos (FINEP), na qual circula uma quantidade significativa de
informações relevantes sobre o desenvolvimento e o avanço da ciência, da tecnologia e da inovação no país, a realidade não é diferente.
É cada vez mais importante, no contexto de empresas como a FINEP, poder contar com
ferramentas que aumentem a agilidade e a precisão na recuperação da informação e auxiliem na padronização da linguagem documentária. Para que as etapas de seleção e análise das propostas de
financiamento sejam cumpridas com êxito, a empresa necessita de uma infraestrutura informacional que esteja de acordo com a política nacional de Ciência, Tecnologia e Inovação (C,T&I).
A FINEP atua no fomento aos projetos de pesquisa voltados à inovação tecnológica. Como
órgão oficial do Ministério da Ciência e Tecnologia (MCT), atende às necessidades de institutos de pesquisa, empresas privadas e públicas, agências internacionais, investidores e organizações do Terceiro Setor. Um elemento importante nesta infraestrutura informacional é a organização das informações das propostas de financiamento, alocadas no Núcleo de Documentação, e do material de apoio à análise realizada pelos técnicos, que são as revistas especializadas e os livros, que constituem o acervo da Biblioteca da empresa. É primordial que haja um padrão na organização e representação da informação, visando eficácia na recuperação. Atualmente, os vocabulários controlados tornaram-se instrumentos importantes para os sistemas informatizados. Esses vocabulários têm por objetivo principal o controle da polissemia que ocorre na linguagem natural, fazendo com que uma palavra que pode eventualmente assumir diversos significados passe a ter só um, determinado pelo contexto no qual a palavra está inserida. Este controle terminológico diminui a polissemia existente na linguagem natural, fazendo com que indexadores (na entrada de dados) e usuários (na busca da informação) consigam resultados mais eficazes.
Neste contexto, o trabalho de desenvolvimento do Vocabulário Controlado FINEP (VCF) surge, objetivando uma padronização e unificação da linguagem, em princípio da Biblioteca e do Núcleo de Documentação e, posteriormente, para uso de toda a FINEP, na recuperação de informação. A elaboração do projeto VCF visou contribuir com a organização do conhecimento e,
GT2
425
consequentemente, com o trabalho da equipe de técnicos e analistas da FINEP, numa iniciativa conjunta
da Biblioteca e do Núcleo de Documentação. A melhoria dos serviços de informação prestados encontra
aliado nas novas tecnologias de informação e comunicação, considerando a importância da recuperação de informação relevante e seu valor na tomada de decisão da empresa. O VCF, elaborado por uma equipe de profissionais da informação (Arquivistas, Bibliotecários
e Cientistas da Informação), visa unificar a terminologia no tratamento da informação dos acervos
bibliográficos e de projetos aprovados pela FINEP através do uso de uma linguagem de indexação padronizada. O VCF é a base para indexação das propostas de financiamento do Núcleo de Documentação e do material do acervo contido na Biblioteca. Atualmente, o uso de instrumentos de controle terminológico para apoio à indexação e recuperação da informação torna-se imprescindível diante dos Sistemas de Recuperação da Informação, acesso on- line à base de dados na internet e organização de bibliotecas visando o incremento na qualidade da informação recuperada pelos usuários. Com base nos elementos expostos, o objetivo principal do presente estudo é analisar o VCF, enquanto instrumento de organização e representação da informação, no contexto da FINEP, enfatizando
a metodologia de construção deste vocabulário e, mais especificamente, seu processo de categorização.
A categorização foi ressaltada neste estudo, por se tratar de um processo que se encontra em fase de
reavaliação e de reestruturação para atender às necessidades de informação dos usuários.
2 CATEGORIZAÇÃO
O método de Categorização ou Facetação foi desenvolvido na década de 20, do século XX,
por Shiyali Ramamrita Ranganathan para a construção de uma tabela de classificação bibliográfica. Ranganathan conduziu seu trabalho no sentido de discutir a natureza dos domínios de conhecimento
a partir da fundamentação do que se entende por conhecimento e formação de conceitos para definir o
modo pelo qual a Teoria da Classificação Facetada se propõe a dividir estes domínios. Para Campos e Gomes (2008):
A Categorização é um processo que requer pensar o domínio de forma dedutiva, ou seja, determinar as classes de maior abrangência dentro da temática escolhida. Na verdade, aplicar a categorização é analisar o domínio a partir de recortes conceituais que permitem determinar a identidade dos conceitos (categorias) que fazem parte deste domínio.
Esta divisão se concretiza a partir do método das categorias fundamentais. Categorias fundamentais são ideias que permitem recortar um “universo de assunto” em classes abrangentes. Atuam como primeiro corte classificatório e fornecem uma visão do conjunto dos agrupamentos que ocorrem
na estrutura, possibilitando o entendimento global da área. Para Vickery (1960), categorias são conceitos
de alta generalidade e ampla aplicação empregados na interpretação do mundo. As categorias também são utilizadas para determinar as relações entre as facetas. Para Ranganathan, facetas são manifestações
GT2
426
de categorias do universo de um conhecimento estudado, são as classes mais abrangentes dentro de
um universo de ideias em que se formam os renques e as cadeias. Para o entendimento das Categorias Fundamentais, encontramos no trabalho de Campos; Gomes; Motta (2006) a seguinte síntese:
· Personalidade - Categoria fundamental de grande dificuldade de identificação. Ranganathan
propõe o método do resíduo para identificar sua manifestação: não é Tempo, não é Espaço, não é
Energia, ou Matéria, portanto é considerada uma manifestação da categoria fundamental Personalidade. Aqui ele aplica o princípio hindu “Não é isso, não é isso”
· Matéria - As manifestações da categoria Matéria são de duas espécies: Material e Propriedade.
· Energia - A manifestação da categoria Energia se caracteriza pela ação de uma espécie ou
outra. A ação pode ser entre e por todas as espécies de entidade, inanimada, animada, conceitual, intelectual e intuitiva.
· Espaço - A categoria Espaço é entendida como o local de pertencimento de um dado objeto,
seja ele indivíduo, coisa, ideia, fenômeno, entre outras entidades. A superfície da terra, o espaço dentro dela e o espaço fora dela são manifestações desta categoria.
· Tempo - A categoria Tempo está de acordo com o que geralmente entendemos por esse termo.
As ideias isoladas de tempo, como milênio, século, década, ano, e assim por diante. A partir dessas categorias podemos então identificar e aplicar a categorização em conceitos utilizados por diferentes áreas do conhecimento que, no domínio interdisciplinar, se agregam nas pesquisas desenvolvidas em seu interior, preservando a sua ideia fundamental, o seu atributo. Segundo Campos; Gomes; Motta (2006)
economia: teorias, política econômica (instrumentos/agentes); planejamento (operações);
e assim por diante. Na construção civil: edificações, como casas, edifícios, teatros, praças (personalidade); técnicas de edificação (técnicas); cimento, pedra, cerâmica, vidro (materiais); os profissionais envolvidos (agentes); e assim por diante. Na biblioteconomia: instituições e organizações, bibliotecas, documentos, usuários, suporte documental (personalidade); tratamento documentário, recuperação de informação, aquisição (processos); linguagens documentárias (agentes dos processos); profissionais envolvidos (agentes dos processos); e assim por diante.
] [
Posteriormente, o Classification Research Group (CRG) - fundado nos anos 50 do século XX com o objetivo de desenvolver estudos teóricos e práticos no âmbito da classificação - desdobrou estas categorias para a elaboração de classificações facetadas. Tais categorias, como bem colocado por Campos e Gomes (2006), são desdobramentos das categorias fundamentais de Ranganathan (PMEST) e se apresentam da seguinte forma:
GT2
427
Coisas, substâncias, entidades que ocorrem naturalmente produtos instrumentos constructos mentais Suas partes constituintes órgãos Sistemas de coisas Atributos de coisas qualidades, propriedades, incluindo Estrutura
Medidas processo, comportamento Objeto da ação (paciente) Relações entre coisas, interações efeitos reações Operações sobre coisas experimentos, ensaios operações mentais Propriedades de atributos, relações e operações Lugar, condição Tempo
O processo de categorização consiste em identificar as possíveis classes gerais (categorias) de conceitos que a área do conhecimento abrange, serve para orientar os profissionais no levantamento dos termos e auxilia na organização do domínio de conhecimento. Dahlberg (1978 apud CAMPOS; GOMES, 2006) enfatiza a importância fundamental da categoria na estruturação do conceito e do sistema de conceitos:
Podemos ver que as categorias têm uma capacidade de estrutura: não apenas estruturam, de fato, todos os nossos elementos de conhecimento e unidades do conhecimento; elas fornecem, ao mesmo tempo, por este meio, o esqueleto, os ossos e tendões para estruturar todo o nosso conhecimento. Com seu uso consciencioso, então, o corpo do nosso conhecimento pode se manter unido, pode se mover, pode se manter flexível - e pode crescer organicamente (DAHLBERG, 1978, p. 34 apud CAMPOS; GOMES, 2006).
A seção a seguir tem como objetivo apresentar o histórico e a metodologia de construção do VCF. Esta apresentação é de fundamental importância para o desenvolvimento e o embasamento dos procedimentos de análise realizados, tendo em vista que a metodologia de elaboração do instrumento estudado (o VCF) tem características específicas. Essas especificidades se destacam por se tratar de um instrumento para a recuperação da informação de uma empresa com a temática voltada para a área de Ciência, Tecnologia e Inovação (C,T&I) e se preocupa com a organização, representação e recuperação da informação, visando atender seus usuários com maior eficiência.
3HISTÓRICOEMETODOLOGIADECONSTRUÇÃODOVOCABULÁRIOCONTROLADO
FINEP (VCF)
A Biblioteca e o Núcleo de Documentação da FINEP perceberam, além da importância,
GT2
428
a necessidade do tratamento para a recuperação das informações contidas tanto nos projetos, que
solicitam financiamento, quanto nos documentos, que compõem o acervo da Biblioteca. Neste sentido, essas unidades tiveram a iniciativa conjunta de desenvolver um instrumento que desse conta da representação temática de seus documentos, ou seja, por assunto. Até então, o que vinha sendo feito era a representação descritiva dos aspectos formais dos documentos 1 e sua representação temática por meio de palavras e sem padronização terminológica. Esta prática mostrou-se pouco eficaz no momento da busca pela informação desejada, pois dispersa documentos que tratam dos mesmos
conceitos, expressos por palavras diferentes. Para suprir esta deficiência, foi criado um projeto para
a elaboração do VCF. Desde a sua concepção, o VCF vem passando por diversas modificações decorrentes de mudanças na sua coordenação, acarretando modificações metodológicas. No ano de 2003, a elaboração de uma proposta metodológica para a construção de um novo instrumento, que tinha como pré-requisito atender às necessidades tecnológicas atuais da FINEP, teve como fundamento os princípios metodológicos que regem a Teoria da Classificação Facetada de Shiyali Ramamrita Ranganathan (1963), a Teoria da Terminologia de Eugene Wüester (1981) e a Teoria do Conceito de Ingrid Dalhberg (1978). Este novo instrumento foi definido, na época, como um vocabulário sistematizado, pois era regido por princípios terminológicos com uma estrutura sistematizada de conceitos, no qual um termo, que no interior de um domínio, juntamente com os outros conceitos, formavam um sistema de conceitos, permitindo uma interface mais simples e útil para o pesquisador final.
Esta primeira etapa objetivou determinar os domínios temáticos para a elaboração do Vocabulário Sistematizado. Definiu-se que os recortes temáticos seriam determinados pelos Fundos Setoriais 2 . Os Fundos foram recortados por domínios de conhecimento ou atividade, o que facilitou a reunião de conceitos dentro de uma mesma área, formando um todo coeso. As áreas escolhidas foram Biotecnologia e Energia, que somaram um total de 845 termos levantados a partir da lista já existente na biblioteca (proveniente da indexação do acervo bibliográfico), dentro de cada domínio e a partir da indexação dos projetos dos Fundos Setoriais destas áreas (CT-BIOTEC e CT-ENERG). Esta primeira fase envolveu as seguintes atividades: Definição das fontes para o levantamento dos termos; Análise dos conceitos; Organização da estrutura do vocabulário (estabelecimento das relações, elaboração das
notas de definição, implantação do vocabulário no software e validação da forma do termo, da definição
e dos relacionamentos pelos especialistas); e Apresentação do Vocabulário para os setores da FINEP. O processo de categorização nesta fase foi apoiado na análise das definições e nas categorias estabelecidas tendo como base as categorias fundamentais de Ranganathan (PMEST). Por exemplo, na área de Biotecnologia, foram estabelecidas apenas três categorias: Domínios de atividade, que são
1 No caso da Biblioteca: registro do nome do autor, título, editor, ano de publicação, títulos de revistas, etc.; no caso do Núcleo de Documentação: nome da instituição, ano e Estado do projeto, nº do contrato, etc.
2 Os Fundos Setoriais, criados a partir de 1999, são instrumentos de financiamento de projetos de pesquisa, desenvolvimento e inovação no País. Há 16 Fundos Setoriais, sendo 14 relativos a setores específicos e dois transversais.
GT2
429
as áreas em que a Biotecnologia atua; Entidade, que é formada por conceitos que representam objetos concretos e abstratos; e as Técnicas Biotecnológicas, que representam os processos e ações dentro do domínio de Biotecnologia. Na segunda fase do projeto de elaboração do VCF, os termos já existentes na base de dados da Biblioteca foram definidos, padronizados e estruturados através de relacionamentos hierárquicos e associativos. E logo em seguida, o foco voltou-se para a indexação das propostas de financiamento aprovadas que compõem o acervo corrente do Núcleo de Documentação (arquivo central) da empresa. Nesta fase, foi decidido utilizar uma nova forma de categorização, com base na Tabela de Áreas do Conhecimento (TAC) do Conselho Nacional de Desenvolvimento Científico e Tecnológico
(CNPq). Para esta função foram utilizados somente dois níveis das áreas do conhecimento estabelecidas pelo CNPq, as grandes áreas e as subáreas, os outros níveis existentes não se mostraram necessários para o agrupamento de descritores, pois são níveis muito específicos. Por exemplo: Matemática, Estatística e Ciência da Computação, entre outros, foram agrupados em Ciências Matemáticas e Naturais. Já as subáreas de Engenharia Civil, Engenharia Sanitária e Ambiental, Engenharia Elétrica
e outros tipos de Engenharia, foram agrupados na grande área Engenharias. E assim por diante. Além
disso foi necessário também, inserir notações (códigos alfanuméricos) para identificar as grandes áreas e as respectivas subáreas. Como, por exemplo, a grande área Ciências Matemáticas e Naturais que recebeu a notação “A” e as respectivas subáreas agrupadas neste grupo que receberam a notação, de acordo com a ordem em que apareciam na tabela do CNPq. A subárea Matemática, por exemplo, tinha notação “A1”, Estatística tinha notação “A2”. No caso dos descritores não se enquadrarem em nenhuma das áreas do CNPq, ora seriam classificados na área Ciência e Tecnologia, ora numa área criada chamada Multidisciplinar. (FINANCIADORA DE ESTUDOS E PROJETOS, 2002, 2003, 2005, 2007; CAMPOS, 2004). Porém, com o desenvolvimento do trabalho, este tipo de categorização começou a apresentar alguns problemas conflitantes com a metodologia originalmente concebida - Ranganathan (1963), Dalhberg (1978) e Wüester (1981). Para Ranganathan, a poli-hierarquia na categorização dos termos não é admitida, cada descritor deve ser inserido em uma só categoria / faceta. Esta metodologia foi utilizada na primeira fase de desenvolvimento do VCF, conflitando-se na segunda fase com a Tabela de Áreas do Conhecimento (TAC) do CNPq, por ser esta uma tabela enumerativa, subdividida em áreas canônicas do conhecimento. Exemplificando: um descritor muito utilizado na indexação dos documentos da FINEP - “Inovação de processo” poderia se inserir em várias áreas do conhecimento; pode haver inovação de processo na área Engenharia de produto ou na área de Agronomia, ou até mesmo na área de Administração. Desta forma, a TAC foi considerada como não adequada para o uso
na função para a qual foi designada no desenvolvimento do VCF. Atualmente o Vocabulário está passando por um processo de revisão e avaliação, tendo como
foco principal a qualidade do tratamento, da indexação e da recuperação da informação relevante para
a FINEP. Diretamente vinculada a esta revisão, encontra-se a categorização dos termos. O presente
GT2
430
trabalho explora o estabelecimento de novas categorias para a organização dos descritores do VCF, cujas análises e resultados são apresentados a seguir.
4 ANALISE E RESULTADOS
A etapa de coleta de dados foi realizada no VCF, que se encontra disponível no Portal da Informação da Intranet da FINEP. Na busca realizada em outubro de 2010 foram identificadas 559 propostas de financiamento indexadas pelos Tipos de Inovação, sendo 113 por “Inovação de processo”, 421 por “Inovação de produto” e 25 por “Inovação de serviço”. Neste trabalho, para efeito de análise, foram selecionados os projetos indexados por “Inovação de processo”, descritor que é definido pela FINEP como:
Adoção de métodos de produção novos ou significativamente melhorados, incluindo métodos de entrega dos produtos. Tais métodos podem envolver mudanças no equipamento ou na organização da produção, ou uma combinação dessas mudanças, e podem derivar do uso de novo conhecimento. Os métodos podem ter por objetivo produzir ou entregar produtos tecnologicamente novos ou aprimorados, que não possam ser produzidos ou entregues com os métodos convencionais de produção, ou pretender aumentar a produção ou eficiência na entrega de produtos existentes. (FINANCIADORA DE ESTUDOS E PROJETOS, 2010).
A escolha de análise por este tipo de Inovação justifica-se pelo fato desse descritor ter sido usado mais enfaticamente pela FINEP nos últimos anos, indicando um interesse da instituição pelo financiamento de projetos desta temática. Além disso, as inovações de processo são sabidamente importantes como diferencial no desenvolvimento socioeconômico dos países. A segunda etapa da coleta de dados consistiu da extração da amostra para análise. Tendo como base o Portal de Informação da FINEP foi construído um relatório de todos os projetos indexados pelo descritor “Inovação de processo”. Este relatório possibilitou a identificação de cada projeto por três itens de informação: o número de referência, o título do projeto e os descritores atribuídos. A partir da leitura do relatório foi possível extrair os descritores que indexaram os projetos, nos quais necessariamente constava o descritor “Inovação de processo”. Foi contabilizado o total de 291 descritores únicos, após descarte dos descritores duplicados. Cumpre ressaltar que tais descritores foram atribuídos pela equipe de elaboração do VCF a partir da indexação dos projetos na íntegra, tendo como base o título, o objetivo e o plano de trabalho, uma vez que estas três partes são consideradas pela equipe do VCF como as que contem as principais informações da temática do projeto. Importante ressaltar que somente a partir de 2007 os projetos aprovados pela FINEP passaram a ser indexados e que cada projeto recebe uma média de 5 a 7 descritores temáticos. Este total foi estabelecido pela equipe do VCF como satisfatório, em termos de exaustividade para os objetivos da FINEP em relação à recuperação da informação dos projetos sob financiamento. No entanto, em busca de maior especificidade de indexação por assunto das propostas foi criado no Portal de Informação o campo “busca livre”, através do qual o usuário tem a possibilidade de inserir qualquer palavra que
GT2
431
desejar e o programa, por sua vez, recupera tal palavra em qualquer parte do projeto. Isto torna o VCF um sistema híbrido, segundo Lancaster (1993, p. 223) “o termo híbrido é empregado para designar qualquer sistema que funcione com uma combinação de termos controlados e linguagem natural”. Lancaster ainda aponta que muitos autores chegaram à conclusão de que o sistema de recuperação ideal inclui uma parte de termos controlados e uma parte de texto livre. A etapa seguinte do presente trabalho constituiu-se da definição dos descritores extraídos do relatório que formam a amostra analisada. Cumpre ressaltar que a definição do descritor para a elaboração de um instrumento de organização e recuperação da informação é etapa de extrema importância, porque este é o elemento de análise que vai permitir não apenas estabelecer a estrutura classificatória como identificar os termos equivalentes que constituem os parâmetros necessários para o processo de categorização dos descritores. Ou seja, somente com os descritores devidamente conceituados é possível identificar a categoria a qual pertence cada descritor. No presente trabalho (como no processo habitual de elaboração do VCF) as fontes utilizadas para a definição dos descritores foram de natureza diversa. Estão mencionadas, a seguir, segundo a ordem de relevância adotada na busca das definições: Glossários e Dicionários Especializados em diversas áreas do conhecimento, Dicionários de Termos Técnicos, Tesauros, Legislações, Manuais Técnicos e Dicionários de Língua Portuguesa. Quando não foi possível encontrar uma definição para os descritores nas fontes impressas disponíveis no acervo da FINEP e nos Glossários Especializados existentes na internet, a busca foi realizada em sites institucionais, como de universidades e empresas públicas e privadas renomadas e também na enciclopédia livre Wikipédia. O uso da Wikipédia se justifica no caso dos termos deste vocabulário pelas seguintes razões. Primeiro por servir de fonte de referência inicial para o entendimento de termos muito complexos. E, segundo, por ser o VCF um vocabulário que lida com termos da área de inovação e, por esse motivo, muitos desses termos ainda não se encontram dicionarizados, principalmente no caso de equipamentos ou produtos novos, que ainda não foram inseridos no mercado. Com os descritores organizados e definidos, a etapa da categorização foi iniciada. Como já mencionado, o elenco de categorias escolhido para análise foi a do Classification Research Group (CRG). Justifica-se esta escolha pelo fato de a classificação do CRG ter um maior número de categorias que a PMEST e, por este motivo, possibilitar uma hospedagem mais flexível dos termos em categorias. Além disso, por ser um desenvolvimento das Categorias Fundamentais de Ranganathan (PMEST), a classificação do CRG não apresenta conflito com a metodologia original, anteriormente estabelecida para a elaboração do VCF. No processo de desenvolvimento da categorização da amostra dos descritores pertencentes ao VCF fez-se necessário o entendimento de cada uma das categorias que foram utilizadas neste processo. Neste ponto cumpre destacar que a teoria do CRG não está centrada em fonte única, sendo apresentada por um número considerável de trabalhos escritos por diferentes membros deste grupo. Além disso, o CRG não apresenta sua teoria de forma explicita em uma lista organizada de princípios, como fez
GT2
432
Ranganathan. Sendo assim, não foi encontrado na literatura nenhum estudo descritivo sobre cada uma das categorias do CRG. Para estabelecer o que foi entendido por cada uma das categorias utilizadas nesta amostra, a natureza exploratória deste estudo permitiu que se considerasse como base de análise: os conceitos das categorias fundamentais de Ranganathan, os dicionários de língua portuguesa, além do próprio agrupamento dos descritores, que de certa forma descrevem as categorias às quais pertencem. A seguir, serão apresentadas as categorias identificadas a partir da definição dos descritores. Também será explicitado o significado de cada uma destas categorias, ou seja, o que aqui foi entendido como o conceito de cada categoria, bem como apontados os casos de equivalência ou semelhança com as categorias fundamentais de Ranganathan: Efeito – o resultado produzido por uma ação ou um agente; Entidade – equivalente à categoria Personalidade de Ranganathan, portanto utilizou-se o método do resíduo para identificar os descritores que aqui se inseriram, ou seja, o que não se caracterizava como alguma das outras categorias foi inserida nesta; Instrumento – aparelhos, objetos ou utensílios que servem para executar uma obra ou levar a efeito uma operação mecânica em qualquer arte, ciência ou ofício; Lugar – equivalente à categoria Espaço de Ranganathan, o lugar diz respeito ao local de pertencimento de um dado objeto, seja ele indivíduo, coisa, ideia, fenômeno, entre outras entidades; Operação – semelhante à categoria Energia de Ranganathan, a operação foi aqui entendida como uma ação ocorrida entre coisas; Operações mentais – compreende os tipos de estudos, pesquisas ou análises; Parte – parte de entidade; Processo – categoria também semelhante à categoria Energia de Ranganathan, porém, se caracteriza por um tipo de ação que ocorre naturalmente, como por exemplo, as reações químicas ou as doenças; Produto – resultado de uma produção; Propriedade – qualidade ou atributo inerente a alguma entidade; Sistema – conjunto ou combinação de coisas ou partes de modo a formarem um todo complexo ou unitário; Substância - aquilo que subsiste por si, sem dependência de quaisquer outros elementos acidentais, a matéria pura. No desenvolvimento do processo de categorização verificamos que algumas categorias/facetas - como, por exemplo: aparelho, técnica e material - foram também identificadas. Porém, como o número de descritores encontrados para tais categorias não justificava a inclusão das mesmas, todos os descritores dessas categorias puderam ser adequadamente agrupados em categorias afins, como indicado a seguir:
As Ciências, aqui entendidas como domínios do conhecimento, foram inseridas na categoria Entidade; Os Equipamentos e os Aparelhos foram agrupados na categoria Instrumento; As Técnicas e os Métodos foram categorizados como Operação; Os Materiais foram agrupados na categoria Produto; Os Setores e os Ramos de um domínio do conhecimento foram categorizados como Parte de coisa; Os atributos foram agrupados juntamente com as propriedades. Como síntese do processo de coleta, tratamento dos dados do presente trabalho, os descritores foram organizados alfabeticamente numa planilha. Para cada descritor foi acrescentada a respectiva definição e a categoria em que foi classificado. No processo de categorização da amostra de descritores do VCF, os principais resultados foram: 1 descritor na categoria Efeito, 32 descritores na categoria
GT2
433
Entidade, 21 descritores na categoria Instrumento, 15 descritores na categoria Lugar, 67 descritores na categoria Operação, 3 descritores na categoria Operações mentais, 19 descritores na categoria Parte, 14 descritores na categoria Processo, 41 descritores na categoria Produto, 7 descritores na categoria Propriedade, 42 descritores na categoria Sistema e 29 descritores na categoria Substância. Como etapa complementar de tratamento de dados foi realizada a análise das definições atribuídas aos descritores contidos na amostra selecionada para este estudo. O objetivo desta análise foi
identificar palavras e expressões, presentes nas definições dos descritores, que tiveram maior influência no processo de classificação no elenco definido de categorias anteriormente descrito. O resultado desta análise será descrito a seguir:
•Efeito - com apenas 1 descritor, a categoria foi caracterizada com seu próprio nome, já que o descritor, aqui categorizado, foi Efeito especial e foi definido como Efeito mecânico;
• Entidade - esta categoria apresentou poucas características comuns entre as definições de seus
descritores, uma vez que esta é uma categoria bastante diversificada. Nesta categoria foram encontradas manifestações como Coisas, Plantas, Frutas, Indústrias, Disciplinas, Empresas, entre outras;
• Instrumento - as palavras mais significativas encontradas nas definições dos descritores foram:
Dispositivo, Máquina, Equipamento, Aparelho e Ferramenta;
• Lugar - não há considerações acerca desta categoria, pois a maioria de seus descritores são Identificadores e no VCF este tipo de descritor não é definido;
• Operação - as palavras mais significativas encontradas nas definições dos descritores foram:
Ação, Atividade, Implementação, Investigação, Método, Processo, Procedimento, e Utilização;
• Operações mentais - as palavras mais significativas encontradas nas definições dos descritores foram: Estudo e Pesquisa;
• Parte - as palavras mais significativas encontradas nas definições dos descritores foram: Parte, Ramo e Setor;
• Processo - as palavras mais significativas encontradas nas definições dos descritores foram:
Alteração biológica, Doença e Processo;
• Produto - as palavras mais significativas encontradas nas definições dos descritores da categoria foram: Agente, Material, Mistura e Produto;
• Propriedade - as palavras mais significativas encontradas nas definições dos descritores foram:
Capacidade, Equilíbrio, Propriedade;
• Sistema - as palavras mais significativas encontradas nas definições dos descritores foram:
Conjunto, Sistema e Variedade;
• Substância - as palavras mais significativas encontradas nas definições dos descritores foram:
Substância, Material e Composto químico.
Importante destacar que os resultados desta análise complementar corroboraram os resultados das análises anteriores do processo de definição das categorias, anteriormente descrito. Em outras
GT2
434
palavras, os projetos com pedidos de financiamento aprovados pela FINEP, indexados por “Inovação de processo”, puderam ser categorizados satisfatoriamente com respaldo da definição dos descritores. Como principal resultado do processo de categorização, destacamos que as categorias Operação e Processo são entendidas como ação entre coisas, condição para a implantação de um Sistema, cujo resultado é um Produto, definido e/ou pesquisado por uma Entidade e/ou Parte. A Substância é a própria matéria, que pode ser objeto da pesquisa científica. A categoria Instrumento nos indica como operacionalizar a pesquisa, localizando-a em Lugar. A categoria Propriedade indica os benefícios, ou não, advindos do objeto pesquisado através das Operações Mentais e seus Efeitos. Outro aspecto a destacar da análise é a ordem das categorias que após o estudo estatístico apresentou a seguinte sequencia de ocorrência: Operação, Sistema, Produto, Entidade, Substância, Instrumento, Parte, Lugar, Processo, Propriedade, Operações Mentais e Efeito. Esses resultados não só respaldam satisfatoriamente o encaminhamento teórico-metodológico adotado no presente trabalho, como também indicam uma possível nova forma de organizar as categorias na indexação de propostas de financiamento encaminhadas e aprovadas à FINEP para recuperação da informação.
4 CONSIDERAÇÕES FINAIS
O presente trabalho teve como objetivo analisar o Vocabulário Controlado FINEP enquanto instrumento de organização e representação da informação e investigar a aplicação do método de categorização neste instrumento. A partir das análises realizadas foi possível observar que o trabalho de elaboração de um instrumento de controle terminológico é bastante minucioso e requer uma série de estudos, pesquisas, decisões e testes. Um ponto importante a ser ressaltado neste estudo foi a busca por definições atribuídas aos descritores. Por ser o VCF um instrumento que abarca diversas áreas do conhecimento é necessário que se tenha um acervo bastante diversificado de glossários, dicionários especializados, dicionários técnicos, manuais, etc. No presente trabalho, foi necessário, em alguns casos, recorrer a sites da internet, já que não se conseguiu encontrar as definições nas obras de referência existentes no acervo FINEP, o que no caso estudado não chegou a comprometer as análises. No entanto, cumpre ressaltar que a falta de credibilidade das fontes de onde são retiradas as definições dos descritores de um vocabulário controlado pode comprometer a estrutura em relação à consistência da categorização e dos relacionamentos entre os descritores. Outra questão importante, ainda sobre a definição, é a validação por parte de especialistas das áreas das propostas financiadas abarcadas pelo VCF. O vocabulário em questão deve ter uma validação periódica das definições, uma vez que é sabido que a qualidade da definição está diretamente ligada à qualidade da categorização e, consequentemente, à qualidade da organização e recuperação da informação.
GT2
435
Um ponto relevante a ser destacado neste estudo foi a complexidade e a dificuldade da tentativa de conceituar o elenco das categorias do CRG, principalmente porque este processo exige um esforço
intelectual considerável, além de um conhecimento de todo o referencial teórico da área de organização
e representação do conhecimento. Porém, mesmo considerando que algumas decisões tomadas acerca
dos conceitos de cada uma das categorias possam suscitar críticas ou questionamentos, os resultados da aplicação demonstraram que esses conceitos auxiliaram na diminuição da margem de erro no processo de categorização, o que não descarta a possibilidade de serem aprimorados futuramente. Quanto à categorização, durante o desenvolvimento deste processo constatou-se que há categorias mais simples de se identificar e outras mais complexas que requerem uma interpretação mais cautelosa. Esta constatação fica bem visível na parte da análise das palavras e expressões significativas das definições. Destacamos que, numa definição bem estruturada, estas palavras ou expressões costumam aparecer logo no início da definição, em que é indicada a natureza do descritor: se Entidade, Processo, Sistema etc. O restante da definição, via de regra, descreve a função ou a composição do descritor. Nas categorias mais simples de se identificar, as palavras significativas que aparecem são, na maioria, quase sinônimas do nome da categoria, enquanto nas categorias mais abstratas essas palavras precisam/necessitam ser interpretadas a partir da definição do descritor e do conceito da categoria. A partir da análise do processo de categorização foi possível verificar a importância da aplicação deste processo na construção de instrumentos de controle terminológico, visando à eficiência na representação do conhecimento para a recuperação da informação. Apesar de no projeto inicial de implantação do VCF ter sido preconizado a utilização das categorias de Ranganathan (PMEST) e, por conjunturas variadas, ter sido adotada posteriormente a organização dos descritores pelas áreas do conhecimento do CNPq - que logo se mostrou insuficiente para atender às demandas da FINEP - verificou-se que a escolha da aplicação das categorias do CRG no VCF seria satisfatória, não sendo necessárias modificações nas categorias já existentes, uma vez que foram suficientes para agrupar os descritores da amostra estudada. Além disso, no caso do VCF, os resultados revelaram que a categorização possibilitou uma estruturação sistemática dos descritores, qualificando ainda mais este instrumento e otimizando os processos de indexação e recuperação da informação na FINEP. Desta forma, acredita-se também que a classificação do CRG apresenta potencial para ser aplicada às outras áreas do vocabulário. Para que isso ocorra, propõe-se um estudo mais aprofundado sobre os resultados desta aplicação na representação e recuperação da informação na FINEP. Além disso, é também desejável um estudo das necessidades dos usuários deste instrumento. O processo de controlar/padronizar um vocabulário é dinâmico, como é dinâmica também
a própria construção do conhecimento. Desta forma, acredita-se no encaminhamento metodológico
de elaboração do VCF como proposto neste trabalho, principalmente porque esta metodologia é sustentada por teorias clássicas da organização e representação do conhecimento, já estabelecidas na Biblioteconomia e na Ciência da Informação.
GT2
436
Por outro lado, a metodologia e o produto gerado neste trabalho permitirão à FINEP avançar
com qualidade no tratamento terminológico de temáticas de pesquisa no âmbito da Ciência, Tecnologia
e Inovação. Por último, é necessário reforçar que o tratamento informacional em uma organização é fator
fundamental para a tomada de decisões e, no caso específico da FINEP, um elemento estratégico para
o gestor.
REFERÊNCIAS
ARAÚJO, Vânia M. R. H. Sistemas de recuperação da informação: nova abordagem teórico conceitual. Ciência da Informação, Brasília, v. 24, n. 1, 1995.
BATTAGLIA, Maria Glória Botelho. A inteligência competitiva modelando o Sistema de Informação de Clientes – FINEP. Ciência da Informação, Brasília, v. 29, n. 2, p. 200-214, maio/ago. 1999.
CAMPOS, Maria Luiza de Almeida. Linguagem Documentária: teorias que fundamentam sua elaboração. Niterói: EdUFF, 2001.
CAMPOS, Maria Luiza de Almeida. Vocabulário controlado: instrumento para a gestão dos recursos informacionais dos acervos da FINEP. Apresentação. Rio de Janeiro, 2004.
CAMPOS, Maria Luiza de Almeida; GOMES, Hagar Espanha. Metodologia de elaboração de tesauro conceitual: a categorização como princípio norteador. Perspectiva em Ciência da
Informação, Belo Horizonte, v. 11, n. 3, p. 348-359, set./dez. 2006. Disponível em: <http://www. scielo.br/scielo.php?pid=S1413-99362006000300005&script=sci_arttext>. Acesso em: 20 jan.
2011.
CAMPOS, Maria Luiza de Almeida; GOMES, Hagar Espanha. Taxonomia e classificação: o princípio de categorização. DataGramaZero: Revista de Ciência da Informação. v. 9, n. 4, ago. 2008. Disponível em: <http://www.dgz.org.br/ago08/Art_01.htm>. Acesso em: 22 out. 2010. Não Paginado.
CAMPOS, Maria Luiza de Almeida; GOMES, Hagar Espanha; MOTTA, Dilza (Coord.) Fonseca da. Elaboração de tesauro documentário: tutorial. 2006. Disponível em: <http://www.conexaorio.com/ biti/tesauro/>. Acesso em: 20 fev. 2011. Não Paginado.
CINTRA, Ana Maria et al. Para entender as linguagens documentárias. 2. ed. rev. e ampl. São Paulo: Polis, 2002.
FINANCIADORA DE ESTUDOS E PROJETOS. Disponível em: <www.finep.gov.br>. Acesso em:
16 jun. 2010.
FINANCIADORA DE ESTUDOS E PROJETOS. Glossário. Disponível em: <http://www.finep.
GT2
437
gov.br/o_que_e_a_finep/conceitos_ct.asp>. Acesso em: 22 ago. 2010.
FINANCIADORA DE ESTUDOS E PROJETOS. Portal da Informação. Disponível em: <www. finep.gov.br/intranet>. Acesso em: 07 jan. 2011.
FINANCIADORA DE ESTUDOS E PROJETOS. Proposta de consultoria para os acervos da FINEP: indexação e recuperação da informação. Proposta. Rio de Janeiro, 2005.
FINANCIADORA DE ESTUDOS E PROJETOS. Relatório das atividades da consultora Maria Luiza de Almeida Campos. Relatório de atividades. Rio de Janeiro, 2003.
FINANCIADORA DE ESTUDOS E PROJETOS. Vocabulário controlado FINEP (VCF):
indexação e recuperação do acervo arquivístico. Relatório de atividades. Rio de Janeiro, 2007.
FINANCIADORA DE ESTUDOS E PROJETOS. Vocabulário controlado: uma nova metodologia
visando o tratamento terminológico de documentos para fins de recuperação. Proposta. Rio de Janeiro,
2002.
FOSKETT, Antony Charles. A abordagem temática da informação. São Paulo: Polígono; Brasília: Ed. Universidade de Brasília, 1973.
LANCASTER, F. W. Construção e uso do tesauro: curso condensado. Trad. de César Almeida de Menezes e Silva. Brasília: IBICT, 1987. 114p.
Indexação e resumos: teoria e prática. Brasília: Briquet de Lemos, 1993. 347p.
Indexação e resumos: teoria e prática. 2. ed. Brasília: Briquet de Lemos. 2004, 452p.
Vocabulary Control for Information Retrieval. Virginia: Information Resources Press, 1986. 270p.
XII Encontro Nacional de Pesquisa em Ciência da Informação – ENANCIB 2011
GT2
438
COMUNICAÇÃO
ORAL
TRATAMENTO TÉCNICO DA DOCUMENTAÇÃO AUDIOVISUAL NA TV DA UNIVERSIDADE FEDERAL DE GOIÁS
Maria Leticia Costa Miranda, Maria de Fátima Garbelini
RESUMO
Atualmente a televisão é considerada um meio de grande explosão informacional e o surgimento dela trouxe uma nova etapa na evolução da documentação audiovisual. Este tipo de documentação vem crescendo consideravelmente em emissoras de televisão muito embora ainda não possuam um tratamento técnico adequado para este tipo de documentação. A presente pesquisa e estudo é uma
proposta e implementação de um tratamento técnico [catalogação, descrição, indexação e preservação] dos documentos audiovisuais da TV UFG (Universidade Federal de Goiás), levantando conceitos de documentação audiovisual e documentação audiovisual em televisão, as etapas do tratamento técnico para documentos audiovisuais para poder implementar o tratamento e fazer com que a informação seja melhor e mais rapidamente recuperada entres os editores e produtores dos programas da TV UFG
e futuramente entre a comunidade em geral, além de preservar a memória institucional da TV UFG.
Palavras-Chave: Documentação Audiovisual. Documentação audiovisual em televisão. Indexação de imagens em movimento. Tratamento técnico de documentos audiovisuais.
1 INTRODUÇÃO
O crescimento da informação audiovisual no ambiente televisivo em nível geral trouxe a
necessidade de desenvolver formas de tratamento para esta documentação, além do desenvolvimento
de ferramentas que suportem uma indexação rápida e eficiente, sendo esta última a mais desafiadora, pois ainda existe muita dificuldade por ser de natureza peculiar.
A TV UFG é vinculada à Fundação Rádio e Televisão Educativa – FRTVE foi instituída
para apoiar a Universidade Federal de Goiás (UFG) em ações voltadas para as áreas de radiodifusão,
comunicação, educação e cultura. Sua atuação é pautada nas políticas relativas ao ensino, à pesquisa
e à extensão da UFG, tendo como principal ramo de atividade a radiodifusão. Com essa missão,
desenvolve diversas atividades relacionadas à comunicação, educação e cultura, apoiando instituições de ensino superior públicas, especialmente a UFG. Desde 2009 é concessionária da TV UFG que em
GT2
439
parceria com a TV Brasil, é transmitido em sinal aberto pelo Canal 14-E UHF. Sendo assim, o objetivo da pesquisa e estudo é implementar um tratamento técnico (registro, catalogação, classificação, indexação e preservação) dos documentos audiovisuais, em especial as imagens em movimento brutas, da TV UFG fazendo um levantamento do acervo já
existente, identificando o conteúdo dos documentos para posteriormente implementar o tratamento
e construir um banco de imagens deixando-a para consulta entre os funcionários da TV UFG, mais
especificamente os responsáveis pela produção e editoração dos programas além de contribuir para a preservação da memória da instituição.
2 DOCUMENTO AUDIOVISUAL: PRINCIPAIS CARACTERÍSTICAS
A palavra “audiovisual” tem origem latina. Mas a palavra tal qual como conhecemos atualmente tem origem Norte-Americana, pois foi neste país que começou a se desenvolver as
primeiras técnicas de som e imagem. No Brasil, somente nos anos 50 esse termo passou a ser utilizado
e em pouco tempo ao termo “audiovisual” foi acrescentado outros sinônimos como: multimeios,
recursos audiovisuais, materiais não impressos, materiais especiais, não gráficos, materiais não bibliográficos e mídia, tornando assim, um campo de estudo bastante amplo, complexo e confundível epistemologicamente, o que dificulta a padronização e a conceituação vocabular. Segundo Cirne (2002, p. 117), “um documento audiovisual é um documento cuja informação é veiculada através de um código de imagens, fixas ou móveis, e de sons, carecendo de um equipamento apropriado para ser visto e ouvido”. Rubio (2003) afirma que:
O documento audiovisual, como documento científico participa, conseqüentemente das mesmas notas de informação e fonte informativa e se integra igualmente no processo informativo-documental: emissor (bibliotecário audiovisual), canal ou meio de transmissão (suporte audiovisual), mensagem (documento audiovisual), receptor ou usuário da mensagem (documento audiovisual). (RUBIO, 2003, p.216).
Para Hidalgo Goyanes (2005, p.234), “os documentos audiovisuais são um fenômeno relativamente recente no âmbito da documentação, sobretudo se compararmos com a larga trajetória dos documentos textuais”. E a mesma autora complementa que os documentos audiovisuais são considerados “opacos”, pois, seu conteúdo não é legível ou acessível de forma direta, sendo que é necessária a utilização de aparatos de leitura, o que os converte em “dependentes” de meios técnicos. Para a autora, documentos audiovisuais são também “Multiformes e Incompatíveis” que estão gravados em múltiplos suportes materiais e diversos formatos. Isto indica que provavelmente estes documentos não são tratados tecnicamente pela maioria dos profissionais da informação por serem muitos mais complexos na sua natureza e produção de se fazer um tratamento técnico eficiente, ou seja, classificar, indexar e conseqüentemente, armazenar.
GT2
440
3 INDEXAÇÃO DE IMAGENS EM MOVIMENTO
Os primeiros registros de imagem surgem há pelo menos 22 mil anos, na forma de escritas pictográficas. As pinturas rupestres das cavernas pré-históricas são testemunhos da necessidade do homem de representar os acontecimentos à sua volta. A imagem (do latim Imago) é uma representação visual, construída pelo homem, dos mais diversos tipos de objetos, seres e conceitos. Pode estar no campo do concreto, quando se manifesta por meio de suportes físicos palpáveis e visíveis, ou no campo do abstrato, por meio das imagens mentais dos indivíduos. Hoje vivemos em uma “civilização da imagem”, onde a dominação visual é maciça, principalmente nos meios de comunicação que as utilizam para informar. O surgimento da fotografia, do cinema e da televisão, acentua ainda mais a presença das imagens no cotidiano do homem, sendo a imagem basicamente uma síntese que oferece traços, cores e outros elementos visuais em simultaneidade. Para Smith (1996, p. 29) o termo “imagem” abrange um vasto leque de documentos iconográficos ou de ilustrações, incluindo pinturas, gravuras, pôsteres, cartões postais, fotografias, filmes (que se encaixa como sendo uma imagem em movimento), etc. A autora destaca ainda que estes registros, embora semelhantes não demandem as mesmas lógicas de tratamento documentário – uma vez que suas modalidades e usos são distintos. Na sociedade contemporânea, a imagem ocupa lugar fundamental, e a visualidade torna-se, reconhecidamente, um dos mais importantes recursos cognitivos. Existe uma demanda, cada vez maior, pela utilização sistemática dos recursos audiovisuais tanto para a divulgação de informações como para a pesquisa. Entende-se por imagem em movimento, segundo uma definição formulada nas “Recomendações sobre a Salvaguarda e a Conservação das Imagens em Movimento”, aprovada pela United Nations Educational, Scientific and Cultural Organization – UNESCO em 1980 como:
Qualquer série de imagens captadas e fixadas em um suporte (independentemente do método de captação das mesmas e da natureza do dito suporte como, por exemplo, filmes, fitas, disco, etc. utilizado inicial e ulteriormente para fixá-las) com ou sem acompanhamento sonoro que, ao serem projetadas, dão uma impressão de movimento e estão destinadas à comunicação ou distribuição ao público ou se produzam com fins de documentação.
Quando se fala em tratamento técnico o que mais possui subjetividade e que por conseqüência disto é mais complexo de se fazer é a indexação. Para Lancaster (2004), indexar significa fazer uma representação temática dos documentos, ou seja, indicar do que se trata o documento e resumir o seu conteúdo. Toda área do conhecimento bem como distintos formatos impressos, como jornais, leis, etc. suscitam problemas de indexação. Mais relevantes são as questões que surgem ao sairmos do texto impresso para outros formatos.
GT2
441
A indexação de imagens, mais especificamente a imagem em movimento, é considerada uma área difícil, pois abarcam campos como tecnologia da fala, visão computacional e compreensão de documentos, que ultrapassaram em muito o escopo da maioria das aplicações de indexação.
Essas questões têm atraído a atenção de novos interessados, tanto os preocupados com o conteúdo informacional das imagens, quantos aos interessados em desenvolver formas automatizadas de descrição e acesso às imagens e destaca ainda que o grande desafio é representar a imagem com finalidade documental, propiciando a sua recuperação apropriada em resposta a uma demanda cada vez mais especializada do usuário. (JOSÉ FILHO, 2004,
p.2)
Smit (1996) aborda aspectos interessantes para serem analisados quando está sendo realizada a indexação de imagens, que podem ser absolutamente utilizáveis em qualquer tipo de análise documentária: segundo a autora, as categorias QUEM, ONDE, QUANDO e COMO/O QUÊ, utilizadas por muitos estudiosos como parâmetro para a análise de textos, inclusive a documentária, é também preconizada para a análise documentária de imagem. QUEM seria a identificação do ser enfocado, ONDE é o local em que a imagem foi gerada, QUANDO é o tempo, ou seja, o ano, mês ou dia e COMO/O QUE aborda o assunto da imagem. A imagem possui característica própria de polissemia que dificultam sua classificação de forma eficiente. O acesso às imagens tem sido tradicionalmente indicado por sistemas de classificação baseados em palavras ou “indexadores descritores” na forma de vocabulários controlados, conhecidos como tesauros além da escolha de palavras-chave voltadas essencialmente para a descrição semântica de conteúdos informacionais, sendo esta última mais utilizada para a indexação e classificação das imagens em movimento. Assim sendo, cabe à Ciência da Informação indicar os caminhos para o acesso mais eficiente a essas imagens enquanto documentos informacionais em seus Sistemas de Recuperação de Informação.
4. A DOCUMENTAÇÃO AUDIOVISUAL NA TELEVISÃO
Atualmente a televisão é considerada um meio de grande explosão informacional e o surgimento dela trouxe uma nova etapa na evolução da documentação audiovisual. De acordo com Fuentes Pujol,
os meios de comunicação em massa são instrumentos básicos de difusão. Devem informar de forma veraz e objetiva a um público variado e amplo, e é o instrumento por excelência que
permite situar e analisar em seu contexto os feitos recentes da história atual (
de informação e, independentemente da diversidade de formas, audiências, periodicidade, etc
), são fontes
]. [
(FUENTES PUJOL, 2006, p.135).
GT2
442
A documentação em meios de comunicação tem características específicas que diferenciam claramente da documentação em outros âmbitos da informação segundo Fuentes Pujol (1995, p. 136) no quais são:
• Dualidade na origem das fontes;
• Multiplicação constante de informação heterogênea;
• Rapidez na resposta;
• Obsolência da informação;
• Dicotomia texto-imagem;
• Diversificação de usuários; Sendo que suas funções principais são:
• Proporcionar fontes concretas para poder comprovar rapidamente um feito ou uma data;
• Ter materiais suficientes para situar os distintos temas em seu contexto;
• Atuar como “fontes de inspiração;
4.1 O TRATAMENTO TÉCNICO DA DOCUMENTAÇÃO AUDIOVISUAL EM TELEVISÃO Os meios de comunicação em especial à televisão formam um arquivo documental muito valioso que deve ser organizado e tratado. A quantidade de informação produzida por estes meios é bem significativa e conseqüentemente muito dispersa o que requer técnicas documentais mais adequadas para que possam ser usadas de forma retrospectiva para melhor satisfazer as demandas dos usuários, dentre eles os jornalistas, editores, produtores etc.–os mais importantes - mas também investigadores estudiosos ou o público em geral que requer informação. Carlos Alberto Nogueira et. al (2008) complementa que:
A produção de imagens para a televisão e o vídeo envolve em seu processo a geração de um grande número de gravação de cenas — material bruto. Na edição, apenas algumas cenas são aproveitadas. As gravações não utilizadas ou parcialmente utilizadas devem receber tratamento técnico visando a sua busca e recuperação para a reutilização em outras produções audiovisuais, e em atividades de ensino, pesquisa e extensão, gerando estoques de informação. (NOGUEIRA et. al 2008 p. 2)
Para Rayo (2007) a documentação audiovisual em emissoras de televisão passa pelas
seguintes etapas desde o momento que chega a um centro de documentação até o seu destino final, para que seja recuperado de forma rápida e precisa. Estas fases são:
• Registro
• Seleção
GT2
443
• Análise Documental
• Recuperação da informação
• Empréstimo
• Conservação
Colocando uma proposta de fluxograma o resultado seria :
Em geral, o tratamento técnico da documentação audiovisual em televisão apresenta diferenças quanto a sua procedência (informativo ou programa) e o tipo de gravação (bruto ou editado) e este tipo de diferenciação se dá na primeira etapa, ou seja, o registro do documento. Dentre as etapas apresentadas, a seleção, análise documental e conservação são consideradas pela maioria dos autores nesta área como o tripé de todo o tratamento técnico. Apresentaremos as etapas do tratamento técnico e o porquê da sua importância.
4.2 SELEÇÃO DOCUMENTAL
Definir “seleção documental” não é uma tarefa muito complicada, mas praticá-la em um Centro
de Documentação sim, principalmente quando se fala em ambiente televisivo, onde a quantidade de material é muito grande. Para Rayo (2007, p. 79) “a seleção documental é toda ação que tem por objetivo avaliar,
descriminar e, em conseqüência, filtrar (escolher e/ou filtrar) um documento (
operação no qual se elegem, dentre todos os outros documentos existentes, aqueles que mais interessam a um serviço. Em uma emissora de televisão, a seleção documental é um procedimento regular de avaliação e para Hidalgo Goyanes (2005 p. 2), esta seleção é uma tarefa importante que deve ser precedida pela existência de uma política clara a respeito da entidade ou organismo em que se encontra o serviço de
ou seja, é uma
)”,
GT2
444
documentação.
Para uma seleção documental ser realizada com êxito, é preciso seguir alguns critérios básicos, como cita Rayo (2007),
• Deve ser um procedimento regular;
• avaliação do material é fundamental
• avaliação do material deve ser feita em função de parâmetros previamente estabelecidos;
• seleção deve se adequar tanto aos objetivos como às necessidades da empresa;
• seleção deve ser feita preferencialmente sobre o material original;
• seleção deve ser feita por bibliotecários e/ou documentalistas.
A
A
A
A
A
4.2.2 Análise Documental
A segunda etapa importante do tratamento técnico consiste na extração das informações
mais relevantes que serão utilizadas na localização a posteriori das mesmas. É considerado um procedimento análogo à indexação e classificação em categorias no qual se permite a recuperação dos dados. Outros elementos podem ser acrescentados quando necessário tais como a cor da imagem, iluminação, movimentos da câmera, efeitos óticos, dentre outros, complementam a análise, mas não precisam necessariamente ser acrescentados, variando de centro de documentação para centro de documentação.
5 TV / UFG
Ahistória da TV UFG começa em 1962 quando a Universidade Federal de Goiás - UFG solicitou a concessão de uma emissora de rádio, a Rádio Universitária, neste mesmo período, fez também o pedido de uma emissora de televisão. A concessão radiofônica foi outorgada à Universidade, mas a televisiva não. Mais tarde, nas décadas de 70 e 80, a UFG teve a oportunidade de ocupar dois canais, o 13 e o 11, mas não conseguiu reunir os recursos financeiros necessários para colocar a emissora no ar e em funcionamento. O Canal 13 foi então incorporado ao Estado e o canal 11, a grupos privados. Em 1996, a Fundação Rádio e Televisão Educativa - RTVE foi instituída com o objetivo de apoiar as ações de radiodifusão, comunicação, educação e cultura da UFG, atendendo inclusive a uma exigência legal no que se refere à área, já que a concessão de radiodifusão no Brasil é pública, mas de direito privado. Em maio de 2004 foi publicado no Diário Oficial da União o Decreto Presidencial que concedeu o Canal 14-E para a Fundação RTVE. O passo inicial para a efetivação da TV UFG estava consolidado. Desde a sua criação, a Fundação RTVE apoiou diversos projetos das áreas de comunicação,
GT2
445
educação e cultura, tanto da UFG, quanto da sociedade goianiense, contribuindo, de forma significativa, para a melhoria da educação e para a democratização do acesso a produtos culturais, principalmente por meio da radiodifusão pública.
5.1 O TRATAMENTO TÉCNICO DA DOCUMENTAÇÃO AUDIOVISUAL
O processo de tratamento técnico da documentação audiovisual, em particular as imagens em movimento brutas do acervo da TV UFG iniciou-se no ano de 2010. Para Cunha (2008, p.293) define tratamento técnico [sinônimo de processamento técnico] como um conjunto de atividades às quais um documento é sucessivamente submetido até ser considerado pronto para ser incluído no acervo [ envolvem dentre outras o número de registro, catalogação, classificação e indexação. A pesquisa e estudo sobre o tratamento técnico surgiram após ter sido feita uma análise da documentação audiovisual como um todo, no qual incluíram uma reunião com os coordenadores de imagem da TV UFG e os pesquisadores. A análise da documentação foi realizada através de uma observação direta do trabalho do editores, mas focado diretamente na localização das imagens e também através da observação da “organização” dos suportes, no qual muitos estavam sem numeração, não permitindo uma organização seqüencial, além de não haver um documento no qual estivesse catalogado todas as informações. O tratamento técnico de toda a documentação foi dividido em quatro fases. São elas: a análise do acervo audiovisual, a decupagem das fitas, a elaboração de novas etiquetas e por fim o armazenamento e conservação de toda a documentação. A princípio não havia uma organização e a informação demandava muito tempo para ser localizada, necessitando assim, de uma catalogação e descrição a fim de serem mais rapidamente recuperadas. Toda a informação audiovisual estava armazenada em um suporte denominado Fitas Mini- Dvs, não havendo um documento com uma descrição detalhada de toda a informação, somente um breve resumo escrito à mão do conteúdo existente na etiqueta original que vinha com o suporte. Antes de iniciar o tratamento técnico da documentação, uma pesquisa foi feita com a equipe responsável pelo audiovisual da TV UFG para saber qual informação era mais relevante ao se localizar uma imagem em movimento e o resultado desta pesquisa será relatado mais adiante. No meio jornalístico e cinematográfico há uma atividade primordial quando se deseja localizar rapidamente uma informação contida em um vídeo ou filme. Esta atividade é denominada de decupagem. Segundo Nogueira (2008 p. 3), “decupar é dividir um filme ou vídeos em planos”. No tratamento técnico há uma etapa que é a chamada “Análise Documental”, no qual é considerada uma das etapas mais importantes, a decupagem pode ser considerada como sendo uma análise documental.
],
GT2
446
Na decupagem há um elemento relevante que permite a localização exata da imagem armazenada no suporte. É o chamado “time - code”, que no resultado da pesquisa feita com a equipe da TV UFG foi o elemento considerado mais importante quando se deseja localizar a imagem com precisão sem demandar muito tempo. Esta atividade foi o marco inicial para que se começasse a elaborar a proposta do tratamento técnico. Inicialmente a TV UFG não dispunha de um software para fazer a decupagem das imagens brutas, então, um modelo de ficha de decupagem foi elaborado manualmente pela coordenadora de produção para ser utilizado como base nas decupagens que viriam ser feitas posteriormente. Neste modelo continha as principais informações tais como o time-code, a descrição da imagem e o tempo de duração, além do número da fita. Baseado no modelo de ficha de decupagem já existente foi assistido fita por fita, utilizando
o deck e o monitor disponíveis, colocando o time-code, descrevendo a imagem, diferenciando-a de entrevista e por fim acrescentando a duração da mesma. Sendo assim, foi elaborado um modelo de ficha de decupagem no Microsoft Office Word® que pudesse também ter a função de uma ficha de catalogação. Logo abaixo o referido modelo.
Neste modelo acima, as informações como número da fita, time-code, descrição do plano
e o tempo de duração foram mantidos e outras foram acrescentadas tais como data de gravação,
nome do programa e também o formato digital em que foi gravada a imagem. Existem dois formatos digitais que são utilizados nas gravações, que são os formatos HDV e o DV. Ambos os formatos são
GT2
447
armazenados em fitas Mini-Dvs. A captura das imagens será o marco inicial para a montagem do banco de imagens que se pretende implementar. Um modelo de etiqueta foi elaborado no programa de desenho vetorial bidimensional para design gráfico denominado Corel Draw Graphics Suite X4®, conforme modelo abaixo.
Nestas etiquetas, as informações do plano foram acrescentadas bem resumidamente, que por ser de menor tamanho, não comporta informações mais detalhadas. Para consultar as informações de forma mais profunda, como por exemplo, pesquisando sobre qual assunto um entrevistado abordou é necessário consultar o documento elaborado no Microsoft Office Word®, que fica disponível direto para consulta. Na etiqueta há somente o nome do entrevistado. No caso das etiquetas dos interprogramas, a descrição é dividida pelos dois interprogramas existentes, “Ei!” e “Conhecendo a UFG”. Assim foi feita a segunda parte do tratamento técnico da documentação.
6 ARMAZENAMENTO E CONSERVAÇÃO
Depois que as fitas passam pelo processo de decupagem e recebem novas etiquetas são encaminhadas para o arquivamento e conseqüentemente a conservação em armários de aço ainda improvisados até a compra de estandes adequadas. Até o presente momento, a montagem do banco de imagens está sendo feita pela captura da fita, como por exemplo, quando vai capturar uma fita de um “inteprograma”, abre-se uma nova pasta com o número da fita e dentro da pasta as imagens especificadas, por exemplo, “gerais da Cidade de Goiás”. O processo de implementação do banco de imagens ainda não está totalmente consolidado, ou seja, está na sua fase inicial podendo sofrer mudanças conforme a necessidade informacional da equipe.
7 CONCLUSÃO
A documentação audiovisual vem crescendo consideravelmente no ambiente televisivo e isto acontece devido à televisão ser um recurso tecnológico muito importante na vida dos cidadãos
GT2
448
e também devido à quantidade de informação que a mesma produz e muitas vezes as emissoras não
têm conhecimento de como tratá-la e organizá-la adequadamente. Este trabalho e pesquisa tiveram como objetivo mostrar organizar toda esta informação de forma que a mesma possa ser mais rapidamente recuperada e também preservada, pois muitas
vezes elas já fazem parte da história da própria emissora. Para organizar e tratar toda esta informação o papel do profissional bibliotecário é imprescindível, pois ele lida com a informação a todo o momento e é o profissional mais indicado para este tipo de atividade. Com este trabalho e pesquisa pretendeu-se também mostrar que existem outras áreas de atuação do profissional da informação que não somente no âmbito da biblioteca ajudando a quebrar
a barreira existente entre a área jornalística e biblioteconômica além de mostrar também que existe “uma carência destes profissionais qualificados por ser um nicho quase inexplorado pela categoria profissional” (PEREIRA; MORAES, 2009, p. 81). ATV UFG ainda é uma empresa de comunicação relativamente nova e está em crescimento
e o processo de organização da informação audiovisual está crescendo junto com ela. Ainda faltam
muitos aspectos a serem melhorados, mas só de estar observando que o começo desta organização está visivelmente satisfatório já é um grande passo feito na história desta jovem empresa que tanto contribui para disseminar o conhecimento produzindo programas de cunho educacional e cultural dentro e fora do âmbito da Universidade Federal de Goiás.
ABSTRACT
Currently television is considered a medium huge information explosion and the appearance of it, brought a new stage in the evolution of audiovisual documentation. This type of documentation has increased considerably among TV stations even thought TV stations still do not have a technical adequate treatment for it. This work presents a proposal of a technical treatment [cataloging, describing, indexing and preservation] for audiovisual documents implemented at TV UFG station raising concepts of audiovisual documents and audio-visual documentation on television, the steps of the technical treatment to audiovisual documents in order to implement the treatment and make so that the information can be better and more quickly recovered by the editors and producers of TV programs and, in the future, by the general community, and the institutional memory of TV UFG station can be preserved.
Keywords: Audiovisual documents. Audiovisual documents in television. Indexing moving images. Technical treatment of audiovisual documents.
GT2
449
REFERÊNCIAS
CIRNE, M. T.; FERREIRA, S. M. A ética para os profissionais da informação audiovisual: o devir tecnológico a moldar uma atitude. Cadernos de Biblioteconomia Arquivística e Documentação – BAD, Lisboa, Portugal, n.1, p.115-129, 2002. Disponível em: < http://redalyc.uaemex.mx/redalyc/ pdf/385/38505210.pdf > Acesso em: 20 Set. 2010. CUNHA, M. B. da.; CAVALCANTI, C. R. O. Dicionário de Biblioteconomia e Arquivologia, Brasília,DF: Briquet de Lemos, 2008. 449 p. JOSÉ FILHO E. A representação da imagem: indexação por conceito e por conteúdo. 2004. Trabalho de Conclusão de Curso (Graduação) – Escola de Comunicação e Artes, ECA, Universidade de São Paulo, São Paulo,2004. Disponível em: < http://rabci.org/rabci/sites/default/files/Estorniolo-Imagem. pdf > Acesso em: 14 Ago. 2009. FUENTES PUJOL, M. E. Características generales de la documentación periodística y características
específicas de los medios de comunicación escritos. In:
de documentación
periodística. 1. ed. Madrid: Sintesis, 1995. Cap. 7. GIMÉNEZ RAYO, M. Documentación audiovisual de televisión: la selección del material. 1. ed. Espanha: Trea, 2007. 214p. HIDALGO GOYANES, P. La documentación audiovisual de las televisiones. La problemática actual y el reto de la digitalización. Documentación de las Ciencias de la Información, s.l, v.28,p.159-171, 2005. Disponível em: < http://revistas.ucm.es/inf/02104210/articulos/DCIN0505110159A.PDF > Acesso em: 26 abr.2010. La selección de documentos audiovisuals en televisión: la selección en TVE. Documentación de las Ciencias de la Información, s.l, v. 26, p.233-260, 2003. Disponível em: < http://revistas.ucm. es/inf/02104210/articulos/DCIN0303110233A.PDF > Acesso em: 15 Abr. 2010.
Manual
Análisis documental de audiovisuales. In: GUTIÉRREZ, Antônio García (Ed.). Introdución a la Documentación Informativa y Periodística. 1. ed. S.l: MAD, 1999. Cap. 11.
audiovisual. In: GUTIÉRREZ, Antônio García (Ed.). Introdución a la
Documentación Informativa y Periodística. 1. ed. S.l.: MAD, 1999. Cap. 16.
e Resumos: Teoria e
Prática. 2. ed. Brasília,DF: Briquet de Lemos, 2004. Cap. 13. NOGUEIRA, C.A.A.; FERREIRA, M.A.P.; FONSECA, M.T. Pedagogia do olhar: oficina permanente
LANCASTER, F.W. Bases de dados de imagens e sons. In:
Documentación
Indexação
para tratamento técnico de imagem em movimento. In: XV SEMINÁRIO NACIONAL DE
São Paulo: Unicamp,
BIBLIOTECAS UNIVERSITÁRIAS, 2008, Campinas Anais eletrônicos
2008. Disponível em: < http://www.sbu.unicamp.br/snbu2008/anais/site/pdfs/2638.pdf > Acesso em:
18 Set. 2010.
GT2
450
PEREIRA, D. A.; MORAES, P. J. M. Recuperação de informação jornalística audiovisual
utilizando linguagem documentária: estudo de caso da TV Globo Brasília. 2009. 87p. Trabalho de conclusão de curso (graduação) – Faculdade de Economia Administração Contabilidade e Ciência da Informação e Documentação – FACE Departamento de Ciência da Informação e Documentação – CID, Universidade de Brasília, Brasília, DF, 2009. Disponível em: < http://bdm.bce.unb.br/ bitstream/10483/622/1/2009_DemianPereira_PauloJoseMedeirosMoraes.pdf > Acesso em: 24 Out.
2010.
RUBIO, A. La documentación audiovisual em el centro territorial de TVE en la Rioja. Berceo, s.l, n.144, p.215-233, 2003. Disponível em: < http://dialnet.unirioja.es/servlet/articulo?codigo=698051 > Acesso em: 15 Abr. 2010. Labor documental para programas de entretenimiento en las televisiones. Ciência da Informação, Brasília, DF, v.35, n.1, p.16-24, jan./abr.2006. Disponível em: < http://www.scielo.br/ pdf/ci/v35n1/v35n1a02.pdf > Acesso em: 13 Abr. 2010. SMIT, J. W. A representação da imagem.Informare,Rio de Janeiro,v.2,n.2,p.28-36, jul./dez.1996. UNESCO. Recomendações sobre a Salvaguarda e a Conservação das Imagens em Movimento. Paris: UNESCO, 1980.
GT2
451
COMUNICAÇÃO
ORAL
A LINGUÍSTICA DOCUMENTÁRIA E A
ANÁLISE DE DOMÍNIO NA ORGANIZAÇÃO DA
INFORMAÇÃO
Julietti de Andrade, Marilda Lopes Ginez de Lara
Resumo
Apresenta análise das abordagens Linguística Documentária e Análise de Domínio com o objetivo de identificar semelhanças, diferenças e uma possível integração entre elas. A metodologia utilizada compreendeu revisão de literatura do período de 1990 a 2010, focalizando textos dos pesquisadores da ECA-USP (Linguística Documentária) e textos de Birger Hjørland, Anne Albrechtsen e Jens- Erick Mai (Análise de Domínio). A análise permitiu verificar que ambas partem de fundamentos teóricos distintos, apresentam diferenças na denominação dos conceitos, mas compartilham o reconhecimento da Organização da Informação e do Conhecimento como uma atividade social ressaltando a importância dos Domínios, embora sob óticas distintas. A Linguística Documentária apresenta metodologias para Análise Documentária e para construção de Linguagens Documentárias; a Análise de Domínio pretende visar um universo mais amplo e apresenta contextos e situações onde a Análise de Domínio pode ser aplicada.
Palavras-chave: Linguística Documentária, Análise de Domínio, Organização da Informação, Organização do Conhecimento.
1 INTRODUÇÃO
A Linguística Documentária (LD) nasceu na Espanha, na década de 90, com os trabalhos de García Gutiérrez, com o objetivo de criar modelos de Análise Documentária e para construção de Linguagens Documentárias. Tem como base a Linguística Estruturalista, a Análise do Discurso, a Análise de Conteúdo, a Análise Semiótica, a Sociologia e o Método Dialético. A linha de trabalho de García Gutiérrez subordina a Análise e a Linguagem Documentária à Linguística Documentária. Os pesquisadores da ECA, que adotam o termo para denominar o subcampo da Ciência da Informação, complementam a abordagem acrescendo a Terminologia como referência para a observação das áreas do saber e de atividades. A Linguística Documentária focaliza os métodos e os processos de construção de Linguagens Documentárias e destaca o papel social e simbólico desses instrumentos como meio para estabelecer as condições de comunicação e interpretação das informações. Para García Gutiérrez, o objeto da Linguística Documentária é a estrutura da Documentação, “como a organização de conteúdos codificáveis e decodificáveis, a qual se divide entre a estrutura cognitiva do produtor e a interpretativa do consumidor, o que, para o autor, contribui para o método
GT2
452
línguo-documental (1990, p. 24)”. Entre o codificável e o decodificável ocorre o fluxo informacional, um movimento entre produtores e usuários da informação que é mediado pelos processos e resultados da Organização da Informação: a análise, a síntese, a representação e a recuperação da informação. O profissional codifica a informação tendo como referência instrumentos e métodos a partir dos quais são construídas representações ou informações documentárias (Lara, 2002, Tálamo e Lara, 2006); o usuário decodifica as informações documentárias (Lara, 2002) enquanto mensagens documentárias, num processo de semiose documentária (LARA, 2009). Para Tálamo e Lara, a ‘estrutura simbólica da Documentação’ (2006, p.204) coloca em jogo questões linguísticas advindas da mediação necessária entre os produtores e os usuários de informação. O adjetivo simbólico sinaliza a importância das referências sócio-culturais que sustentam a significação das representações. Estas devem ser construídas com base na observação dos contextos, das culturas das quais fazem parte e de sua linguagem e terminologia, para que possam dar origem aos processos de comunicação e significação. A Análise de Domínio, por sua vez, surgiu por volta de 1995 a partir dos trabalhos de Birger Hjørland e Hanne Albrechtsen, propondo-se como um novo paradigma em Ciência da Informação, cujas bases estão na Psicologia Social (Cognitivismo Social), na Sociologia da Ciência, na Filosofia da Ciência e na Bibliometria. Segundo os autores, esse paradigma constitui uma alternativa ao Cognitivismo marcado por características mais racionalistas e positivistas. No que se refere às questões de raciocínio, de produção e uso do conhecimento, de comportamento de busca de informação, bem como no âmbito da organização, da recuperação e da comunicação de informações, o paradigma cognitivista volta-se ao indivíduo, enquanto a Análise de Domínio à atuação dos indivíduos nos grupos. Assim, o objetivo dos autores é analisar a atuação dos indivíduos nos grupos a partir do conceito de Domínio e de Comunidades Discursivas, tendo como base os mecanismos de funcionamento de produção e uso do conhecimento dentro das disciplinas, especialidades, profissões e outros ambientes de informação. Em 2008, Hjørland publicou um artigo chamado What is knowlegde organization (KO)? onde deixa mais explícito o modo como concebe a relação entre a Análise de Domínio e a Organização do Conhecimento (OC). A “Análise de Domínio é a primeira abordagem que visa a uma fundamentação metodológica de forma sistemática para Organização do Conhecimento” (2008, p. 90). A Análise de Domínio requer considerar atuação dos indivíduos nos grupos enfatizando a importância da comunicação nas especialidades (Wilson, 1993 citado por Hjørland e Albrechtsen, 1995), como também relacionar o tipo de área temática às necessidades de informação (Motes, 1962). Para Ambar e Lyer baseados em Motes “o tipo da área temática determina o tipo de necessidade (Ambar e Lyer, 1992, p.98 citado por Hjørland e Albrechtsen, 1995, p. 401, tradução nossa) ”, o que inclui a forma como a área está consolidada, como seus membros se relacionam, produzem e usam o conhecimento A área temática e as necessidades de informação configuram-se em contextos que devem ser levados em consideração nos processos de organização, recuperação e comunicação da informação. O conceito de Comunidade Discursiva não é definido por Hjørland e Albrechtsen no artigo
GT2
453
de 1995. Em alguns momentos, os autores fazem uma equivalência sinonímica entre Domínios do Conhecimento e Comunidades Discursivas, conforme podemos observar na definição inicial do paradigma Analítico de Domínio: para entender informação na Ciência da Informação é necessário estudar os Domínios do Conhecimento ou as Comunidades Discursivas. De fato, a relação entre os dois conceitos é bastante forte. Isto posto, é possível identificar as relações existentes entre a proposta da Linguística Documentária e a da Análise de Domínio.
2. RELAÇÕES ENTRE A LINGUÍSTICA DOCUMENTÁRIA E A ANÁLISE DE DOMÍNIO 2.1 A Face Social da Organização da Informação e do Conhecimento
Aanálise dos textos relativos às duas abordagens permite afirmar que a Linguística Documentária se propõe como fundamentação teórico-metodológica para a Organização da Informação e a Análise de Domínio para a Organização do Conhecimento. Ao preferir o termo Organização da Informação,
a Linguística Documentária assinala sua diferença em relação ao conceito de conhecimento. Ambas
as abordagens se referem à preocupação com os aspectos sociais na concepção de suas teorias, instrumentos e metodologias, o que se manifesta de várias maneiras. A Linguística Documentária, ao menos inicialmente 1 , desenvolve suas análises e aplicações do
ponto de vista da Documentação; a Análise de Domínio, da perspectiva da Ciência da Informação. Para
a Linguística Documentária, há uma íntima relação entre a Documentação e a Ciência da Informação,
salientando a importância de Paul Otlet como um dos precursores da Ciência da Informação. Sob matrizes diferentes, tanto a Documentação, como a Ciência da Informação estão voltadas ao social, o que é possível verificar pelas afirmações destacadas a seguir e que podem ser aplicadas à reflexão e à construção de teorias e metodologias de Organização da Informação e do Conhecimento tomadas como atividades nucleares do campo, hoje identificado como sendo da Ciência da Informação. Para comprovar o que dizemos, retomamos García Gutiérrez, para quem:
O caráter social da Documentação, é portanto, a via pela qual a Linguística
Documentária estabelece relações com a Sociolinguística, ciência que relaciona a
Os produtos transformados
pelo método documentário são reflexo direto da composição, flutuações, manifestações e, inclusive, da relação de poder entre os diferentes extratos do grupo social produtor (GARCÍA GUTIÉRREZ, 1990. p.33-34, tradução nossa).
língua, a estrutura e os comportamentos sociais [
].
1 A produção bibliográfica da Linguística Documentária identifica, inicialmente, a Documentação como seu campo maior. Mais
recentemente, especialmente nos textos elaborados por pesquisadores da ECA, a Linguística Documentária é inserida no contexto da Ciência da Informação como um de seus subdomínios.
GT2
454
A Linguística Documentária trabalha a função social quando vê a Documentação sob a
perspectiva da interrogação e do uso. Essa perspectiva também está implícita à medida que tem como referências, a Linguística Estruturalista, as teorias da linguagem e a Terminologia (por meio das Linguagens de Especialidades) e a Semiótica. Na perspectiva da Linguística Estruturalista, a língua é um produto social:
Mas o que é a língua? [
de linguagem, e um conjunto de convenções necessárias, adotadas pelo corpo social, para permitir o exercício dessa faculdade nos indivíduos (SAUSSURE, 1972, p. 17).
É, ao mesmo tempo, um produto social da faculdade
]
Tálamo & Lara ressaltam esse aspecto quando se referem à linguagem:
A linguagem como elemento constitutivo da cultura informacional não exerce função meramente instrumental. Para além de seu funcionamento codificador, ela se propõe como representação, seja como insumo do processo social de geração de sentido, seja como resultado textual desse processo (TÁLAMO e LARA, 2006, p.25).
A Terminologia é importante como apoio à construção das linguagens documentárias. Via
linguagens de especialidade, são buscadas referências validadas socialmente nas comunidades de discurso. Os sistemas de conceitos dos domínios e áreas de atividade justificam e contextualizam os relacionamentos semânticos entre descritores, pois constituem expressão de pontos de vista
razoavelmente consensuais; os referenciais pragmáticos das terminologias, por sua vez, asseguram referência à observação de objetivos institucionais e demandas localizadas de informação.
A Semiótica também contribui para o destaque da função social da atividade documentária ao
considerar a importância da experiência colateral, que diz respeito ao conhecimento dos indivíduos,
para a interpretação e seleção de informações:
A perspectiva supõe a informação como um signo contextualizado pragmaticamente. Sua abordagem como signo, via descritores da linguagem documentária, a insere num processo interpretativo, mas somente quando é contextualizada de forma pragmática é que e a adquire um estatuto social, transformando-se, pela legitimação, em elemento efetivo de comunicação (LARA, 2006, p.343).
Hjørland e Albrechtsen (1995) preconizam o caráter social da Análise de Domínio quando
GT2
455
subordinam a abordagem à Ciência da Informação, a qual consideram como uma ciência social.
Referem-se também à relação entre a divisão social do trabalho, à produção e o uso do conhecimento
e à própria Organização do Conhecimento. A forma como se dão as relações no mundo do trabalho
influenciam diretamente a produção e o uso do conhecimento, o que se estende aos objetivos, às metodologias e aos resultados da Organização do Conhecimento. Os dois autores fazem um contraponto entre a visão cognitivista e a visão de Domínio específico para demonstrar a importância de se deslocar o foco do indivíduo para o social. Reportam- se à filosofia de John Dewey, que afirma a centralidade das ocupações na determinação dos modos de vida, dos hábitos e dos desejos de consumo. Utilizando tal referência, procuram mostrar como as nossas atividades profissionais acabam por determinar a forma como agimos, pensamos e nos relacionamos com as pessoas, dentro e fora do cenário profissional e como elas são traduzidas no contexto pragmático da Organização do Conhecimento.
Ocupações determinam os modos fundamentais da atividade, e por isso controlam a formação e os hábitos. As ocupações determinam os modelos
principais de satisfação, os padrões de sucesso e fracasso. Por isso, elas
]. Além disso,
elas decidem as relações que são importantes, e assim oferecem o conteúdo
] (DEWEY,
fornecem as classificações de trabalho e definições de valor [
ou material de atenção e as qualidades que são significativas. [
1902 2 , p.219-220 citado por HJØRLAND e ALBRECHTSEN, 1995, p.405, tradução nossa).
Para tentar compreender como as pessoas atuam nesse processo, Hjørland e Albrechtsen (1995), bem como Hjørland (2008) trabalham no desenvolvimento dos conceitos de Domínios do Conhecimento e Comunidades Discursivas, os quais por sua vez são discutidos por meio da análise
dos conceitos de disciplinas, especialidades, profissões, comunidades científicas, pensamento coletivo, entre outros. A Psicologia Social é utilizada principalmente para sustentar a argumentação a favor de um cognitivismo que contribua para a análise da atuação dos indivíduos nos grupos, bem como para
o entendimento do funcionamento da linguagem. As especialidades estão hierarquicamente subordinadas às disciplinas: elas surgem em função da grande quantidade de conhecimento produzido implicando a necessidade de seleção, uma vez que
é impossível ter acesso a tudo ou informar-se sobre tudo o que é produzido. Ambos os conceitos estão ligados às formas como as pessoas se organizam e se relacionam, bem como ao modo como essas relações determinam as formas de produção, transmissão e consumo da informação pela sociedade. A Linguística Documentária desenvolvida pelos pesquisadores da ECA também trabalha com o conceito de Domínio, porém do ponto de vista da Terminologia, mais especificamente, da Terminologia Comunicativa e da Socioterminologia. Um Domínio, segundo a norma ISO 704,
2 Dewey, J. Interpretation of savage mind. The Psychological Review, v. 9, p. 217-230, 1902.
GT2
456
constitui um subconjunto de uma área determinado por um sistema de noções. Uma área se define como uma parte do saber cujos limites são definidos segundo um ponto de vista particular de uma ciência ou técnica. O termo domínio é mais utilizado para falar dos conceitos relativos a áreas do saber, enquanto o termo Área de Atividade, como o próprio nome o diz, para contemplar o ‘fazer’. Os Domínios e as Áreas de Atividade têm como função balizar as hipóteses de Organização da Informação que sustentam o plano de classificação das Linguagens Documentárias. Embora na Linguística Documentária raramente se utilize o termo comunidades discursivas, a referência à terminologia dos domínios e áreas de atividade supõe, necessariamente, um conjunto de discursos que caracterizam tendências, compartilhamentos e temáticas. Na Análise de Domínio, o conceito de relevância tem como base as pesquisas de Saracevic (1975) 3 , que diferencia relevância da literatura do assunto e do conhecimento do assunto. Hjørland (2008) discute a relevância do ponto de vista dos sistemas, criticando as abordagens da Recuperação da Informação, bem como a Orientada ao Usuário, pelo fato delas não lidarem com a questão da representação de forma contextualizada, ou seja, considerando os possíveis usos dos documentos. O conceito de relevância é recuperado pela Linguística Documentária a partir de textos de Capurro e Hjørland (2003; 2007). Lara (2009) concorda com os autores quando eles afirmam que, para a definição de algo como informativo para alguém, concorrem estruturas informacionais, terminológicas e de linguagem das comunidades discursivas, o que mostra que o conceito de informação é subjetivo, porém não individual (HJØRLAND , 2002 4 ; CAPURRO & HJØRLAND , 2003; 2007 citados por LARA, 2009). A questão do contexto também é discutida por ambas as abordagens. García Gutiérrez fala sobre os aspectos linguísticos e extralinguísticos da Documentação e discute o conceito de contexto com base em Wittgenstein. No Brasil, Kobashi e Fernandes (2010) buscam especificar tipos de contextos para operacionalizar o trabalho de organização da informação com base na pesquisa de Armengaud 5 (2006). Na Análise de Domínio, a discussão sobre contexto aparece, em especial, no trabalho de Mai (2005), distinguindo-os a partir de uma abordagem objetivada e uma abordagem interpretativa (Talja, Keso, and Pietilainen 6 , 1999, p. 752, citados por Mai 2005, p. 605). O contexto é, assim, referido no âmbito da linguagem e dos processos de significação aí envolvidos nas abordagens
3 Saracevic, T. Relevance: a review of and a framework for the thinking on the notion in information science. Journal of the American Society.for Information Science, v.26, p. 321-343, 1975.
.Domain analysis in information science: eleven approaches traditional as well as innovative. Journal of Documentation,
v.58, n.4. p. 422-462, 2002.
4 Hjorland, B.
|
4 |
|
|
5 |
5 Armengaud, F. A pragmática. São Paulo: Parábola, 2006. |
6 Talja, S., Keso, H., & Pietilainen, T. The production of context in information seeking research: a metatheoretical view. Information Processing and Management, v. 35, p. 751–763, 1999.
6
GT2
457
da Linguística Documentária e da Análise do Domínio.
2.2 Atividade Documentária, Organização da Informação e Organização do Conhecimento
A Linguística Documentária usa os termos Atividade Documentária e Organização da Informação; a Análise de Domínio prefere o termo Organização do Conhecimento. A diferença de terminologia reside no fato da Linguística Documentária ter como foco as atividades de tratamento da informação, tais como análise, indexação/representação e construção de linguagens, consideradas nucleares na Ciência da Informação.Assim, ela prioriza as questões decorrentes do trabalho no universo da linguagem, buscando definir metodologias sem desprezar seus fundamentos epistemológicos. A Análise de Domínio opta por uma discussão de cunho mais epistemológico e busca aplicar as metodologias de Organização do Conhecimento com foco no Domínio a outros contextos, como por exemplo, na construção de Guias de Literatura. Observa-se que Hjørland (2008) ao falar de Organização do Conhecimento, propõe um sentido específico (que se aproximaria daquele dado pela Linguística Documentária, focando a atividade, ou a análise e indexação dos documentos) e um sentido mais amplo (a organização mais geral do conhecimento, mais ampla que a da atividade específica, voltada à forma como as instituições e os atores que produzem conhecimento se organizam para alcançar tal objetivo). Hjørland ressalta que o sentido amplo da OC deve dar subsídios ao sentido específico da OC. Na Linguística Documentária, o termo Atividade Documentária em alguns contextos é mais amplo do que Organização da Informação, como por exemplo, quando engloba todos os aspectos da Documentação, desde a criação do documento para o sistema documentário (emissão) até sua utilização pelo usuário (recepção). Em outros, o termo Atividade Documentária é praticamente sinônimo de Organização da Informação, referindo-se aos processos e às operações utilizadas para registrar a informação e fazer circular a informação (que incluem a Análise Documentária como metodologia).
2.3 Conhecimento, Informação, Documento
Na Linguística Documentária o conceito de Conhecimento é discutido a partir de sua relação com o conceito de informação. Informação recebe, muitas vezes, o qualificativo ‘documentária’, de modo a salientar sua condição de produto construído pela atividade documentária que se debruça sobre o conhecimento registrado. O conhecimento é também compreendido como resultado da apropriação da informação. A Análise de Domínio discute o conceito do ponto de vista da metodologia da ciência, salientando as visões positivista e a pragmática do conhecimento de modo a fazer ressaltar suas implicações epistemológicas. Na ótica da Linguística Documentária, o conceito de informação é construído observando-se
GT2
458
sua dependência institucional, como resultado de um processo de seleção e de tratamento que se insere num contexto determinado e visa atender a demandas específicas. Ao utilizar o termo informação documentária, pretende salientar o caráter construído da informação como fruto de opções ideológicas
e intencionais. Num sistema documentário-informacional, a função desse produto é desencadear
processos de construção da significação no momento da recepção. Instrumentos e métodos são
utilizados com o objetivo de oferecer condições de negociação de sentido, ou seja, condições para que a informação seja efetivamente apropriada como conhecimento. A Análise de Domínio procura entender o comportamento da informação nos Domínios do Conhecimento e nas Comunidades Discursivas a partir da divisão social do trabalho, ou seja, nas situações de produção e uso do conhecimento. Compreende-se a informação como subjetiva enfatizando o pertencimento do indivíduo a um grupo, condição que determina as possibilidades e modos de interpretação. O conceito de Documento em ambas as abordagens relaciona-se aos aspectos físicos e de conteúdo, ao concreto e ao abstrato, sendo que tanto na Linguística Documentária como na Análise de Domínio a função social do Documento envolve aspectos pragmáticos. As duas vertentes rejeitam
a ideia de uma materialidade que torna o documento algo objetivo e passível de ser representado
com neutralidade. Ambas relacionam a objetividade à face material do documento, a face que lhe dá identidade, e a subjetividade às questões de uso, de necessidades, de referências que corroboram para estabelecer os pontos de vista pelo quais o documento pode ser visto. Para finalizar, ressalta-se que na Linguística Documentária os conceitos de Documento, Informação, Conhecimento são subjacentes à fundamentação teórica da abordagem; na Análise de Domínio estão ligados à discussão sobre as formas de Organização do Conhecimento.
2.4 As Metodologias e Aplicações da Linguística Documentária e da Análise de Domínio
No que se refere às questões metodológicas verificamos que a Linguística Documentária apresenta métodos para Organização da Informação relativos à análise de documentos e à construção Linguagens Documentárias, o que resulta na criação e discussão de conceitos como Leitura Documentária, Produtos Documentários, Mensagem documentária, Signo Documentário, Semiose Documentária, Comunicação Documentária, entre outros. A Análise Documentária, outro conceito que pode ser englobado pela Linguística Documentária, ao menos na concepção de García Guitérrez (1990), não é discutido detalhadamente neste texto, pois a produção sobre esse tema é anterior ao período analisado. Conforme já assinalamos, não encontramos naAnálise de Domínio metodologia para o trabalho concreto de indexação ou de construção de linguagens documentárias. Hjørland e Albrechtsen (1995) afirmam que o melhor exemplo de aplicação do Domínio Específico é a representação/classificação de assuntos, lado interno do sistema, mas restringem-se a indicar contextos e situações na qual
GT2
459
ela poderia ser aplicada. Exceção deve ser feita ao trabalho de Mai (2005) que propõe etapas para análise do documento com foco no domínio, muito embora sua proposta não chegue a constituir uma metodologia detalhada. Embora Hjørland e Albrechtsen (1995) falem na Bibliometria, na perspectiva da Análise de Domínio, como método capaz de contribuir para a análise de tendências nas pesquisas científicas, não chegam a explicar, nos textos analisados, uma indicação metodológica para sua utilização. Em relação às operações documentárias, a Linguística Documentária utiliza o termo representação documentária, embora também utilize o termo indexação quando se refere, em especial, à Análise Documentária enquanto processo metodológico. Na Análise de Domínio, o termo mais utilizado é indexação, provavelmente justificado pela influência da linha inglesa. O termo representação é citado pelos autores no quadro comparativo que propõem entre o Cognitivismo e o Domínio Específico (HJØRLAND e ALBRECHTSEN, 1995). Hjørland (2008) faz críticas à visão das representações como objetivas e neutras com base na visão pragmática do conhecimento, perspectiva compartilhada pela Linguística Documentária quando esta sugere falar em hipóteses de organização para a construção das linguagens documentárias, combinando referências concretas das linguagens de especialidade aos objetivos institucionais do sistema documentário. No que tange aos resultados da Organização da Informação e do Conhecimento, a Linguística Documentária reúne, sob o termo Produto Documentário, resumos, índices e outros resultados da indexação e da representação documentária, bem como a própria Linguagem Documentária. AAnálise de Domínio propõe uma série produtos, serviços e estudos nos quais a metodologia da abordagem poderia ser aplicada, como os Guias de Literatura, as classificações, tesauros, estudos bibliométricos, etc.
3 CONSIDERAÇÕES FINAIS
A comparação aqui realizada não esgota todos os aspectos passíveis de serem cotejados das duas vertentes, até porque os textos analisados referem-se ao período de 1990 a 2010. Ao final da pesquisa, podemos afirmar que o conceito de Organização da Informação é uma opção da Linguística Documentária utilizado para falar das metodologias, instrumentos, processos e operações realizadas para que a informação seja registrada, recuperada, ou enfim, comunicada, interpretada e utilizada nos contextos documentário-informacionais. Na ótica da Análise de Domínio, o conceito de Organização do Conhecimento, muito embora os autores afirmem incluir os elementos acima, aplica-se mais propriamente à observação das formas como as instituições produtoras de conhecimento se organizam para produzi-lo por meio das disciplinas, especialidades, profissões etc., o que permitiria distinguir melhor entre o que Hjørland afirma como sentido específico e sentido geral da organização. De fato, o modo como as instituições se organizam para produzir conhecimento influencia
GT2
460
o conteúdo do conhecimento produzido e consequentemente, a Organização da Informação e do
Conhecimento. Por exemplo: uma disciplina denominada ‘sistemas de recuperação de informação’ pode ter sentidos diferentes num curso de Biblioteconomia e num curso de Ciência da Computação,
privilegiando traços que são mais particulares a uma atividade ou outra. Essa constatação corrobora
a hipótese de que a Organização da Informação e a Organização do Conhecimento são atividades
sociais que se relacionam intimamente à formação das pessoas, aos contextos ou às situações onde são produzidas ou processadas informações. Nas palavras de Rendon Rojas (2008), os documentos dão
origem à objetivação e à subjetivação da informação: a objetivação acontece a partir da materialidade do documento; a subjetivação, no momento em que o sujeito entra em contato com o documento, na nossa ótica, construindo-o e interpretando-o a seu modo como forma de conhecimento. A perspectiva da Linguística Documentária ao utilizar o termo Organização da Informação acaba por enfatizar um conjunto de preocupações relativas à comunicação documentária – ou
a comunicação em ambientes documentário-informacionais – que incluem necessariamente a
observação das referências simbólicas e contextuais que orientam o processo de significação e de apropriação da informação como conhecimento. Estas observações se traduzem em metodologias que orientam concretamente o trabalho documentário-informacional. Todavia, as metodologias não acontecem num vazio teórico: ao contrário, constituem uma manifestação clara de perspectivas teórico-epistemológicas que se assentam na consideração da atividade documentária como atividade simbólica que tem na linguagem e nas referências sócio-culturais sua base. A Análise de Domínio privilegia a construção da visão epistemológica do campo, destacando a importância do contexto nos processos de organização e o papel dos ambientes nos quais se produz informação e conhecimento, como as universidades, disciplinas, especialidades, profissões, etc. As ênfases são diferentes, o que não significa necessariamente que ambas as abordagens não reconheçam quer o papel do contexto, quer o papel da linguagem. Resta dizer que, para uma análise mais ampla da Linguística Documentária, seria necessário retroceder no tempo, retomando a produção sobre Análise Documentária que originalmente se apoiou em autores franceses, como M. Coyaud (1966) e J.-C. Gardin (1966; 1973), autores que também representam o principal apoio de García-Gutiérrez e dos pesquisadores em Análise Documentária da ECA-USP. Para finalizar, procuramos reunir em um quadro as principais semelhanças e diferenças entre as duas abordagens.
GT2
461
|
Quadro 1: Principais semelhanças e diferenças entre a Linguística Documentária e a Análise de Domínio. |
||||
|
Linguística Documentária |
Análise de Domínio |
|||
|
Ponto de |
||||
|
Partida |
Documentação, Ciência da Informação. |
Ciência da Informação. |
||
|
Bases teóricas |
Linguística Estruturalista, Terminologia, Semiótica, Lógica, Comunicação, Análise do Discurso. |
Psicologia Social, Sociolinguística, Sociologia da Ciência, Sociologia do Conhecimento, Filosofia. |
||
|
Fundamentar teórica e metodologicamente |
Discutir a Organização do Conhecimento do ponto de |
|||
|
a |
elaboração de instrumentos e métodos |
|||
|
Objetivos |
de organização da informação. No período analisado, os pesquisadores da ECA focalizam a construção de linguagens documentárias |
vista epistemológico, propondo |
||
|
a |
Análise de Domínio como |
|||
|
metodologia para organização do Conhecimento. |
||||
|
Trabalha os aspectos sociais a partir das visões de língua e linguagem propostas pela Linguística Estruturalista de Saussure |
Trabalha o social a partir do desenvolvimento e discussão dos conceitos de Domínios do Conhecimento, Comunidades Discursivas, Disciplinas, Especialidades, Relevância. |
|||
|
Foco nos |
e |
de seus seguidores. Procura referendar |
||
|
aspectos Sociais |
seus recortes na Terminologia buscando referências de validação social dos termos, ou seja, seu uso efetivo nos discursos dos domínios e áreas de atividade. |
|||
|
Apresenta metodologia para Análise Documentária e para a construção de Linguagens Documentárias, em especial, os tesauros. |
Não há metodologia explícita para operacionalização da análise, restringindo-se a apontar as áreas que apóiam |
|||
|
Metodologias |
a |
análise, a exemplo da |
||
|
Bibliometria. Mai destaca as etapas para análise em indexação com foco no domínio. |
||||
|
Conhecimento |
Discute o conceito de conhecimento com foco na relação informação e conhecimento. Visão pragmática. |
Discute o conceito com base em análise comparativa, rejeitando a visão positivista em favor da visão pragmática. |
||
GT2
462
|
Trabalha com o conceito de informação institucionalizada para ressaltar os vínculos da seleção com os critérios de organização. Adota o termo informação |
A informação é um conceito subjetivo, mas não individual. Relaciona-se à divisão social do trabalho, às Comunidades discursivas e aos Domínios do Conhecimento. |
||
|
Informação |
documentária para especificar o produto da atividade documentária. Destaca o papel da negociação de sentido para construir |
||
|
a |
informação, bem como as referências |
||
|
validadas socialmente via terminologias. |
|||
|
Documento |
Documento, produto de seleção. Prefere utilizar texto como unidade de análise. |
Não se refere a documento explicitamente, a não ser citando outros autores. |
|
|
Conceito de Domínio abordado |
|||
|
a partir da Educação, da |
|||
|
Domínio |
Conceito de Domínio abordado através da Terminologia. O Domínio é referência para delimitação da linguagem documentária, como um dos elementos para a consequentemente, para o engendramento das redes semânticas. escolha da hipótese de organização e, |
Psicologia, da Sociologia, etc. Tem como objetivo compreender como as pessoas as instituições se organizam para produção e uso do conhecimento. e |
|
|
Discussão do conceito de relevância baseada na visão |
|||
|
Relevância |
O Linguística Documentária a partir de textos de Capurro e Hjørland (2003; 2007). Lara (2009) concorda com os autores quando eles afirmam que, para a definição de algo conceito de relevância é recuperado pela |
de Saracevic (1975). Discute conceito do ponto de vista epistemológico e do ponto de vista das abordagens de Recuperação da Informação o |
|
|
como informativo para alguém, concorrem estruturas informacionais, terminológicas e de linguagem das comunidades discursivas. |
e orientada ao usuário, as |
||
|
quais são criticadas por não |
|||
|
trabalharem com a questão da representação no contexto. |
|||
|
Conceito discutido com base em |
|||
|
Wittgenstein (o significado das palavras |
|||
|
esclarecido pelo uso). García Gutiérrez considera a concorrência do linguístico é |
|||
|
e do extralingüístico na Documentação. |
Mai (1975) fala de contexto segundo uma abordagem objetivada e uma abordagem interpretativa. |
||
|
A Linguística Documentária brasileira |
|||
|
Contexto |
enfatiza relação com a linguagem de cunho estruturalista e seus desenvolvimentos, destacando a natureza simbólica do processo de comunicação. Kobashi |
||
|
e |
Fernandes apresentam (2010) tipos |
||
|
de contextos com base na pesquisa de Armengaud (2006). |
|||
GT2
463
|
Organização |
Prefere o termo Organização da Informação referindo-se aos processos e etapas da organização no interior da atividade documentária. Utiliza o termo Atividade Documentária como conceito que reúne a produção de documentos, seu tratamento e uso. |
Utiliza o termo Organização do Conhecimento para referir- se aos processos e operações utilizados para organizar informação para recuperação, bem como para falar sobre a forma como as instituições que produzem conhecimento se organizam para tal. Distingue sentido específico e amplo de Organização do Conhecimento. |
|
|
da Informação, |
|||
|
Organização do |
|||
|
Conhecimento, |
|||
|
Atividade |
|||
|
Documentária |
|||
|
Produtos, |
Linguagens Documentárias, Índices nas |
Guias de literatura, classificações, construção de tesauros. |
|
|
Resultados |
bases de dados organizadas via linguagens documentárias, resumos. |
||
|
Conceitos |
Domínios do Conhecimento, Comunidades Discursivas, Disciplinas, Especialidades, Especialização, Profissões, Contexto, Domínio Específico. Relevância. |
||
|
e |
contextos |
Documentação, Linguística Estruturalista, Linguagem, Terminologia, terminologias, |
|
|
relacionados à |
|||
|
fundamentação |
Semiótica, Lógica. |
||
|
teórica da |
|||
|
abordagem |
|||
|
Seleção, Contexto, Atividade Documentária, |
Conhecimento, Informação, Documento, Organização do Conhecimento, Organização Social do Conhecimento, Organização intelectual do Conhecimento, Processos de Organização do Conhecimento, Sistemas de Organização do Conhecimento. |
||
|
Conceitos |
Análise Documentária, Documento, |
||
|
e |
contextos |
Informação Documentária, Informação Institucionalizada, terminologias, linguagem de especialidade, domínios, áreas de atividade, Comunicação Documentária, |
|
|
relacionados à |
|||
|
Organização |
|||
|
da Informação |
|||
|
e |
do |
Signo Documentário, Semiose Documentária, |
|
|
Conhecimento |
Mensagem Documentária, Definição, Rede de relações lógico-semânticas. |
||
Andrade, J. A Linguística documentária e a análise de domínio na organização da informação. 2010. 150 p. Dissertação de Mestrado. ECA-USP, São Paulo, 2010. Abstract Presents analysis of Documentary Linguistics and Domain Analysis approaches in order to identify similarities, differences and a possible integration between them. The methodology used understood a literature review the period 1990 to 2010, focusing on texts of the ECA-USP researchers (Documentary Linguistics) and Birger Hjørland, Anne Albrechtsen e Jens-Erick Mai texts (Domain Analysis). The analysis has shown that both start from different theoretical foundations, differ in the description of the concepts, but they share the recognition of the Information Organization and Knowledge Organization as a social activity highlighting the importance of domains, although under different optical. Documentary Linguistics presents methodologies for analysis and construction of documentary language, domain analysis is designed to meet a broader universe and presents contexts and situations where domain analysis can be applied. Keywords: Documentary Linguistics, Domain Analysis, Information Organization and Knowledge Organization.
GT2
464
REFERÊNCIAS
ANDRADE, J. A Linguística documentária e a análise de domínio na organização da informação.
2010. 150 p. Dissertação de Mestrado. ECA-USP, São Paulo, 2010.
CAPURRO, R; HJØRLAND, B. O conceito de informação. Perspectivas em Ciência da Informação,
v. 12, n.1, p. 148-207, jan/abr. 2007.
CINTRA, A.M.M., et al. Para entender as Linguagens Documentárias. São Paulo: Editora Polis,
2002. 2ª edição. 92 p.
COYAUD, M. Introduction à l’étude des langages documentaires. Paris: C. Klincksiek, 1966.
GARCÍA GUTIÉRREZ, A. Elementos de Linguística en sistemas de información y documentación. Revista Latina de Comunicación Social, v. 7, 1998. Disponível em. <http://www.ull.es/publicaciones/ latina/a/66ant.htm>. Acesso em Jan. 2009.
GARCÍA GUTIÉRREZ, A. Estructura linguística de la documentación: teoría y método. Murcia:
Universidad de Murcia, 1990. 167 p.
GARDIN, J.-C. Análise documentária e análise estrutural em arqueologia; trad. de J. T. Coelho Netto. In: CORDIER, S. (editor). Lévi-Strauss. São Paulo: Documentos, 1968(a).
GARDIN, J.-C. et al. L’automatisation des recherches documentaires: un modèle géneral, Le SYNTOL. Parais: Ed. de la Maison de l’Homme, 1968 (b).
HJØRLAND, B. Core Concepts in Library and Information Science. 2005. Disponível em: < http://www.db.dk/bh/core%20concepts%20in%20lis/home.htm> Acesso em: 2009 e 2010.
HJØRLAND, B. Domain analysis in information science: eleven approaches – traditional as well as innovative. Journal of Documentation, v. 58, n.4, p. 422-462, 2002.
HJØRLAND, B.; Nicolaisen J. The Epistemological Lifeboat. Disponível em: <http://www.iva.dk/ jni/lifeboat/>. Acesso em: 2009 e 2010.
HJØRLAND, B. Lifeboat for Knowledge Organization. Disponível em: <http://www.iva.dk/bh/ lifeboat_ko/home.htm>. Acesso em: 2009 e 2010.
HJØRLAND, B. What is knowledge organization? Knowlegde Organization International Journal,
v. 35, n. 2-3, p. 86-101, 2008.
HJØRLAND, B; ALBRECHTSEN H. Toward a new horizon in information science: domain- analysis. Journal of the American Society for Information Science. v. 46, n. 2, p. 400-425, 1995.
KOBASHI, N.Y. Fundamentos semânticos e pragmáticos da construção de instrumentos de representação de informação. DataGramaZero Revista de Ciência da informação, v.8, n.6, dez.
GT2
465
2007. Disponível em: < <http://www.dgz.org.br/dez07/Art_01.htm> Acesso em: Ago. 2008.
KOBASHI, N.Y. Linguística textual e elaboração de informações documentárias: algumas reflexões. In: Nádea Regina Gaspar; Lucília Maria Souza Romão. (Org.). Discurso e texto: multiplicidade de sentidos na Ciência da Informação. São Carlos: EduFscar, 2008, v. 1, p. 47-66.
ISO 704. Terminología: princípios e métodos. (1º projeto de norma). Rio de Janeiro: ABNT: 1996.
KOBASHI, N.Y; FERNANDES J.C. Pragmática linguística e organização da informação. In:
Encontro Nacional de Pesquisa em Ciência da Informação, X, 2009, Paraíba. Anais Eletrônicos João Pessoa: UFPB, 2009, Comunicação Oral. Disponível em: <http://dci2.ccsa.ufpb.br:8080/jspui/ handle/123456789/491>. Acesso em: Janeiro: 2010.
LARA, M.L.G. Diferenças conceituais sobre termos e definições e implicações na organização da linguagem documentária. Ciência da Informação, v.33, n.2, p. 91-96, maio/agosto, 2004.
LARA, M.L.G. É possível falar em signo e semiose documentária. Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianópolis, 2° número esp., 2º sem. 2006. LARA, M.L.G. Elementos de Terminologia: apostila para uso didático. ECA-USP: São Paulo,
2005.
LARA, M.L.G. Informação, informatividade e linguística Documentária: alguns paralelos com as reflexões de Hjørland e Capurro. DataGramaZero. Revista de Ciência da Informação, v.9, n.6
2008. Disponível em: <http://www.datagramazero.org.br/dez08/Art_01.htm>. Acesso em Dez. 2008.
LARA, M.L.G. Linguagem Documentária e terminologia. Transinformação, Campinas, v. 16, n. 3, p. 231-240, 2004.
LARA, M.L.G. Linguística Documentária: seleção de conceitos. Ano de Obtenção: 2009. Tese de Livre docência. São Paulo, ECA-USP. 2009.
LARA, M.L.G. O processo de construção da informação documentária e o processo de conhecimento. Perspect. cienc. inf., Belo Horizonte, v. 7, n. 2, p. 127-139, jul./dez. 2002.
LARA, M.L.G. A representação documentária: em jogo a significação. Ano de Obtenção 1993. Dissertação de Mestrado. São Paulo: ECA-USP, 1993. Orientador: Prof. Dr. Johanna W. Smit.
LARA, M.L.G. Representação e linguagens documentárias: bases teórico-metodológicas, Ano de Obtenção: 1999. Tese de Doutorado. São Paulo: ECA-USP, 1999. Orientador: Prof Dr. José Teixeira Coelho Netto.
LARA, M.L.G; TALAMO M.F.G.M. Uma experiência na interface Linguística Documentária e Terminologia. DataGramaZero. Revista de Ciência da Informação, v.8, n.5, 2007. Disponível em:
<http://dgz.org.br/out07/Art_01.htm>. Acesso em: Junho:2008.
MAI, JE. Analysis in indexing: document and domain centered approaches. Information Processing and Management, v. 41, p. 599-611. 2005.
GT2
466
ORTEGA, C.D; LARA, M.L.G. Documento e informação, conceitos necessariamente relacionados no âmbito da Ciência da Informação. In: Encontro Nacional de Pesquisa em Ciência da Informação, XI, 2008, São Paulo. Anais do Encontro Nacional de Pesquisa em Ciência da Informação, 2008.
RENDÓN ROJAS M.A. Bases teóricas e filosóficas de la bibliotecologia. 2 ed. México: UNAM, 2005. 183 p.
RÉNDON ROJAS, M.A. La ciencia de la información en el contexto de las ciencias sociales y humanas. Ontología, epistemología, metodología e interdisciplina. DataGramaZero - Revista de Ciência da Informação - v.9 n.4 ago/08. Disponível em <http://dgz.org.br/ago08/Art_06.htm>. Acesso em: Setembro 2008.
SAUSSURE, F. Curso de linguística geral. São Paulo: Cultrix, 1972. 279 p.
TALAMO, M.F.G.M. Linguagem Documentária. São Paulo: APB, 1997. (Ensaios APB, n. 45).
TÁLAMO, M.F.G.M; KOBASHI, N.Y. Informação: fenômeno e objeto de estudo da sociedade contemporanea. TransInformação, Campinas, v. 15(edição especial), p.7-21, set/dez. 2003.
TÁLAMO, M.F.G.M; LARA, M.L.G. O campo da Linguística Documentária. TransInformação, Campinas, v. 18, n.3, p. 203-211, set./dez., 2006.
GT2
467
COMUNICAÇÃO
ORAL
A ORGANIZAÇÃO DA INFORMAÇÃO EM SITES DE RECURSOS HUMANOS
Brigida Maria Nogueira Cervantes, Antonio Bezerra de Lima Filho
Resumo: A organização da informação em sites de recursos humanos tem como primazia proporcionar às instituições e aos usuários, agilidade, rapidez e economia de tempo para se buscarem as informações que se fazem necessárias, contribuindo para o acesso à informação e ao conhecimento, bem como a disseminação e o compartilhamento. Os sites emergem fazendo parte desse importante processo. Partindo desse pressuposto, abordaram-se, nesta investigação, especificamente os sites de recursos humanos das universidades públicas estaduais da região sul do Brasil. Delineou-se, como objetivo geral, realizar uma análise da estrutura de organização da informação nesses sites. O estudo caracteriza- se como uma pesquisa exploratória e descritiva, com abordagem quantitativa, a coleta de dados consistiu na análise documental e o instrumento utilizado foi o formulário, o qual compõe-se de cinco das quinze regras de Eckerson (1999). Verificou-se que a maioria das universidades disponibilizam aos usuários alguma função de ajuda, tais como Fale Conosco ou Entre em Contato, permitindo que o usuário entre em contato com os setores específicos para a resolução de problemas e disponibilizando os seus conteúdos para downloads. Quanto à tipologia documentária disponível, predominam-se Decretos, Editais, Normas, Requerimentos e Resoluções. Conclui-se que as universidades utilizam os sites de recursos humanos para disponibilizar seus conteúdos, mas acredita-se que seja necessário um maior investimento no tocante à organização da informação nesses sites.
Palavras-chave: Organização da informação. Sites de recursos humanos. Universidades estaduais.
1 INTRODUÇÃO
A organização da informação de modo geral tem como característica auxiliar a compreensão do mundo, bem como facilitar o processo de busca, acesso e recuperação da informação. Dentro desse
raciocínio, este estudo tem como foco a Organização da Informação em sites de recursos humanos, especificamente nas universidades públicas estaduais da região sul do Brasil. Ele identifica-se com os apontamentos de Guimarães (2003, p. 100) por considerar o tratamento ou a organização da informação em “etapa intermediária voltada primordialmente para a garantia de um diálogo entre o
ponte informacional”. Neste
contexto, acredita-se que se faz presente o profissional da informação, atuando no processo de busca,
seleção, armazenamento e disseminação das informações. Sabe-se que na atualidade vivemos interligados com o mundo inteiro e as pessoas cada vez mais buscam informações e conhecimentos. Miranda (2005, p. 26) considera que a realidade contemporânea “permitiu a eliminação das fronteiras e das barreiras para o acesso ao conhecimento produzido pela
produtor e o consumidor da informação, assumindo [
]
função de [
]
GT2
468
humanidade”, pois quanto mais informações as pessoas possuem, mais críticas e mais preparadas para enfrentar os desafios do dia a dia, elas se tornam. As Tecnologias da Informação e Comunicação (TICs) se fazem presentes utilizando-se de suas ferramentas, tais como os portais e sites, exercendo um papel de fundamental importância, pois fazem com que as informações estejam presentes em toda parte e com rapidez, para serem acessadas e utilizadas a qualquer momento. Diante dessa realidade e frente a tantas informações disponíveis, é perceptível a dificuldade de saber em quais informações acreditar e confiar, bem como de compreender a forma como estão organizadas, exigindo-se que as mesmas estejam organizadas facilmente para serem encontradas. Estas questões tornam-se muito pertinentes quando se trata da organização da informação nos sites presentes nas instituições de ensino superior, especificamente nas universidades, que têm um papel relevante para a disseminação das informações para a sociedade como um todo. Acredita-se que tais pontos não podem passar despercebidos, pois manter uma comunidade informada de todos os acontecimentos não é uma tarefa muito fácil, desde os resultados de pesquisas, bem como atender as necessidades informacionais mais específicas. Acreditando-se que os sites estão presentes em todas as organizações, seja pública ou privada, optou-se em aprofundar o estudo a respeito da Organização da Informação nos sites de recursos humanos. Contudo, para se compreender o que seja site, primeiramente é necessário conhecer o que venha a ser o Portal. Para efeito deste estudo, entende-se portal como a primeira ou principal porta de entrada para os conteúdos que as instituições gerenciam, e denominam-se sites todos os endereços ou páginas no âmbito desses portais. Sendo assim, este estudo justifica-se, tendo em vista que, sendo funcionário da Pró-Reitoria de Recursos Humanos e tendo percebido a dificuldade das pessoas em encontrar as informações de que necessitam, bem como os formulários e documentos disponíveis no site, acredita-se que os sites desempenham um papel importante, operando como mediador entre a informação e o usuário ou o consumidor de informação. As universidades que disponibilizam os sites de recursos humanos devem utilizá-los como meio e recurso facilitador para a promoção do acesso às informações e sua disseminação, diminuindo os entraves burocráticos e principalmente, no que se refere à exclusão informacional dos servidores, além de mostrar as políticas e recursos para o acesso à informação e isto só é conseguido se os sites dispuserem as informações organizadas e que viabilizem uma infra-estrutura que apoie a criação, o compartilhamento e o uso da informação. Nessa perspectiva, delineou-se como objetivo analisar a estrutura de organização da informação dos sites de recursos humanos das universidades públicas estaduais da região sul do Brasil. A partir dos resultados obtidos, foi possível analisar e detectar se essas instituições estão possibilitando o acesso ao seu conteúdo com rapidez e fácil localização.
GT2
469
2 SITES DE RECURSOS HUMANOS Na sociedade moderna, produz-se uma infinidade de informações e uma das maneiras para
que as informações sejam distribuídas são as TICs, que são consideradas ferramentas de fundamental importância, pois fazem com que as informações estejam presentes em toda parte e rapidamente, para serem acessadas e utilizadas a qualquer momento por todas as pessoas e organizações. Rezende e Abreu (2001, p. 76) consideram as TICs como “recursos tecnológicos e computacionais para geração
e uso da informação” fornecendo às organizações e pessoas outra maneira de ver o mundo, por meio
de diversos caminhos e a adoção de novos paradigmas. Diante da diversidade de tecnologias existentes, pode-se considerar a internet como um dos principais meios responsáveis por causar mudanças na vida das pessoas, seja na ordem social, econômica, familiar ou pessoal, fazendo com que todos se adaptem à era digital. Ela proporciona a diminuição das distâncias e aproxima as pessoas às informações, muitas vezes em tempo real. Terra e Gordon (2002, p. 23) vão ao encontro dessa ideia, pois acreditam que as novas tecnologias baseadas nos padrões da internet “estão facilitando a troca de informações entre organizações e as possibilidades de colaboração entre as pessoas, em modos síncronos ou assíncronos, independentemente de localização física”.
A internet favorece a comunicação interna em uma organização, proporcionando aos seus usuários o acesso fácil, rápido e imediato às políticas e informações disponíveis na empresa. Para
tanto, Uriarte (2006, p. 40) enfatiza que “as tecnologias muito utilizadas são os sites e os portais; e, embora tenham um cunho parecido, são coisas distintas”. Um site é considerado, de acordo com Cunha e Cavalcanti (2008, p. 347) e Hagedorn (c2000, p. 6), como um “recipiente para objetos com conteúdos ou documentos que os usuários navegam por meio de busca e folheio”. Para Rodrigues (2005, p. 1), o site é o “espaço básico da informação, [ ] tem como principal objetivo organizá-la, estruturando uma hierarquia para que todo o conteúdo seja entendido e acessado com facilidade”. Conforme Ferreira, Vechiato e Vidotti (2008), os sites possuem, em sua interface, “elementos gráficos que favorecem o contato com a informação por meio de barras/menus, de ferramentas/opções
e caminhos de acesso”. Assim, de acordo com estes autores, o site permite a “integração efetiva do
usuário no processo de seleção, busca, acesso, criação e recuperação das informações em um navegar hipertextual, de acordo com seu processo de aquisição de conhecimento” (FERREIRA; VECHIATO; VIDOTTI, 2008, p. 116). De acordo com Dias (2007, p. 3), o portal “normalmente é o ponto de entrada ou o primeiro site a ser carregado quando você inicializa seu navegador web”. Além disso, o portal é considerado o
cartão de visita e o retrato da organização; por meio dele, podem-se conhecer a sua missão, origem, estrutura e políticas administrativas. Logo, o portal reflete a imagem da instituição. Para Eckerson (1999, p. 13) o portal é “um aplicativo capaz de proporcionar aos usuários um único ponto de acesso a qualquer informação necessária aos negócios, esteja ela dentro ou fora da corporação”, sendo
GT2
470
possível encontrar vários dispositivos oferecendo serviços, notícias, negócios, entretenimento, links, comunidades virtuais, chats e outros mais. Eckerson (1999) elenca 15 regras que são consideradas requisitos para um portal ou site:
Fácil para usuários eventuais, Classificação e pesquisa intuitiva, Compartilhamento cooperativo, Conectividade universal aos recursos informacionais, Acesso dinâmico aos recursos informacionais, Roteamento inteligente, Ferramenta de inteligência de negócios integrada, Arquitetura baseada em servidor, Serviços distribuídos, Definição flexível das permissões de acesso, Interfaces externas, Interfaces programáveis, Segurança, Fácil administração, e Customização e personalização. Os sites de recursos humanos fornecem informações a respeito de planos de cargos, salários, carreira administrativa, demonstrativos de pagamentos, promoções, avaliações, formulários, requerimentos, documentos, férias, aposentadoria, regulamentações, resoluções, legislação, processos de seleção, concursos e outras informações de sua competência.
3 ORGANIZAÇÃO DA INFORMAÇÃO EM SITES DE RECURSOS HUMANOS
Com o passar dos anos, o homem foi descobrindo como poderia se comunicar com o seu semelhante, com o ambiente em que vivia, e como manter esse conhecimento registrado. Esse registro das informações simboliza a maneira de representar os nossos pensamentos e o conhecimento existente e, assim, frequentemente se vê a necessidade de organizar estas informações,
visto que, na atualidade, produz-se uma quantidade imensa de informações, de todos os tipos e assuntos e também para uma diversidade de pessoas. Nas organizações, este fato também está presente, pois as mesmas produzem muita informação e convivem com dificuldades de organizá-las e utilizá-las, estas organizações acabam se perdendo neste excesso de informações. Quando nos referimos ao uso, devemos também ter a preocupação da relevância a respeito do processo de acesso que é dado às informações e ao conhecimento existente, assim Andrade
(2006, p. 46) enfatiza que “tal acesso só se viabiliza se for precedido por ações [
representação do conhecimento, que culminem no processo de transferência da informação”. Desta forma, dentro deste processo de gestão, acesso e utilização da informação, reside a necessidade de se conhecerem e organizarem as informações possuídas. O tratamento ou a organização da informação, de acordo com Guimarães (2003), é visto como uma ponte informacional, ou seja, uma etapa que tem a função de intermediar, logo, realiza a mediação entre aquele que produz (autor) e o usuário (consumidor) da informação. A organização da informação é entendida por Café e Sales (2010, p. 118) como “um processo de arranjo de acervos tradicionais ou eletrônicos, realizado por meio da descrição física e de conteúdo (assunto) de seus
] de organização e
objetos informacionais”. Entende-se, desta forma, que a representação e organização da informação contribuem para o processo de acesso à informação e ao conhecimento bem como são consideradas sustentáculos para os processos de integração e compartilhamento. Rosenfeld e Morville (2002, p. 50), de uma forma
GT2
471
mais abrangente, acreditam que a organização “colabora com a nossa compreensão do mundo, com a
nossa forma de viver, ajudando na adoção de valores, crenças e costumes”, por isso a organização da informação é necessária em todos os ambientes, pois proporciona agilidade, rapidez e economia de tempo para se buscar aquilo que realmente se necessita. Os sites devem oferecer as informações de maneira organizada, bem representada, de fácil entendimento, propiciando agilidade no acesso e recuperação, bem como ser o mais simples possível
e conter um mínimo de páginas e como em todo processo informacional, na adoção de sites, deve-se
ter a preocupação com os usuários, pois são eles os que terão que utilizá-lo, os maiores beneficiados, deve-se adotar uma estrutura que possa refletir a maneira como as pessoas utilizam as informações (DAVENPORT; PRUSAK, 1998). Guinchat e Menou (1994, p. 223) acreditam que “os sistemas informatizados devem ser concebidos, mantidos e alimentados por pessoas. Isto significa que estes sistemas não substituem completamente o homem [ Quando se reflete sobre os desafios de organizar as informações, sabe-se que este problema não é nada novo, ele vem de muito tempo e a consequência disto é a existência de pessoas convivendo com uma grande dificuldade de encontrar as informações desejadas, assim há, alguns elementos ou desafios que dificultam a organização da informação, tais como design, excesso de informação, layout, dentre outros (DIAS, 2001; 2007; FREITAS, QUINTANILLA, NOGUEIRA, 2004; TERRA; GORDON, 2002). Deve-se atentar para o fato de que, quando se projeta ou se adota um site, ele é direcionado para vários usuários e cada usuário tem maneiras diferentes de compreender a informação. Um ambiente, seja ele virtual ou físico, quando é desorganizado, causa o que se pode chamar de “caos” ou “desordem” informacional. A organização da informação tende a colaborar com este processo, fornecendo uma padronização, por isso as informações disponíveis nos sites ou em outro local não permanecerão desorganizadas e desestruturadas. Os sites vêm a colaborar com a organização da informação, pois por meio deles é possível o controle da inclusão, do armazenamento, da disseminação, do compartilhamento e, principalmente,
a recuperação da informação. Assim, os portais e sites emergem para reunir informações que
estão dispersas, em um único ponto de acesso, colaborando com o processo de busca, seleção, compartilhamento e disseminação das informações, desta forma Fonseca e Fonseca (2005, p. 85)
consideram que “a disseminação do conteúdo permanece como razão de ser da maioria dos websites,
e como resultado, a qualidade do conteúdo fornecido é um fator importante motivando visitas
repetidas”. Sánchez de Bustamante (2004, p. 3) descreve que “a organização da informação é o processo
onde se dispõe e ordena a seqüência dos elementos que integram o conteúdo de um sítio na web”,
e Benine e Zanaga (2009) acrescentam que, para este processo, é necessária a existência de uma
estrutura informacional e uma hierarquia bem definida. Esta estrutura hierárquica se faz presente nos
GT2
472
sistemas de navegação, apresentando índices e meios de rotulagem ou etiquetas que facilitam a busca pelas informações. Estes esquemas de navegação têm o intuito de serem facilitadores para o processo de busca, pois eles reúnem as informações e, desta forma contribuem para a sua organização. Benine e Zanaga (2009, p. 454), ainda, acrescentam que “as informações disponibilizadas na Web devem seguir modelos, formatos e padrões denominados de metadados” e estes são “aplicados em registros eletrônicos para descrição de um documento”. Os metadados facilitam a busca das informações no meio digital, evitando a duplicidade de informações e um re-trabalho das informações existentes. Julga-se importante reforçar, neste momento, alguns elementos que já foram citados, tais como facilidade de localização, informações organizadas e bem visíveis, pois colaboram para que haja um processo eficiente de recuperação da informação. Este fato é importante quando da construção de portais e sites, principalmente porque estes elementos são alvos de preocupações constantes para que estejam presentes nos sites, desta forma faz-se necessário a adoção de sistemas de organização de informação. Rosenfeld e Morville (2002) esclarecem que os sistemas de organização são compostos de esquemas e estruturas de organização. Um esquema de organização define a divisão de itens característicos, ao passo que uma estrutura de organização define os tipos de relacionamento entre itens de conteúdo e grupos. Os esquemas e as estruturas de organização são agrupados de maneira lógica, porém nos esquemas não há uma relação entre os itens; ao contrário da estrutura, que relaciona os itens nela agrupados (SANCHES, 2004). Os Esquemas de Organização dividem-se em três formas de organização: Esquemas de Organização Exatos, Ambíguos e Híbridos (ROSENFELD; MORVILLE, 2002). Os Esquemas de Organização Exatos compreendem o Alfabético, o Cronológico e o Geográfico. O Alfabético organiza as informações utilizando as letras ou palavras na ordem alfabética. O cronológico organiza as informações por data, utilizando-se da ordem inversa, contínua, crescente ou decrescente. O Geográfico organiza as informações primando a localização geográfica (ROSENFELD; MORVILLE, 2002). Nos Esquemas de Organização Ambíguos, a informação pode pertencer a mais de uma categoria. São compostos das seguintes formas: Por Tópicos, Orientados a Tarefas, Específico a um Público e Dirigido a Metáforas (ROSENFELD; MORVILLE, 2002). Quando por Tópicos, as informações são organizadas por assuntos, como exemplo os sumários. O modelo Orientado a Tarefas organiza conteúdos e aplicações em conjuntos de funções e processos, promovendo a interação do usuário por meio de determinadas ações. O modo Específico a um Público é direcionado a um tipo de usuário com objetivos definidos. Pode ser aberto para acesso a vários conteúdos ou fechado, quando o acesso requer um cadastro prévio ou utilização de senhas.
GT2
473
O modo Dirigido a Metáforas utiliza-se de metáforas comuns ao usuário que o permite entender itens
de informação que poderão ser acessados. Os Esquemas de Organização Híbridos são caracterizados como insuficientes, havendo a necessidade de complementação de outro esquema ou estrutura que melhor responda e satisfaça às necessidades das pessoas, desta forma, este esquema utiliza tanto os esquemas exatos como os ambíguos. As Estruturas da Organização dividem-se da seguinte forma: Estrutura Hierárquica, Base de Dados Relacional e Hipertexto (ROSENFELD; MORVILLE, 2002). Na estrutura Hierárquica as classes são ordenadas por ordem de subordinação podendo ser crescentes ou decrescentes e são mais conhecidas como de cima para baixo (top-down). A estrutura de Base de Dados Relacional possibilita a organização de conteúdos diferentes e em vários formatos; a definição de campos oferecidos para a busca pelo usuário é conhecida como busca booleana (bottom-up). A estrutura de Hipertexto é uma forma não linear de estruturação de
conteúdo ou informação. Em rede, itens ou partes de informações são interligados através de links, podendo formar hipermídias, proporcionando ligações com informações em vários formatos, seja na forma de som, vídeo ou texto. Assim como os sistemas de organização, compostos de esquemas de organização e estruturas de organização têm uma presença fundamental para organizar, acessar, recuperar e disseminar a informação, Curty e colaboradoras (2009, p. 4) acreditam que “os sistemas de rotulagem são de suma importância para se definir a estrutura de organização do conteúdo de um web site”. Estas autoras consideram que o sistema de rotulagem “representa o acesso aos conteúdos, geralmente encontrados nos menus e nas barras de navegação”, ou seja, por intermédio dos rótulos, é possível compreender
as informações que estão disponíveis, logo, decidir o caminho a percorrer. Os rótulos são considerados por Curty e colaboradoras (2009, p. 4) como “símbolos linguísticos que são utilizados para expressar um conceito. O conceito deve ser comunicado de forma eficiente e
eficaz, exigindo pouco espaço da interface e o menor esforço cognitivo do usuário para interpretá-lo”, pois tendem a agilizar e tornar fácil a identificação do conteúdo almejado. O processo de rotulagem
é visto como “um passo importante para assegurar que os mecanismos de busca encontrarão os
documentos solicitados e para distribuir os documentos baseando-se em regras de personalização” (TERRA; GORDON, 2002, p. 100). Na adoção dos rótulos, é necessário também levar-se em consideração a linguagem utilizada e que a mesma seja acessível e compreensível ao usuário, logo, “na criação ou utilização de rótulos para Web site, é preciso que se tenha uma convenção ou normalização desses rótulos de forma que sejam
ou se tornem mais familiares e precisos aos usuários” (SANCHES, 2004, p. 72), ou seja, devem-se evitar, nos sites, termos, que não tenham significado para o usuário. Os rótulos podem ser de natureza textual (verbal), que utilizam palavras ou termos para representar certa categoria, ou não-textuais (iconográficos) que direcionam às imagens, sons e gestos,
GT2
474
geralmente os ícones são os mais utilizados (CURTY et al, 2009). O sistema de rotulagem, de acordo com Sanches (2004, p. 73), deve procurar “permitir que os usuários possam identificar-se rapidamente com a linguagem e toda a estruturação do site, baseados em rótulos consistentes”, como consequência estes usuários reconhecerão as informações disponíveis nos sites e, como vantagem, haverá uma diminuição no tempo de navegação.
4 PROCEDIMENTOS METODOLÓGICOS
Para o desenvolvimento deste estudo e com base no objetivo proposto, realizou-se uma pesquisa exploratória e descritiva, com abordagem quantitativa. O universo da pesquisa é representado pelas oito universidades públicas estaduais da região sul do Brasil: Universidade Estadual de Londrina (UEL), Universidade Estadual do Norte do Paraná (UENP), Universidade Estadual de Maringá (UEM), Universidade Estadual de Ponta Grossa (UEPG), Universidade Estadual do Oeste do Paraná (UNIOESTE), Universidade Estadual do Centro-Oeste (UNICENTRO), Universidade do Estado de Santa Catarina (UDESC) e Universidade Estadual do Rio Grande do Sul (UERGS), especificamente os sites de recursos humanos. Salienta-se que a UERGS não possui site de recursos humanos, algumas informações dessa competência são disponibilizadas no portal da universidade ou no portal do servidor público, mas julgou- se interessante constá-la no rol das universidades públicas. O desenvolvimento da pesquisa, com ênfase na coleta, análise e interpretação dos dados, classificou-se como Pesquisa Documental. Vale destacar que as páginas da Web são vistas como documentos. Para Gil (2008b, p. 147), “são considerados documentos não
apenas os escritos utilizados para esclarecer determinada coisa, mas qualquer objeto que possa contribuir para a investigação de determinado fato ou fenômeno”.
A coleta de dados consistiu na Análise Documental, pois, conforme Gil (2008a, p. 89), é uma
técnica que “possibilita a descrição do conteúdo manifesto e latente das comunicações”. Esta análise documental foi realizada em consultas nos sites de recursos humanos das universidades públicas estaduais da região sul do Brasil.
O instrumento adotado foi o formulário, em razão de ser uma técnica de coleta de dados “em
que o pesquisador formula questões previamente elaboradas e anota as respostas” (GIL, 2008a, p. 115). Por meio do formulário, buscou-se identificar os elementos disponíveis nos sites de recursos humanos selecionados para o estudo. Para a elaboração do instrumento de coleta de dados, baseou-se nas 15 regras elencadas por Eckerson (1999), entretanto, em razão das particularidades desta pesquisa e das características observadas nos sites de recursos humanos, tendo em vista a realização de uma análise preliminar
nos sites, a qual se detectou a necessidade de aprimoramentos no instrumento de coleta, houve a necessidade de adequação das regras propostas, desta forma foram selecionadas 5 dessas regras, as quais foram sistematizadas em categorias e são apresentadas a seguir. O instrumento adotou a forma de planilha, facilitando a coleta e a análise dos dados coletados.
GT2
475
5 ANÁLISE E APRESENTAÇÃO DOS RESULTADOS
A análise e apresentação dos resultados foram sistematizadas em 5 categorias denominadas:
1) Fácil para usuários eventuais, 2) Classificação e pesquisa intuitiva, 3) Conectividade universal aos recursos informacionais, 4) Acesso dinâmico aos recursos informacionais e 5) Interfaces externas. Para o estabelecimento das categorias, foi observada a própria nomenclatura adotada por Eckerson (1999). As informações foram coletadas conforme cada item discriminado nas categorias e, em seguida analisadas. Cabe salientar que, para a análise dos resultados obtidos, considerou-se apenas as universidades que apresentaram as características selecionadas para a pesquisa, totalizando 7 sites em cada categoria de análise.
Categoria 1: Fácil para usuários eventuais
Na primeira categoria englobaram-se algumas questões para reflexão, abordando temáticas tais como: Se o site possui uma página de perguntas frequentes, a disponibilização de função de ajuda, meios de contato com os responsáveis pelos setores específicos, se os usuários conseguem alcançar as informações necessárias entre três a quatro cliques e se todas as páginas informam ao usuário onde ele se encontra dentro da estrutura de organização. Com base nas questões abordadas, percebeu-se que, entre as universidades pesquisadas, apenas
a UENP possui uma página destinada às perguntas frequentes, Na referida universidade, este artifício
é denominado “dúvidas frequentes”, o qual tem o objetivo de “agilizar a troca de informações entre
os membros docentes e funcionários administrativos que integram a UENP, visam a [
dúvidas e tratar de questões polêmicas discutidas no âmbito do RH da UENP” (UENP, 2011). Quando se verificou a existência de alguma função de ajuda, detectou-se que, entre as funções disponíveis nos sites da maioria das universidades, foi possível encontrar o “Fale Conosco” e “Entre em Contato”; apenas a UEL e a UNICENTRO não disponibilizavam este serviço. Esta opção é considerada importante, pois “perguntas frequentemente feitas, manuais de instrução, e formulários com feedback são outros instrumentos comumente usados para apoio aos usuários” (FONSECA; FONSECA, 2005, p. 120). Entre os pontos positivos encontrados nos sites das universidades pesquisadas, observou-se a existência de recursos que permitem que o usuário entre em contato com os setores específicos para resolução de problemas. Uma das maneiras utilizadas para esse contato refere-se a uma listagem contendo o nome, telefone e e-mail dos servidores ou a opção “Fale Conosco”. Desse modo, considera-
] atender as
se que os sites devem proporcionar aos seus usuários a “habilidade de localizar especialistas na organização, de acordo com o grau de conhecimento exigido para o desempenho de alguma tarefa” (DIAS, 2007, p. 22). Dentro desse pensamento Fonseca e Fonseca (2005, p. 119) acrescentam que os sites devem,
GT2
476
“de modo geral, conter alguma informação de contato para a organização que eles representam, bem como para qualquer outra parte que os usuários alvo desejem contato”, consequentemente, isso proporciona também a credibilidade das informações disponíveis. Ao verificar se os sites disponibilizavam aos usuários o acesso às principais partes do site acionando-as entre três a quatro cliques, notou-se que as universidades têm mostrado sua preocupação com os usuários, ajudando-os para que consigam atingir seus objetivos com facilidade e rapidez. A esse respeito, corroboram Fonseca e Fonseca (2005, p. 79) ao afirmarem que “os usuários devam ser
capazes de acessar todas as páginas críticas ou importantes dentro de 3-4 cliques de hiper-conexão”; esse princípio contribui para assegurar que os usuários encontrem facilmente as informações disponíveis nos sites. Outro ponto positivo percebido foi que as universidades têm procurado manter os seus usuários informados de sua localização dentro de sua estrutura, de vez que “os usuários necessitam saber onde
eles estão [
de modo a navegarem efetivamente. Isto é especialmente importante para os maiores
websites, que contem muitas páginas” conforme Fonseca e Fonseca (2005, p. 77). Concordando com isto, Dias (2007, p. 195) recomenda que o site “deve sempre manter o
usuário informado quanto à página em que ele se encontra, como chegou até essa página e quais são suas opções de saída, isto é, onde ele se encontra numa sequência de interações”. Em razão disso, os sites devem procurar fornecer, o máximo possível, recursos facilitadores que ajudem os usuários a ter acesso às informações com economia de tempo e rapidez. Assim,
] interfaces
concorda-se com a argumentação de que os sites devem ser caracterizados pelas suas: “[
simples e objetivas, com os recursos que propiciem a movimentação pela fonte por meio de links e
sistemas de busca, [
dentro de um portal ou de
uma fonte”. (TOMAÉL; ALCARÁ; SILVA, 2008, p. 17).
],
]
e que possibilite, ao usuário, saber sua posição [
]
Categoria 2: Classificação e pesquisa intuitiva
Com relação à segunda categoria, consideraram-se para análise as seguintes variáveis: A disponibilização de opção de busca, a existência de opções de busca em todas as páginas, os tipos de buscas oferecidos nos sites, se as informações estão dispostas em categorias, se os termos utilizados representam o conteúdo e se o conteúdo é pertinente à categoria adotada. A respeito das variáveis analisadas, optou-se por englobar algumas dessas variáveis, tendo em vista que somente duas universidades disponibilizaram as opções de busca para acesso às informações do site de recursos humanos. Constatou-se que apenas a UEPG e UNIOESTE apresentaram esta opção: ambas oferecem opção de busca por palavra-chave, mas, enquanto a UNIOESTE possui a opção de busca em todas as páginas do site de recursos humanos, a UEPG oferece apenas na página principal do site de recursos humanos. É certo que os usuários não dispõem de muito tempo para realizar consultas nos sites, um dos motivos que fazem com que as opções de busca atuem fortemente,
GT2
477
proporcionando economia de tempo para a realização de tarefas ou pesquisas. Por esse motivo, opções
de busca “são ferramentas extremamente úteis, [
mais relevantes para uma dada consulta” (TERRA; BAX, 2003, p. 41). Observou-se ainda que o site de recursos humanos da UNIOESTE não proporciona opção de busca restrita ao conteúdo de recursos humanos. Cabe salientar que apenas o site da UEPG é que
realiza esta operação, ou seja, sua busca é restrita ao conteúdo de recursos humanos, sobre isto é
devem prover, no menor tempo, os resultados
]
recomendado que os sites restrinjam “a pesquisa dos serviços de busca apenas ao conteúdo [ acordo com Dias (2007 p. 198).
Acredita-se que as opções de busca se fazem necessárias nos sites, pois proporcionam agilidade na recuperação das informações. Tomaél, Alcará e Silva (2008, p. 18) consideram a “busca como um sistema de pesquisa na fonte, com recursos que possibilitem acessar e recuperar rapidamente
]”, de
|
a |
informação”. Nesse raciocínio, Freitas, Quintanilla e Nogueira (2004) acreditam que “é inegável |
||
|
o |
valor das ferramentas de busca [ |
] |
frente à profusão de informações e conteúdo existente, pois |
estas são um enorme avanço e agente facilitador para quem procura informações [
QUINTANILLA; NOGUEIRA, 2004, p. 3). Em se tratando dos tipos de busca oferecidos nos sites, Fonseca e Fonseca (2005, p. 151) sinalizam que “as opções de buscas oferecidas devem fazer sentido, considerando os tipos de fontes de informação que a busca cobre, e os tipos de perguntas que os usuários comumente perguntam”. Complementam essa afirmação Terra e Bax (2003, p. 41), ao destacarem que “pessoas diferentes procurarão por informações de maneiras diferentes”, aqui os autores relacionam a escolha pelos tipos de busca levando em consideração a preferência pelos mesmos, experiência com estas opções e o conhecimento prévio. No que se refere às informações dispostas em categorias, percebeu-se que os sites das universidades pesquisadas apresentam, unanimemente, as informações de modo categorizado, iniciativa apoiada por Tomaél, Alcará e Silva (2008, p. 17) ao afirmarem que “as informações devem estar apresentadas em categorias adequadas, que reúnem as similares, com possibilidade de inserção de novos itens”. Quando se verificaram os termos utilizados nos sites das universidades, especificamente se esses termos representam o conteúdo e também, se o conteúdo disponível é pertinente à categoria adotada, percebeu-se que apenas a UEL apresentou discordância neste quesito. A universidade disponibiliza conteúdo que não é representativo ao termo utilizado nesta categoria, como exemplo, citamos a opção denominada “Diversos”, na qual é possível encontrar vários tipos de assuntos, tais como: Lista dos Servidores, Calendário Administrativo, JOSUEPAR (Jogos dos Servidores
]” (FREITAS;
das Universidades Estaduais do Paraná) e PCCS (Plano de Cargos, Carreira e Salários) - Análise da Carreira Técnica das IEES/PR (Instituições Estaduais de Ensino Superior/Paraná). Acredita-se que tais assuntos poderiam ser englobados dentro de categorias específicas já existentes no site de recursos humanos; neste prisma, Svenonius (2000) considera que, em uma linguagem perfeitamente
GT2
478
ordenada, cada item tem apenas um nome e um nome é usado para se referir a cada coisa única. Há, também, a opção denominada “Carreira”, na qual se encontram, além de assuntos relacionados à carreira Docente e Técnica-Administrativa, o termo Área de conhecimento CNPQ/CAPES (Conselho Nacional de Desenvolvimento Científico e Tecnológico/Coordenação de Aperfeiçoamento de Pessoal de Nível Superior). Apesar de este link não estar funcionando no momento da análise, mês de maio
do corrente ano, crê-se que o assunto ali referendado possa ser englobado em outra categoria também. Percebe-se, como citado, o uso de siglas e é possível que, de forma geral, tais siglas não sejam compreensíveis para os usuários. Os sites devem utilizar-se de termos que deixem o mais claro possível o assunto a que se
referem, ou seja, de acordo com Fonseca e Fonseca (2005, p. 87), “o conteúdo [
deve focar em
descrever, estabelecer, instruir, ou apoiar temas ou tópicos específicos vigentes ligados ao propósito e estratégia do website, de modo que os usuários alvo o compreenderão prontamente”.
]
Categoria 3: Conectividade universal aos recursos informacionais
As questões adotadas para análise foram: a existência de redundância de conteúdo nos sites, oferta de tradutor de idiomas, opção de modificação do tamanho da fonte, modificação da cor do fundo da página dos sites de recursos humanos e disponibilização de downloads. A respeito da existência de conteúdos redundantes nos sites de recursos humanos, detectou-se que os sites da UEL e UENP apresentaram essa característica, ou seja, os conteúdos estão presentes em mais de um lugar. Segundo Fonseca e Fonseca (2005, p. 118), “a redundância pode algumas vezes agir como uma ferramenta, ou um aparato, empregado para reforçar as mensagens, ou para persuadir uma certa visão de uma questão”, entretanto acredita-se que a redundância pode ocasionar confusão ao usuário ao mesmo tempo em que deixa a impressão de ser um site sem avaliação ou atualização constante. Quando se encontra um documento em vários lugares, isto pode causar dúvidas sobre qual documento é o mais recente e se houve alteração em algum deles, consequentemente, o usuário é obrigado a verificar todos os documentos disponíveis para utilizar o correto. Em se tratando da disponibilização de um tradutor de idiomas, percebeu-se que nenhum site das universidades oferece alguma opção de tradutor de idiomas. Esse fato é preocupante, pois muito se ouve falar nos dias de hoje de inclusão, acredita-se que esse é um assunto polêmico e, talvez, caminha a passos lentos. Entretanto, Dias (2007, p. 107) considera que os sites e os portais devem se preocupar em “utilizar linguagem simples, compatível com o tipo de produto, público e situação de uso, e ainda facilitar a identificação de termos em outros idiomas para que sejam traduzidos por ferramentas auxiliares”. A respeito da opção de modificação do tamanho da fonte, apenas o site da UENP disponibilizou este serviço, sendo possíveis as opções de aumentar ou diminuir o tamanho das fontes e, ainda, alterar a disposição da tela, tais como tela estreita ou tela expandida. De acordo com Dias (2007, p. 106), as
GT2
479
“informações apresentadas em um formato (visual, auditivo, táctil) só são percebidas por pessoas que tenham esse sentido em níveis normais”. Ainda acrescenta que “facilitar a compreensão do conteúdo informacional do produto também é essencial para o design universal” (DIAS, 2007, p. 107). Percebeu-se, também, que nenhum dos sites analisados disponibilizou a opção de modificação de cor do fundo da página do site de recursos humanos. Sobre este assunto, Dias (2007, p. 151)
acredita que “não basta ser acessível: um portal [
usuário, para que seja efetivamente um meio de comunicação e fonte de informações ao público em geral”. A autora entende que o site deve “fornecer ao usuário procedimentos e opções diferentes para atingir o mesmo objetivo, da forma que mais lhe convier” (DIAS, 2007, p. 199). Em se tratando de permitir aos usuários a realização de downloads do conteúdo disponível, constatou-se que todos os sites de recursos humanos das universidades pesquisas disponibilizaram os seus conteúdos para downloads. Desta forma, acredita-se que esta disponibilização de arquivos para downloads é algo importante, pois, quando os sites de recursos humanos oferecem este recurso, proporcionam aos usuários economia de tempo, principalmente pelo fato de esses usuários não precisarem se deslocar até o setor responsável para buscar formulários, requerimentos ou outros documentos ou informação, os usuários podem acessar o conteúdo disponível e gravá-lo em seu computador.
deve ser também eficaz, eficiente e agradável ao
]
Categoria 4: Acesso dinâmico aos recursos informacionais
Em relação à quarta categoria, as variáveis escolhidas para análise foram:Avisos ou notificações aos usuários a respeito de novos conteúdos e quais as tipologias documentárias disponíveis nos sites de recursos humanos. No tocante ao quesito de se manterem os usuários informados a respeito de novos conteúdos, notou-se que a UEL, UEM, UEPG e UNIOESTE procuraram manter os seus usuários informados a respeito de novos conteúdos e atualizações, utilizando-se do próprio site de recursos humanos. Cabe salientar que a UEPG utilizava tanto o site de recursos humanos, como a página principal da universidade para fazer esta disponibilização. Por outro lado, a UNICENTRO, a UDESC e a UENP disponibilizavam seus novos conteúdos na página principal da própria universidade. As universidades recorriam de artifícios para chamar a atenção dos usuários para esses conteúdos, apontando-os como novo ou novidades. A respeito das tipologias documentárias disponíveis nos sites das universidades públicas estaduais pesquisadas, percebeu-se que houve predominância na disponibilização de Decretos, Editais, Normas, Requerimentos e Resoluções. Esclarece-se que, para efeito desta pesquisa, devido às características dos sites, englobou-se o formulário no item requerimento. Esses documentos se referem aos seguintes assuntos: férias, inscrição em cursos ou treinamentos, licenças, alteração classe/ nível, dispensa de cargo, promoção, vale transporte, gratificações e outros. Ainda sobre esse assunto, observou-se que a UENP disponibiliza aos usuários apenas requerimentos que se referem ao TIDE –
GT2
480
Tempo Integral e Dedicação Exclusiva, que é um regime de trabalho. Percebeu-se também que, em nenhum site, foram encontrados disponíveis para acesso público os seguintes documentos: Ata, Atestado, Certidão, Contrato e Declaração. Estes documentos podem estar disponíveis nos portais ou sites de acesso restrito aos servidores, como o Portal do Servidor.
Categoria 5: Interfaces externas
Com base na quinta categoria, englobaram-se algumas questões para análise, tais como: a
existência de links internos e externos, o funcionamento dos links e a possibilidade dos usuários de retorno à página inicial ou anterior. Dentre os sites pesquisados, todos apresentaram links internos; no que diz respeito aos links externos, apenas UEL, UEM, UEPG e UENP apresentaram esses links. A UNIOESTE, UNICENTRO
e UDESC não disponibilizavam links para acesso aos portais e sites externos, percebeu-se que esses
links estão disponíveis apenas na página principal da universidade. Os links são a “identificação para onde apontam; relação apropriada entre as informações do documento original e para o que apontam”, ou seja, são as “ligações entre as partes de uma mesma fonte e/ou com elementos que a complementam” (TOMAÉL; ALCARÁ; SILVA, 2008, p. 17). Quando se verificou o funcionamento dos links e se eles remetem aos conteúdos corretamente, constatou-se que apenas os links da UNICENTRO, UDESC e UENP funcionam corretamente; nos outros sites, foram detectadas algumas falhas, tais como “link quebrado”, “não encontrado”, ou outro de erro. Principalmente os links que direcionam às agências bancárias são os que não completaram o carregamento. Tomaél, Alcará e Silva (2008, p. 18) consideram os “links ativos (denotam qualidade e atualidade da fonte) ou quebrados (denotam abandono e desatualização da fonte)”, deixam claro que “os links precisam estar ativos: apontar para um site que esteja on-line, ou seja, uma fonte atualizada não apresenta links quebrados” (TOMAÉL; ALCARÁ; SILVA, 2008, p. 20). Com referência à possibilidade de os usuários retrocederem para a página inicial ou anterior
a partir de todas as páginas dentro do site, apenas no site da UEM é que não estava disponível essa opção. Entre as outras universidades, UEL, UEPG, UNICENTRO, UNIOESTE, UDESC e UENP, esse recurso se faz presente. A esse respeito, Dias (2007) argumenta que as ações devem ser reversíveis, podendo desfazer pelo menos a última ação realizada, assim, o usuário sabe que se cometer algum erro ele pode ser corrigido e se encoraja a explorar outras opções desconhecidas.
7 CONCLUSÕES
Diante da análise realizada, percebeu-se que a estrutura de organização da informação disponível nos sites de recursos humanos tem promovido o acesso ao seu conteúdo com rapidez e fácil localização, haja vista a disponibilização de algumas funções de ajuda, meios de contato com os responsáveis pelos setores, permissão para downloads e a possibilidade de se alcançarem as principais
GT2
481
páginas com poucos cliques, assim, de modo geral, as universidades pesquisadas têm utilizado os sites de recursos humanos para disponibilizar aos usuários os seus conteúdos, ou seja, informações e vários tipos de documentos. tais como Ato Executivo, Decreto, Edital, Estatuto, Instrução Normativa, Leis, Requerimentos e Resoluções. Por outro lado, algumas melhorias são necessárias nos sites de recursos humanos, por exemplo, o cuidado com links que não funcionam corretamente, o uso de termos que não representam a categoria adotada, por exemplo, o uso do termo “Diversos”, expressão que pode confundir os usuários, visto que não deixa claro realmente qual o seu conteúdo e, até mesmo a sua abrangência, a ambiguidade que leva o usuário a ficar confuso diante de uma informação que se encontra em vários locais, a disponibilização de opções de busca que proporcionarão economia de tempo, já que os usuários geralmente não dispõem de tempo para a realização de consultas nos sites, e também com relação à utilização de siglas e abreviaturas, uma realidade que se faz presente em alguns sites. Desta forma, acredita-se que o objetivo proposto foi alcançado, analisar a estrutura de organização da informação nos sites de recursos humanos das universidades públicas da região sul do Brasil e que o desenvolvimento de novas pesquisas poderá aprofundar os estudos a respeito da organização da informação em sites de recursos humanos de modo geral.
ABSTRACT: The organization of information in human resources sites has the purpose of providing institutions and users with agility, speed and time saving in order to seek information that is needed. Thus, through the organization of information, the search, selection, storage and information retrieval processes are strengthened, contributing to information and knowledge access as well as dissemination and sharing. Sites emerge as part of this important process. Based on this assumption, the human resources sites of public state universities in southern Brazil were specifically addressed in this research. The general objective was to analyze the structure of the information organization from the human resources websites of public state universities in southern Brazil. The study is characterized as an exploratory and descriptive research. Data collection consisted of document analysis and the instrument used was the form, consisting of five of the fifteen rules by Eckerson (1999). It was observed that most universities provide users with a certain kind of help, such as Contact Us, allowing the user to contact the specific sectors to solve their problems and providing content for download. As for the type of documents available, the Decrees, Edicts, Standards, Requirements and Resolutions predominate. It was concluded that universities use the human resources sites to provide its contents, but it is believed that more investment is needed concerning information organization in these sites.
Key words: Information organization. Human resources sites. State universities.
REFERÊNCIAS ANDRADE, M. E. A. Um olhar sobre representações no universo do conhecimento: o caso de micro e pequenas empresas. In: NAVES, Madalena Martins Lopes; KURAMOTO, Hélio (Org.).
Organização da informação: princípios e tendências. Brasília, DF: Briquet de Lemos, 2006. p. 46-
61.
BENINE, F.; ZANAGA, M. P. Organização da informação em portais de bibliotecas universitárias, Revista ACB: Biblioteconomia em Santa Catarina, Florianópolis, v.14, n.2, 451-467, jul/dez. 2009.
GT2
482
Disponível em: <http://revista.acbsc.org.br/index.php/racb/article/viewArticle/672>. Acesso em: 25 ago. 2010. CAFÉ, Lígia; SALES, R. Organização da informação: Conceitos básicos e breve fundamentação teórica. In: ROBREDO, J.; BRÄSCHER, M. (Org.). Passeios no Bosque da Informação: estudos sobre representação e organização da informação e do conhecimento. Brasília, DF: IBICT, 2010. Cap. 6, p. 115-129. Disponível em: <http://www.ibict.br/publicacoes/eroic.pdf>. Acesso em: 26 maio 2011. CUNHA, M. B. da; CAVALCANTI, C. R. de O. Dicionário de biblioteconomia e arquivologia. Brasília, DF: Briquet de Lemos, 2008. CURTY, R. G.; ARAUJO, N. C.; CERVANTES, B. M. N.; GIRALDES, M. J. C. A. organização e a descrição de estruturas de informação em repositórios institucionais acadêmicos: uma análise com base em elementos de arquitetura de informação. In: CONGRESSO BRASILEIRO DE BIBLIOTECONOMIA, DOCUMENTAÇÃO E CIÊNCIA DA INFORMAÇÃO, 23., 2009, Bonito.
Anais
DAVENPORT, T. H.; PRUSAK, L. Ecologia da Informação: por que só a tecnologia não basta para o sucesso na era da informação. São Paulo: Futura, 1998. DIAS, C. Portal corporativo: conceitos e características. Ciência da Informação, Brasília, v.30, n.1, p.50-60, jan./abr. 2001. Disponível em: <http://www.scielo.br/pdf/ci/v30n1/a07v30n1.pdf>. Acesso em: 12 maio 2010.
Bonito: FEBAB, 2009. p. 1-12.
Usabilidade na web: criando portais mais acessíveis. 2.ed. Rio de Janeiro: Alta Books,
2007.
ECKERSON, W. 15 rules for enterprise portals. Oracle Magazine, July/Aug. 1999. FERREIRA, A. M. J. F. C.; VECHIATO, F. L.; VIDOTTI, S. A. B. G. Arquitetura da informação de web sites: um enfoque à universidade aberta à terceira idade (UNATI). Revista de Iniciação Cientifica da FFC, v. 8, n. 1, p. 114-129, 2008. Disponível em: <http://www2.marilia.unesp.br/ revistas/index.php/ric/article/view/184>. Acesso em: 04 jul. 2010. FONSECA, A.; FONSECA, A. F. Avaliando websites: perguntas chaves para revisões efetivas de websites. 1.ed. João Pessoa, PB: Ed. UNIPÊ, 2005. FREITAS, R. A.; QUINTANILLA, L. W.; NOGUEIRA, A. S. Portais corporativos: uma ferramenta estratégica para a gestão do conhecimento. Rio de Janeiro: Brasport, 2004. GIL, A. C. Como elaborar projetos de pesquisa. 4.ed. São Paulo: Atlas, 2008a. Métodos e técnicas de pesquisa social. 6.ed. São Paulo: Atlas, 2008b. GUIMARÃES, J. A. C. A análise documentária no âmbito do tratamento da informação: elementos históricos e conceituais. In: RODRIGUES, G. M.; LOPES, I. L. L. (Org.). Organização e representação do conhecimento na perspectiva da Ciência da Informação. Brasília, DF:
Thesaurus, 2003. (Estudos Avançados em Ciência da Informação, v.2). GUINCHAT, C.; MENOU, M. Introdução geral às ciências e técnicas da informação e documentação. Brasília, DF: IBICT, 1994. HAGEDORN, K. The information architecture glossary. [s.1.]: Argus Center for Information Architecture, c2000. Disponível em: <http://argus-acia.com/white_papers/iaglossary.html>. Acesso em: 05 jul. 2011. MIRANDA, M. L. C. Organização e representação do conhecimento: fundamentos teórico- metodológicos na busca e recuperação da informação em ambientes virtuais. 2005. Tese (Doutorado
GT2
483
em Ciência da Informação) – Universidade Federal do Rio de Janeiro/ECO, Rio de Janeiro, 2005. REZENDE, D. A.; ABREU, A. F. de. Tecnologia da informação aplicada a sistemas de informação empresariais: o papel estratégico da informação e dos sistemas de informação nas empresas. 2. ed. São Paulo: Atlas, 2001. RODRIGUES, B. Site ou portal? as diferenças entre site, portal, hotsite e minisite. Postado em 18 abr. 2005. Disponível em: <http://websinder.uol.com.br/2005/04/18/site-ou-portal/>. Acesso em: 05 jul. 2011. ROSENFELD, L.; MORVILLE, P. Information architecture for the Word Wide Web . 2 nd . ed. Sebastopol, CA: O’Reilly, 2002. p. 50-55. Disponível em: <http://books.google.com.br/
books?id=OM3DvakML-MC&dq=information+architecture+
for+the+world+wide+web&printsec=frontcover&source=bn&hl=pt-R&ei=ghGJTPHZG4T48
AbwxaWMAg&sa=X&oi=book_result&ct=result&resnum=4&ved=0CCgQ6AEwAw#v=onepage
&q&f=false>. Acesso em: 20 ago. 2010. SANCHES, S. A. S. Arquitetura da informação em web sites: elementos, técnicas e métodos.
2004. Trabalho de Conclusão de Curso (graduação), Faculdade de Filosofia e Ciências,
Universidade Estadual Paulista, São Paulo, 2004. SÁNCHEZ DE BUSTAMANTE, A. M. de O. Arquitectura de información y usabilidad: nociones básicas para los profesionales de la información. Acimed, Havana, v.12, n.6, 2004. Disponível em:
<http://bvs.sld.cu/revistas/aci/vol12_6_04/aci04604.htm>. Acesso em: 27 ago. 2010.
SVENONIUS, E. Bibliographic Entities. In:
organization. London, England: The MIT Press, 2000. p. 31-52. TERRA, J. C. C.; GORDON, C. Portais corporativos: a revolução na gestão do conhecimento. 6.ed. São Paulo: Negócio, 2002.
; BAX, M. P. Portais corporativos : instrumento de gestão de informação e de conhecimento. 2003. Disponível em: <http://www.bax.com.br/research/publications/ portaiscorporativosInstrumentosGestão.pdf>. Acesso em: 25 ago. 2010.
TOMAÉL, M. I.; ALCARÁ, A. R.; SILVA, T. E. Fontes de informação na internet: critérios de qualidade. In: TOMAÉL, M. I. (Org.). Fontes de informação na internet. Londrina: EDUEL,
2008. p. 3-28.
URIARTE, F. M. N. Portal corporativo como canal para gestão do conhecimento. 2006. Dissertação (Mestrado em Engenharia e Gestão do Conhecimento) – Universidade Federal de Santa Catarina, Florianópolis, 2006. Disponível em: <http://btd.egc.ufsc.br/wp-content/uploads/2010/06/ Flavia-Maia-da-Nova-Uriarte.pdf>. Acesso em: 26 maio 2010.
The
intellectual foundation of information
GT2
484
COMUNICAÇÃO
ORAL
RELAÇÕES CONCEITUAIS E CATEGORIAS FILOSÓFICAS:
APORTES DAS ONTOLOGIAS E DA TERMINOLOGIA PARA A REPRESENTAÇÃO DO CONHECIMENTO
Walter Moreira, Marilda Lopes Ginez de Lara
Resumo: Discute os subsídios que as interfaces entre terminologia, ontologia filosófica, ontologia computacional oferecem para a organização das relações conceituais nos processos de representação do conhecimento em sistemas de informação documentária. Considera que a ontologia, em quaisquer dos seus aspectos, possui função de fornecer sistemas de categorização que permitam ao homem organizar a realidade. Estabelece, portanto, como objetivos: a) discutir o fundamento filosófico da aplicação de ontologias com base no estudo das categorias ontológicas presentes em Aristóteles e Kant e b) fornecer subsídios iniciais para a compreensão da inter-relação entre ontologia filosófica, ontologia formal e representação documentária baseada em categorias de assunto. Defende a vinculação mais forte dos estudos sobre ontologias à compreensão filosófica do termo. A representação do conhecimento é o aspecto que une, por semelhança de propostas, a ciência da computação, por meio das ontologias, e a ciência da informação, por meio dos tesauros, por isso são utilizados referenciais teóricos de ambos os campos. Considerando-se, ainda, que a intersecção entre estes campos, na abordagem do mesmo objeto, ocorre por meio da compreensão e aplicação de categorias de assunto, insere também os estudos filosóficos na fundamentação teórica que sustenta a reflexão. Aponta, como considerações finais, que a construção de ontologias não pode prescindir do tratamento terminológico-conceitual, como compreendido pela terminologia e pela ciência da informação, acumulado nos referenciais teóricos e nas metodologias para construção de linguagens documentárias e que, por outro lado, a construção de linguagens documentárias mais flexíveis não pode ignorar o modelo de representação do conhecimento praticado nas ontologias, com mais predisposição para a formalização e para a interoperabilidade.
Palavras-chave: Relações conceituais. Categorias. Ontologias. Terminologia. Representação do conhecimento.
1 INTRODUÇÃO
Em se tratando de atribuir semântica aos fluxos de informação na web, as ontologias têm sido amplamente estudadas na ciência da computação e, na mesma condição de instrumentos de representação do conhecimento, também interessam à ciência da informação. Não raramente o computador e as tecnologias que lhe são associadas têm sido tratados como panaceia ou, por outra associação com a cultura grega, como o deus ex machina (o artefato que o teatro grego produziu para resolver inesperadamente, todos os problemas de uma trama). Com o fim de evitar este engano, buscou-se sustentar esta pesquisa não apenas no caráter da racionalidade técnica, mas também da racionalidade reflexiva. Busca-se, especificamente, refletir a aplicação de ontologias
GT2
485
nos processos de representação do conhecimento, considerando-se, principalmente, a compreensão da ciência da informação. As condições para a comunicação efetiva da informação e do conhecimento formam, na definição clássica de Saracevic (1996, p. 47), a preocupação central da ciência da informação; entendida como
um campo dedicado às questões científicas e à prática profissional voltadas para os problemas de efetiva comunicação do conhecimento e de seus registros entre os seres humanos, no contexto social, institucional ou individual do uso e das necessidades de informação. No tratamento destas questões são consideradas de particular interesse as vantagens das modernas tecnologias informacionais.
Destacam-se dois aspectos desta definição: “os problemas de efetiva comunicação do conhecimento” e as “vantagens das modernas tecnologias informacionais”. O primeiro dá conta de um olhar pragmático para o objeto da ciência da informação, isto é, ainda que não se possa garantir totalmente a produção de conhecimento com a simples comunicação da informação, é essa é a finalidade dos sistemas documentários. O segundo aspecto, referente às tecnologias, confere à definição um caráter indispensável às definições clássicas: a peremptoriedade. A questão das ontologias tem interessado à ciência da computação, que registra, aliás, avanços significativos, e à ciência da informação, por meio do refinamento de propostas das linguagens documentárias, notadamente com o aporte da terminologia. Passados quase 15 anos, ainda é possível verificar a falta de diálogo entre os dois campos apontada por Vickery (1997), no que se refere aos processos e aos produtos que ambas geram. Assumindo-se que a representação do conhecimento ou a representação documentária jamais são fins em si mesmas, o compromisso maior que tanto um campo quanto outro adota relaciona-se, no limite, com o desenvolvimento da ciência e da tecnologia, já que o fluxo do conhecimento científico e tecnológico também se dá por meio de suas representações, sejam ontologias ou tesauros. Acredita-se, então, que a compreensão mais terminológica das ontologias pode oferecer colaborações para a organização de um acesso menos quantitativo e mais qualitativo à informação. Mais de dois mil anos depois do surgimento das primeiras formas de índice, ainda se dá primazia, grosso modo, para a frequência e/ou ocorrência como indicadores de relevância. Esta reflexão apóia-se nos seguintes pressupostos: a) a construção de ontologias não pode prescindir do tratamento terminológico-conceitual, como compreendido pela terminologia e pela ciência da informação, acumulado nos referenciais teóricos e nas metodologias para construção de linguagens documentárias; b) a construção de linguagens documentárias mais precisas e mais flexíveis expressas em relacionamentos conceituais mais dinâmicos pode beneficiar-se do conhecimento das metodologias utilizadas na construção de ontologias de domínio e suas regras de inferências e relacionamentos. Estabeleceu-se como objetivo, portanto, investigar as interfaces entre terminologia, ontologia filosófica, ontologia computacional e linguística documentária e os subsídios que oferecem para a organização das relações conceituais nos processos de representação do conhecimento em sistemas de informação documentária.
GT2
486
1.1 Justificativa
A quantidade de informações em circulação atualmente, consideradas as facilidades de acesso, armazenamento e, principalmente, circulação, trazidas pelas tecnologias da informação e da comunicação, continua provocando a busca de novas metodologias para a organização destas massas que agora, em vista da maior oferta e diversidade de documentos, são ainda mais incoerentes, para utilizar a expressão que aparece no parágrafo de abertura do clássico otletiano (OTLET, 1996, p. 6). Não fossem outras razões, esta seria suficiente para motivar uma reflexão sobre este que tem sido um dos problemas mais caros à ciência da informação: as condições de produção, acesso e circulação da informação, bem como o comprometimento com a produção, acesso e circulação do conhecimento, que envolve, naturalmente, aspectos semânticos. O tratamento semântico, pela relação semiótica contextual que visa a estabelecer, é inerentemente complexo e também tem sido proposto como tarefa para as ontologias computacionais, principalmente em aplicações para a internet. O uso de ontologias neste ambiente visa a sanar um problema histórico recente: a rede cresceu como meio para a troca de informações entre pessoas e deixou a desejar no que se refere às condições da troca de dados e informações que possam ser processados automaticamente (BREITMAN, 2005). Ainda que trate de um tema cuja literatura mais vasta encontra-se no interior da ciência da computação, esta pesquisa tem como fundamentação teórica a literatura da ciência da informação e da terminologia, com especial atenção para a teoria comunicativa da terminologia, cuja concepção de unidade terminológica é mais flexível e admite a possibilidade de variação conceitual e denominativa, além de admitir também relações entre conceitos que ultrapassam as relações lógicas e ontológicas estabelecidas pela teoria clássica. As ontologias permitem melhorar significativamente a representação computacional de um domínio do conhecimento. Esta melhoria dá-se inicialmente num nível máquina-máquina e depois máquina-homem, para posteriormente interferir na relação homem-homem. Sendo as ontologias conjuntos estruturados de conceitos especializados representados por denominações, a terminologia pode igualmente contribuir para o aprofundamento da compreensão.
2 A BASE FILOSÓFICA DAS ONTOLOGIAS
Considerada em quaisquer de seus aspectos, pode-se atribuir à ontologia a função de fornecer sistemas de categorização que permitam ao homem organizar a realidade. Insere-se neste ponto sua proximidade com o domínio da ciência da informação e objetiva-se, desse modo, com a presente seção: a) discutir o fundamento filosófico da aplicação de ontologias com base no estudo das categorias ontológicas presentes em Aristóteles e Kant e b) fornecer subsídios iniciais para a compreensão da inter-relação entre ontologia filosófica, ontologia formal e representação documentária baseada em categorias de assunto. A adoção de princípios ontológicos no campo de pesquisa que envolve a representação e a
GT2
487
recuperação da informação e do conhecimento, ainda que a base tecnológica atual possa fazer parecer incipiente, não é recente, embora seja, por sua complexidade, insipiente. Aristóteles, um sábio de Estagira cuja cabeça sustenta ainda hoje o Ocidente 1 , inaugura, com o que chamou de metafísica 2 , estes estudos. Posteriormente, Porfírio (explicador de Aristóteles), Brentano, Kant e Peirce entre outros, retomam e atualizam o pensamento aristotélico, direta ou indiretamente, concordando com ou divergindo dele, conforme apontado na discussão que se segue. Defende-se, juntamente com Smith (2002; 2004, entre outros), que se corre o risco de realizar um uso pobre da ontologia se isso ocorrer desvinculado da compreensão filosófica. A maioria dos trabalhos sobre metodologias para desenvolvimento de ontologias para sistemas de informação, como foi possível comprovar (MOREIRA, 2010) tomando-se como ponto de partida a sustentação de Smith (2002; 2004), ignoram o trabalho feito na filosofia. A exemplo do que ocorre com as classificações bibliográficas, cuja compreensão não pode ser separada da compreensão das classificações filosóficas, acredita-se que não se pode desenvolver ontologias (conforme compreendidas pela ciência da computação/inteligência artificial) sem o necessário aporte da ontologia (conforme compreensão da filosofia).
2.1 Categorias aristotélicas
Aristóteles (384-322 a.C.) compreende o mundo físico como a realidade última, concepção que se revela nas categorias com as quais quer analisar os predicados do ser: substância, qualidade, quantidade, relação, lugar, tempo, posição, estado, ação e paixão. A substância pode ser considerada como a categoria primeira, pois em torno dela giram as afirmações possíveis pelo uso das demais categorias. Kant, posteriormente, irá criticar os problemas de derivação presentes nas categorias aristotélicas. Sowa (2000; 2009) estabelece um interessante paralelo entre as categorias de Aristóteles e seus desdobramentos diretos ou indiretos. Neste trabalho, que acompanha seu raciocínio em alguns aspectos, ater-se-á somente à já clássica representação de Porfírio e às representações posteriores de Kant por considerá-las mais próximas do que se pretende como organização e representação do conhecimento no universo da ciência da informação em sua necessidade de operar com esses conceitos. Estudos posteriores deverão comparar a evolução da representação ontológica em outros pensadores. Um dos maiores divulgadores das ideias aristotélicas acerca da categorização foi Porfírio (232- 305), cuja dicotomia deve sua larga e longa aceitabilidade, certamente, ao que se pode chamar de vontade humana de que o mundo pudesse assim ser compreendido e representado, notadamente no medievo. Feliz ou infelizmente a realidade é complexa e não pode ser facilmente representada em face
1 Verso da música Alexandre, de Caetano Veloso, gravada em seu álbum Livro, de 1997.
2 Aristóteles qualificou os pré-socráticos, por seu esforço em compreender o universo (physis) de físicos (physikoi) e propôs, para diferenciar-se deles, o termo metafísica.
GT2
488
da presença/ausência de determinados traços. Dentre as contribuições mais importantes de Porfírio estão os comentários sobre as categorias de Aristóteles: a Isagoge (uma variação linguística arcaica equivalente a preliminar ou preâmbulo). Nesta obra aparece sua conhecida concepção arborescente (embora ele mesmo não use esta forma de representação). Baseando-se na teoria dos predicados de Aristóteles, a Árvore de Porfírio constitui-se num conjunto hierárquico finito de gêneros e espécies, identificados por dicotomias sucessivas. A influência de Porfírio estende-se pela posterior teoria da definição e classificação dos seres e igualmente pelas classificações das ciências, seja originando classificações dicotômicas, seja exigindo- lhes simetria (POMBO, 1998). Essa influência estende-se ainda, naturalmente, com maior ou menor intensidade pela classificação bibliográfica e outras linguagens documentárias de um modo geral e também está presente nas taxonomias e nas ontologias. A Árvore de Porfírio deve sua limitação à relatividade de sua construção, conforme apontado por Tálamo et al. (1992), pois depende da seleção do atributo de qualidade que compreenderá as subdivisões sucessivas. O homem, no exemplo de Eco (1984), também citado pelas autoras, só é mortal numa hierarquia que focalize o problema da duração da vida. Considerados outros aspectos, pode-se, por exemplo, inseri-lo numa hierarquia que considere sua natureza orgânica ou inorgânica. A seleção se dá, então, pelo que Tálamo et al. (1992) chamam de ‘pressão’ contextual, podendo-se considerá-la verdadeira “apenas em relação a um determinado código e não em relação às propriedades dos objetos em si mesmos”. Neste tipo de divisão, o contexto não é incorporado, ou então incorpora-se apenas um contexto determinado, o qual irá suportar a interpretação.
2.2 As categorias de Kant
A razão, para Immanuel Kant (1724-1804), é uma estrutura vazia, inata, independente da experiência, uma espécie de forma pura, sem conteúdos, universal. Os conteúdos são dados pela experiência. “Sem sensibilidade”, pode-se ler em Kant (1996, p. 92), no que é considerado como uma síntese entre racionalistas e empiristas, “nenhum objeto nos seria dado, e sem entendimento nenhum seria pensado. Pensamentos sem conteúdo são vazios, intuições sem certos conceitos são cegas [ Na Crítica da razão pura, Kant propôs uma primeira mudança radical nas categorias aristotélicas: a combinação dos relacionamentos num julgamento, considerando que a realidade se dá na possibilidade de emissão de juízos, afirmações ou negações. Em outros termos, não basta apenas que algo esteja num contexto de tempo e de espaço para que seja considerado real, antes é preciso que se possam emitir juízos a seu respeito. Apresentando-se a realidade nos juízos, pode-se afirmar a correspondência condicionada entre juízo e realidade, o que permite ao homem formar um conjunto de juízos que sustenta sua expressão das coisas reais. Os juízos não possuem, contudo, sempre a mesma natureza. A afirmação ou negação das propriedades de algum objeto, variam e condicionam a percepção do objeto, como ocorre, por exemplo,
GT2
489
com as seguintes afirmativas: ‘A USP é uma universidade brasileira’, que não possui a mesma natureza de: ‘A USP é a melhor universidade do Brasil’. Ambas referem-se a propriedades da USP; são portanto juízos e podem dar a impressão de simplesmente descrevê-la. Basta um exame mais atento, entretanto, para que sejam percebidas suas diferenças: a primeira afirmativa refere-se ao que se denomina por fatos, enquanto a segunda envolve um ‘juízo de valor’, representando, neste caso, uma opinião, para a qual não se pode esperar o mesmo grau de concordância. A partir de uma tábua dos juízos, Kant propõe e lhe faz derivar e corresponder uma tábua das categorias, ambas organizadas em quatro grupos de três. Esta é considerada a primeira grande mudança imposta às categorias aristotélicas, mas ainda parte delas (SOWA, 2000; 2009). É o próprio Kant (1996, p. 108), aliás, quem informa sobre seu desejo de rever Aristóteles: “seguindo Aristóteles, denominaremos tais conceitos categorias na medida em que nossa intenção, em princípio, identifica-se com a de Aristóteles, se bem que se afaste bastante dele na execução”. Considera que por meio desses conceitos puros é possível compreender “algo do múltiplo da intuição” e segue sua crítica ao modelo aristotélico:
a procura desses conceitos fundamentais constituiu um plano digno de homem
perspicaz como Aristóteles. Entretanto, por não possuir nenhum princípio catou-
os como se lhe deparavam, reunindo primeiramente dez, que denominou categorias (predicamentos). A seguir, creu ter encontrado ainda mais cinco conceitos que
acrescentou sob a denominação de pós-predicamentos [
] [
]
(KANT, 1996, p. 109).
Aristóteles, na visão de Kant, enumera, mas não justifica as categorias, não apresenta provas de sua derivação. A diferença em Kant é o foco no sujeito como princípio orientador da descoberta. O mundo é ordenado pelos seres humanos segundo a distinção que possuem. Se não se conhece a distinção mesa, por exemplo, não se pode observá-la. Pode-se ver diferenças de cor, forma, textura etc., mas não uma mesa (SALATIEL, 2006). Para utilizar um exemplo corriqueiro, os esquimós podem observar mais distinções de branco do que os brasileiros, a diferença entre os povos, neste caso, não é biológica. Em Kant, são as categorias que permitem organizar os dados da experiência, por esta razão se diz que o entendimento kantiano é apriorístico (anterior à experiência e independente dela). Munido das categorias, o sujeito forma os conceitos.As categorias permitem ao sujeito o “enquadramento” do mundo, por isso condicionam, num certo sentido, sua visão de mundo e sua racionalidade. Conhecimento, em Kant, é relação e não contemplação. Chamou-se ‘revolução copernicana’ à síntese que Kant realizou do embate filosófico entre racionalistas e empiristas. Sua concepção filosófica aceita argumentos de uns e de outros na compreensão de que o conhecimento começa com a experiência, mas que esta não age sobre um ser sujeitado; o sujeito constrói esquemas interpretativos de organização dos dados da experiência. Estes esquemas permitem transformar em conhecimento os dados da experiência. Em vez de explicar os conceitos em função da experiência, Kant dedicou-se a explicar a experiência em função dos conceitos, considerando que “antes que as impressões que irrompem nos
GT2
490
sentidos se transformem em conhecimento, devem ser organizadas ou unificadas de algum modo pela atividade do entendimento” (RUSSELL, 2001, p. 345). Enquanto a filosofia centra suas preocupações ontológicas no que existe no mundo, a aplicação de ontologias no domínio da representação computacional do conhecimento é bem mais modesta; entende pragmaticamente o que existe como o que pode ser representado (GRUBER, 1995). Neste último caso, as preocupações ontológicas restringem-se a domínios específicos e visam antes soluções de problemas (aplicações práticas) absolutamente demarcados, que reflexões. Nestes tipos de aplicações, envolvem-se basicamente: a) um conjunto de termos e conceitos que são utilizados para a descrição do domínio (uma ontologia); b) uma base de conhecimento que permita aplicar isso a uma determinada realidade e c) agentes inteligentes (programas de computador com capacidade autônoma de ação), assim denominados porque visam a simular o comportamento humano na resolução de tarefas. Os agentes, mediante as instruções do usuário, coletam dados na internet e processam as informações por meio de regras lógicas de inferências, como as ontologias. É importante lembrar que outra característica dos agentes é a cooperação, ou seja, a troca de informações que podem realizar entre si. Ainda que Gruber (1995) tente simplificar a questão, conforme apontado anteriormente, afirmando que para a inteligência artificial o que existe é o que pode ser representado, não escapa do problema ontológico e filosófico fundamental: o que de fato existe para ser representado? Quais são as entidades dessa condição virtual? Do modo como a questão está colocada faz parecer que a oposição se dá entre o real (a realidade, o que existe) e o potencial (o que pode ser representado). Optar pela potencialidade é algo simplesmente irrealizável, pois não existem opções neste caso. Não há como separar efetivamente o que pode ser representado do que não pode sê-lo. O problema da representação não se resolve deste modo. Talvez fosse melhor pensar a relação atual e virtual, conforme a concepção deleuzeana para definir o escopo das relações categoriais nas ontologias. O virtual, esclarece Deleuze (1988, p. 203), “não se opõe ao real, mas apenas ao atual. O virtual possui plena realidade enquanto virtual”.
2.3 Categorias, ontologias e informação documentária Ainda em busca da compreensão das inter-relações apontadas anteriormente, pergunta-se: como os estudos sobre categorização realizados no interior da ciência da informação se relacionam com as ontologias e estas com a construção de informação documentária? Os sistemas de informação têm sua eficácia condicionada à adoção de critérios explícitos e de recortes institucionais no delineamento de categorias, não sendo assim, corre-se o risco de tomar casos concretos por princípios estabelecidos. Nas linguagens documentárias as categorias herdam alguns princípios filosóficos, pois se referem a agrupamentos que manifestam particularidades em relação aos campos do conhecimento ou de atividade, mas como contraexemplo do que ali se dá, não são universais (ou não pretendem sê-lo), pois servem a propósitos institucionais objetivados e denotam interpretações particulares.
GT2
491
A institucionalização, a necessidade de um olhar apriorístico que atenda às necessidades institucionais de categorização do conhecimento para fins de representação e posterior recuperação da informação em sistemas de informação pode levar à crença de que a abordagem kantiana é a solução para tais problemas. Com base em que princípios, contudo, poderão ser produzidas as categorias do conhecimento (categorias do entendimento, diria Kant)? O único princípio norteador da escolha é a própria experiência concreta dos sistemas de informação e sua complexidade, que envolve os usuários da informação (considerados de forma coletiva), as linguagens documentárias, os profissionais da informação e a base tecnológica disponível. A ciência da informação, uma ciência social aplicada, vale lembrar, pretende organizar o conhecimento não apenas para representá-lo, mas também para garantir seu uso e seu reuso. Sem a adoção de critérios explícitos arrisca-se a reduzir a discussão sobre a apropriação ao nível do indivíduo e dessa forma perder o parâmetro social.
3 CARACTERÍSTICAS DAS ONTOLOGIAS A definição de ontologias tem ocupado espaço considerável na literatura especializada. Guarino
e Giaretta (1995), num trabalho que discute a formação, o significado do termo e suas interpretações
partem da definição clássica de Gruber (1995) para construir um (já então necessário) ‘esclarecimento
terminológico’, como denuncia, aliás, o subtítulo de seu artigo. Passados dezesseis anos, o campo ainda
é incipiente e o significado do termo é amplo, ambíguo e ainda está em negociação, variando conforme
sua aplicação. Em ciência da computação (mais especificamente no domínio da inteligência artificial) compreendem-se as ontologias, numa abordagem sintética, como um conjunto de conceitos e termos que podem ser usados para descrever alguma área do conhecimento ou construir sua representação. Trata-se, conforme a já clássica definição de Gruber (1995), de uma especificação formal explícita de uma conceitualização compartilhada. Por formal entende-se que esta representação seja expressa num
formato legível por computadores; explícita significa que os conceitos, as propriedades, as relações, as funções, as restrições e os axiomas devem estar formalmente definidos e passíveis de serem manipulados por computadores. Entende-se por conceitualização que tal representação seja referente a algum modelo abstrato de algum fenômeno do mundo real e, finalmente, por compartilhada, compreende-se que esse conhecimento seja consensual (MOREIRA, 2010). A definição de Jacob (2003), reproduzida abaixo, tangencia a de Gruber e acrescenta-lhe aspectos importantes: as ontologias focam, sem prejuízo da informação sintática, o compartilhamento da informação semântica entre sistemas de informação.
uma ontologia é uma conceitualização parcial de um determinado domínio
do conhecimento, compartilhado por uma comunidade de usuários, que foi definida numa linguagem formal processável por máquina para o propósito explícito de compartilhar informação semântica entre sistemas automatizados (JACOB, 2003, p. 20, tradução livre).
] [
GT2
492
Considera-se relevante citar ainda, pela abrangência, a definição de Jasper e Uschold (apud BREITMAN, 2005, p. 31): independentemente do formato que assuma, uma ontologia “deve incluir um vocabulário de termos e alguma especificação de seu significado. Esta deve abranger definições e
uma indicação de como os conceitos estão inter-relacionados, o que resulta na estruturação do domínio
e nas restrições de possíveis interpretações de seus termos”. A expressão restrições possíveis merece
ser observada com mais cuidado. Considerando-se que o compartilhamento de conhecimentos deve ser consensual, espera-se que os atores envolvidos possam, de alguma forma, expressar interpretações que possuam pontos de contato entre si, que possuam potencial dialógico. No que se refere aos elementos que compõem uma ontologia, segue-se a descrição de Gómez- Pérez (1999, p. 35, tradução livre): a) conceitos organizados numa taxonomia (classes e subclasses) – os conceitos podem ser abstratos ou concretos, simples ou compósitos (composite), reais ou fictícios; b) relações entre os conceitos, formalmente definidas; c) funções – casos especiais de relacionamento em que um conjunto de elementos tem uma relação única com um outro elemento; d) axiomas – regras, sempre verdadeiras; e) instâncias – usadas para representar elementos. A indicação da instância como componente das ontologias causa, na literatura da ciência da computação, discussão semelhante à que provoca na ciência da informação a utilização de conceitos individuais na organização de tesauros, que, aliás, não os admite. Os níveis de modelagem das relações conceituais nas ontologias, contudo, admitem maiores variações e podem exigir no vaso das ontologias de aplicação, por exemplo, esta especificação. Veja-se, como ilustração, a classificação de ontologias apresentada por Maedche (2002): a) ontologias de alto nível – descrevem conceitos genéricos, como espaço, tempo, evento e outros, os quais são independentes de domínios particulares; ajustam-se melhor às ações de interoperabilidade, pois podem ser compartilhadas por grande número de usuários; b) ontologias de domínio – descrevem o vocabulário relacionado com um domínio genérico por meio da especialização dos conceitos introduzidos nas ontologias de alto nível; c) ontologias de tarefa – descrevem o vocabulário relacionado com uma tarefa ou atividade genérica por meio da especialização dos conceitos introduzidos na ontologia de alto nível; d) ontologias de aplicação – são as ontologias mais específicas; os conceitos neste tipo de ontologia frequentemente correspondem às especializações dos conceitos usados nas ontologias de domínio ou de tarefa.
3.1 Interoperabilidade semântica
As novas possibilidades de interação e de interatividade influem, de modo natural, nos sistemas de informação e o interesse em interoperabilidade (que não é novo) cresce proporcionalmente ao também renovado interesse em intercâmbio de informações documentárias. Superar as barreiras tecnológicas
e de organização (representações e garantias de acesso) tornou-se objetivo comum hoje a todos os envolvidos nos processos de tratamento da informação. Um dos problemas mais claramente colocados à interoperabilidade, que, aliás, também influenciou o projeto de adoção uniforme dos sistemas de classificação, como queriam seus
GT2
493
idealizadores, refere-se à questão da complexidade das culturas envolvidas nos processos de construção da informação documentária. Se num contexto particular de uma unidade de informação já é muito difícil garantir a coerência intraindexadores e interindexadores, o problema agrava-se muito em contextos desterritorializados de intercâmbio intercultural ou internacional. Dentre as principais justificativas para o desenvolvimento e a adoção de ontologias estão, certamente, suas possibilidades de reuso. Isto de deve, vale recordar, ao fato de serem projetadas com foco também nas interações entre sistemas de agentes inteligentes, o que lhes exige maior grau de formalização.
Os conceitos de interoperabilidade e de reuso implicam uma dupla caracterização das ontologias,
por um lado as ontologias devem ser específicas o suficiente para descrever o campo de aplicação, por outro, não podem prescindir de certo nível de generalização que possa garantir seu intercâmbio em contextos diferenciados. A tarefa seria simples se os termos fossem rótulos e se fosse possível operar, em todos os contextos, com macro-ontologias, como se fora uma linguagem universal e se os termos fossem estáticos em face dos conceitos que pretendem representar. Como operam no terreno do simbólico, as ontologias, como qualquer outra construção simbólica, demandam alinhamento.
3.2 As relações entre interoperabilidade e categorias
A compreensão da realidade prima pelo conforto, pela ordem, como elementos quase naturais do homem. Se os elementos da realidade não se encaixam nas categorias de que o indivíduo já dispõe, se suas hipóteses são rejeitadas, é forçoso ajustá-las como condição para o conhecimento; caso em que se propõe um novo modelo, uma nova hipótese Lara (2001). A categorização é um dos aspectos mais importantes da linguagem, pois possibilita encontrar características semelhantes em objetos individuais, ainda que tais objetos sejam dessemelhantes (MOREIRA, 2011). A categorização torna-se assim, não uma estrutura para definir ou enquadrar o universo, mas um processo para formar ferramentas para o pensamento, grupos momentaneamente úteis por associação. Esta abordagem é especialmente relevante num cenário que inclui de usuários buscando por informação e na identificação do modo como eles categorizaram os conceitos naquele momento, para expressar sua necessidade imediata de informação.
4 AS ONTOLOGIAS E A CONSTRUÇÃO DE INFORMAÇÕES DOCUMENTÁRIAS
|
4.1 |
Informação documentária e terminologia |
|
O |
desenvolvimento terminológico é considerado como componente e consequente do |
desenvolvimento científico e tecnológico. Não há conhecimento científico sem terminologia e, por esta razão, a legitimação da ciência se dá por meio da legitimação de sua própria terminologia, como ensina Benveniste (1989, p. 252):
A constituição de uma terminologia própria marca, em toda ciência, o advento ou o
GT2
494
desenvolvimento de uma conceitualização nova, assinalando, assim, um momento decisivo de sua história. Poder-se-ia mesmo dizer que a própria história particular de uma ciência se resume na de seus termos específicos. Uma ciência só começa a existir ou consegue se impor na medida em que faz existir e em que impõe seus conceitos, através de sua denominação. Ela não tem outro meio de estabelecer sua legitimidade senão por especificar seu objeto denominando-o, podendo este constitui uma ordem de fenômenos, domínio novo ou um modo novo de relação entre certos dados. O aparelhamento mente consiste, em primeiro lugar, de um inventário de termos que arrolam, configuram ou analisam a realidade. Denominar, isto é, criar um conceito é, ao mesmo tempo, a primeira e última operação de uma ciência.
Considerando-se que não há mais delimitação rígida de domínios do conhecimento (SANTOS, 2002; 2003; VOGT, 2008), suas terminologias também não são mais tão facilmente demarcadas, mas sua identificação torna-se condição para os diálogos que a ciência e a tecnologia estabelecem entre si e com seus públicos. Sem que se conheça a abrangência terminológica de um determinado campo não se podem negociar sentidos ou mesmo significados em seu interior. Esta impossibilidade de negociação reduz (se não inviabiliza) a comunicação eficaz. O termo, na linguagem especializada, assume função muito semelhante à atribuída à palavra, na linguagem natural. A palavra, na linguagem natural, também depende de negociação de sentido e essas negociações também se inserem em contextos regulatórios mais ou menos específicos. A diferença fundamental, então, está na pré-definição, no pré-acordo com relação ao grau de especificidade do domínio que o termo requer, com vistas a diminuir consideravelmente a ambiguidade da linguagem natural. A univocidade comunicacional desconsidera os diferentes significados e os sentidos que a linguagem no uso pode emprestar aos termos. Isso aparece também nas normas de elaboração de tesauros que, como observou Lara (2009), nem mencionam a polissemia. Se o critério orientador para a semântica é o uso diário, fica fácil deduzir que os sistemas de recuperação da informação forçam o pesquisador a utilizar a linguagem de forma não natural. Neste sentido, é importante apontar o auxílio que as metodologias para construção de ontologias podem oferecer à linguagem documentária. Os tesauros, na condição de linguagem documentária, de código comutador, são instrumentos que visam a orientar as relações entre os conceitos e a atribuição de descritores pelo sistema de informação documentária e seu posterior uso para fins de recuperação. Na condição de código comutador, o tesauro lida, necessariamente, com a redução semântica. As experiências com o uso da linguagem natural podem até mesmo melhorar as condições de recuperação da informação (embora ainda não se conheçam resultados satisfatórios sobre isso), mas escapam das questões da linguística documentária, porque não envolvem a representação (ou a construção de informações documentárias). O mapeamento terminológico, ou seja, a identificação dos termos representativos do domínio, seus conceitos básicos e seus relacionamentos, enquanto fase da criação de ontologias, possibilita a identificação da informação no discurso, dos termos que devem ser modelados como classes, propriedades ou axiomas (BREITMAN, 2005), fixando as regras de inferência.
GT2
495
4.2 Informação documentária e representação do conhecimento
Pode-se efetivamente representar o conhecimento para fins de recuperação da informação? Esta questão tem unido os esforços de pesquisadores da ciência da computação e da ciência da informação, mas tem origem mais remota; nasce na filosofia, mais precisamente estudada pela teoria do conhecimento. Do ponto de vista da ciência da informação, entretanto, é preciso completá-la com objetivos também pragmáticos, pois é preciso perguntar também pela qualidade e pela efetividade desta possível representação.
5 CONSIDERAÇÕES FINAIS
Estabeleceu-se como objetivo geral para esta reflexão investigar as interfaces entre a linguística documentária, terminologia e ontologias (filosóficas, como aporte teórico, e computacionais, como conjunto de metodologias). A discussão partiu de um ponto de observação preciso, do interior do qual
se analisou a problemática: os subsídios teórico-práticos que as ontologias oferecem para a construção de informações documentárias em sistemas de informação documentária.
A interdependência inerente aos sistemas de informação, considerados seus objetivos, impede
a insistência em modelos isolados ou nucleares de organização do conhecimento. Observou-se que, conquanto compartilhem alguns objetivos comuns, ainda há pouco diálogo entre a ciência da informação
(e, no seu interior, a linguística documentária) e a ciência da computação (ontologias), principalmente desta última para com a primeira. Dessa forma, em alguns momentos foi necessário evidenciar as relações que guardam entre si a ciência da informação e a ciência da computação. Este diálogo teve como base a convicção de que a aplicação dos recursos da informática não resolve, por si, todos os problemas decorrentes da organização e do fluxo da informação, como quer acreditar o senso comum, e que, por outro lado, não é possível, considerando-se a base tecnológica atual, resolver estes problemas sem o auxílio do tratamento automático da informação.
Os métodos automáticos de organização da informação consideram basicamente os seus aspectos
sintáticos e estatísticos, possivelmente por conta da facilidade com que os softwares aplicativos podem operar com este tipo de insumo. Defende-se, para dar conta dos aspectos semânticos ausentes, que os aportes da terminologia e das ontologias respondem, com maior acuidade, aos problemas de acesso menos quantitativo e mais qualitativo à informação.
A abordagem automática quantitativa é utilizada com base no argumento de uma pretensa
objetividade, o mesmo princípio de objetividade, aliás, que norteou algumas teorias iniciais referentes à análise documentária, que ensinavam a indexar o verdadeiro conteúdo do documento e não aquele que o
autor gostaria de ter escrito (LANCASTER, 1993, p. 31) ou aquele que é resultado da interpretação do indexador . No âmbito dos sistemas de informação documentária, a abordagem automática quantitativa da informação, embora se preste ao levantamento de dados de importância para um trabalho de construção de filtros semânticos, não responde adequadamente às necessidades relativas ao tratamento
GT2
496
documentário-informacional dos discursos, quer em relação aos conteúdos ou ao atendimento das necessidades territorializadas de informação. Interessou também neste trabalho, verificar a contribuição das ontologias para o desenvolvimento de tesauros e vice-versa. Acredita-se que haja um conjunto de conhecimentos desenvolvido na ciência da informação referentes à organização e recuperação da informação e à organização e fluxo do conhecimento que é resultante de um longo processo de desenvolvimento, visando alcançar o seu aperfeiçoamento. Neste sentido são questionadas algumas pesquisas sobre ontologias por seu caráter absolutamente utilitarista, voltados que são à formalização sem considerar as particularidades dos campos de conhecimento e de atividade. Sobre esse aspecto, observou-se que, com raras exceções, como Sowa (2000; 2009), Smith (2002; 2004) e Schwarz e Smith (2008), por exemplo, as discussões sobre ontologias não são realizadas a partir de fundamentação teórico-filosófica. Defende-se nesta reflexão, ao contrário – e na linha dos últimos autores citados – que a construção de ontologias concretas e as ontologias filosóficas não são eventos completamente independentes que guardam entre si apenas a similaridade de denominação. A discussão sobre categorias e categorização na ciência da computação, nem sempre possui, pelo que pôde observar (MOREIRA, 2010) nos limites desta reflexão, a ênfase que recebe na ciência da informação no âmbito dos estudos sobre organização e representação do conhecimento. No que diz respeito às interfaces entre a ciência da computação e a ciência da informação, foi possível confirmar que, do lado da ciência da informação – em especial no que tange à construção de linguagens documentárias – pode haver uma profícua apropriação de metodologias para a construção de instrumentos documentários mais precisos, flexíveis e dinâmicos a partir do conhecimento acumulado, na ciência da computação, com a construção de ontologias de domínio e suas regras de inferências e relacionamentos. O tesauro, cujo surgimento coincide com o da ciência da informação, é resultante da necessidade de resolver os problemas de fluxo de informação (acesso e uso) decorrentes da rápida ampliação da produção do conhecimento científico e tecnológico neste período. A consequente dificuldade que este contexto trouxe para a organização e recuperação da informação científica também colaborou para sua aceitação e uso. O tesauro possibilitou, por meio do estabelecimento de rede lógico-semântica de conceitos, maior independência do pesquisador e maior eficácia nas buscas que necessita realizar em bases de dados. Este novo arranjo possibilitou organizar os termos e conceitos de um determinado campo e facilitar, dessa forma, o acesso à informação. Um dos fatores que limitam os tesauros, entretanto, refere-se à ausência de regras de inferência explicitamente formuladas. O modo como as relações entre os conceitos são estabelecidas, cuja base precípua é a garantia literária, bem como a estrutura de sua apresentação, possibilitam que o tesauro assuma também função pedagógica. Esta função, contudo, é sempre tributária das necessidades de informação e das condições de interpretação que o usuário manifesta. Com exceção das notas de aplicação, portanto, não há indicações explícitas sobre o ponto de vista pelo qual o conceito é formulado.
GT2
497
Como resultante disso, o tesauro precisa admitir alguma estabilidade do conceito para que possa operar. Espera-se que o sistema conceitual que o tesauro estabeleceu repita-se nos documentos futuros. A modelagem conceitual possibilitada pelas ontologias, pelo seu alto grau de formalização, tende
a ser mais consistente nos aspectos que envolvem a interoperabilidade, porque incorpora semântica de um modo mais formalizado, o que não significa, evidentemente, que consegue resolver todos os problemas de significação. Na condição de instrumentos de modelização do conhecimento, as ontologias computacionais
precisam envolver, além dos aspectos cognitivos e linguísticos, os aspectos teórico-filosóficos. A escolha das formas de organização (as relações conceituais) das ontologias implica, então, necessariamente, uma visão que se rebate, de certo modo, numa posição filosófica. Dessa forma, não se deve adotar como ponto de partida os mundos substitutos construídos dentro de modelos de software existentes. Pelo contrário, é preciso, concorda-se com Smith (2004), abordar a realidade em si, aproveitando a riqueza e a diversidade das descrições científicas possíveis em face das formas de organização reconhecidas pelas comunidades discursivas. As inter-relações entre ontologia filosófica, ontologia computacional e representação documentária baseada em categorias de assunto também foram objeto desta reflexão. É certo que as fronteiras entre os campos científicos, bem como a própria concepção de ciência, veem sendo paulatinamente dissolvidas, mas elas ainda existem e insistem. As questões sobre disciplinaridade (a aproximação da realidade por meio de um recorte possível) e interdisciplinaridade (os espaços contraditórios decorrentes) ainda fomentam calorosos debates. Desse modo, ainda que a ciência da informação e a ciência da computação (que já fora confundida com a informática) não cheguem
a um acordo nem mesmo sobre o que é informação e ainda discutam territórios, é forçoso aceitar: a
ciência da informação, por meio da documentação, principalmente, vem desenvolvendo metodologias para a organização da informação (os catálogos, por exemplo) e para a organização do conhecimento (as classificações, por exemplo), desde que isso se tornou uma preocupação humana. Por outro lado, a ciência da computação avançou consideravelmente no trato da informação sintática (resolveu questões de fluxo e ajustou algumas propostas da catalogação para a descrição dos metadados) e desenvolveu metodologias e perspectivas interessantes para a representação e a organização do conhecimento, como as que oferecem as ontologias e sua interface com a web semântica. Em síntese: a construção de ontologias não pode prescindir do tratamento terminológico-conceitual, como compreendido pela terminologia e pela ciência da informação, acumulado nos referenciais teóricos e nas metodologias para construção de linguagens documentárias. A construção de linguagens documentárias mais flexíveis não pode ignorar o modelo de representação das ontologias, com mais predisposição para a formalização e
para a interoperabilidade. A representação do conhecimento é o aspecto que une, por semelhança de propostas, a ciência da computação, por meio das ontologias, e a ciência da informação, por meio dos tesauros. Se há alguma identidade na origem da proposta, contudo, ela não existe no destinatário, que não é o mesmo.
GT2
498
Os tesauros são construídos para funcionar como instrumento de representação do conhecimento e recuperação da informação em atividades de busca realizadas por seres humanos (especialistas). As ontologias são construídas para funcionar como instrumentos de representação do conhecimento e recuperação da informação em atividades de busca delegadas a agentes inteligentes. O computador (o que computa) opera, como não poderia deixar de ser, de forma mais eficaz em ambientes quantitativos de recuperação de informação, justamente porque há nestes mais previsibilidade. Comparadas as funções de representação e recuperação da informação, tem-se que a segunda apresenta mais instabilidade e um número maior de variáveis. A relativa estabilidade atribuída à representação neste caso refere-se ao fato de que esta toma como ponto de partida interesses institucionais determinados e estabelece, por este meio, o ponto de vista pelo qual o objeto será focalizado. Na recuperação da informação, o usuário parte de alguma necessidade ou desejo de informação e navega pelas estruturas de informação em busca do modo preciso pelo qual foi organizada a informação que atenda aos seus interesses. A atividade de seleção que um usuário não determinado qualquer realiza é, inerentemente, uma atividade intelectual e sempre inserida em contextos dinâmicos e, por este motivo, mais difícil de ser formalizada por meio de um algoritmo. Em síntese, os sistemas de informação documentária não podem prescindir das tecnologias desenvolvidas para o aperfeiçoamento das ontologias, pois perderiam, dessa forma o momento histórico, como quase perderam, num sentido vago, com os metadados. É preciso, então, pensá-los com as ontologias e ajustar as metodologias desenvolvidas pela ciência da computação para os objetivos da ciência da informação e incorporar os fundamentos da ciência da informação aos procedimentos da ciência da computação no que tange ao universo dos fluxos da informação e do conhecimento.
Abstract: Discusses the benefits that the interfaces between terminology, philosophical ontology, and computational ontology offer to the organization of conceptual relations in the processes of knowledge representation in documentary information systems. Considers that ontologies, in any of its aspects, offer categorization systems that enable human beings organize the reality. Therefore establishes the following objectives: a) discuss the philosophical foundation of the application of ontologies based on the studies of ontological categories present in Aristotle and Kant and b) provide grants for the initial understanding of the interaction between philosophical ontology, formal ontology and documentary representation based on subject categories. Advocates a stronger linkage between the studies about ontologies with the philosophical understanding of the term. The knowledge representation is that aspect that unites, for its similar proposals, computer science, by means of ontologies, and information science, through the thesaurus, so the reflection is based on both theoretical fields. Also considering that the intersection between these fields, addressing the same object, occurs by means of the comprehension and application of subject categories, adds the philosophical studies to the theoretical foundations of the reflection. Points out, as final considerations, that the construction of ontologies cannot ignore the terminological-conceptual treatment comprehended by terminology and information science, accumulated on the theoretical references and on the methodologies to the construction of documentary languages and, by the other side, that the construction of more flexible documentary languages cannot ignore the knowledge representation modeling adopted by ontologies, with more predisposition to the formalization and interoperability. Keywords: Conceptual relations. Categories. Ontologies. Terminology. Knowledge representation.
GT2
499
REFERÊNCIAS
BENVENISTE, Émile. Problemas de lingüística geral II. Campinas: Pontes, 1989.
BREITMAN, Karin K
DELEUZE, Gilles. Diferença e repetição. Rio de Janeiro: Graal, 1988. ECO, Umberto. Conceito de texto. São Paulo: Edusp, 1984. GÓMEZ ‐ PÉREZ, Asunción. Ontological engineering: a state of the art. Expert Update, v. 2, n. 3, p. 33‐ 43, 1999.
GRUBER, Thomas R. Toward principles for the design of ontologies used for knowledge sharing. International Journal Human ‐ Computer Studies, v. 43, n. 5/6, p. 907 ‐ 928, 1995. Disponível em:
<http://www.itee.uq.edu.au/~infs3101/_Readings/OntoEng.pdf>. Acesso em: 14 ago. 2011. GUARINO, Nicola; GIARETTA, Pierdaniele. Ontologies and knowledge bases: towards a terminological clarification. In: MARS, N. (Ed.) Towards very large knowledge bases: knowledge building and knowledge sharing. Amsterdam: IOS, 1995. p. 25 ‐ 32. Disponível em: <http://www. loanr.it/Papers/KBKS95.pdf>. Acesso em: 14 ago. 2011 HJORLAND, B. Principia informatica: foundational theory of information and principles of information services. In: INTERNATIONAL CONFERENCE ON CONCEPTIONS OF LIBRARY AND INFORMATION SCIENCE, 4., 2002, Greenwood Village. Proceedings… Greenwood Village: Libraries Unlimited, 2002. Disponível em: <http://www.iva.dk/bh/Core%20Concepts%20 in%20LIS/articles%20a-z/principia_informatica.htm>. Acesso em: 14 ago. 2011. JACOB, Elin K. Ontologies and the semantic web. Bulletin of the American Society for Information Science and Technology, apr./may, p. 19‐ 22, 2003. KANT, Immanuel. Crítica da razão pura. São Paulo: Nova Cultural, 1996. (Os Pensadores). LANCASTER, F. W. Indexação e resumos: teoria e prática. Brasília: Briquet de Lemos, 1993. LARA, Marilda L. G. Linguística documentária: seleção de conceitos. 2009. 178 f. Tese (Livre ‐ docência) – Escola de Comunicações e Artes, Universidade de São Paulo, São Paulo, 2009
Web semântica: a internet do futuro. Rio de Janeiro: LTC, 2005.
documentária. DataGramaZero, v. 2, n. 6, dez. 2001. Disponível em <http://www.datagramazero. org.br/dez01/Art_03.htm>. Acesso em: 14 ago. 2011. MAEDCHE, Alexander. Ontology learning for the semantic web. Boston: Kluwer Academic Publisher, 2002. MOREIRA, Walter. A construção de informações documentárias: aportes da linguística documentária, da terminologia e das ontologias. 2010. 156 f. Tese (Doutorado em Ciência da Informação) – Universidade de São Paulo, Escola de Comunicações e Artes, São Paulo, 2010. Categorias e conceitos: compreensões fundamentais para a organização da informação. In: CONGRESSO BRASILEIRO DE BIBLIOTECONOMIA, DOCUMENTAÇÃO E CIÊNCIA DA INFORMAÇÃO, 24., 2011, Maceió-AL. Anais… Maceió, 2011. OTLET, Paul. El tratado de documentación: el libro sobre el libro: teoría y práctica. Tradução Maria Dolores A. García. Murcia: Editum, 1996. POMBO, Olga. Da classificação dos seres à classificação dos saberes. Leituras: revista da Biblioteca Nacional de Lisboa, n. 2, p. 19 ‐ 33, primavera, 1998. Disponível em: <http://www.educ.fc.ul.pt/hyper/ resources/opombo-classificacao.pdf> Acesso em: 14 ago. 2011
RUSSELL, Bertrand. História do pensamento ocidental: a aventura dos pré‐ socráticos a Wittgenstein. Rio de Janeiro: Ediouro, 2001.
O unicórnio (o rinoceronte, o ornitorrinco
),
GT2
500
SALATIEL, José Renato. Peirce e Kant sobre categorias: parte I: dedução metafísica e reviravolta semiótica. Cognitio‐ Estudos: Revista Eletrônica de Filosofia, v. 3, n. 1, p. 79 ‐ 88, jan./jun. 2006. Disponível em: <http://revistas.pucsp.br/index.php/cognitio/article/viewFile/5478/3925>. Acesso em: 14 ago. 2011. SANTOS, Boaventura S. Um discurso sobre as ciências. 13.ed. Porto: Afrontamento, 2002. Introdução a uma ciência pós ‐ moderna. 4.ed. Rio de Janeiro: Graal, 2003. SARACEVIC, Tefko. Ciência da informação: origem, evolução e relações. Perspectivas em Ciência da Informação, Belo Horizonte, v. 1, n. 1, p .41 ‐ 62, jan./jun. 1996. Disponível em: <http:// portaldeperiodicos.eci.ufmg.br/index.php/pci/article/viewFile/235/22>. Acesso em: 14 ago. 2011. SCHWARZ, Ulf; SMITH, Barry. Ontological relations. In: MUNN, Karherine; SMITH, Barry (Eds.). Applied ontology: an introduction. Frankfurt: Ontos Verlag, 2008. p. 219-234. SMITH, Barry. Ontologies and information systems. Saarbrücken: European Centre for Ontological Research, [2002?]. Disponível em: <http://www.ecor.uni-saarland.de/otherpublications.html>. Acesso em: 19 set. 2011. Ontology. In: FLORIDI, Luciano (Ed.). The blackwell guide to the philosophy of computing and information. Malden: Blackwell, 2004. p. 155‐ 166. SOWA, John F. Building, sharing and merging ontologies. 2009. Disponível em: <http://www.jfsowa. com/ontology/ontoshar.htm>. Acesso em: 17 set. 2011. Knowledge representation: logical, philosophical, and computational foundations. Pacific Grove: Brooks/Cole, 2000. TÁLAMO, Maria de Fátima G. M. et al. Instrumentos de controle terminológico: limites e funções.
In: SIMPÓSIO LATIONAMERICANO DE TERMINOLOGIA, 2., 1992, Brasília. Anais
União Latina/ IBICT, 1992. Disponível em: <http://www.riterm.net/actes/2simposio/talamo.htm> Acesso em: 12 fev. 2010.
VICKERY, B. C. Ontologies. Journal of Information Science, v. 23, n. 4, p. 277-286, 1997. VOGT, Carlos. Divulgação e cultura científica. ComCiência, n. 100, 10 jul. 2008. Editorial. Disponível em: <http://www.comciencia.br/comciencia/?section=8&edicao=37&id=436>. Acesso em: 14 ago. 2011
Brasília:
GT2
501
COMUNICAÇÃO
ORAL
INDEXAÇÃO AUTOMÁTICA E VISUALIZAÇÃO DE INFORMAÇÕES: UM ESTUDO BASEADO EM LÓGICA PARACONSISTENTE
Carlos Alberto Correa,Nair Yumiko Kobashi
Resumo: Apresentação dos resultados de pesquisa de utilização da lógica paraconsistente em procedimentos de indexação automática. A utilização dessa lógica e de métodos dela derivados, por serem flexíveis, comportam estados lógicos que vão além das dicotomias sim e não. Essas características permitem adiantar a hipótese de que os resultados da indexação poderão ser melhores do que os obtidos por métodos tradicionais. Do ponto de vista metodológico, optou-se pela utilização de um algoritmo para tratar incerteza e imprecisão, desenvolvido no âmbito da lógica paraconsistente, para modificar os valores dos pesos atribuídos aos termos de indexação. O experimento foi realizado em corpus disponível em sistema de indexação e visualização de informações com código fonte aberto. Os resultados foram avaliados por meio de critérios e índices embutidos no próprio sistema de visualização e demonstram que há ganhos mensuráveis de qualidade na construção das visualizações. Confirma-se, assim, a hipótese de que a lógica paraconsistente tem aplicação promissora em indexação automática por sua potencialidade para tratar situações que envolvem incerteza, imprecisão e vagueza.
Palavras-chave: Indexação automática. Visualização de informação. Lógica paraconsistente.
1 INTRODUÇÃO O volume crescente dos estoques de registros externos à memória humana, aumenta consideravelmente as dificuldades para a manutenção, organização e manipulação dos dispositivos informacionais. Uma das alternativas para enfrentar esse desafio tem se ancorado na indexação automática, processo que envolve diversas disciplinas, tais como Linguística, Estatística, Terminologia e diversas teorias desenvolvidas no âmbito da Matemática e da Lógica, como as teorias de tratamento de incerteza e imprecisão. Cabe acrescentar que, tradicionalmente, os sistemas de recuperação de informação são o ambiente preferido para testes de indexação automática e de visualização de informação Neste texto, são apresentados os resultados de uma pesquisa de Indexação automática e visualização de informações baseada em Lógica paraconsistente (CORRÊA, 2011). Antes da apresentação dos resultados serão discutidos, de forma breve, o modelo do espaço vetorial e propostas baseadas em lógicas não clássicas, como também as propostas de visualização gráfica.
2 INDEXAÇÃO AUTOMÁTICA E O MODELO DO ESPAÇO VETORIAL O propósito principal do desenvolvimento de índices e de resumos é “construir representações
GT2
502
de documentos publicados numa forma que se preste a sua inclusão em algum tipo de base de dados” (LANCASTER, 2004, p. 1). As pesquisas para armazenar informação se voltaram, com o tempo, para a busca de soluções de indexação automática. Os primeiros experimentos tiveram início na década de 1950, com Luhn e Baxendale (LANCASTER, 2004), sendo o modelo do espaço vetorial (MEV) um dos mais citados na literatura da área. O MEV é também utilizado em diferentes tipos de sistemas de visualização de informações. O MEV foi desenvolvido por Luhn e popularizado por Salton no âmbito do sistema SMART – System for the Manipulation and Retrieval of Text (RAGHAVAN, 1997). Ele utiliza a mesma representação tanto para os documentos de uma coleção quanto para as consultas ao sistema. Essa representação é baseada no conceito matemático de vetor. Considere-se, por exemplo, o documento D, com os termos de indexação t 1 , t 2 e t 3 . No MEV atribui-se um peso para cada termo de indexação, cuja representação do documento é um vetor que pode ser visualizado em espaço tridimensional. O MEV pode ser representado por meio de uma matriz, conforme descrito por Salton (1989):
D 1
D 2
D 3
D k
t 1
t 2
t 3
t
n
|
w 1,1 |
W |
1,2 |
w |
1,3 |
W |
1,n |
|
|
w 2,1 |
W |
2,3 |
w |
2,3 |
W |
2,n |
|
|
w |
3,1 |
W |
3,2 |
w |
3,3 |
W |
3,n |
|
w |
k,1 |
w k,2 |
w |
k,3 |
w k,n |
||
Figura 2 – Matriz documentos X pesos Fonte: Adaptada de Salton (1989)
A abordagem vetorial permite que conceitos desenvolvidos no âmbito da teoria matemática de vetores sejam utilizados. Um deles é o de distância entre dois vetores. Salton e McGill (1983) consideram que o cálculo da distância entre dois vetores, que representam documentos da coleção, indica seu grau de similaridade. O cálculo da distância entre dois vetores x e y é efetuado pela fórmula (FERNEDA, 2003; SALTON e McGILL,1983):
onde w i,x refere-se ao peso do i-ésimo termo (ou elemento) do vetor x e w i,y refere-se ao peso do i-ésimo termo (ou elemento) do vetor y. Uma expressão de busca também pode ser representada vetorialmente, atribuindo-se pesos aos termos utilizados. Esse procedimento permite calcular o grau
GT2
503
de similaridade entre uma consulta e os documentos da coleção. Uma vez compreendidos os aspectos básicos do MEV, uma questão continua em aberto: como definir os valores dos pesos para os termos de indexação e para os termos de busca? Várias critérios podem ser utilizados para definir o cálculo dos pesos (SALTON; McGIL, 1983; SALTON; BUCKLEY, 1988). O método mais utilizado é baseado na frequência estatística
de ocorrência dos termos em duas instâncias diferentes: o documento, individualmente e a coleção. No primeiro caso, efetua-se a contagem pura e simples do número de vezes em que o termo aparece no documento. Esse valor é denominado tf (expressão: term frequency). No segundo, verifica-se
a quantidade de documentos da coleção em que o termo ocorre, comparando-o com a quantidade
total de documentos da coleção. Esta medida é denominada de idf (da expressão: inverse document frequency). Nesse caso, o cálculo é dado pela fórmula idf t = N / n t , onde N é o numero de documentos da coleção e n t é o número de documentos da coleção que contém ao menos uma ocorrência do termo
t. Uma variante dessa fórmula utiliza o logaritmo de base 10, ou seja: idf t = Log (N / n t ). Uma vez
definidos os valores das instâncias locais e globais do termo t, seu peso é calculado como: W t,d = tf t,d
x idf t .
3 INDEXAÇÃO AUTOMÁTICA E LÓGICAS NÃO CLÁSSICAS As soluções desenvolvidas em indexação automática utilizam, muitas vezes, teorias para lidar com situações imprecisas, vagas e ambíguas, tais como as lógicas não clássicas. Três problemas, ao menos, motivaram o desenvolvimento das lógicas não clássicas: (i) a identificação de certos paradoxos lógico-matemáticos que alimentavam dúvidas quanto à validade dos princípios gerais dessas disciplinas; (ii) o surgimento de matemáticas “não tradicionais” como, por exemplo, as geometrias não euclidianas; (iii) as situações do mundo real que não se ajustam à dicotomia – verdadeiro ou falso –da lógica clássica A lógica clássica foi desenvolvida com base em três princípios fundamentais: a) identidade, que estabelece que todo objeto é idêntico a si mesmo; b) não-contradição – que estabelece que uma proposição não pode ser verdadeira e falsa ao mesmo tempo; c) o do terceiro excluído – que considera que uma proposição é verdadeira ou falsa, não havendo uma terceira possibilidade. Dois exemplos de lógicas não clássicas são a lógica difusa e a lógica paraconsistente. A lógica difusa foi desenvolvida em contraposição à lógica clássica, com base na teoria dos conjuntos difusos, proposta por Loft Zadeh (BOJADZIEV; BOJADZIEV, 1995). A lógica paraconsistente, por sua vez, teve seus fundamentos desenvolvidos, independentemente, pelo polonês Stanislaw Jaskowiski e pelo brasileiro Newton da Costa. Podem ser citadas duas de suas principais características: (i) derroga o princípio da não-contradição; (ii) possui variantes de sua formulação original que permitem desenvolver vários estados lógicos além dos estados dicotômicos Verdadeiro (V) e Falso (F).
3.1 Indexação automática e lógica difusa A teoria clássica de conjuntos e a lógica clássica são utilizadas, implícita ou explicitamente, na
GT2
504
grande maioria dos sistemas de recuperação de informação (SRI) (FERNEDA, 2003) e, similarmente, nos procedimentos de indexação automática. Os defensores da lógica difusa, por outro lado, consideram que a teoria dos conjuntos difusos pode ser empregada com sucesso para tratar a imprecisão e a subjetividade inerentes aos processos de indexação, bem como para gerenciar a vagueza embutida nas consultas formuladas pelos usuários (HERRERA-VIEDMA; PASI, 2003). Bordogna e Pasi (1995) aplicaram a lógica difusa em um SRI. As autoras partiram do princípio que os documentos são organizados em partes estruturais, tais como título, autor(es), palavras-chave, resumo e referências. O papel informativo de cada termo depende da parte ou seção em que ele ocorre. Além disso, as seções de um documento podem ter diferentes graus de importância para cada usuário e, assim, o cálculo do grau de significância passa a depender da intervenção do usuário (BORDOGNA; PASI, 1995). Outra utilização da abordagem difusa foi efetuada por Molinari e Pasi (1996). Nesse trabalho, as autoras propõem que a indexação de documentos HTML seja efetuada utilizando-se a estrutura sintática dessa linguagem. O documento também é dividido em seções, de acordo com as regras de construção da linguagem. Similarmente ao trabalho de Bordogna e Pasi (1995), esse modelo atribui um grau de importância a cada seção.
3.2 Indexação automática e lógica paraconsistente A utilização da lógica difusa na indexação automática estimulou esta pesquisa de uso da lógica
paraconsistente. Adotou-se, neste estudo, uma de suas variantes - a Lógica paraconsistente anotada.
A anotação é feita com dois valores que, de agora em diante, será referida como LPA2v, conforme
utilizado por Da Costa et al. (1999). Nessa lógica, atribuem-se duas variáveis a uma proposição: os graus de crença e de descrença, com valores que variam no intervalo [0,1]. Essa abordagem permite estabelecer quatro estados lógicos principais (inconsistente, verdadeiro, falso, indeterminado) e uma quantidade variável de estados lógicos intermediários. Os estados lógicos são estabelecidos a partir
da análise efetuada sobre os dois valores da anotação, descritos por um par (m 1, m 2 ), que representa os graus de crença e descrença atribuídos a uma proposição. Dessa forma, para uma dada proposição, se
os valores dos graus de crença e descrença (m 1, m 2 ), forem estabelecidos ou calculados com os valores
(1.0, 0.0), o significado será: crença total e ausência de descrença na proposição ou, seja, seu estado lógico será verdadeiro. De forma similar podem-se descrever outros três estados lógicos principais:
(1.0,1.0) – inconsistente (crença total e descrença total); (0.0,1.0 ) – falso (ausência de crença e descrença total); (0.0,0.0) – indeterminado (ausência de crença e ausência de descrença). Outros valores pertencentes ao intervalo [0,1] podem ser atribuídos aos graus de crença
e descrença, de modo a estabelecer estados lógicos intermediários. Esses estados ls podem ser
representados em um gráfico, em que os eixos horizontal e vertical indicam os respectivos graus. Esse procedimento permite estabelecer descrições de situações em que os valores extremos não se aplicam, conforme a figura abaixo, chamada por Da Costa et al. (1999) de quadrado unitário do plano
GT2
505
cartesiano – QUPC.
Figura 3 - Representação de alguns estados lógicos intermediários Fonte: Da Costa et al. (1999), p 50
O gráfico acima pode ser expandido traçado-se alguns segmentos de reta de modo a definir, em vez de pontos intermediários, regiões de ocorrência dos estados lógicos extremos e intermediários. Ou seja, além do ponto que descreve o estado extremo, tem-se uma região que pode ser considerada a ocorrência de um estado extremo ou intermediário. A seguir estão listados os segmentos de reta traçados e as figuras que descrevem algumas das regiões que os segmentos delimitam: Segmento BD - linha limite de falsidade; Segmento DF - linha limite de inconsistência; Segmento FH - linha limite de verdade; Segmento HB - linha limite de indeterminação.
Figura 4 - QUPC com linhas de limitação de regiões caracterização da região do totalmente inconsistente
Fonte: Da Costa et al. (1999), p. 65 e 66
Alem das regiões associadas aos estados extremos, outras podem ser observadas. Elas
GT2
506
descrevem estados intermediários e tendências que se situam entre os estados extremos definidos. A figura 5, a seguir, descreve todas as regiões do QUPC. Essa configuração é chamada por Da Costa et al. (1999) de QUPC de resolução 12, pois podem ser identificadas, no gráfico, 12 regiões.
Figura 5 - QUPC de resolução 12 destacando todas as regiões possíveis – intermediárias e extremas Fonte: Da Costa et al. (1999), p. 89
Para esta última figura, as regiões representadas são identificadas por diversas abreviaturas, cujos significados são: T – Inconsistente; F – Falso; ^ – Indeterminado; V – Verdadeiro; ^ ® f – Indeterminado, tendendo ao Falso; ^ ® v – Indeterminado, tendendo ao Verdadeiro; T ® f – Inconsistente, tendendo ao Falso; T ® v – Inconsistente, tendendo ao Verdadeiro; Qv ® T– Quase Verdadeiro, tendendo ao Inconsistente; Qf ® T– Quase Falso, tendendo ao Inconsistente; Qf ® ^– Quase Falso, tendendo ao Indeterminado; Qv ® ^– Quase Verdadeiro, tendendo ao Indeterminado. Da Costa et al. (1999) descrevem variáveis que podem ser utilizadas como delimitadores das regiões mostradas. São elas: V scc – valor superior de controle de certeza, que limita o grau de certeza próximo ao verdadeiro; V icc – valor inferior de controle de certeza, que limita o grau de certeza próximo ao falso; V scct – valor superior de controle de contradição, que limita o grau de contradição próximo ao estado inconsistente; V icct – valor inferior de controle de contradição, que limita o grau de contradição próximo ao indeterminado. Para todos os gráficos anteriores essas variáveis assumem os seguintes valores: V scc = 1/2 ;V icc = - 1/2;V scct = 1/2;V icct = -1/2. Essas variáveis não são visíveis diretamente nos gráficos por serem artifícios matemáticos que permitem fazer ajustes no tamanho das regiões delimitadas no QUPC, de forma a restringir a sensibilidade do procedimento a certos valores lógicos. Na figura 6, a seguir, vemos variações da figura 5, em que os valores das variáveis V scc, V icc , V scct , V icct é modificado.
GT2
507
Figura 6- QUPC de resolução 12- destaque para regiões com variáveis delimitadoras modificadas Fonte: Da Costa et al. (1999), p. 91 e 93
No segmento à direita, da figura 6 os valores das variáveis delimitadoras são: V scc = 3/4, V icc = - 3/4, V scct = 3/4, V icct = -3/4. Pode-se observar a redução no tamanho das regiões extremas (verdadeiro, falso, inconsistente e indeterminado). Nesse caso, a análise efetuada a partir dos valores de crença e descrença (m 1 e m 2) será mais exigente para os valores extremos. Ou seja, o número de situações em que o par m 1 - m 2 será considerado verdadeiro (ou falso, indeterminado e inconsistente) será menor do que o número de situações analisadas na figura 5. No gráfico à esquerda da figura 6, os valores das variáveis delimitadoras são: V scc = 3/4, V icc = - 3/4, V scct = 1/2 e V icct = -1/2. Pode-se ver no gráfico a redução no tamanho das regiões extremas para os valores lógicos verdadeiro e falso, quando comparadas com as regiões para o indeterminado e o inconsistente. Em ambas as situações descritas nas figuras 5 e 6, o tamanho das regiões intermediárias também é modificado, significando que pode haver diferentes tolerâncias para os valores intermediários. Apesar de as figuras serem boas para visualizar o estado lógico de uma proposição, elas não são úteis para fazer avaliações de maneira contínua ou repetitiva. Nesse sentido, Da Costa et al. (1999) desenvolveram um algoritmo que permite, a partir dos valores de graus de crença e descrença, determinar o estado lógico da proposição. O algoritmo é chamado de para-analisador, que permite calcular o estado lógico de um enunciado a partir dos valores de m 1 , m 2 , V scc ,V icc ,V scct , e V icct .
4 VISUALIZAÇÃO, SIMILARIDADE, DISTÂNCIA E PROXIMIDADE A Computação Gráfica nasceu com o intuito de melhorar a interação humano-computador e a manipulação computacional de imagens de diversos tipos. Esses recursos são potencialmente úteis para minimizar as dificuldades com os processos de Recuperação de Informação. Essas soluções
GT2
508
permitem conhecer melhor o espaço de busca, de modo a aumentar a efetividade dos resultados porque procuram retratar a estrutura semântica global de uma coleção de documentos (BORNER; CHEN; BOYACK, 2003). Os sistemas de visualização de apresentação de coleções de documentos, de acordo com a abordagem escolhida, adotam metáforas diversas.Assim, por exemplo, o sistema Infosky (ANDREWS et al. 2002) utiliza como metáfora a representação de uma visão noturna do céu. Nesse sistema, as ocorrências individuais dos documentos são apresentadas como “estrelas” no céu. Os “agrupamentos de estrelas” indicam agrupamentos de documentos similares. Por outro lado, o VxInsight (BORNER; CHEN; BOYACK, 2003) utiliza uma metáfora baseada em mapas geográficos. A tela principal do sistema exibe um agrupamento de “montanhas”, de altura variável para representar agrupamentos de objetos de informação. A altura da montanha é proporcional à quantidade de documentos similares que formam os agrupamentos. Outro sistema com capacidade para criar visualizações de coleções de documentos é o Projection Explorer – PEx, desenvolvido no Instituto de Ciências Matemáticas e de Computação da USP/São Carlos. O PEx utiliza pequenos círculos coloridos para representar documentos individuais de uma coleção ( PAULOVICH; OLIVEIRA; MINGHIM, 2007; PAULOVICH et al., 2008) 1 . Independentemente da metáfora utilizada, os sistemas de apresentação de coleções de documentos realizam procedimentos e cálculos voltados a dois objetivos específicos: (i) o agrupamento de documentos considerados similares; (ii) a separação dos grupos de documentos dissimilares entre si. Para isso, os sistemas devem ser capazes de efetuar cálculos que indiquem o grau de similaridade entre os documentos. Um dos modelos mais utilizados para este fim é o MEV, descrito na seção 2. A figura 7, a seguir, é um exemplo de visualização construída com o sistema PEx. Os círculos de mesma cor indicam documentos de um mesmo assunto, todos pertencentes a uma mesma coleção de teste. Na figura, os retângulos coloridos destacam grupos de documentos que, apesar de serem de assuntos distintos, aparecem próximos na visualização. Este efeito é uma conseqüência dos critérios que o sistema usa para construir a visualização. Nesse caso, os documentos possuem algum grau de similaridade. Nesse contexto, poder-se-ia perguntar se tal constatação seria facilmente observável em um sistema de recuperação de informações.
1 O sistema Projection Explorer pode ser obtido, gratuitamente, em http://infoserver.lcad.icmc.usp.br/infovis2/PEx.
GT2
509
Figura 7 – Visualização de documentos no Projection Explorer – destaque p/ documentos de assuntos diferentes porem com algum grau de similaridade entre si Fonte: Visualização criada, com o Projection Explorer
5 EXPERIMENTO COMPUTACIONAL DE INDEXAÇÃO COM CRITÉRIOS DA LÓGICA PARACONSISTENTE. Os testes realizados para verificar os efeitos da utilização da Lógica paraconsistente nos procedimentos de indexação automática consistiram na inclusão do algoritmo para-analisador no código fonte do sistema PEx. Optou-se por utilizar, nos testes, as coleções de documentos disponibilizadas com o PEx, pois seu uso facilitaria a comparação entre as visualizações originais e as construídas com as alterações introduzidas no sistema. Os testes efetuados podem ser sintetizados nos seguintes passos: (1) gerar a visualização de uma coleção de documentos com as facilidades de indexação/cálculos de similaridade embutidas originalmente no PEx; (2) utilizar o algoritmo para-analisador para avaliar e redefinir os índices e/ ou os respectivos pesos estabelecidos para os documentos da coleção; (3) obter uma visualização da coleção a partir desses novos pesos;(4) comparar a visualização obtida em (3) com a visualização obtida em (1). Deve-se observar que existem diferentes métodos que possibilitam mensurar a qualidade de uma dada visualização. As próximas seções detalharão esses aspectos bem como os resultados obtidos.
GT2
510
5.1 Coleções de teste utilizadas
A principal coleção de teste, constituída de 675 documentos é chamada pelos criadores do PEx de CBR-ILP-IR-SON, composto pelas siglas dos assuntos dos documentos que a compõem, ou seja: CBR – Case-based reasoning (raciocínio baseado em casos); ILP – Inductive logic programing (Programação lógica indutiva); IR – Information Retrieval (Recuperação de informação); e SON – Sonification (Sonificação). De acordo com Paulovich (2008), os documentos dos assuntos CBR e ILP foram retirados de periódicos dessas áreas. Os documentos dos assuntos IR e SON foram obtidos por meio de buscas na Internet, classificados de maneira aproximada, de acordo com a fonte onde foram obtidos (MINGHIM; LEVKOVITS, 2007). Uma análise preliminar da coleção foi efetuada por Paulovich (2008) e uma das conclusões refere-se à não homogeneidade do conjunto de documentos de IR (Information retrieval). Segundo este autor, a não homogeneidade decorre do fato de os documentos classificados para este assunto terem sido obtidos por buscas genéricas na Internet, utilizando-se as palavras “information” and “retrieval”. Nesse caso, elas não são suficientes para identificar precisamente a área. Em decorrência, espera-se que os objetos componentes desse conjunto de documentos se apresentem, na visualização, mais espalhados que os demais, não compondo um grupo separado e nem se misturando muito aos objetos dos outros assuntos. Outras coleções foram construídas a partir da coleção original. Foram mantidas as abreviaturas dos assuntos da coleção original e, obtiveram-se as seguintes coleções: CBR-ILP-IR, com 574 documentos; CPR-ILP-SON, com 496 documentos; CBR-ILP, com 395 documentos. Todas as coleções são construídas a partir dos títulos, resumos e referências de cada documento.
5.2 Avaliação de visualizações
O PEx possui funcionalidades que permitem avaliar a qualidade das visualizações geradas, levando-se em conta diferentes aspectos. Uma dessas técnicas é chamada de neighborhood hit. Ela objetiva analisar se, para uma pré- classificação efetuada na coleção, é possível identificar na projeção ou visualização construída, a separação entre as diferentes classes do conjunto original de dados. Assim, quanto mais separados e agrupados os pontos estiverem na visualização gerada, de acordo com as classes originais, maior será a precisão. Este procedimento permite avaliar, numericamente, o quanto estão destacadas, na visualização final, as classes pré-existentes e a facilidade de encontrar limites bem definidos entre elas. O índice neighborhood hit materializa-se por meio de um gráfico que avalia a precisão de acordo com o número de “vizinhos” analisados. A figura 8, a seguir, é um exemplo de como é efetuada uma comparação com a utilização do índice citado. As curvas de diferentes cores avaliam o índice para situações diferentes. Nesse gráfico, a situação representada pela curva vermelha é considerada a pior
GT2
511
de todas, pois apresenta os menores valores de precisão calculados (eixo vertical) para as quantidades de vizinhos especificadas (eixo horizontal). Analogamente, a curva azul é a situação com melhor avaliação de neighborhood hit.
Figura 8 – Exemplo de curvas de Neighborhood Hit Fonte – Produzida com a utilização do Projection Explorer
Outro método de avaliar as visualizações consiste em utilizar índices para medir a qualidade dos agrupamentos produzidos pelos diferentes algoritmos. Muitos desses métodos são baseados em análises estatísticas, utilizados na Análise de agrupamentos (Cluster Analysis). Um dos métodos, conhecido por coeficiente de silhueta (silhouette coefficiente) é um índice obtido numericamente. Descrito, com pequenas variações, em Kaufman e Rosseeuw (1990) e em, Tan, Steibach e Kumar (2006), o coeficiente de silhueta é um valor que se situa entre -1 (pior valor), e 1 (melhor valor).
O Projection Explorer utiliza outro método de visualização, ferramenta estatística chamada histograma de distâncias. Um histograma permite observar as distribuições de frequência de valores que ocorrem numa classe de variáveis observadas. O gráfico é construído a partir de dois eixos coordenados. No eixo horizontal são colocados os valores individuais da variável em estudo, no nosso caso, as distâncias. O eixo vertical apresenta a escala onde são lidos os valores relativos aos números de observações ou, mais comumente, as frequências de classe (TOLEDO; OVALLE, 1986). Para as visualizações de coleções de documentos é possível observar a distribuição das frequências de distâncias que ocorrem para a coleção. A figura 9 a seguir, é um exemplo de histograma de distância obtido no PEx.
Figura 9 – Exemplo de histograma de distancias Fonte: produzido no PEx
GT2
512
No exemplo acima, pode-se observar que a maioria das ocorrências de distâncias ocorrem no intervalo [0,9;1,0]. Também se pode observar que existe um pico de 25000 ocorrências para determinado valor de distância.
5.4 Uso do para-analisador no Projection Explorer
O MEV é o modelo básico utilizado para elaborar os cálculos de similaridade que irão definir a apresentação final (layout) da visualização. Nesse modelo, conforme exposto na seção 3.5, é montada uma matriz de documentos - termos, que contém os pesos calculados para cada termo, de acordo com a fórmula tf * idf. Essa matriz é utilizada pelo PEx para efetuar os cálculos de similaridade. De acordo com Salton e McGill (1983), os pesos calculados para um termo, em um dado documento, representam o grau de utilidade do termo para este documento. Para a sequência de testes optou-se por atribuir uma penalização para o peso do termo (ou seu grau de utilidade), de acordo com a região do QUPC que a para-análise efetuada indicar. Para esse procedimento foi escolhido o valor de tf, do termo, para o grau de crença e valor df para o grau de descrença. Os pesos originalmente calculados foram mantidos apenas para os termos cuja análise indicasse a região do totalmente verdadeiro. Os fatores de penalização foram arbitrados considerando- se uma diminuição de 0,15 em relação ao valor 1 (atribuído à região do totalmente verdadeiro), à medida que a região se afasta da região do totalmente verdadeiro. Assim, supondo-se que o cálculo do peso de um termo, por meio da fórmula tf * idf, é igual a 100; por outro lado, se a para-análise indicar a região Qv ® ^ (quase verdadeiro, tendendo ao indeterminado), o peso a ser atribuído ao termo passa a ser 100 * 0,85, ou seja, 85. O objetivo é observar os efeitos que a alteração no peso dos termos provocará na construção das visualizações das coleções. Além da penalização, os testes foram efetuados modificando-se os tamanhos das regiões do QUPC. Essa modificação é efetivada pela manipulação das variáveis V scc (valor superior de controle de certeza), V icc (valor inferior de controle de certeza), V scct (valor superior de controle de contradição) e V icct (valor inferior que limita o grau de contradição próximo ao indeterminado), conforme descrito na seção anteriormente. As regiões utilizadas nos testes, e seus respectivos valores limite, são:
Região 0 (R0): V scc = 1/2 ; V icc = -1/2 ; V scct = 3/4; V icct = -3/4 Região 1 (R1): V scc = 1/2;V icc = -3/4; V scct = 3/4; V icct = -3/4 Região 2 (R2): V scc = 3/4; V icc = -3/4; V scct = 3/4; V icct = -3/4 Região 3 (R3) :V scc = 1/2; V icc = -1/2; V scct = 1/2; V icct = -1/2 O procedimento anteriormente descrito, de alterar os pesos e modificar o tamanho das regiões do QUPC, produz visualizações diferentes daquelas produzidas com o cálculo tradicional de
similaridades.
5.5 Resultados obtidos Os resultados do experimento foram compilados para cada coleção. São apresentados os
GT2
513
gráficos de neighborhood hit, os histogramas de distância e os valores dos coeficientes de silhueta obtidos nas visualizações construídas. As curvas são identificadas pelos nomes da coleção seguidas dos sufixos: orig, para visualizações construídas com o procedimento original do PEx; e para-Rx, para as visualizações obtidas com o uso do para-analisador na região Rx, onde x pode ser 0, 1, 2 ou 3, conforme descrito anteriormente. Também são mostradas as figuras geradas, para cada coleção. Foram destacados, em vermelho, os melhores valores obtidos para os coeficientes de silhueta. Devidos as restrições de espaço para esse trabalho, optamos por mostrar as regiões que apresentaram melhores valores de neighborhood hit e de coeficiente de silhueta. Os histogramas de distâncias das coleções utilizadas indicam uma redistribuição das frequências. Podem-se observar dois efeitos: (i) uma diminuição da concentração de distâncias, numa mesma classe, quando comparada com as visualizações criadas com o cálculo tradicional de tf-idf, ou seja, o histograma se apresenta mais espalhado e, (ii) uma diminuição no valor dos picos de frequências. Houve diminuição dos valores máximos de ocorrências de distância (ou similaridade) calculados para os documentos.
Coleção CBR-ILP-IR-SON
Legenda de cores para esta coleção:
Azul – CBR (Case based reasoning) Vermelho – SON (Sonification) Lima – IR (Information Retrieval) Verde – ILP (Inductive Logic Programing)
Visualização
Figura 10 – Visualização original Fonte: produzida no PEx
Histograma de distancias
Coeficiente de Silhueta: - 0,058435094
GT2
514
Figura 11 – Visualização da Região R0 do QUPC Fonte: produzida no PEx
Figura 12 – Visualização da Região R1 do QUPC Fonte: produzida no PEx
Coeficiente de Silhueta: 0,18285953
Coeficiente de Silhueta: 0,2880726
Coleção CBR-ILP-IR
Legenda de cores para esta coleção:
Azul – CBR (Case based reasoning) Vermelho – IR (Information Retrieval) Verde – ILP (Inductive Logic Programing)
Visualização
Figura 13 – Visualização original Fonte: produzida no PEx
Histograma de distancias
Coeficiente de Silhueta: 0,19003317
GT2
515
Figura 14 – Visualização da Região R2 do QUPC Fonte: produzida no PEx
Coeficiente de Silhueta: 0,65129006
Coleção CBR-ILP-SON
Legenda de cores para esta coleção:
Azul – CBR (Case based reasoning) Verde – ILP (Inductive Logic Programing) Vermelho – SON (Sonification)
Visualização
Figura 15 – Visualização original Fonte: produzida no PEx
Histograma de distancias
Coeficiente de Silhueta: 0,41561985
GT2
516
Figura 16 –Visualização da Região R3 do QUPC Fonte: produzida no PEx
Coeficiente de Silhueta: 0,6606122
Coleção CBR-ILP
Legenda de cores para esta coleção:
Azul – CBR (Case based reasoning) Vermelho – ILP (Inductive Logic Programing)
Visualização
Figura 17- Visualização original Fonte: produzida no PEx
Figura 18 - Visualização da Região R2 do QUPC Fonte: produzida no PEx
Histograma de distancias
Coeficiente de Silhueta: 0,67798316
Coeficiente de Silhueta: 0,74633
GT2
517
5.6 Análise dos resultados Os documentos dos assuntos IR (Information retrieval) e SON (Sonification), conforme dito acima, não apresentam o mesmo grau de pureza quando comparados com os documentos de CBR (Case-Based Reasoning) e ILP (Inductive Logic Programing), pois foram obtidos a partir de consultas na Internet, ao passo que estes últimos foram selecionados de periódicos das respectivas áreas. É razoável supor que, para os documentos dos assuntos IR e SON, os termos extraídos dos documentos apresentam menor grau de representatividade do que aqueles extraídos para os assuntos CBR e ILP. Por outro lado, pode-se considerar que os documentos dos assuntos CBR e ILP, extraídos de periódicos especializados, utilizam com maior rigor a terminologia das respectivas áreas sendo portanto mais representativos. Pode-se considerar que as coleções CBR-ILP-IR-SON, CBR-ILP-IR, CBR-ILP-SON são coleções que apresentam em maior ou menor quantidade, certo grau de ruído. Por outro lado, a coleção CBR-ILP pode ser considerada como a que apresenta maior grau de pureza, pois foi criada com documentos de repositórios especializados. Pode-se observar, nos gráficos de neighborhood hit obtidos, que o efeito de modificar os pesos dos termos é mais forte nas coleções que possuem, em maior ou menor grau, algum ruído (documentos classificados sem rigor). Por outro lado, também se pode observar que a coleção CBR- ILP foi aquela em que os gráficos ou ficaram muito próximos da curva original (regiões R0, R1 e R2), ou muito aquém da mesma (região R3). Os documentos da coleção CBR-ILP são os documentos bem classificados e, seu quantitativo
é de 395. Analogamente, pode-se calcular o quantitativo de “documentos ruído” nas outras coleções,
verificando-se a diferença entre os dois tipos de documentos. Nesse caso, têm-se os seguintes valores:
Coleção CBR-ILP-IR-SON: total de documentos = 675; documentos ruído = 280 Coleção CBR-ILP-IR: total de documentos = 574; documentos ruído = 179 Coleção CBR-ILP-SON: total de documentos = 496; documentos ruído = 101. Nas considerações anteriores, observa-se que os maiores efeitos sobre o índice de neighborhood hit foram obtidos nas coleções CBR-ILP-IR-SON e CBR-ILP-IR que são, respectivamente, as coleções com maior quantidade de documentos ruído. Para a coleção CBR-ILP-SON, a utilização da para-análise modificou os valores do neighborhood hit, mas as curvas resultantes se mantiveram, em alguns trechos, próximas da curva original. Por outro lado, para a coleção CBR-ILP, com exceção da região R3, que se situa muito abaixo da curva original, as curvas resultantes se posicionaram extremamente próximas da curva original, ou seja, os efeitos da alteração de peso são mínimos quando comparados com a visualização original. Essas considerações sugerem que o procedimento de modificar os pesos dos termos de
indexação está, por meio da curva de neighborhood hit, avaliando a qualidade das coleções sob
o ponto de vista da classificação de assuntos. Ou seja, a utilização da para-análise e do índice de neighborhood hit fornece uma maneira indireta de avaliar a qualidade com que os documentos de uma coleção foram classificados.
GT2
518
Além disso, pode ser observado, nos testes realizados, uma melhora nos valores do coeficiente de silhueta dos agrupamentos produzidos pois o procedimento produz agrupamentos mais efetivos do que aqueles obtidos com os procedimentos originais do sistema.
6 CONSIDERAÇÕES FINAIS
O objetivo principal desta pesquisa - verificar o potencial e os efeitos da utilização da
lógica paraconsistente em procedimentos de indexação automática -, procurou buscar interações entre diversas disciplinas ou campos de estudo, tais como: recuperação de informação, indexação automática, lógicas não-clássicas e visualização de informações. Tal objetivo foi desenvolvido por meio de dois procedimentos básicos. O primeiro consistiu em modificar o calculo tradicional de pesos, efetuado pelo modelo do espaço vetorial. Nesse contexto, utilizou-se o algoritmo para-
analisador, desenvolvido no âmbito da lógica paraconsistente, para modificar os pesos atribuídos aos termos de indexação. Dessa forma, aplicou-se um método desenvolvido para tratamento de situações em que a incerteza e a imprecisão são inerentes, a um processo de indexação automática. O segundo procedimento consistiu em observar e mensurar os efeitos da modificação no cálculo dos pesos em um sistema de visualização de informação – o Projection Explorer, uma vez que esse sistema utiliza
o modelo do espaço vetorial para determinar o grau de similaridade entre os documentos da coleção
a ser visualizada.
Os resultados demonstram que o uso do para- analisador permitiu ganhos quantificáveis tanto
nas avaliações das visualizações como um todo (por meio do índice neighborhood hit), quanto na
avaliação dos agrupamentos que representam as visualizações (por meio do coeficiente de silhueta). Também se observaram modificações nas distribuições de frequência representadas nos histogramas de distâncias obtidos. Os efeitos produzidos nos agrupamentos, demonstrados nos valores dos coeficientes de silhueta indicam que o uso do para-analisador, sob as condições do experimento efetuado, tem a capacidade de gerar agrupamentos mais efetivos. Esse é um ponto que chama a atenção, uma vez que
a formação de bons agrupamentos pode ser utilizada para aperfeiçoar procedimentos de recuperação
de informação quando se consideram os efeitos da hipótese do cluster: de que documentos similares tendem a ser relevantes para uma questão formulada a um sistema de recuperação de informação (VAN RIJSBERGEN, 1979). Os resultados sugerem que a abordagem estatística deve ser relativizada ou, dito de outra forma, confrontada com informação adicional. Os resultados obtidos com a introdução do algoritmo para-analisador no sistema Projection Explorer permitiram relativizar os valores dos pesos. Assim, a pesquisa indica que a atribuição de pesos aos termos que representam um documento pode ser vista como um procedimento repleto de incertezas e vagueza e, dessa forma, os procedimentos devem se apoiar em ferramentas com capacidade para o tratamento desses aspectos, como o para- analisador.
GT2
519
Para Anderson e Perez-Caballo (2001), a atribuição de pesos aos termos de indexação é, muitas vezes, feita através de tentativa e erro, sem maiores justificativas teóricas. Os resultados desta pesquisa indicam que o uso do para-analisador, como uma ferramenta que avalia a qualidade dos termos de indexação escolhidos, pode ser visto como um modo de justificar e relativizar o valor dos pesos dos termos. Ou seja, abre caminho para o desenvolvimento de uma teoria sobre a atribuição de pesos aos termos de indexação nos moldes definidos pelo modelo do espaço vetorial. Além disso, a relativização dos pesos encontra apoio nas colocações de Kaufman e Rousseeuw (1990), que entendem que algumas variáveis, escolhidas para representar os objetos a serem agrupados são, intrinsecamente, mais importantes que outras. Pode-se concluir que a utilização de procedimentos para tratamento de incerteza, imprecisão e vagueza tem potencial para produzir ganhos mensuráveis nos processos de indexação automática. O experimento realizado mostrou o potencial positivo de utilização do para-analisador. Contudo, não foi capaz de explicar o porquê e como ocorreram os efeitos observados. É possível afirmar, porém, que a adoção de parâmetros não-dicotômicos (não-excludentes) estabelece novas possibilidades de relacionar informação. De todo modo, é necessário aprofundar os aspectos teóricos do modelo do espaço vetorial, os critérios de atribuição de pesos aos termos de indexação e, finalmente, a concepção e realização de novos experimentos que capturem, com a devida precisão, os efeitos individuais do uso do para- analisador e da lógica paraconsistente em projetos de indexação automática.
Abstract: The aim of this research is to evaluate the use of paraconsistent logic, a nonclassical logic, capable of dealing with situations involving uncertainty, imprecision and vagueness, in the procedures of automatic indexing. The use of this logic, being flexible and containing logical states that go beyond the dichotomies yes and no, permit to advance the hypothesis that the results of indexing could be better than those obtained by traditional methods. From the methodological point of view, was used an algorithm for treatment of uncertainty and imprecision, developed under the paraconsistent logic, to modify the values of the weights assigned to index terms. The tests were performed on a information visualization system, with source code available. The collections used are available in the system. The results were evaluated by criteria and indexes built in the information visualization system itself, and demonstrate measurable gains in the construction, the quality of the displays, thus confirming the hypothesis of this research.
Keywords: Automatic indexing. Information visualization. Paraconsitent logic.
REFERÊNCIAS ANDREWS, K; KIENREICH, W.; SABOL, V.; BECKER, J.; DROSHCHL, G.; KAPPE, F.;
GRANITZER, M.; AUER, P.; TOCHTERMANN, K. The InfoSky visual explorer: exploiting hierarchical structure and documet similarities. Information Visualization, v. 1, n. 3/4, p. 166-181,
2002.
BELKIN, N. Interaction with Texts: Information Retrieval as Information-Seeking Behavior. Proceedings of the Fifth International Symposium for Information Science, 1993. Disponível em http://citeseer.ist.psu.edu/belkin93interaction.html.
GT2
520
BOJADZIEV, G.; BOJADZIEV, M. Fuzzy sets, fuzzy logic, aplications. Singapore: World Scientific Publishing Co Pte Ltd, 1995. BORDOGNA G.; PASI, G. Controlling information retrieval through a user adaptative representation of documentos, International journal of approximate reasoning, 12, p. 317-339, 1995. BORNER, K.; CHEN, C.; BOYACK, K. Visualizing Knowledge Domains. Annual Review of Information Science and Technology(ARIST), v. 37, p. 179–255, 2003 CORRÊA, C. A. Indexação automática e visualização de informações: Um estudo baseado em lógica paraconsistente. 2011. 152p. Tese (Doutorado em Ciência da Informação) – Escola de Comunicações e Artes, Programa de pós graduação em Ciência da Informação, Universidade de São Paulo, São Paulo 2011. DA COSTA N. C.; ABE J. M.; DA SILVA FILHO , J. I; MUROLO A. C.; LEITE C. F. S. Lógica paraconsistente aplicada, São Paulo:Atlas,1999. FERNEDA, E. Recuperação de informação: Análise sobre a contribuição da Ciência da Computação para Ciência da Informação. 2003. 147p. Tese (Doutorado em Ciência da Informação) – Curso de Ciências da Comunicação, Departamento de Biblioteconomia e Documentação, Universidade de São Paulo, São Paulo 2003. HERRERA-VIEDMA, E.; PASI, G. Fuzzy approaches to access information on the web: recent
developments and research trends. Proceedings of the Third Conference of the European Society for Fuzzy Logic and Technologies, 2003, p. 25-31. KAUFMAN, L.; ROUSSEEUW, P. J. Finding groups in data – An introduction to Cluster Analysis . New York: John Wiley & Sons, Inc., 1990. LANCASTER F. W. Indexação e Resumos: teoria e prática, Brasília: Briquet de Lemos, 2004. MAI, J. Analysis in indexing: document and domain centered approaches. Information Processing and Management, 41, p. 599-611, 2005. MINGHIM, R.; LEVKOWITZ, H. Visual Mining of Text Collections. Tutorial Notes. In: Proceedings of EUROGRAPHICS 2007 - Computer Graphics Forum, p. 929-1021. 2007. MOLINARI, A.; PASI, G. A fuzzy representation of HTML documents for information retreieval systems. Proceedings of IEEE International Conference on Fuzzy Systems, New Orleans, p. 8-12,
1996.
PAULOVICH, F.; OLIVEIRA, M. C. F.; MINGHIM, R. The Projection Explorer: A Flexible tool for projection-based multidimensional visualization, Proc. of XX Braziliam Sumposium on Computer Graphics and Image Processing, p. 27-34, 2007. PAULOVICH, F. V.; NONATO, L. G.; MINGHIM, R.; LEVKOWITZ, H. Least Square Projection: A Fast high-precision multidimensional projection technique and its application do documet mapping. IEE Transactions on Visualization and Computer Graphics, v. 14. n. 2, March/April, p. 1-12, 2008. PAULOVICH, F.V. Mapeamento de dados multidimensionais – integrando mineração e visualização. 2008. 144p. Tese (Doutorado em Ciência da Computação) – Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, 2008. RAGHAVAN, P. Information retrieval algorithms: a survey. Proceedings of the eight annual ACM- SIAM - Symposium on Discret algorithms, Society for industrial and applied mathematics, Philadelphia, PA, USA, p. 11-18, 1997. SALTON, G. Automatic Text Processing – The Tranformation, Analysis, and Retrieval of Information by Computer. New York: Addinson-Wesley Publishing Company, Inc, 1989. SALTON, G.; McGILL, M. J. Introduction to Modern Information Retrieval. New York: McGraw- Hill Publishing Company, 1983. SALTON, G.; BUCKLEY, C. J. Term-Weighting approches in automatic text retrieval. Information Processing and Management, v. 24, n. 5, p. 513-523, 1988.
GT2
521
SILVA, M. R.; FUJITA, M. S. L. A prática da indexação: análise da evolução de tendências teóricas e metodológicas. Transinformação, 16(2), p.133-161, mai/ago 2004. TAN, P.; STEINBACH, M.; KUMAR, V. Introduction to Data Mining. Boston: Pearson Education Inc, 2006. TOLEDO, G. L.; OVALLE, I. I. Estatística Básica. São Paulo: Editora Atlas S.A., 1986. VAN RIJSBERGEN, C. J. Information retrieval. London: Butterworths, 1979.
GT2
522
COMUNICAÇÃO
ORAL
A TEORIA CLÁSSICA DE CATEGORIZAÇÃO E OS PRINCÍPIOS CATEGORIAIS DE RANGANATHAN: UMA ANÁLISE TEÓRICA
Alessandra Rodrigues da Silva e Gercina Angela Borem Oliveira Lima
Resumo: A categorização constitui-se na biblioteconomia e ciência da informação (BCI) como uma ação intrínseca à organização dos registros do conhecimento e constitui a temática central
deste trabalho. Dada à importância dos enunciados de Ranganathan e a relevância dos escritos de Aristóteles a estruturação do conhecimento no Ocidente, objetiva-se neste trabalho descrever ambas as propostas categoriais e delinear pontos convergentes entre estas que constituem, especialmente a primeira citada, um marco na teoria da classificação da BCI. Para tanto, fez-se uma análise teórica das estruturas categorias de ambos os estudiosos mediante levantamento bibliográfico. Considera-se que por mais que o propósito de criação destas propostas categoriais seja distinto, já que Aristóteles trabalhou com os seres e Ranganathan com os registros do conhecimento, a percepção do que constitui
a estrutura ranganathiana é visivelmente inspirada nas categorias aristotélicas ainda que se verifiquem alguns embates, sobretudo no delineamento do par substância/personalidade.
Palavras-chave: Categorização. Categorias. Teoria clássica de categorização. Classificação facetada. 1 INTRODUÇÃO
A categorização – o processo cognitivo de compreensão das características dos objetos por
critérios de similitude ou dessemelhança – constitui-se na biblioteconomia e ciência da informação (BCI) como uma ação intrínseca à organização dos registros do conhecimento. No âmbito teórico,
a lógica categorial apontada como a mais influente na BCI e a matriz, por quase dois mil anos, para
trabalhos em diversas áreas do conhecimento é a teoria clássica de categorização, idealizada pelo filósofo grego Aristóteles. Vários estudiosos da BCI a visualizam em consonância com os trabalhos realizados pelo bibliotecário indiano Shiyali Ramamrita Ranganathan (1892-1972), em especial as categorias fundamentais por ele propostas, expressas pelo acrônimo PMEST (personalidade, matéria, energia, espaço e tempo). Ranganathan elencou critérios metodológicos para a categorização na BCI, o que o faz ser visto como um dos nomes mais expoentes, no século XX, na teoria da classificação. Após a divulgação de seus trabalhos, ocorreu uma reestruturação nas pesquisas da área e vários estudiosos e grupos se debruçaram sobre o que constitui os princípios categoriais ranganathianos. Contudo, Ranganathan
não formalizou explicitamente 1 em nenhum de seus textos a derivação dos princípios categoriais que propôs.
1 Ranganathan cita Aristóteles nos Prolegomena to Library Classification, contudo o faz de maneira genérica, não aborda as categorias do estagirita e nem menciona o embasamento das categorias fundamentais naquelas propostas por Aristóteles.
GT2
523
Apresenta-se, mediante as afirmações mencionadas, a categorização na BCI como a temática central deste trabalho e, dada a importância dos enunciados de Ranganathan, bem como a relevância de Aristóteles a estruturação do conhecimento no Ocidente, objetiva-se descrever ambas as propostas categoriais e delinear pontos convergentes entre estas que constituem, especialmente a primeira citada, um marco na teoria da classificação da BCI. Para tanto e, mediante o número restrito de estudos teóricos recentes sobre a categorização na BCI (GUIDO BARITE, 1998), optou-se pela abordagem exploratório-descritiva viabilizada mediante o levantamento bibliográfico na BCI 2 e áreas correlatas.
2 A TEORIA CLÁSSICA DE CATEGORIZAÇÃO A teoria clássica de categorização foi a que teve maior influência no Ocidente, em quase dois mil anos. Suas origens remontam à Grécia Antiga, nos escritos de Aristóteles (ca. 384/383 – 322 a.C.), filósofo nascido em Estagira, na Macedônia. Discípulo de Platão, em Atenas, por cerca de vinte anos, Aristóteles escreveu sobre várias áreas do saber, como a metafísica, a filosofia, a política, a ética, a psicologia, a zoologia, a botânica, as artes, entre outras. A extensa obra de Aristóteles, baseada na de Platão, tanto coincide quanto diverge desta. Aristóteles contesta alguns pontos dos escritos de Platão, como a dualidade do mundo em sensível e inteligível, propõe a união do mundo em coisas reais de nossa experiência sensível através do ‘hipojéimenos’, ou seja, a substância (GARCÍA MORENTE, 1967). Sua lógica pode ser vista como um instrumento de acesso à realidade e é tida como o ‘realismo aristotélico’. Aristóteles foi o filósofo pioneiro no estudo das categorias no sentido em que se conhece na atualidade. Antes de seus trabalhos, não existia uma abordagem filosófica ou técnica para as categorias (MORA, 2004). As demonstrações do estudioso sobre o assunto serviram como fundamento para basicamente todos os seus trabalhos, em especial aqueles voltados para a ontologia. Em seu tratado “Categorias”, primeiro da série dedicada à lógica na obra Órganon, Aristóteles trabalha com as categorias ou predicáveis (de predicaere = atribuir). As categorias aristotélicas constituem as dez unidades ditas pelo autor como aquelas que estão fora de toda a combinação; refletem a reunião das expressões sem ligação e, por si só, não podem ser tidas como verdadeiras ou falsas. Para Aristóteles, “as categorias exprimem diferentes sentidos do ser” (ARISTÓTELES, 2001, p. 83). As categorias consistem em:
Classes gerais em que, segundo ele [Aristóteles], [pode-se] situar, ordenadamente, as idéias que temos das coisas e que constituem os dez gêneros supremos, as dez essências mais
as categorias são fatos que constatamos nas coisas, quando as examinamos. São as
principais entidades envolvidas na estrutura da realidade, modos de ser a serem reconhecidos, formas de existência, que compõe a existência de todas as coisas (PIEDADE, 1977, p. 10-11, grifos no original).
gerais [
]
2 Este texto corresponde ao percurso investigativo teórico da dissertação de mestrado apresentada em dezembro de 2010 na ECI/ UFMG. A pesquisa mencionada possui ainda uma parte empírica que não é retratada neste texto, aos interessados sugere-se a leitura:
SILVA, A. R. Estudos dos princípios de categorização na biblioteconomia e ciência da informação: Ranganathan – entre a teoria clássica e a abordagem cognitiva contemporânea. 193 f. Dissertação (Mestrado em Ciência da Informação) – Escola de Ciência da Informação, Universidade Federal de Minas Gerais, Belo Horizonte, 2010.
GT2
524
Alguns compiladores das obras aristotélicas apresentam variações na quantidade das categorias, o próprio Aristóteles assim o fez em algumas obras (Tópicos – listagem de 10 categorias,
Physica – listagem de oito categorias). “Isto parece dar a entender que Aristóteles não considerava a lista das categorias como fixada de uma vez por todas e que, em princípio, se podia descobrir que uma
categoria era redutível à outra [
as dez categorias a seguir indicadas:
(MORA, 2004, p. 416). Optou-se, por estudar a visão que aborda
]”
QUADRO 1 As categorias fundamentais de Aristóteles
|
Categorias |
Exemplos |
|
Substância |
Homem, cavalo, pedra |
|
Quantidade |
Duas varas, grande, dois quilos |
|
Qualidade |
Branco, azul, virtuoso |
Relação
Tempo / Data / Duração
Lugar
Ação
Paixão / Sofrimento
Maneira de ser / Estado
Posição
Duplo, meio, mais pesado
O ano passado, ontem, 1982
Aqui, Brasil, no Liceu
Amando, correndo, falando
Derrotado, cortado
Saudável, febril, calçado
Horizontal, sentado, deitado, em pé, invertido
Fonte: Adaptação dos textos de PIEDADE, 1977; ARISTÓTELES, 2001; ARANALDE, 2009.
García Morente (1967) expõe que Aristóteles, ao abordar as categorias, o fez para trabalhar com o problema da estrutura do ser e que esta estrutura está relacionada tanto à ordem lógica quanto ao sentido ontológico. Ambas as perspectivas foram abordadas nos escritos de Aristóteles, sendo a primeira retratada no tratado Categorias e a segunda abordada, especialmente, nos quatorze livros da Metafísica 3 . Assim, apresenta-se as categorias pela obra Órganon, mas, na teoria da substância, apropria-se de algumas considerações ontológicas. García Morente expõe que:
Do ponto de vista lógico, [Aristóteles] chama-as predicáveis ou predicamentos:
são os atributos mais gerais que se podem fazer na formação de juízos. Do ponto de vista ontológico considera-as como as formas elementares de todo ser, como aquelas formas que, impressas na matéria, constituem o mínimo de forma necessário para que o ser seja. (GARCÍA MORENTE, 1967, p. 105)
Para Aristóteles, a categoria básica – primária – é a substância. O estagirita afirma que “o ser tem muitos significados, dos quais a substância não só é o principal, mas até mesmo o fundamento de todos os outros” (ARISTÓTELES, 2001, p. 42, grifos do original). Sem a substância, não é possível
3 Livro de Aristóteles que reúne escritos sobre a física, meta significa “depois” e também remete à ideia de “sobre” (DAHLBERG,
1992).
GT2
525
existir a qualidade, a maneira de ser ou qualquer outro atributo. García Morente, neste sentido, declara que:
A substância é a primeira categoria que êle [Aristóteles] enumera na lista: é o ponto de vista no qual nos situamos para dizer que algo “é”: este é homem, este é cavalo, este é peixe. Quando dizemos que algo é isto ou aquilo, aquilo que é, então consideramos este algo como uma substância e o que dele dizemos isto é ele. (GARCÍA MORENTE, 1967, p. 104)
Da substância, enquanto ser a priori, pode-se predicar as outras categorias, ‘o muito e o pouco’. Aranalde (2009) intitula essa derivação como uma relação parasitária entre as demais categorias com a substância. Estas se constituem a partir da substância, são visualizadas como um acidente desta categoria primordial. Do ser que existe, que é real, pode-se afirmar que é grande ou pequeno, que possui dois ou setenta quilos, ou seja, pode-se analisá-lo sob a ótica da quantidade. Um ser pode também ser visto sob o olhar daquilo que o qualifica, ou seja, se é azul, se é feio, se é ignóbil, se é amargo. Dessa forma, determina-se aquilo que Aristóteles designou como a qualidade dos seres. Pode-se predicar os seres uns em relação aos outros: aquele que se constitui como mais pesado, menor do que outro, igual. Aristóteles assim designou a categoria da relação. Têm-se os pontos de vista do lugar e tempo aplicados aos seres: de um ser que existe, pode- se afirmar que está aqui ou lá, que vive em Atenas ou em Manaus, bem como pode-se afirmar desse ser quando ele é, quando deixa de ser, quando foi. “Pode-se dizer que é agora e continua a ser ou que deixou de ser” (GARCÍA MORENTE, 1967, p. 105). É possível dizer o que esse ser que existe faz, ou seja, qual a ação que este ser executa. Diz- se que o homem está amando, que um machado é cortante, que uma borboleta voa. Pode-se afirmar, ainda, do que este ser padece, do que ele sofre: a árvore é cortada, o homem é derrotado. Dá-se o nome de paixão a esta categoria. Outras duas categorias foram elencadas por Aristóteles: a maneira de ser e o estado. A primeira se refere àquilo que o ser é no momento, e a segunda ao estado como está. Segundo Reale (ARISTÓTELES, 2001, p. 74-75), Aristóteles, após propor as dez categorias (número perfeito), deve ter notado “que as duas últimas não têm relevância ontológica a ponto de motivar uma distinção, sendo redutíveis a outras”. Este pensamento é ratificado por García Morente (1967), que associa isso ao fato de Aristóteles as ter omitido em algumas passagens. Moss (1964) propõe que cada uma das categorias representa termos gerais ou abstratos derivados de interrogações simples como: O quê (substância)? Qual a grandeza (quantidade)? Que tipo de coisa (qualidade)? Relacionado a quê (relação)? Onde (espaço)? Quando (tempo)? Em qual posição (estado/posição)? Em que circunstância (condição)? Qual a ação (ação)? O quão passivo (paixão)? Reale assevera que a noção de ser exposta nas categorias não só se difere no âmbito da substância, mas também o ser de cada uma das demais categorias se difere entre si. As figuras das categorias são
GT2
526
vistas por Reale (ARISTÓTELES, 2001) como os significados primeiros e fundamentais do ser: “são a distinção originária sobre a qual se apóia necessariamente a distinção dos significados ulteriores”. Aristóteles afirma que tudo o que há em todo o ser das categorias se deriva do ser da substância, ou seja, fundamenta-se nesta. Torna-se oportuno descrever o que o estagirita designa como substância. Logo, as indagações “ – Quem existe? A substância. – E a substância, o que é”? São trabalhadas no próximo tópico. 2.1 A SUBSTÂNCIA ARISTOTÉLICA
O ser que possui existência metafísica plena é a substância primeira, que é sempre vista sob
a ótica individual. Apesar de a listagem de categorias servir de insumo à compreensão dos seres, a
delimitação da substância serve ao entendimento individual destes. Aristóteles procurou trazer a noção ideacional proposta por Platão ao mundo sensível e inteligível, ou seja, a realidade. Esse mundo, para Aristóteles, está perfeitamente sistematizado, não deixa nenhum resquício a nada irracional, a nada incompreensível, e se constitui por uma magnífica coleção de substâncias (GARCÍA MORENTE, 1967). Assim, a substância, enquanto elemento fundamental à constituição dos seres, é passível de compreensão, mediante sua inteligibilidade. O que constitui a substância para Aristóteles refere-se ao entendimento de que:
O ser tem múltiplos significados, dos quais o de substância não só é o principal, mas até mesmo o fundamento de todos os outros (REALE, [tradutor e comentador de ARISTÓTELES, 2001],
p. 106). [
devemos examinar principalmente, fundamentalmente e, por assim dizer, exclusivamente o que é o ser neste significado (ARISTÓTELES, 2001, p. 42). A substância é para Aristóteles aquilo que existe, porém não somente aquilo que existe, mas aquilo que existe em unidade indissolúvel com o que é, com sua essência, não somente com sua essência, mas com seus acidentes (GARCÍA MORENTE, 1967, p. 106).
por isso também nós
]
‘o que é o ser’, equivale a este: ‘o que é a substância’ (
);
Dessa forma, a noção que a substância adquire se reflete em três elementos: 1º) a substância
em si, 2º) a essência e, também, 3º) o referente ao acidente. A substância em si corresponde ao elemento a priori, o quid descrito por São Tomás de Aquino (GARCÍA MORENTE, 1967), isto é, ao sujeito da proposição.
A essência se refere à soma dos predicados que se pode derivar da substância. Sob esta ótica
os predicados podem ser inerentes à constituição da substância, concebidos como a essência em si, ou ainda podem se configurar como complementares, de maneira que se algum deles faltar à substância, não comprometem que esta seja o que realmente é, designados como acidentais. Dessa forma, a substância se configura como a soma dos atributos essenciais e daqueles acidentais que constituem o ser.
Reale (ARISTÓTELES, 2001, p. 98) expõe cinco características definidoras da substância:
1) o fato de ser substrato de inerência e de predicação dos outros modos do ser; 2) ser um ente capaz de subsistir separadamente do resto, de modo autônomo; 3) a necessidade de ser algo determinado; 4) a característica intrínseca da unidade: não pode ser substância um agregado de partes; e 5) o ato
e a atualidade: só será substância o que é ato ou implica essencialmente ato, e não o que é mera
GT2
527
potencialidade. As características citadas por Reale trazem à tona um par de conceitos que configuram a substância aristotélica, a saber: a matéria e a forma. A matéria, em Aristóteles, corresponde àquilo de que algo é constituído. Essa afirmação não se restringe ao caráter material, mas a quaisquer coisas que venham a constituir um ser. García Morente (1967, p. 97) exemplifica a matéria assim: “uma tragédia
é uma coisa que fez Ésquilo ou que fez Eurípedes, e essa coisa é feita de palavras, de logoi, de razões, de ditos dos homens, de sentimentos humanos; e não é feita de matérias no sentido que dão à palavra ‘matéria’ os físicos de hoje”.
Já a forma recebe duas acepções: uma voltada à noção geométrica do termo, como a figura dos
corpos, entendimento este mais vulgar; e a outra, como aquilo que faz com que a coisa seja o que é,
tanto no âmbito material, quanto no imaterial. Aristóteles acredita que cada coisa possua a forma que deva ter, a forma define a coisa (GARCÍA MORENTE, 1967, p. 98). Na forma, encontra-se o telos do ser, ou seja, a finalidade a que se destina.
A matéria e a forma constituem um conjunto harmônico e indivisível, não se podendo afirmar
que uma corresponda à existência e a outra à essência. O que se pode considerar, tão somente, é que “a coisa advém a ser aquilo que é porque sua matéria é informada, é plasmada, recebe forma, e uma forma é a que lhe dá sentido e finalidade” (GARCÍA MORENTE, 1967, p. 98). A matéria e a forma estabelecem uma relação estática, contemplada desde a eternidade metafísica dos seres. Aristóteles não somente elencou as categorias para o conhecimento das entidades, como também, por meio de sua lógica, descreveu critérios para uma teoria de categorização. A intitulada teoria clássica de categorização (ou teoria aristotélica) é descrita a seguir.
2.2 A noção de categorização na teoria clássica
O modelo clássico de categorização – também nomeado como ‘teoria dos atributos definitórios
dos conceitos’– embasa-se na noção de reconhecimento (JACOB, 2004). Assim, um conceito pertence à determinada categoria se compartilhar um conjunto de características essenciais – rígidas e bem delimitadas – com os demais membros desta categoria. Cada uma dessas características é necessária ao delineamento dos conceitos que a compõem, e todas são conjuntamente suficientes para algo ser identificado como um exemplar da categoria (EYSENCK; KEANE, 2007). Os limites entre as categorias são nítidos, um membro é ou não – o princípio do “tudo ou nada”- reconhecido como integrante, e não há uma escala de representatividade dos objetos da categoria (tipicidade), já que todos compartilham as mesmas características. A experiência de mundo dos indivíduos, no modelo clássico, se dá por categorias predeterminadas, ou seja, não é necessária a
criação de novas categorias para a classificação dos objetos, há o reconhecimento destes no universo de conhecimentos a priori que os indivíduos possuem. Os objetos possuem uma relação de herança que se consolida mediante a estrutura hierárquica, logo, os conceitos mais específicos possuem as características daqueles que lhes são superiores, e
GT2
528
assim sucessivamente. Duas definições são especialmente relevantes na interpretação da teoria clássica: a intensão
e a extensão. A primeira é definida como “o conjunto das características representadas por um termo geral” (LALANDE, 1999, p. 582). Alguns estudiosos a intitulam como compreensão, pois, de certa forma, compreende aquilo que identifica um objeto. Já a extensão pode ser apreendida como “ [ ]
o conjunto dos objetos (reais ou ideais, concretos ou abstratos) aos quais se aplica um elemento de
conhecimento [
Dessa forma, a intensão de uma categoria na teoria clássica é inversamente proporcional à extensão da mesma, pois na medida em que uma aumenta, isso se reflete na outra em sentido contrário. Conforme Jacob (2004), esta estipulação é a fonte do poder explicativo da teoria clássica, o que lhe concede uma explanação simples e elegante tanto para a representação de estruturas cognitivas externas como para o significado semântico dos conceitos. É uma abordagem objetiva, que reduz incertezas, trabalha com o que é observável e permite o estabelecimento de padrões estáveis. Caracterizada a teoria clássica, muitas foram as críticas e falhas a ela atribuídas, o processo tópico reserva-se a exposição destas.
]”
(LALANDE, 1999, p. 373).
2.3 Incoerências no modelo clássico: omissões na teoria ou mau uso? Até aproximadamente a década de 1970, a teoria clássica não havia sido submetida a críticas fundamentadas sob uma abordagem sociocognitiva. A partir dos trabalhos de Eleonor Rosch, psicóloga
cognitivista da University of Berkeley, foram tecidos elementos sobre as omissões do modelo clássico.
O olhar aqui posto sobre estas essas omissões é delineado sob duas perspectivas: as falhas na teoria em
si, como também os erros ao utilizá-la. As primeiras são visualizadas sob a abordagem das ciências cognitivas, já o segundo ponto é visto sob o amparo dos estudos da BCI, em especial, os de Shera. Dentre as falhas apontadas à teoria clássica, um quesito que se sobressai é a ausência de tipicidade dos objetos que compõem as categorias. Estudos realizados por Rosch e Mervis (1975) apontam que existe um gradiente de tipicidade inerente a cada categoria, em que existem membros que melhor representam a categoria se comparados com outros pertencentes à mesma, que estão em posição mais periférica. Dessa particularidade, infere-se outra relacionada à aprendizagem dos conceitos: os exemplares
vistos como mais típicos de uma categoria são recordados com maior facilidade que os menos típicos,
e a aprendizagem dos primeiros se dá de forma mais rápida do que com os segundos. Percebe-se que,
por excluir o gradiente de tipicidade dos conceitos, o modelo clássico restringe sua aplicação, já que este elemento é facilmente percebido em determinadas categorias, sobretudo, de conceitos naturais. Sobre os limites rígidos e predeterminados das categorias, Eysenck e Keane (2007) apresentam estudos que indicam forte influência do contexto no delineamento dos conceitos. Como mencionado por Shera,
é a habilidade de nosso cérebro estabelecer padrões em resposta a uma sensação que dá
GT2
engrena com a rede de vida
sobre nós, particularmente com a rede da estrutura social. (SHERA, 1957, p. 21, grifou-se).
realidade ao nosso meio ambiente. Assim, a rede do corpo, [
]
529
Desta maneira, pode-se afirmar a inviabilidade de se determinar todos os conceitos que integram uma categoria a priori, já que existem aqueles de caráter mais flexível, com um conjunto alternativo de atributos, que oscilam conforme a realidade de mundo do indivíduo. Já há algumas décadas de análise, se percebem falhas na definição das características de muitos conceitos, o que remete ao fato de que alguns destes simplesmente não possuem atributos definitórios. O filósofo austríaco Ludwig Wittgenstein (1889-1951), na segunda fase de seus estudos, ao tratar de categorias linguísticas como a dos jogos, sugere que existem parecenças entre os membros de uma família (vistos aqui como os registros do conhecimento), mas não o compartilhamento obrigatório de um grupo de características. Um exemplo célebre de suas críticas é o conceito de jogos: qual o atributo necessário à sua definição? Existe uma multiplicidade de elementos que os caracterizam – podem ser de mesa, envolver um ou mais jogadores, utilizar bolas, mas quase nenhum atributo consegue abranger a todos os jogos. Logo, não se pode enunciar que todos os tipos de conceitos possuam características estanques como propõe o modelo clássico, visto que isso pode se aplicar a alguns tipos, mas não a todos. Sob a perspectiva das classificações bibliográficas, Shera (1957) enuncia que estas foram calcadas na lógica aristotélica, sobretudo no que tange à estruturação hierárquica. O pesquisador reflete sobre as falhas no modelo, mediante a afirmativa de Alfred North Whitehead sobre a lógica aristotélica: “a matriz fértil das falácias”. Contudo, Shera (1957, p. 27) aponta uma perspectiva diferenciada das omissões relacionadas à teoria clássica, ao enunciar que “o erro não se apresenta,
no ato de classificação como um processo mental, mas sim, no seu mau uso”. Para Shera (1957), exigiu-se da classificação o que ela não poderia proporcionar: um padrão universal de conhecimento, olvidando-se que, apesar de o teor de pensamento existente nos registros do conhecimento se aproximar daquele dos indivíduos, inclusive dos usuários de um sistema de recuperação de informação, ainda há uma distância imensa entre estes, seja pelo quesito temporal, seja pelas nuances sociocognitivas que delineiam cada indivíduo. Shera não condena os bibliotecários por isso, pois acredita que “a falácia se assenta, é claro, no fato de que uma estrutura hierarquizada é apenas um padrão de pensamento num universo de padrões infinitos, e a ‘semelhança’ para uma pessoa pode ser a ‘diferença’ para outra, e o que para alguém é uma associação lógica ou racional para outro pode ser ilógico e irracional (SHERA, 1957, p. 26). Isso não faz com que Shera (1957) desacredite nos padrões e sugira o caos para a organização documental. Ao contrário, o estudioso caracteriza a tendência de sistemas voltados para conceitos, ou seja, que se tratem os registros do conhecimento conforme unidades de conhecimento e mediante a sua categorização. Em continuidade ao que propõe neste texto e devido à aceitação quase unânime do marco divisório na teoria da classificação da BCI estipulado por Ranganathan, apresentam-se, a seguir, os estudos relativos à categorização realizados pelo mesmo.
[
],
GT2
530
3 OS PRINCÍPIOS CATEGORIAIS DE RANGANATHAN Shiyali Ramamrita Ranganathan (1892-1972) é um dos nomes mais expoentes da biblioteconomia mundial. Nascido em um distrito de Madras, na Índia, e pertencente à casa dos brâmanes, Ranganathan estudou matemática em nível de graduação e de pós-graduação. Foi aprovado em concurso para bibliotecário na Universidade de Madras, em 1924, sendo que, no ano seguinte, partiu para Londres, para realizar estudos de pós-graduação em biblioteconomia sob a orientação de W. C. Berwick Sayers (NAVES, 2006). Naves (2006) o aponta como um parttern maker – designação dada a pessoas que dedicam suas vidas a estudos e alcançam generalizações que transcendem limitações de espaço e tempo, isto é, tornam-se perenes. Assim, Ranganathan, foi tido como o estudioso que conferiu bases teóricas sólidas aos estudos da BCI . Sua extensa obra corresponde a cerca de cinquenta livros, com estudos que se direcionam desde o plano epistemológico, com a noção de conhecimento, às atividades de organização do conhecimento, mediante proposições inovadoras na teoria da classificação. Ranganathan foi extremamente influenciado pelas culturas brâmane, chinesa e pela astrologia (SEPÚLVEDA, 1996).Além disso, dado que chegou a especializar-se em língua inglesa, é perceptível a miscigenação dos costumes orientais com os preceitos vitorianos em algumas de suas obras. Contudo, a influência mais perceptível nos escritos de Ranganathan é a da lógica aristotélica. Naves (2006, p. 38, grifou-se) aponta que “[Ranganathan] influenciado pelos ensinamentos de Sayers, calcados na teoria da classificação com base na lógica aristotélica, partiu para uma revolução no delineamento de esquemas de classificação”. Esta revolução é inquestionável, vista sobremaneira pela proposição das categorias fundamentais, mas que, como salienta Moss (1964), possui origens longínquas, especificamente na Grécia Antiga, dada a semelhança dos estudos de Ranganathan com as categorias originais propostas por Aristóteles. Piedade (1977) corrobora desse entendimento e menciona que a classificação facetada ou analítico-sintética proposta por Ranganathan absorve as categorias aristotélicas no âmbito das variadas relações que permite entre os assuntos, desencontrando-se das propostas até então existentes no âmbito da BCI, que expunham a dicotomia da árvore de Porfírio. Portanto, na BCI, pode-se ratificar a derivação aristotélica nos escritos de Ranganathan. Os olhares destes estudiosos se deram por motivações distintas: Aristóteles propunha uma análise ontológica, voltada aos seres, já Ranganathan debruçou-se nos registros do conhecimento – as chamadas categorias do classificar, conforme Aranalde (2009), vistas aqui não somente como o classificar, mas sim como as categorias para se entender e representar os registros do conhecimento.
3.1 A noção de conhecimento e o plano das ideias Uma das contribuições fundamentais de Ranganathan refere-se ao questionamento de como o conhecimento humano é formado. Para tanto, o estudioso propõe que o conhecimento corresponde ao universo de ideias, e que estas são o resultado do pensamento, da reflexão, da imaginação e da intuição (RANGANATHAN, 1967, p. 81). O universo do conhecimento em Ranganathan é algo
GT2
531
dinâmico e contínuo, em crescimento constante. Ao propor que a fonte da atividade classificatória estava no universo do conhecimento, Ranganathan rompe com a visão dominante da árvore dicotômica de Porfírio e apresenta a noção da policotomia ilimitada de conhecimento, representada pela árvore baniana – espécie de figueira indiana (NAVES, 2006), que possui vários troncos secundários ligados ao tronco original. A árvore baniana representa uma metáfora da possibilidade infinita de relacionamentos entre os assuntos e o crescimento contínuo destes, em que a evolução de um assunto serve de estímulo a outro, em uma espiral infinita No ano de 1933, Ranganathan apresentou a Colon Classification, também intitulada de classificação facetada. Esta classificação propõe, mediante o método hipotético-dedutivo, que entre dois pontos há um número infinito de assuntos e que esses devam ser combinados pelo bibliotecário quando preciso. Para Dahlberg (1978), a classificação facetada pode ser visualizada como um sistema de conceitos, já que as facetas e seus elementos se refletem nas categorias. Um dos grandes pontos da Colon Classification é a proposição de três planos de trabalho para a classificação:
O plano das idéias – a mente é o local de origem das idéias; o plano verbal – após a formulação
das idéias, vem a capacidade de desenvolver uma linguagem articulada; o plano notacional –
as palavras são traduzidas para símbolos (letras e números) que formam a notação. (NAVES, 2006, p. 42).
O primeiro, o plano das ideias, é tido como superior por Ranganathan, já que se relaciona com o trabalho da mente e possui uma noção até mesmo exotérica, pois o bibliotecário o afirma ser invisível, tal como Deus (RANGANATHAN, 1967, p. 335). É um plano a priori, em que os conceitos são percebidos antes de quaisquer contatos com os planos verbal e notacional. O plano das ideias é aquele em que “se encontra a estratégia de classificação cristalizada na elaboração das categorias fundamentais” (ARANALDE, 2009, p. 99). Feita esta apresentação, avança-se ao estudo da estrutura PMEST de Ranganathan.
3.2 As categorias fundamentais de Ranganathan Ranganathan, na obra Prolegomena to Library Classification (1967), afirma que não se podem separar as categorias fundamentais (personalidade, matéria, energia, espaço e tempo) e que elas implicam em cinco (e somente cinco) expressões. Aranalde (2009) aponta que Ranganathan, ao propor as cinco categorias, partiu do entendimento de que a análise precisa parar em um ponto firme, uma fórmula básica e inicial para se compreender o universo infinito de conhecimentos existentes. E, ao questionar a quantidade de categorias fundamentais, acrescenta:
Ranganathan (1967) afirma que qualquer pessoa tem total liberdade para formular o número de categorias que quiser, desde que elas sejam empiricamente testadas. Para tanto, sugere
que se classifiquem alguns milhares de artigos: se os resultados forem satisfatórios, o novo
postulado pode ser aceito. Ou seja, ressalta o critério da utilidade [
p 100-102)
].
(ARANALDE, 2009,
Cabe recordar que o número de categorias proposto para a análise dos registros do conhecimento,
GT2
532
conforme Barité (1998), aumenta em razão inversa ao grau de generalidade de aplicação que se pretenda dar às mesmas. Assim, o princípio da utilidade (um dos cânones do Plano das Ideias) é empregado, já que não há uma quantidade de categorias vista como adequada, e sim a referência à utilidade que estas venham a alcançar na proposta classificatória que se propõe. Ranganathan restringe o uso dessas categorias ao universo classificatório, às facetas dos assuntos dos registros do conhecimento, resguardando-se de quaisquer análises dessas nos quesitos da filosofia (metafísica ou física). Informa ainda que o significado de “categorias fundamentais”, em um dicionário, não remete ao que elas realmente possam ser. A definição dessas categorias só pode se dar por enumeração. Aranalde (2009) acredita que elas podem ser apenas supostas, e não objetos de definições. Sob essa perspectiva, almeja-se, a seguir, enumerar proposições significativas para as categorias fundamentais de Ranganathan, sabendo-se da impossibilidade de trazer definições precisas, já que o próprio Ranganathan não o fez em seus estudos. Tempo - A categoria tempo é vista por Ranganathan como aquela de menor dificuldade em sua identificação. Talvez, por corresponder à noção usual que se faça de tempo no cotidiano, vinculada
a aspectos cronológicos. Os seguintes exemplos ilustram esta categoria: dia, noite, milênio, século. Espaço - O espaço, tal como o tempo, corresponde ao conhecimento geral que se tem sobre este conceito, remetendo ao aspecto espacial geográfico dos assuntos analisados. Ranganathan o exemplifica com conceitos amplos como a ‘superfície da terra’ e também com outros mais específicos como: continentes, países, cidades. Tanto o tempo quanto o espaço recebem tratamento análogo pelos estudiosos da teoria da classificação na BCI. Energia - A energia é a categoria que remete à ação presente nas coisas. Pode também indicar reações, processos, atividades, tratamentos, operações, problemas, assim como o que Ranganathan identifica como estrutura (morfologia), função, mau funcionamento, ações do ambiente e outras ideias similares. Para Barité (1998), está relacionada aos aspectos dinâmicos dos objetos. Piedade (1977, p. 12) a exemplifica da seguinte forma: “na biologia, na botânica e na zoologia é representada pela morfologia, pela fisiologia, pela patologia, pela ecologia, pela genética e pela ontologia e sua manifestação”. Matéria - Já a matéria corresponde aos materiais e às propriedades que constituem as coisas.
Aranalde (2009) assevera que esta categoria engloba tanto os elementos abstratos quanto os concretos:
a madeira que constitui uma mesa, assim como sua forma e cor. A matéria corresponde a elementos
mais estáveis na delineação de um objeto no mundo, se comparada à energia. E mesmo sabendo-se que
algumas coisas e objetos estão em constante mudança, em cada uma dessas fases é possível observar
a acepção de matéria que as constituem. Talvez, nos registros do conhecimento, a compreensão do
que venha a ser matéria seja obscura se tomada ipsis literis, no entanto, se compreendida em uma
dimensão maior (inclusive com algumas subcategorias), pode ser elucidativa das características que
a compõem. Substância - A categoria fundamental, apresentada por Ranganathan como a de mais difícil
GT2
533
identificação, é a personalidade. O estudioso chega a designá-la como inefável. A delineação que se vê de personalidade, na literatura da BCI, é a de que corresponde a entidades, seus tipos, suas espécies, partes e/ou órgãos. Aquilo que se demonstra como básico e fundamental à compreensão de determinado assunto. Segundo Grolier (1962), a personalidade não possui um valor teórico, constitui-se como um rótulo atribuído conforme uma ou mais características selecionadas arbitrariamente que refletem determinado ponto de vista, mas, apesar disso, é indispensável à existência das coisas. Em comprovação do último apontamento, Grolier estuda e averigua que a categoria personalidade se configura essencial na estruturação da Colon Classification. Normalmente, o reconhecimento da categoria personalidade só se dá por eliminação. Dessa forma, Ranganathan propôs a aplicação do método de resíduos – princípio do hinduísmo: “não é isso, não é isso” – em que, após se separarem as manifestações de tempo, espaço, energia e matéria de um assunto, o que não couber em nenhuma dessas categorias pode vir a ser considerado como personalidade (RANGANATHAN, 1967). Vickery é incisivo na crítica que faz a essa noção suspensa que Ranganathan dá à personalidade:
Ranganathan não tentou uma definição exata de personalidades, embora a tenha na ocasião comparado com “todos”, afirmando que “elas não são analisáveis e têm de ser manejadas habilmente e como um todo” – elas são “inefáveis”. Sua abordagem não pode ser aceita pela situação atual, por causa da falta de clareza da categoria postulada – não a definiu claramente, nem analisou suas relações com outras categorias postuladas. (VICKERY, 1980, p 234)
As dúvidas acerca do que venha a ser a personalidade refletem o quão transcendente é o conceito associado a esta categoria. Se for considerado que a personalidade é a essência do objeto, aquilo que o torna único e sem o qual não pode existir, conclui-se que todas as outras categorias dela se originam, ou seja, são dependentes da existência da personalidade. Caso se julgue que a personalidade é uma categoria tal como as outras, os objetos são caracterizados por elementos não essenciais, em que não há uma ‘ordem’ necessária para que venham a existir. Destaca-se que Ranganathan, por trabalhar com as categorias relacionadas à classificação dos registros do conhecimento de uma sábia maneira, vem a se eximir dessa discussão. Ao propor o método de resíduos para determinar a personalidade, ele não se posiciona sob nenhuma das abordagens citadas, apenas menciona que a personalidade é de difícil determinação e que os assuntos dos registros do conhecimento, presentes no universo documental, são manifestações de uma das cinco categorias fundamentais. Em um mesmo ciclo categorial, pode ocorrer mais de uma categoria fundamental (FOSKETT, 1973). Isso demonstra a divisão em níveis, ou seja, a noção de facetas permite divisões posteriores, que buscam destrinchar os elementos de formação do objeto analisado. Foskett aponta que, se não fosse assim, a análise dos objetos estaria restrita a apenas três categorias fundamentais (personalidade, energia e matéria), já que as categorias tempo e espaço estão presentes em qualquer objeto. Aranalde (2009, p. 102) complementa essa ideia afirmando que “as categorias são fundadoras e possibilitadoras do uso de novas categorias delas derivadas”. Na realidade, por serem categorias
GT2
534
básicas, as facetas de Ranganathan necessitam de divisões em níveis secundários, uma vez que fornecem uma visão introdutória à análise dos registros, mas não comportam em si todas as manifestações deles. Piedade (1977, p. 13) enuncia que “um mesmo conceito pode pertencer a uma categoria em um contexto e a outra em um contexto diverso”. As facetas, assim, permitem a análise multidimensional dos conceitos presentes nos registros do conhecimento, dado que possibilitam combinações que não
compreendem o caráter classificatório, pois apresentam coesão e aplicação extensiva de cada categoria (o que Piedade menciona como uma classificação flexível, mas que não abrange inconsistências como nas classificações cruzadas). Ranganathan relaciona o entendimento de faceta à aplicação de uma característica divisória ao universo considerado de registros do conhecimento, pautado, sobretudo, na utilidade que essa divisão possa oferecer.
A seguir, faz-se o cotejamento entre a perspectiva categorial de Ranganathan e de Aristóteles
no intuito de se explicitarem as interações existentes nas propostas de ambos os estudiosos. 4 INTERAÇÕES TEÓRICAS ENTRE RANGANATHAN E ARISTÓTELES A noção categorial de Ranganathan pode ser vista como uma releitura das categorias aristotélicas 4 . Moss (1964) deixa explícita essa derivação e afirma que algumas categorias de Ranganathan são idênticas às de Aristóteles, a saber: as categorias de lugar e tempo comungam do mesmo entendimento em ambos os estudiosos; a categoria ação corresponde à energia; a posição é vista por Moss (1964) como supérflua, já que é uma duplicação da categoria espaço; e a substância seria, no sentido lógico, equivalente à personalidade de Ranganathan e, no sentido metafísico, equivalente à categoria da matéria. A seguir, descrevem-se algumas relações observadas entre as propostas categoriais de Ranganathan e aquelas deAristóteles oriundas do levantamento bibliográfico realizado e das percepções da autora durante a elaboração deste texto. São observações que procuram trazer elucidações ao panorama da categorização na BCI. a) Tempo e espaço Inicialmente, parecem categorias autoevidentes, dada a similitude que possuem com o que delas se compreende no senso comum. Contudo, a noção de tempo, na filosofia, adquire um sentido extremamente metafísico de inserção do sujeito no mundo e da própria existência. Recorda o raciocínio exposto por Dahlberg referente aos objetos individuais: por tempo e espaço, sabe-se que a Universidade Federal de Minas Gerais é aquela existente no Estado de mesmo nome, no país Brasil e, ainda, nos séculos XX e XXI.
O tempo e o espaço, nesse entendimento, correspondem à concepção de quando e onde. Se
tomado como referência o ser no mundo, ambas as categorias possuem uma efemeridade imensa, já
4 Sabe-se que as categorias propostas pelos estudiosos surgiram por motivações e propósitos distintos – Aristóteles as propôs com relação aos seres e Ranganathan ao universo de registros do conhecimento, mas, ainda assim, sabe-se que ambas as propostas se constituem como instrumentos de análise.
GT2
535
que o ser no mundo é passível de deslocamento, de mudança, o que, conforme García Morente (1967),
recorda a postura de Aristóteles quanto ao também filósofo grego Heráclito 5 . Em complemento a isso, Moss (1964) afirma que a categoria posição em Aristóteles remete à dimensão de espaço, já que nos dicionários de filosofia espaço é designado como um “meio ideal, caracterizado pela exterioridade de suas partes, no qual se localizam nossos perceptos e que contém, por consequência todas as extensões finitas” (LALANDE, 1999, p. 322). Já em Ranganathan, tanto o tempo quanto o espaço assumem uma dimensão constante, uma vez que os registros do conhecimento, ao que até então se conhece, por serem formalizados, perenizam determinada ideia. Sabe-se da interdependência da categorização e dos registros do conhecimento, bem como da interdisciplinaridade destes, mas, ainda assim, quando os registros do conhecimento são formalizados, um entendimento predominante destas duas categorias é atribuído aos objetos.
b) Energia
A energia, proposta por Ranganathan, é frequentemente associada à categoria de ação de
Aristóteles.Acategoria energia é um acidente (no sentido de efemeridade) no universo do conhecimento registrado e reflete algo mutável e não definitivo. É também vista, dentre outras apropriações, como reações e mau funcionamento. Daí que se sugestione a relação existente entre o que Ranganathan aponta como energia, no sentido de reação, e a paixão (sofrimento) de Aristóteles. E, um pouco além, estendendo-se o mau funcionamento da energia ranganathiana, poder-se-ia associá-la à maneira de ser de Aristóteles. Isso indica que Ranganathan sintetizou as propostas de Aristóteles em categorias mais abrangentes, buscando relacioná-las ao universo do conhecimento até então conhecido.
c) Matéria
Pelo entendimento que se tem de matéria, pode-se associá-la, tal como o fez Moss (1964), com a substância de Aristóteles. Pensando-se assim, dá-se uma dimensão unívoca à substância do
autor grego, e afasta-a das teorias platônicas que este aproveitou. Aranalde (2009) afirma que em Ranganathan a matéria possui uma estrutura mais constante se comparada à substância. Sob esse enfoque, pode-se vê-la como a substância, mas não de forma completa, já que, ao se pensar que
a matéria é constituída por elementos abstratos e reais, pode-se resgatar a categoria qualidade em Aristóteles e aproximá-la ao entendimento de Ranganathan. Assim, uma escultura feita de mármore pode ter a coloração bege, que reflete dois sentidos da matéria em um objeto no mundo. Ainda sobre a matéria, se pensada no âmbito da divisão, daquilo que possa abranger, as
categorias quantidade e posição lhe seriam próximas. Isso, a princípio, parece um equívoco, entretanto,
a quantidade nada mais é do que a mensuração daquilo que a matéria é feita, e a posição corresponde
à forma como a matéria se comporta em uma dada circunstância. Ilustra-se essas afirmações com o exemplo do cavalo citado alhures, o fato de estar arreado corresponde à posição, à manifestação da matéria naquela circunstância. E, se se atribuir o peso X a este animal, está-se descrevendo um dos
5 Heráclito de Éfiso (ca. de 540 a.C. - 470 a.C.) é o filósofo pré-socrático que cultiva o princípio do dinamismo em que tudo flui (Panta rei).
GT2
536
aspectos da matéria da qual é feito. d) Substância
O tratamento dado à substância diferencia-se em Aristóteles e Ranganathan, basicamente, sob
dois aspectos: a terminologia usada e a proposta para a compreensão dessas categorias que cada um dos estudiosos determinou. Ranganathan, ao considerar as categorias como fundamentais e indefiníveis, se resguardou, sobretudo, de definir o que venha a ser a personalidade. Foi talvez mais além ao propor, para a delimitação desta, o método de resíduos. Este é, como exposto por Aranalde (2009), um ponto dissociante entre as perspectivas dos dois filósofos, já que Aristóteles vai em direção oposta. Aristóteles opta por elencar o que seja a substância em nível primordial, para, então, o que dela surgir ser considerado como acidente, isto é, as demais categorias. Isso dá à substância uma
existência distinta que talvez não a caracterize como uma categoria, e sim como o objeto em si. Reale (ARISTÓTELES, 2001) nega este entendimento, pois, para ele, as categorias são derivadas do ser, e não o próprio ser.
É interessante observar que a noção da substância aristotélica como essência corresponde
àquilo que transcende o mundo das ideias de Platão, estando sincrônica com a realidade, pois, remete ao entendimento teológico que Aristóteles possuía. Por isso, dá-se à substância um verdadeiro caráter inexorável e supremo, pelas próprias apreensões teológicas de que Aristóteles comungava. E mesmo com vários séculos de distância e em regiões geográficas não tão próximas, assiste-se, em Ranganthan,
à acepção quase divina sobre a personalidade, ainda que por um caminho oposto ao de Aristóteles. Ranganathan, ao vê-la como indizível, como o produto após todas as indagações, como aquilo que está sobrejacente a quaisquer coisas, deixa explícita sua base religiosa com relação à proposta da personalidade, isto é, um elemento que se julga existente, mas que não é passível de definição.
5 REFLEXÕES FINAIS Ao se dissertar sobre a derivação dos princípios categoriais de Ranganathan daqueles de Aristóteles, deve-se recordar a similitude percebida entre estes princípios, em especial, quanto à estrutura PMEST e às categorias fundamentais do estagirita. Ainda que o propósito de criação destas propostas categoriais seja distinto, já que Aristóteles trabalhou com os seres e Ranganathan com os registros do conhecimento, a percepção do que constitui a estrutura ranganathiana é visivelmente inspirada nas categorias aristotélicas. Aristóteles é tido por parcela dos estudiosos como o filósofo realista, aquele que compreende
o ser na condição de ser que existe, daí a noção de substância como algo primeiro na estruturação
ontológica das coisas. Já Ranganathan constrói suas categorias em direção oposta, apesar de se valer das categorias aristotélicas, tudo aquilo que não é, é personalidade, ou seja, apesar de ser constituinte do conteúdo dos registros do conhecimento (recordando que estes são os seres que Ranganathan retrata, não são categorias ontológicas), a personalidade adquire um papel de maior complexidade no reconhecimento destes. O método de resíduos representa a importância e o caráter inefável que norteiam o que consiste a personalidade para a BCI.
GT2
537
Quanto à categoria personalidade, observa-se a associação com a substância na concepção formativa e na relevância que lhes são dadas, apesar de nos quesitos metodológicos assistir-se a uma oposição entre o que cada uma delas constitua. A personalidade é descoberta pelo método de resíduos
– tudo o que não é, é personalidade, já a substância segue o caminho inverso: é o ser por si, a priori,
a essência. Aliado a isso, Ranganathan propôs um plano ideacional que foge ao realismo aristotélico, em parte, pois implica que há um nível de existência das coisas que antecede aquilo que forma explicitamente o plano verbal. O plano ideacional mais se aproxima das noções idealistas de Platão do que da verdade ontológica que Aristóteles busca retratar. Feitas estas reflexões, encerra-se esta análise ratificando a similitude entre a estrutura PMEST de Ranganathan e as categorias fundamentais de Aristóteles e, reforça-se a reivindicação de Barité (1998) quanto à necessidade das categorias serem revisitadas na BCI.
Abstract:
In the Librarianship and Information Science (LIS) categorization consists as an intrinsic action into knowledge recording organization, and represents the central subject of this paper. Based on the importance of Ranganathan’s work and the relevance of Aristotle’s ideas for structuring knowledge in the Occident, this paper aim describe both categorical propose and point out their convergences points, especially in the first one cited, that have been considered a theoretical landmark on Librarianship and Information Science (LIS). In order to do that, it was made a theory analysis of the categorical structures of both ideas through a bibliographic survey. Although the propose of these categorical ideas has been distinct, because Aristotle worked with human beings and Ranganathan worked with records of knowledge, the perception is that the Ranganathan’s structuring is clearly inspired in Aristotle’s categories, despite some clashes, in particular in the categories substance and personality.
Keywords: Categorization. Category. Classical theory of categorization. Faceted classification.
REFERÊNCIAS
ARANALDE, M. M. Reflexões sobre os sistemas categoriais de Aristóteles, Kant e Ranganathan. Ciência da Informação, Brasília, v. 38, n. 1, p. 86-108, jan./abr. 2009.
ARISTÓTELES. Metafísica: ensaio introdutório, texto grego com tradução e comentário de Giovanni Reale. Tradução de Marcelo Perine. São Paulo: Loyola, 2001. v. I: ensaio introdutório.
BARITE, M. G. Las categorías: aportes para una revisión conceptual y metodologica. Cadernos da F.F.C., v. 7, n.1/2, p. 77-96, 1998.
DAHLBERG, I. Fundamentos teórico-conceituais da classificação. Revista de Biblioteconomia de Brasília, Brasília, v. 6, n. 1, jan./jun. 1978.
DAHLBERG, I. Knowledge organization and terminology: philosophical and linguistic bases. International Classification, v. 19, n. 2, p. 65-71, 1992.
EYSENCK, M. W.; KEANE, M. T. Manual de psicologia cognitiva. 5. ed. Porto Alegre: Artmed,
|
2007. |
|
|
GT2 |
538 |
FOSKETT, A. C. A abordagem temática da informação. São Paulo: Polígono; Brasília: Ed. Univ. Brasília, 1973.
GARCÍA MORENTE, M. Fundamentos de filosofia I: lições preliminares. 3. ed. Tradução e prólogo de Guillermo de la Cruz Coronado. São Paulo: Mestre Jou, 1967. Lição VII: O realismo aristotélico,
p. 91-101; Lição VIII: A metafísica realista, p. 103-113.
GROLIER, E. de. A study of general categories applicable to classification and coding in documentation. Paris: Unesco, 1962.
JACOB, E. K. Classification and categorization: a difference that makes a difference. Library Trends,
v. 52, n. 3, p.515-540, Winter 2004.
LALANDE, A. Vocabulário técnico e crítico da filosofia. Tradução de Fátima Sá Correia et al. São Paulo: Martins Fontes, 1999.
MORA, J. F. Dicionário de filosofia. Sao Paulo: Loyola, 2004. tomos I, III.
MOSS, R. Categories and relations: origins of two classification theories. American Documentation,
p. 296-301, Oct. 1964.
NAVES, M. M. L. A importância de Ranganathan para a organização do conhecimento. In: NAVES, M. M. L.; KURAMOTO, H. (Org.). Organização da informação: princípios e tendências. Brasília:
Briquet de Lemos, 2006. p. 36-45.
PIEDADE, M. A. Requião. Introdução à teoria da classificação. Rio de Janeiro: Interciência, 1977.
PINTO, A. da C. Categorização de itens verbais: medidas de freqüência de produção de tipicidade. Porto: Relato técnico de Centro de Psicologia Cognitiva da FPCE da UP, 1992. Não paginado.
RANGANATHAN, S. R. Prolegomena to library classification. 3. ed. London: 1967.
ROSCH, E.; MERVIS, C. B. Family resemblances: studies in the internal structure of categories. Cognitive Psychology, v. 7, n. 4, p. 573-605, Oct. 1975.
SEPÚLVEDA, F. A. M. A gênese do pensar de Ranganathan: um olhar sobre as culturas que o influenciaram. 1996. Dissertação (Mestrado em Ciência da Informação) – CNPq/IBICTUFRJ/ECO, Rio de Janeiro, 1996.
SHERA, J. H.; EGAN, M. Catálogo sistemático: princípios básicos e utilização. Tradução de Maria Neile Teles Landau. Brasília: Ed. Universidade de Brasília, 1969.
SHERA, J. Padrão, estrutura e conceitualização na classificação para recuperação da informação. Tradução de Hagar Espanha Gomes. Publicado originalmente em: Proceedings of the International Study Conference on Classification for Information Retrieval, Beatrice Webb House, Dorking, England, 13th-17th May 1957. London: ASLIB, 1957. Disponível em: <http://www.conexaorio.com/ biti/shera/index.htm#nota1>. Acesso em: 02. ago. 2009.
VICKERY, B. C. Classificação e indexação nas ciências. Tradução de Maria Christina Girão Pirolla. Rio de Janeiro: BNG/BRASILART, 1980.
GT2
539
COMUNICAÇÃO
ORAL
A APLICAÇÃO DA TEORIA DA CLASSIFICAÇÃO FACETADA EM BANCO DE DADOS, ATRAVÉS DA MODELAGEM CONCEITUAL
Márcio Bezerra da Silva, Dulce Amélia de Brito Neves
Resumo: Apresentamos a Teoria da Classificação Facetada (TCF) de Ranganathan como possibilidade de estruturação do conhecimento, através da organização de conceitos e da criação de relacionamentos em ambiente de Banco de Dados (BD). Aqui são elencadas as cinco categorias ou facetas, estabelecidas por Ranganathan, chamadas de PMEST (Personalidade, Material, Energia, Espaço e Tempo). Objetiva-se, a partir de uma pesquisa aplicada e exploratória, investigar a possibilidade de aplicação da classificação facetada para organização do conhecimento, visando à recuperação da informação em BD. Também se almeja, de maneira mais específica, investigar a possibilidade da aplicabilidade da classificação facetada com a modelagem de dados em ambientes digitais. Adota-se como etapa de pesquisa o desenvolvimento do protótipo de BD, mais especificamente a fase inicial da modelagem de dados (modelagem conceitual), subsidiados por uma pesquisa bibliográfica sobre Representação Temática da Informação. O texto apresenta como resultados da pesquisa a determinação dos termos representativos aos materiais/documentos, por meio da TCF, na modelagem conceitual do protótipo de BD. Visa a organização e recuperação da informação na Instituição em pesquisa. Conclui-se que é possível adotar a TCF em ambientes digitais por meio da modelagem conceitual, além de apresentar uma estrutura de classificação facetada ilimitada, flexível e multidimensional.
Palavras-chave: Representação Temática da Informação. Teoria da Classificação Facetada de Ranganathan. Modelagem de Dados. Modelagem Conceitual.
1 INTRODUÇÃO A humanidade, ao longo de sua história, procura organizar o cotidiano, seja para atitudes correspondentes ao dia-dia, seja para o conhecimento adquirido e desejado. Para realizar esta organização, o homem procura classificar as coisas que estão à sua volta, a exemplo das informações que circulam por todos os lados, a todo o momento. Mesmo estando elas disponíveis em grande quantidade, o ser humano não capta todas as informações que o cercam; seleciona apenas o que considera necessário, permitindo assim a criação do que chamamos conhecimento. A importância de organizar o conhecimento, através de formas de classificação, ganha cada vez mais importância. Além das classificações adotadas diariamente, há muito tempo, estudos vêm sendo desenvolvidos com o intuito de promover formas e técnicas de classificação desse conhecimento elaborado pelo homem. Os sistemas de classificação desenvolvidos ao longo da história humana, passando pelas
GT2
540
filosóficas, depois bibliográficas até os esquemas de organização do conhecimento considerados mais modernos como Tesauros e Ontologias. Os sistemas de classificação dependem destes termos. Como exemplos de sistemas, citemos os mais usados no mundo, que são a Classificação Decimal de Dewey (CDD) e a Classificação Decimal Universal (CDU). Os métodos tradicionais de organização do conhecimento carecem de aperfeiçoamento. As informações contidas em ambientes digitais, principalmente na Web, encontram-se desorganizadas, dificultando à recuperação desejada; isso nos leva à ideia de que o problema não está propriamente nos dados recuperados, mas no processo anterior para isso utilizado, ou seja, na organização. Nesse sentido, em uma determinada Instituição 1 , mais especificamente no Setor Pedagógico, ocorria a inexistência, ou má organização, tanto dos mínimos materiais físicos, quanto dos criados digitalmente. A partir desta situação, nos foi solicitado, pela Direção da Instituição, a criação de um banco de dados (BD), em ambiente digital, a fim de alcançar o objetivo de organizar e recuperar as informações do respectivo setor.
Partindo da premissa de que o problema se encontrava na organização, estudos foram realizados para a escolha de um sistema de classificação que fosse incorporado ao protótipo de BD, através da modelagem de dados, ou seja, que atendesse às várias necessidades da organização do conhecimento, pertinentes tanto à Ciência da Informação (CI), quanto à Ciência da Computação (CC). Considerando esses aspectos, optamos pelo sistema de classificação facetada do indiano Shialy Rammarita Ranganathan (1897-1972), que foi foco na questão da organização. Também destacamos os estudos continuados, sobre a classificação facetada de Ranganathan, pelo londrino Classification Research Group (CRG), da escola de estudiosos como Campell, Coates, Farradane, Foskett, Milles, Vickery, Walford, entre outros. Conforme as teorias e aplicações dos antes mencionados, buscamos solucionar os problemas da Instituição X, respondendo a seguinte indagação, que representa a problematização do presente trabalho: De que modo a classificação facetada pode contribuir para organização do conhecimento registrado em BD, visando à recuperação da informação com maior valor agregado? A busca de respostas para essa questão motivou o presente estudo a investigar a possibilidade de aplicação da classificação facetada para organização do conhecimento, visando à recuperação da informação em banco de dados. Especificamente: queremos investigar a possibilidade de aplicabilidade da classificação facetada com a modelagem de dados em ambientes digitais. Calcado nas informações apresentadas, este trabalho apresenta a seguinte estrutura: no capítulo 1, contextualizamos o trabalho; no capítulo 2, abordamos a contribuição da CI, proposta sumarizada neste artigo, especialmente sobre a TCF de Ranganatham; no capítulo 3, delineamos o percurso metodológico que caracteriza a presente pesquisa; no capítulo 4, apresentamos as ações de aplicação da TCF na Modelagem Conceitual em BD, e, por fim, no capítulo 5, expomos as considerações finais e expectativas de estudos futuros.
1 Rotularemos, ao longo do trabalho, o campo da pesquisa de Instituição X.
GT2
541
2 A CIÊNCIA DA INFORMAÇÃO NO PROTÓTIPO DE BANCO DE DADOS Nos últimos tempos, como já enfatizamos, a informação ganha cada vez mais importância.
Essa importância se reflete diretamente nas tomadas de decisões das pessoas, principalmente a partir da globalização, que recentemente, tem provocado a eliminação de barreiras, quando se trata de acesso ao conhecimento, fato esse nitidamente marcado pelas Tecnologias da Informação (TIs). No protótipo de BD, a informação deve passar por um processo de representação, que objetiva torná-la compreensível
à linguagem dos usuários; para tal, são necessários meios, elementos, ou veículos que possibilitem o acesso a informação. Na CI, constatam-se definições que apresentam a representação como uma ação que visa
“permitir a recuperação de algo, no caso, a própria informação, [
aquilo que representa, algo que mantém informações sobre um domínio qualquer e de forma semântica” (FURGERI, 2006, p.26).
Destacamos outra definição, a de Novellino (1996, p.38), porque, para a autora, “a principal
característica do processo de representação da informação é a substituição de uma entidade linguística longa e complexa – o texto do documento – por sua descrição abreviada”. O ato de representar cria uma estrutura eficiente com fins de recuperação de informações. A partir do momento que as informações/documentos entram num sistema de informação, ou unidade de informação, estes passam por um tratamento, aliados a sentimentos: emoções, e razão, que estão relacionados ao cognitivo, visando facilitar a posterior recuperação do documentos. Cada documento possui características próprias representadas por meio da Representação Descritiva da Informação, e pela Representação Temática da Informação, que buscam a posterior Recuperação da Informação. Conforme Feitosa (2006), ambas constituem o Tratamento Intelectual da Informação e podem ser executadas em qualquer sistema de informação. As três ações supracitadas construíram os módulos do protótipo de BD, correspondendo à normas e características de cada elemento. No caso deste trabalho, destacaremos a Representação Temática da Informação, também chamada de análise da informação, ou simplesmente indexação; ela adota elementos simbólicos para a sua realização. Esta forma de representação se refere ao conteúdo informacional dos documentos e permite a identificação do tema, ou do assunto a que se refere, através das ações de indexação, elaboração de resumos, classificação, disseminação, busca e recuperação. Aliada a indexação, ao consultarmos definições sobre CI, é possível verificar a presença da organização dentre suas práticas. A organização do conhecimento tem como objetivo organizar
a informação, a fim de que ela seja recuperada. Entretanto, diante da problemática na quantidade
informacional crescente, ocorrem transformações/adaptações nas formas de organização existentes, além de exigir a criação de novos instrumentos. É exatamente esta percepção que foi adotada para
a construção do protótipo: visamos a adaptação de uma teoria de classificação, a ser apresentada na
uma vez que ela procura substituir
]
subseção 2.1, destinada a organizar o conhecimento, e, consequentemente, permitir a efetiva recuperação. Acompreensão do raciocínio aqui exposto fica ainda mais claro, quando retomamos o pensamento
GT2
542
de Berners-Lee (2001): ele defende que a organização é a ação mais importante nos processos de que envolvem a representação da informação. Sobre esta questão, Cesarino (1985 p.161-162) afirma que “grande parte das falhas [nos sistemas] se deve a erros ou omissões na interpretação do conteúdo dos documentos e na percepção da demanda das pessoas a que se destina o sistema”. Diante da colocação do autor e com ele concordando Berners-Lee (2001), afirma que o problema em questão é ocasionado por uma falha no processo de organização, que consequentemente, afeta o processo de recuperação da informação. Na próxima subseção apresentaremos a TCF de Ranganathan, considerada por estudiosos, como Ingwersen e Wormell (1992), um grande contribuinte do desenvolvimento dos SRIs; antes mesmo de sua construção, os princípios da organização do conhecimento, e da metodologia sobre análise facetada podem ser os elementos iniciais do processo de modelagem de uma estrutura cognitiva; isso parece ser relevante no trabalho de análise de uma determinada área do conhecimento, assim como realizamos no protótipo.
2.1 A Teoria da Classificação Facetada de Ranganathan
Até a primeira metade do século XX, vários teóricos haviam realizado estudos sobre sistemas de classificação bibliográfica. Dentre os referidos teóricos, destacamos Cutter, Dewey, Brow e Bliss. Eles receberam influência do século passado, e repetiram algumas teorias. Entretanto, um nome se destacou durante aquele período, especialmente nos estudos voltados a classificação de assunto. Esse nome foi Shiyali Ramamrita Ranganathan, considerado por muitos, nos círculos internacionais, como o precursor do método cientifico da Biblioteconomia. Por isso, é comum ouvir que Ranganathan é o pai da Biblioteconomia, e, conforme Dahlberg (1979), o pai da Moderna Teoria da Classificação. Ranganathan nasceu em 1892, numa pequena aldeia no sul da Índia. Morreu em 27 de setembro de 1972. Bacharel e Mestre em Matemática, dedicou-se a leitura das obras de W. C. Berwick Sayers, que mais tarde tornaria o seu mestre nos estudos biblioteconômicos. Após muitas leituras, e influências dos ensinamentos do seu mestre, Ranganathan partiu para uma revolução no delineamento dos sistemas de classificação da época, tema sedutor para sua mente “matemática”. A partir das leituras de Sayers, Ranganathan iniciou estudos sobre o sistema de classificação que causariam uma revolução à época. Iniciando sua enorme contribuição para os processos de organização/classificação da informação, foi influenciado pelas culturas brâmane, chinesa, além da astrologia, a quem creditava ideias abrangentes sobre o universo como um todo.
Em 1925, ao retornar a Índia, assumiu a direção da Biblioteca da Universidade de Madras e iniciou o desenvolvimento do sistema idealizado, sob o aspecto de uma classificação analítico-sintética: Colon Classification. Além disso, Ranganathan passou a defender a importância das bibliotecas em relação à educação do seu país. Ranganathan examinou o método da Decatomia, difundido por Kant, que representa a formação de assuntos em dez divisões, e “concluiu que, em vista do crescimento prolífico multidimensional, este método não era satisfatório” (LIMA, 2004, p.79).
Como solução, Ranganathan sugeriu a adoção da Policotomia Ilimitada, isto é, formação de assuntos com número ilimitado de divisões das áreas do conhecimento. Na necessidade de explicar como seria a sua formação de assuntos, Ranganathan buscou esclarecimentos na Árvore Baniana, que representa uma espécie de figura indiana, constituída de vários troncos secundários, formados de
GT2
543
tempos em tempos, adicionados ao tronco original, associando, desta forma, a uma árvore de assuntos (RANGANATHAN, 1967). Diante de todas as contribuições apresentadas por Ranganathan, sem dúvida, a obra de maior expressão foi a Colon Classification que, inclusive, tem sido objeto de vários estudos nos últimos tempos. Destacamos as teses das professoras Maria Luiza de Almeida Campos (2001) e Gercina Ângela Borém de O. Lima (2004). A Colon Classification, traduzida para o português como Classificação de Dois Pontos, também chamada de Classificação em Facetas, TCF, ou Classificação Analítico-Sintética, foi publicada pela primeira vez em 1933; provem da constatação de Ranganathan, quanto à rigidez dos sistemas de classificação do seu período, no caso, CDD e CDU. Compreendendo a necessidade de criação de um
sistema mais flexível, Ranganathan fez uso do método hipotético-dedutivo, no plano das ideias, verbal
e notacional.
Na TCF, o mapeamento do conhecimento é de grande importância, tanto para um determinado período específico, como para permitir a descoberta de conexões e analogias, entre diferentes campos do conhecimento, porque facilita a
recuperação a informação (SPEZIALI, 1973). A noção de facetas tem sido frequentemente apresentada como
a maior contribuição teórica da CI (MANIEZ, 1999), nos estudos sobre classificação, e tem inspirado vários estudos nas últimas décadas (MAS et al., 2008, p.3).
O diferencial da TCF é a utilização de uma estrutura dinâmica multidimensional, com a introdução do termo faceta, “que ficou sendo, nos modernos estudos sobre teoria da classificação, o substituto de característica” (BARBOSA, 1969, p.16).
Faceta é “um termo genérico usado para denotar algum componente, pode ser um assunto básico ou um isolado, de um assunto composto, tendo, ainda, a função de formar renques, termos e números” (RANGANATHAN, 1967, p.88). Barbosa (1972, p.75) define faceta “como uma lista de termos mantendo entre si as mesmas
amplas relações com a classe que lhes deu origem, ou então, ‘como um conjunto de termos produzidos pela aplicação de um amplo princípio de divisão’”. Miranda (2005, p.132) contribui para a discussão, ao citar a definição de faceta apresentada por Ranganathan na última publicação da Colon Classification: “um termo genérico usado para designar qualquer componente de um assunto composto”. As facetas subordinam-se a cinco itens, definidos por Ranganathan (1967, p.398) como Categorias Fundamentais, a saber: Personalidade,
estritamente no contexto da
disciplina de classificação. Nada têm a ver com seu emprego na Metafísica, ou na Física”. Personalidade [P] pode ser a essência de um determinado assunto, os objetos de estudo de uma determinada disciplina, tipos, entidades etc. Tipo de biblioteca, por exemplo, pode ser uma Personalidade da Biblioteconomia. Consideremos como manifestação da categoria Personalidade [P], as seguintes facetas:
“bibliotecas, números, equações, comprimentos de ondas de irradiação, obras de engenharia, substâncias químicas, organismos e órgãos, adubos, religiões, estilos de arte, línguas, grupos sociais,
Matéria, Energia, Espaço e Tempo (PMEST), Estes itens são usados “[
]
GT2
544
comunidades” (VICKERY, 1980, p.212). Matéria [M] representa manifestações, complementos, substâncias, que constituem as coisas, os objetos. Esta categoria é classificada em material e propriedade. Por exemplo, na Biblioteconomia, temos livros (material) raros (propriedade). Energia [E], ou ação é a manifestação de um verbo, de uma ação, como processos, técnicas,
atividades etc. Por exemplo, na Biblioteconomia, serviços como catalogação, indexação e classificação representam a categoria Energia. Espaço [S] é uma divisão geográfica, uma manifestação de lugar, onde ocorre determinado evento, como cidades, superfícies em geral entre outros. Exemplificando, temos a cidade Rio de Janeiro, para Biblioteconomia. Tempo [T] é uma divisão cronológica, uma manifestação de ideias em determinado tempo comum, como séculos, anos, meses, dias etc. Século XXI, para Biblioteconomia, é um exemplo da categoria em questão. Dos cinco postulados categóricos determinados por Ranganathan (1967), Personalidade [P] é definida como uma categoria indefinível. Para ele, é a mais importante categoria. É a que contém os termos que atribuem à classe a sua identidade no campo do conhecimento. Esta categoria “tem causado mais dificuldades e controvérsias do que qualquer outra categoria fundamental” (ANJOS, 2008, p.197). Tentando minimizar a problemática em discussão, Ranganathan (1967) expõe que, caso a manifestação não seja determinada como espaço, energia ou matéria, a mesma pode ser considerada como uma manifestação da categoria fundamental Personalidade [P]. A esta ação, Ranganathan intitula de métodos de resíduos. Silva e Neves (2010), ainda no contexto da Biblioteconomia, complementam as explicações sobre as categorias fundamentais, apresentando as seguintes facetas, respectivas a cada categoria:
|
[P] |
representa Personalidade (personality): bibliotecário; [M] representa Matéria (material): livro; |
|
[E] |
representa Energia (energy): classificação; [S] representa Espaço (space): biblioteca central; [T] |
representa Tempo (time): hoje. Das categorias do PMEST surgem as facetas. Segundo Ranganathan (1967), categorias são as classes mais gerais, que podem ser formadas e empregadas para reunir outros conceitos. Cada faceta é formada por um número mínimo de subdivisões, denominadas focos; cada uma é acompanhada por algarismos arábicos decimais, constituindo seu símbolo de classificação. Após a faceta principal, surgem os termos que, segundo Ranganathan (1967), são as representações verbais dos conceitos em uma linguagem natural. Com base nos termos e na necessidade de ramificações de seu assunto,
termos as subfacetas.
Ranganathan, além de determinar os elementos que caracterizam a TCF, em especial suas facetas, também estipulou cinco caminhos para a formação dos assuntos, e regras utilizadas para ordenar as facetas, e os elementos interiores de uma estrutura de classificação.
A Espiral do Método Científico possibilitou a Ranganathan medir o crescimento da Espiral
GT2
545
do desenvolvimento de novos assuntos, de maneira cíclica, identificando os estágios de Pesquisa Fundamental (fundamental research), Pesquisa Aplicada (applied research), Projeto Piloto (pilot project), Novo Mecanismo (new mechanism), Novo Material (new material), Novo Produto (new product), Utilização (utilisation) e Novos Problemas (new problems). Diante do Método Científico apresentado, Ranganathan determinou cinco modos de representação temática, considerados preliminares, para a formação de assuntos e isolados, a saber:
“Dissecação, Laminação, Desnudação, Reunião/Agregação e Superposição” (RANGANATHAN, 1967, p.351). A Dissecação (Dissecation) propõe dividir o universo em partes coordenadas em um mesmo nível quantas vezes for necessário, criando para cada parte o seu próprio universo. Cada uma dessas partes é chamada de Lâmina, a qual pode representar um assunto básico, ou um isolado. O modo da Laminação (Lamination) propõe-se a superposição de uma faceta com outra,
constituindo-se camadas de assuntos básicos e ideias isoladas. Além disso, as ideias isoladas quando combinados, formam assuntos compostos. Já a Desnudação (Desnudation), também chamada de Desfolhamento, provoca uma diminuição progressiva da extensão, e um aumento da profundidade de um assunto básico, ou de uma ideia isolada, permitindo a formação de cadeias, através de resultados sucessivos do caminho/ processo; pode representar o núcleo específico de um assunto básico, ou de uma ideia isolada. Esta
é a forma de representação temática a ser adotada no protótipo, porque a Instituição tem interesse de especificar, ao máximo, a informação, já que busca a precisão na recuperação da informação. Por sua vez, a Reunião/Agregação (Loose Assemblage) refere-se à combinação do assunto básico, ou composto com ideias isoladas, formando um assunto complexo, isto, uma ideia isolada complexa. Por fim, a Superposição (Superimposition), também chamada de Sobreposição, permite
a conexão de duas ou mais ideias isoladas, pertencentes ao mesmo universo de ideias isoladas. A
ideia isolada resultante desta superposição é chamada de ideia isolada superposta, ou ideia isolada composta. Este caminho é diferente do adotado pela Laminação, que permite a ligação entre isolados de universos diferentes. Entender esses caminhos, ou seja, o da transformação do assunto em documentos do sistema de classificação, “é fundamental, pois desta compreensão resultará a sua atuação nos processos de organização e recuperação de informação” (CAMPOS, 2001, p.66). Além disso, os assuntos poderão ser relacionados de maneira ilimitada e multidimensional. A estudiosa Mas et al. (2008, p.3) complementa ao afirmar que:
eficácia da classificação facetada é a sua capacidade de integrar diferentes dimensões
de análise sobre os objetos de informação, para caracterizar e tornar mais fácil o acesso a informação fornecendo múltiplos caminhos de navegação para qualquer documento.
] [
GT2
546
Determinados os assuntos, as facetas precisam ser organizadas no sistema de classificação. Neste sentido, Ranganathan criou uma série de Cânones e Princípios para organizar o conhecimento, e orientar na escolha da sequência de facetas, apresentados na terceira edição do Prolegomena to Library Classification, que tem como objetivo atingir o que ele mesmo denominou de Cânone da Sequência Útil. Os cânones a serem abordados neste trabalho serão os voltados ao plano das ideias, organizados em Características, Sucessão de Características, Renque de Classes, Cadeia de Classes e Sequência de Filiação. Cada um dos cânones apresentados possui subdivisões, conforme pode ser observado no quadro 1:
|
SEQÜÊNCIA |
||||
|
CARACTE- RÍSTICA |
SUCESSÃO DE CARACTERÍSTICAS |
RENQUE DE CLASSES |
CADEIA DE CLASSES |
DE FILIAÇÃO |
|
Diferenciação |
Concomitância |
Exaustividade |
Extensão |
Classes |
|
decrescente |
subordinadas |
|||
|
Classes |
||||
|
Relevância |
Sucessão relevante |
Exclusividade |
Modulação |
coordenadas |
|
Verificabilidade |
Sucessão consistente |
Seqüência útil |
x |
x |
|
Seqüência |
||||
|
Permanência |
X |
consistente |
x |
x |
Quadro 1: Cânones para o Trabalho no Plano das Ideias.
Fonte: Gomes, Motta e Campos (2006).
Após as informações apresentadas, podemos entender que a classificação facetada é um sistema de agrupamento por termos estruturados, por meio da análise de assunto. Diante desta análise, ocorre a identificação de facetas, ou seja, dos diferentes aspectos nele contidos, que oferecem as condições necessárias para a construção de uma estrutura organizacional, dispensando a necessidade de outros modelos. Desta forma, apresentaremos o caminho percorrido para realizar a pesquisa e quais foram às contribuições da TCF no desenvolvimento do protótipo de BD.
3 PERCURSO METODOLÓGICO Esta pesquisa visou aplicar as teorias da classificação da CI, em ambientes digitais, da CC. Trata-se de uma Pesquisa Aplicada, definida por Oliveira (2001, p.123) como um modelo de pesquisa
GT2
547
teorias ou leis mais amplas como ponto de partida, e tem como objetivo
pesquisar, comprovar ou rejeitar hipóteses sugeridas pelos modelos teóricos e fazer a sua aplicação às diferentes necessidades humanas”. Implica-se também uma Pesquisa Exploratória, porque, ainda
dada à descoberta de práticas ou diretrizes que precisam modificar-
se e na elaboração de alternativas que possam ser substituídas” (OLIVEIRA, 2001, p.134). Apesquisa postula maior familiaridade com o problema, visado torná-lo explícito, ou a construir hipóteses. Envolve levantamento bibliográfico, entrevistas com pessoas que tiveram experiências práticas com o problema pesquisado e análise de exemplos que estimulem a compreensão (GIL,
conforme o autor, a ênfase é “[
que necessita de “[
]
]
1994).
Na Instituição X, o trabalho concentrou-se no Setor Pedagógico, responsável pela coordenação dos cursos, além da aquisição e produção dos materiais didáticos. Diante da problemática na organização desses materiais, muitos foram adquiridos mais de uma vez, como livros e programas de computador. Em vários momentos, apostilas eram elaboradas também mais de uma vez, bastando mudar o professor, de determinado curso, para que uma nova apostila, com o mesmo conteúdo, diagramação etc., fosse elaborada. Diante da realidade do campo de pesquisa, este trabalho tratará do desenvolvimento de um protótipo de BD, intitulado Sistema Facetado, por meio da modelagem de dados. De acordo com Miranda (2005, p.72), “esta técnica consiste em se estabelecer um modelo de entrada e tratamento de dados a serem armazenados num sistema de informação”. Em outras palavras, “é um modo de estruturar logicamente as informações” (FURTADO; SANTOS, 1980, p.37). A modelagem de dados é constituída das etapas conceitual, lógica e física, sendo a primeira responsável pela adoção da TCF no Sistema Facetado. Os estudos sobre a TCF de Ranganathan constituiu um dos objetos privilegiados desta pesquisa por acreditarmos que realizar a distribuição da informação em facetas seria uma ação positiva, já que são inerentes ao assunto ou campo principal. De acordo com as palavras de Silva e Neves (2010, p.14-15), “no interior de cada faceta, os termos que as constituem estão aptos a novos agrupamentos pela aplicação de outras características ou classes divisionais, dando origem às facetas menores, que chamaremos de subfacetas”. A maior contribuição da CI para este estudo se deve à TCF, apresentando o nome sugestivo ao protótipo de BD. De fato, o que propiciou a escolha da TCF para este trabalho foi exatamente a flexibilidade, ou seja, a possibilidade de criar e recriar novos agrupamentos entre as facetas, sem alterar significativamente a estrutura de programação e relacionamentos das tabelas do BD. Contextualizado os elementos que constituem o Sistema Facetado, apresentaremos o resultado de sua construção, na próxima seção, conforme o nível inicial da modelagem de dados: modelagem conceitual.
4 APLICANDO A TCF NA MODELAGEM CONCEITUAL EM BANCO DE DADOS
GT2
548
O protótipo de BD promulgou a representação da realidade do Setor Pedagógico da Instituição
X, que necessitava recuperar informação. Para realizá-la, foi usada a modelagem conceitual, definida como “a representação abstrata e simplificada de um sistema real, com a qual se pode explicar, ou testar o seu comportamento, no todo ou em partes” (COUGO, 1997, p.7). Na modelagem conceitual não são levadas em consideração atribuições computacionais relacionadas à escolha, neste caso, do Sistema Gerenciador de Banco de Dados (SGBD), do Sistema de Banco de Dados (SBD) e do formato de estruturação do sistema. Neste momento, na tentativa de representar a realidade da Instituição X, a técnica de indexação e os estudos da TCF foram de
fundamental importância, já que, a partir dos subsídios da CI supracitados, os termos representativos da Instituição foram adquiridos conforme a indexação por extração e, em seguida, organizada no Sistema Facetado.
deve se
concentrar na observação dos fatos relevantes que ocorrem na realidade, com a finalidade de construir
um sistema que possa automatizar as necessidades de informação da mesma”. Tomando partido das compreensões dos autores, no protótipo deste trabalho, adaptamos a estrutura conceitual do Mapa Hipertextual (MHTX) criado por Lima (2004), em sua tese, acrescido de algumas ações, a saber: conversar com os possíveis usuários do sistema; compreender as atividades
realizadas pelos usuários na Instituição; identificação dos materiais pertencentes ao Setor Pedagógico; leitura técnica dos materiais para a extração dos termos representativos; análise facetada; organização de todos os termos selecionados e suas respectivas relações.
A análise facetada permitiu incorporar propriedades adicionais às informações, sejam elas
textuais ou multimídia, além de fornecer dados para a análise das categorias de dados presentes em ambientes digitais, como é o caso do protótipo de BD, afetando, assim, a sintaxe potencial do referido sistema. Porém, para adicionar novas propriedades a tais elementos e alterar a leitura da sintaxe do ambiente digital em discussão, foi necessário sua análise, a fim de levantar e definir a terminologia do assunto para que posteriormente os termos presentes no sistema fossem analisados e distribuídos em facetas. Na formação dos assuntos, dentre os métodos “Dissecação, Laminação, Desnudação, Reunião/Agregação e Superposição” (RANGANATHAN, 1967, p.351), apresentados na subseção 2.1, adotamos a Dissecação e a Desnudação, já que os termos extraídos da indexação foram mantidos na linguagem natural, ou seja, conforme são apresentados nos materiais, não passando pela tradução de qualquer vocabulário controlado. Além disso, também nos baseamos na proposta do MHTX criado por Lima (2004).
A Dissecação (Dissecation) permitiu dividir o universo dos materiais, e identificar que
“Educação Profissionalizante em Informática” era o assunto básico, também rotulado pela Instituição de “Capacitação Profissional”, ou “Capacitação Profissionalizante”.
O outro método utilizado, a Desnudação (Desnudation), também permitiu representar o núcleo
Segundo Machado e Abreu (1996, p.21), na modelagem conceitual, o analista “[
]
GT2
549
específico de um assunto básico, ou de uma ideia isolada dos materiais consultados. A Desnudação foi considerada o método mais importante para o sistema, pois a Instituição necessitava que a recuperação de informações fosse precisa, exigindo maior especificidade dos assuntos, de acordo com a exemplificação do quadro 2:
ASSUNTO BÁSICO
■ Cursos ■■ Curso Básico ■■■ Curso de Introdução a Microinformática
Quadro 2: Exemplo de Desnudação no Sistema Facetado.
Fonte: Dados da pesquisa (2011).
Para realizar os métodos apresentados, foi necessário executar algumas ações e, baseado nas orientações apresentadas por Lima (2004) em sua tese, adotamos a leitura minuciosa do documento; identificação dos conceitos representativos ao conteúdo semântico do documento; seleção dos termos mais relevantes ao assunto básico; seleção dos termos com um conteúdo semântico significativo; e representação natural dos conceitos selecionados, ou seja, não utilizando um vocabulário controlado. Apesar de as orientações serem construídas por Lima, com olhar nos hiperlinks, verificamos aplicação de ambas na modelagem conceitual no protótipo de BD, constituindo a primeira ação da CI utilizada no sistema: a indexação/análise facetada. Segundo esta ação de representação da informação, apresentamos uma parcela dos termos (quadro 3) necessários ao desenvolvimento de uma estrutura, chamada neste trabalho de Mapa Categorial do Sistema Facetado, contendo como classe geral Educação Profissionalizante em Informática.
|
Administrativo |
Manhã |
|
Aluno |
Modular |
|
Apostila |
Nivelamento |
|
Apresentação |
Palestras |
|
Artes |
Primeiro |
|
Cadastro |
Professor |
|
Capacitação |
Profissionais |
|
Cartões |
Propriedade |
|
CD-ROM |
Relatórios |
|
Cursos |
Segundo |
|
Documentos |
Semestre |
GT2
550
|
Internet |
Pedagógico |
|
Interdisciplinar |
Software |
|
Microinformática |
Tarde |
|
Laboratório |
Técnico |
|
Livro |
Turno |
Quadro 3: Lista de termos para o Sistema Facetado.
Fonte: Dados da pesquisa (2011).
Determinados os assuntos, estes precisavam ser organizados conforme suas características. A organização ocorreu segundo as cinco categorias fundamentais de Ranganathan (1967): Personalidade, Matéria, Energia, Espaço e Tempo (PMEST). Na figura 1, temos um trecho da organização estruturada pela categoria fundamental Tempo [T], segundo o plano notacional:
5. Tempo
a. Turno
i. Manhã
ii. Tarde
Noite
iii.
b. Semestre
i. Primeiro
ii. Segundo
Figura 1: Organização notacional estruturada pela categoria Tempo [T].
Fonte: Dados da pesquisa (2011).
O plano notacional fez parte da construção do sistema, contribui para a organização dos assuntos, entretanto, diante do seu acervo ser constituído em sua maioria por documentos digitais, sendo os impressos digitalizados futuramente, o Setor Pedagógico descartou a utilização da notação da Colon Classification, CDD ou CDU. A notação ocorrida foi adaptada conforme o citado setor, ou seja, a cada entrada, os documentos recebem um código chamado de ID 2 . Sendo assim, a notação, criada no módulo de classificação do sistema, é formada pelo símbolo do assunto, neste caso “INF”, por tratarmos exclusivamente de documentos dos cursos de informática, adicionado ao número de ID do documento cadastrado. Por exemplo, o livro “Introdução a Microinformática” foi o primeiro livro cadastrado, recebendo a “ID 1”. Ao associarmos a ID ao seu respectivo assunto, temos a notação resultante “INF1” e assim sucessivamente. Baseado no plano das ideias, complementamos a estrutura de organização do sistema adotando a proposta do CRG que usa no princípio das categorias fundamentais, categorias baseadas no
contexto do próprio assunto. Segundo Lima (2002, p.116), o CRG sugere “[
pode ser imposta mecanicamente ao assunto. Além disso, o CRG acredita que nenhuma lista deva
que nenhuma lista
]
2 ID: Identidade gerada pela numeração automática do sistema, conforme a entrada do material no protótipo.
GT2
551
ser necessariamente exaustiva ou aplicada a todos os assuntos”. Neste quesito, tal adoção foi muito importante para este trabalho, diante da contribuição dos aspectos que envolvem a passagem de uma organização estruturada notacional para uma estrutura sistemática de termos (figura 2).
5. Tempo
c. Curso da Manhã
d. Curso da Tarde
e. Curso da Noite
f. Primeiro Semestre
g. Segundo Semestre
Figura 2: Organização sistemática estruturada pela categoria Tempo [T].
Fonte: Dados da pesquisa (2011).
Entretanto, alguns conceitos receberam outras denominações para representar, de maneira mais fidedigna, a realidade do Setor Pedagógico. Assim, Personalidade [P] assumiu Tipologia; Matéria [M] assumiu Propriedade (qualidade) e Matéria (substância); Energia [E] assumiu Ação; Espaço [S] assumiu Lugar; e Tempo [T] manteve sua rotulação. Para a estrutura do sistema, as categorias e suas respectivas facetas precisavam de uma ordem de apresentação, ou seja, de uma Ordem de Citação, que é a ordem de aplicação dos princípios de divisão. O exemplo da figura 1, para ser apresentado desta maneira, foi estruturado segundo regras que objetivavam a Ordem de Citação deste trabalho. Ranganathan, para organizar o conhecimento e orientar na escolha da sequência de facetas, adotou como referência a Policotomia Ilimitada e a Árvore Baniana. Sua ordenação se deu pela criação de uma série de Canônes e Princípios, cujo objetivo é atingir o que ele mesmo denominou de Canône da Sequência Útil. Buscando adotar uma Sequência Útil para este trabalho, cinco regras, entre cânones e princípios foram seguidas: Cânone Cadeia de Classes: Extensão Decrescente; Princípio da Contiguidade Espacial; Cânone Renque de Classes: Seqüência Útil e Sequência Consistente; e Princípio da Seqüência Canônica. No Cânone Cadeia de Classes, aplicamos a regra Extensão Decrescente, que apresenta a classe geral antes das específicas. No sistema, observamos o aprofundamento em uma das sequências da categoria Personalidade [P], iniciando no mais geral “Profissionais”, passando por “Professor” e decrescendo até o mais específico “Professor de Informática”. A segunda regra adotada para organizar a sequência de facetas foi Princípio do Posterior-na- Evolução, que segue a organização de conceitos ligados a processos evolutivos. Esta regra pode ser observada em uma sequência da categoria Matéria [M], no foco “Nivelamento”, ao exigir que o aluno seja aprovado em diferentes módulos para adquirir conhecimentos aprofundados de determinado curso: Básico, Intermediário e Avançado. No Cânone Renque de Classes, adotamos a regra Seqüência Útil, já que seguimos sequências
GT2
552
de classes consideradas úteis aos propósitos da classificação das informações no sistema. Como exemplo, temos, na categoria Personalidade [P], no foco “Documentos”, uma sequência de renques
iniciada por “Administrativo” e na especificação “Cadastro de Professor” e “Cadastro de Aluno”. Esta
é uma sequência útil para o sistema, baseada nas atividades realizadas na Instituição em pesquisa. Ainda no Cânone Renque de Classes, adotamos também a regra Sequência Consistente,
porque pode ocorrer de conceitos iguais surgirem em mais de um ponto da estrutura de classificação, exigindo que todos tenham a mesma ordenação. Na categoria Personalidade [P], foco “Documentos”, temos em “Ensino”, uma sequência de facetas formada por “Apostila”, “Livro” e “CD-ROM”. Já na categoria Matéria [M], foco “Por Matéria (substância)”, temos a mesma sequência formada por “Apostila”, “Livro” e “CD-ROM”. Na primeira categoria, a sequência refere-se à tipologia de documentos utilizados no “Ensino”; na segunda categoria, a sequência está associada à substância que formam os materiais: como papel e plástico. Outra regra seguida foi o Princípio da Seqüência Canônica, que consagra a tradição, ou seja, a ordem mais conhecida comumente por todos os que usam o sistema. Neste caso, na categoria Tempo [T]; para o foco “Turno”, compreendemos que a sequência conhecida por todos é “Manhã”, “Tarde”
e “Noite”. Definida a modelagem conceitual, em outro trabalho será apresentada a representação da modelagem lógica e física, em cujas etapas da modelagem de dados, as informações deverão ser organizadas e relacionadas como subsídios para a implementação do Sistema Facetado no Setor Pedagógico.
5 CONSIDERAÇÕES FINAIS Ao longo do presente trabalho, foi possível perceber a importância da organização para a efetiva recuperação da informação. Para muitos, o problema dos resultados de busca se refere às ferramentas de busca, ou ao excesso de informações. Entretanto, buscando autores que defendem outra perspectiva, nos baseamos naqueles que asseveram que o problema se encontra na organização, ou seja, como as coisas, e os objetos são classificados. Nas aplicações desenvolvidas pelos profissionais de Ciência da Computação (CC) e áreas afins, é nítida a não preocupação com os elementos que estão por trás da interface, por trás da máscara do sistema visualizada pelos usuários. Em várias discussões e fóruns, verificamos a preocupação pelo desenvolvimento de ferramentas de busca cada vez melhores, em plataformas que ofereçam um visual deslumbrante e amigável.
Baseado nos estudos teóricos buscou-se discutir o que se encontra por trás da interface do sistema, ou seja, a organização/classificação, preocupação esta respalda na Ciência da Informação (CI). O que propormos a fazer é o chamado “trabalho sujo”, isto é, um trabalho que exige ter conhecimento sobre representações e sistemas de classificação.
GT2
553
ACI nos ofereceu os elementos necessários para a construção de um sistema para a catalogação, classificação e, por fim, recuperação dos materiais do Setor Pedagógico da Instituição X. Neste certame, ao longo dos estudos para a definição dos métodos de organização do conhecimento a serem usados, identificamos a necessidade de aperfeiçoamento dos métodos tradicionais, especialmente quando falamos da Web, onde as informações encontram-se desorganizadas. Foi exatamente esta constatação que nos levou a crer que o problema não está na recuperação, mas no processo de organização. Nas práticas da CI, enraizadas na Biblioteconomia, mais especificamente nas bibliotecas tradicionais, encontramos sistemas de classificação chamados bibliográficos, originalmente criados e usados em coleções de livros. Entretanto, características desses sistemas, como a organicidade de assuntos e as relações entre eles são plausíveis de aplicação em ambientes digitais. Adotamos a Teoria da Classificação Facetada (TCF), do matemático e indiano Shiyali Ramamrita Ranganathan (1892- 1972), complementada pelo princípio das categorias fundamentais, proposta pelo Classification Research Group (CRG). Após os devidos estudos, ambos foram inseridos em um ambiente digital, neste caso, um protótipo de Banco de Dados (BD). Ao longo da idealização do sistema, muitas foram às semelhanças encontradas. Dentre elas, percebemos que, assim como na classificação facetada, os sistemas computacionais por modelagem de dados, em BD, também objetivam a estruturação do conhecimento, através da organização de seus conceitos e da criação de relacionamentos entre eles, permitindo o mapeamento de uma área de assunto e a inclusão de novos conceitos, sem alterar a estrutura do sistema. Segundo as semelhanças entre a TCF de Ranganathan e os BDs, foi iniciado o desenvolvimento de um Sistema de Banco de Dados (SBD). Este protótipo de BD, que intitulamos Sistema Facetado, tem como objetivo solucionar problemas, tipo: produção/confecção da mesma apostila várias vezes, e a não localização de suportes como fitas VHS, CDs etc., devido à inexistência, ou má organização ali presente, tanto nos mínimos materiais físicos, como nos criados digitalmente.
Concluída a aplicação da TCF no Sistema Facetado, por meio da modelagem conceitual, constatamos que a análise de determinado assunto por facetas (PMEST), significou que o mesmo era visualizado pelas manifestações das características, ou facetas a ele atribuídas, assunto que, no caso deste trabalho, chamamos de conceitos. Estas manifestações foram muito importantes, pois o Sistema Facetado tornou-se multidimensional e ilimitado, representados pelas facetas e organizadas por categorias, ou seja, uma lista de conceitos, hierarquizados igualmente aos seus respectivos assuntos gerais, refletindo a aplicação de um princípio básico de divisão. Muitas foram às contribuições da TCF para o Sistema Facetado, o que comprova sua aplicação em ambientes digitais. Com isso, desejamos o surgimento de mais estudos sobre esta temática, além de acreditar que o presente trabalho inspire aqueles que decidam enveredar por esse caminho, assim como decidi, graças às leituras encorajadoras das Teses das professoras Maria Luíza de Almeida
GT2
554
Campos e Gercina Ângela Borém de O. Lima. O Sistema Facetado é um protótipo. Muito resta ainda a fazer. Este trabalho apresentou parte da modelagem de dados: a modelagem conceitual. Em outro momento apresentaremos a modelagem lógica, e física, além do Sistema Facetado em funcionamento. Ainda faz-se necessário salientar:
expandiremos o uso do sistema para os materiais dos demais cursos oferecidos pela Instituição.
Abstract: The present study focalizes Ranganathan’s Theory of Faceted Classification (TFC) as possibility of knowledge structuring through the organization of concepts and relationships creation in a environment of Database (DB). Contributions of Information Science (IS) for the research by defend the importance of organization for effective information retrieval is discussed: descriptive and thematic representation of information. The five categories established by Ranganathan and facets in this system called PMEST are cited: Person, Material, Energy, Space and Time. From an applied and exploratory research, the object is to investigate the possibility of applying the faceted classification to knowledge organization, looking for information retrieval in the database. More specifically, we also want to check the applicability of faceted classification with data modeling in digital environments. Use as the development stage of the research prototype database, specifically the initial phase of data modeling (conceptual modeling), subsidized by a literature search on Thematic Representation of Information. Presents as search results the determination of the terms representing the materials/ documents, through the TFC in conceptual modeling of the prototype database, searching the organizing and retrieving information in the institution researched. We conclude that it is possible to adopt the TFC in digital environments and that this action may be taken by the conceptual model, featuring a faceted classification structure unlimited, flexible, and multidimensional.
Keywords: Thematic Representation. Ranganathan’s Theory of Faceted Classification. Data Modeling. Conceptual Modeling.
REFERÊNCIAS
ANJOS, L. dos. Sistemas de classificação do conhecimento na Filosofia e na Biblioteconomia:
uma visão histórico-conceitual crítica com enfoque nos conceitos de classe, de categoria e de faceta. São Paulo, 2008. 290f. Tese (Doutorado em Ciência da Informação) – Curso de Pós Graduação em Ciência da Informação – Escola de Comunicações e Artes, Universidade de São Paulo, São Paulo,
2008.
BARBOSA, A. P. Classificações facetadas. Ci. Inf . Rio de Janeiro, v.1, n. 2, p. 73-81, 1972. Disponível em: <revista.ibict.br/index.php/ciinf/article/download/1665/1271>. Acesso em 11 jan. 2010.
Teoria e prática dos sistemas de classificação bibliográfica. Rio de Janeiro: Instituto Brasileiro de Bibliografia e Documentação, 1969.
BERNERS-LEE, T.; HENDLER, J.; LASSILA, O. The semantic WEB. Scientific American, New York, v. 284, n. 5, p.35-43, may 2001. Disponível em: <http://www.scientifi camerican.com/2001/0501issue/0501bernerslee.html>. Acesso em: 12 jan. 2010.
CAMPOS, M. L. A. A organização de unidades do conhecimento em hiperdocumentos: o modelo conceitual como um espaço comunicacional para realização da autoria. 2001. 190f. Tese (Doutorado em Ciência da Informação) - CNPq/IBICT-URFJ/ECO, Rio de janeiro, 2001.
GT2
555
CESARINO, M. A. da N. Sistemas de recuperação da informação. Revista da Escola de Biblioteconomia da UFMG. v. 14, n. 2, p.157-68, set. 1985. Disponível em: <http://portaldeperiodicos. eci.ufmg.br/reb/>. Acesso em: 29 jan. 2010.
COUGO, P. Modelagem conceitual e projeto de banco de dados . Rio de Janeiro: Campus, 1997.
DUARTE, E. A.; CERQUEIRA, R. F. P. de. Análise Facetada: um olhar face a modelagem conceitual. Revista Digital de Biblioteconomia e Ciência da Informação, Campinas, v. 4, n. 2, p. 39-52, jan./ jun. 2007. Disponível em: <http://www.sbu.unicamp.br/seer/ojs/index.php/ sbu_rci/article/viewFile/339/221>. Acesso em: 02 jan. 2010.
FURGERI, S. Representação de informação e conhecimento: estudo das diferentes abordagens entre a ciência da informação e a ciência da computação. Campinas: PUC-Campinas, 2006.
FURTADO, A. L.; SANTOS, C. S. dos. Organização de Banco de Dados. 2. ed. Rio de Janeiro:
Campus, 1980.
GIL, A, C. Métodos e técnicas de pesquisa social. 4. ed. São Paulo: Atlas, 1994.
GOMES, H. E.; MOTTA, D. F. da; CAMPOS, M. L. de A. Revisitando Ranganathan: a classificação na rede. 2006. Disponível em: <http://www.conexaorio.com/biti/revisitando/revi sitando.htm#canones>. Acesso em: 10 jan. 2011.
INGWERSEN, P.; WORMELL, I. Ranganathan in the perspective of advance information retrieval. Libri, v. 42, n. 3, p.184-201, jul./set. 1992.
LIMA, G. A. B. A análise facetada na modelagem conceitual de sistemas de hipertexto: uma revisão de literatura. Perspectiva em Ciência da Informação. Belo Horizonte, v. 7, n. 2, p. 189-196, jul./ dez. 2002. Disponível em: <portaldeperiodicos.eci.ufmg.br/index.php/pci/article /view/407/219>. Acesso em 20 jan. 2010.
Mapa Hipertextual (MHTX): um modelo para organização hipertextual de documentos. 2004, 199f. Tese (doutorado em Ciência da Informação). Curso de Pós Graduação em Ciência da
Informação – Escola de Ciência da Informação, Universidade Federal de Minas Gerais, Minas Gerais,
2004.
MACHADO, F.; ABREU, M. Projeto de Banco de Dados: uma visão prática. 11. ed. São Paulo:
Editora Érica, 1996.
MANIEZ, J. Des classifications aux thésaurus: du bon usage des facettes. Documentaliste - Sciences de l’information, v. 36, n. 4-5, p.249-262, 1999. Disponível em: <http://www.adbs.fr/des-
classifications-aux-thesaurus-du-bon-usage-des-facettes-13338.htm?
RH=REVUE>. Acesso em: 12 jan. 2011.
MAS, S. [et al.]. Classification à facettes et modèles à base de points de vue: Différences et
complémentarité. 36e congrès annuel de ACSI: University of British Columbia, Vancouver, 5-7 jun. 2008. Disponível em: <http://www.caisacsi.ca/proceedings/2008/mas_2008.pdf>. Acesso em: 24 out.
2010.
MIRANDA, M. L. C. de. Organização e Representação do Conhecimento: fundamentos teórico- metodológico na busca e recuperação da informação em ambientes virtuais. 2005, 353f. Tese (Doutorado em Ciência da Informação). Curso de Pós Graduação em Ciência da Informação –
GT2
556
Convênio CNPQ/IBICT – UFRJ/ECO, Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2005.
OLIVEIRA, S. L. de. Tratado de Metodologia Científica: Projetos de Pesquisas, TGI, TCC, Monografias, Dissertações e Teses. São Paulo: Pioneira, 2001.
RANGANATHAN, S. R. Prolegomena to library classification. Bombay: Asia Publ. House, 1967.
SILVA, M. B. da. NEVES, D. A. de B. Estudo sobre o uso da teoria da classificação facetada em banco de dados. XI Encontro Nacional de Pesquisa em Ciência da Informação (ENANCIB), Rio de Janeiro, 25-28 de outubro de 2010. Anais. Disponível em: <http://congresso.ibict.br/index.php/ enancib/xienancib>. Acesso em: 05 jan. 2011.
SPEZIALI, P. Classifications of the sciences. DICTIONARY of the history of ideas . New York:
Scribners, 1973. p. 462-467.
VICKERY, B. C. Classificação e indexação nas ciências. Rio de Janeiro: BNG/Brasilart, 1980.
GT2
557
COMUNICAÇÃO
ORAL
IDENTIFICAÇÃO ARQUIVÍSTICA: SUBSÍDIOS PARA A CONSTRUÇÃO TEÓRICA DA METODOLOGIA NA PERSPECTIVA DA TRADIÇÃO BRASILEIRA
Resumo
Ana Celia Rodrigues
A identificação é uma tarefa de pesquisa sobre a gênese do documento de arquivo, desenvolvida no
início do tratamento documental para definir requisitos normalizados de planejamento das funções
que sustentam o tratamento técnico documental, seja no momento da produção ou da acumulação (produção, classificação, avaliação e descrição). Esta pesquisa tem por objetivo lançar bases teóricas para caracterizar a identificação como função independente no âmbito da metodologia arquivística, sistematizando-a na perspectiva da tradição arquivística brasileira. Nesse sentido, aliará uma dimensão teórica a uma dimensão aplicada. Do ponto de vista teórico, busca-se especificamente analisar a dimensão conceitual da identificação no contexto das metodologias arquivísticas e sistematizar seus procedimentos, servindo como referencial metodológico para a realização de praticas arquivísticas desenvolvidas no Brasil. Na dimensão aplicada, tem por objetivo desenvolver estudos de caso de identificação arquivística no âmbito de programas de gestão de documentos e tratamento de massas documentais acumuladas em arquivos, verificando a aplicabilidade dos princípios teóricos
e metodológicos da identificação. Como estudo de caso de identificação vem sendo desenvolvido
o projeto de pesquisa “Identificação arquivística: utilizando a diplomática contemporânea como fundamento metodológico no Programa de Gestão de Documentos do Governo do Rio de Janeiro”, projeto financiado pelo Programa Jovem Pesquisador UFF 2009. Neste estudo, são aplicados os
parâmetros da diplomática contemporânea para a identificação da tipologia documental, objetivando
|
a |
normalização de procedimentos para classificar e avaliar os documentos das Secretarias de Fazenda |
|
e |
de Planejamento do Governo do Estado do Rio de Janeiro no âmbito do Projeto de Gestão de |
Documentos (PGD), através de parceria institucional estabelecida entre o Arquivo Público do Estado
/ Casa Civil do Governo do Estado do Rio de Janeiro e a Universidade Federal Fluminense. Recortes temáticos dessa pesquisa vêm sendo abordados no âmbito de projetos de TTC em Arquivologia, PIBIC
e do Mestrado em Ciência da Informação da UFF, integrando a produção do Grupo de Pesquisas
“Gênese Documental Arquivística”, UFF/CNPq. Palavras-chave: Arquivística. Metodologia Arquivística. Identificação Arquivística. Tipologia Documental. Diplomática Contemporânea.
Abstract Identification is a task of research on the genesis of the record developed at the beginning of the documentary to set standard requirements of the planning functions that support the technical processing of documents, either at the production or accumulation (production, classification, evaluation and description). This research aims to launch a theoretical basis for identifying and characterizing the independent function within the archival methodology, systematizing it in the perspective of the
GT2
558
archival tradition in Brazil. In this sense, an allied theoretical dimension to a dimension applied. From the theoretical point of view, we seek to specifically examine the conceptual dimension of identification in the context of archival methodologies and systematize its procedures, serving as a methodological framework for conducting archival practices developed in Brazil. Dimension in applied, aims to develop case studies of identification in the context of archival programs, document management and mass treatment of documents accumulated in files, checking the applicability of the theoretical and methodological principles of identification. As a case study has been developed to identify the research project “Archival Identification: Using the contemporary diplomatic and methodological foundation in the Document Management Program of the Government of Rio de Janeiro”, a project funded by the Young Investigator 2009 UFF. In this study, we applied the parameters of contemporary diplomatic to identify the document type, aiming at standardization of procedures for classifying and evaluating the documents of the Secretaries of Finance and Planning of the State Government of Rio de Janeiro under the Project Management Documents through an institutional partnership established between the Public Archives of State / Government of the Civil House of the State of Rio de Janeiro and Fluminense Federal University. Scraps theme of this research have been addressed in the context of projects in Archival TTC, PIBIC and the Masters in Information Science from the UFF, integrating the production of the Research Group “Genesis Document Archival,” UFF / CNPq. Keywords: Archival. Archival methodology. Archival Identification. Typology documentary. Diplomatic contemporary.
Introdução A aparição do termo identificação na literatura arquivística remonta aos anos 80, como resultado de experiências metodológicas desenvolvidas por grupos de arquivistas que se formaram em países ibero-americanos para solucionar problemas de acumulação de documentos em arquivos, contexto em que se inserem as práticas espanholas e brasileiras, nosso objeto de estudos. Na Espanha, nos anos 90, o conceito foi incorporado pelo Diccionário de Terminologia Archivística, resultando na publicação de artigos e manuais especializados. No Brasil, o conceito aparece no Dicionário Brasileiro de Terminologia Arquivistica, publicado em 2005. Ambos se referem à identificação como fase do processamento técnico, de tipo intelectual, que tem por objeto de estudos o órgão produtor e os documentos gerados no exercício de suas atividades. O conhecimento produzido nesta fase de pesquisa fica registrado em instrumentos específicos e fundamentam o desenvolvimento das funções de planejamento da produção, classificação, avaliação e descrição de documentos de arquivo. Muitas inovações nos métodos de trabalho arquivístico apareceram no período como resultado das experiências desenvolvidas. Os processos de identificação, seu objeto e metodologia foram alvo de debates em reuniões profissionais e mereceram a atenção de pesquisadores da área, por praticamente uma década. As experiências realizadas no âmbito de sistemas de arquivos na Espanha geraram estudos teóricos e aplicações práticas que acabaram destacando o país no panorama arquivístico internacional. Na Espanha, as discussões sobre a normalização dos processos de identificação de documentos de arquivo, para o controle da acumulação ou planejamento da gestão, abriram perspectivas que influenciaram a arquivística ibero-americana e, neste contexto, a do Brasil.
GT2
559
Identificação como pesquisa científica em arquivística
A identificação é uma tarefa de pesquisa sobre a gênese do documento de arquivo, desenvolvida
no início do tratamento documental para definir requisitos normalizados de planejamento das funções que sustentam o tratamento técnico documental, seja no momento da produção ou da acumulação (planejamento da produção, classificação, avaliação e descrição). No âmbito da gestão documental a pesquisa discute especialmente a identificação de documentos desenvolvidos nos parâmetros da diplomática contemporânea (ou tipologia documental) como base para a padronização de tipologias para produção de documentos e funcionamento de sistemas de gerenciamento eletrônico de documentos (GED). Esta pesquisa requer a busca de informações, em fontes especificas, sobre o órgão produtor (contexto) e os documentos (tipologia documental), seja em fase de produção e/ou acumulação, “elementos que caracterizam este contexto, no desempenho de competências e funções específicas deste órgão produtor e da tipologia documental, que registra os procedimentos administrativos realizados para cumpri-las” (CARMONA MENDO, 2004, p. 40).
Esta fase da metodologia arquivística denominada identificação, consiste em estudar analiticamente o documento de arquivo e os vínculos que mantém com o órgão que o produziu, seja em fase de produção ou de acumulação. Neste sentido, é um trabalho de pesquisa e de crítica sobre a gênese documental.
O documento de arquivo é produzido de forma involuntária, criado no decurso de uma atividade. É o resíduo material da ação que lhe dá origem. É a própria ação “autodocumentada”, como o define Menne-Haritz (1998). “Uma ação é qualquer exercício de vontade que objetiva criar, mudar, manter ou extinguir situações”, e constitui o núcleo do documento, ressalta Heather MacNeil (2000, p. 93). Desta característica essencial, inerente a sua gênese, decorre sua natureza probatória. A identidade do documento de arquivo se mostra através dos elementos que o integram: sua estrutura e substância. Estão representadas através de regras, que contém elementos intrínsecos e extrínsecos. Estes caracteres são estudados do ponto de vista da diplomática e também da arquivística, por autores como Luciana Duranti, Schellenberg e Vicenta Cortés Alonso, entre outros. Esta capacidade de provar o fato que lhe dá origem é resultado da especial relação que o documento possui com o órgão que o produz, o vinculo que se revela no conteúdo pela atividade registrada, que constitui o núcleo de sua identidade. O vínculo arquivístico, tão bem discutido por Luciana Duranti (1997), é o componente essencial do documento de arquivo, que revela sua verdadeira natureza, que determina sua identidade, pois é definido pela sua ligação com o órgão produtor.
O procedimento da identificação é realizado a partir de um conjunto de atividades integradas,
com uma unidade metodológica e desenvolvidas na seguinte ordem: primeiro identifica-se o “organismo produtor (evolução orgânica e competências administrativas), elemento funcional (competências,
GT2
560
funções e atividades), tipo documental (procedimento administrativo e trâmite) e delimitação da série documental” (TORRE MERINO; MARTÍN-PALOMINO, 2000, p.14).
Assim, a pesquisa é realizada em duas etapas e consiste na:
1. Identificação do órgão produtor: contexto onde os documentos de arquivo são produzidos.
a) Elemento orgânico: órgão produtor dos documentos. b) Elemento funcional: representado pelas funções e atividades administrativas desempenhada pelo órgão, em virtude da competência que tem a seu cargo e que compõe a serie documental. (MOLINA NORTES; LEYVA PALMA, 1996, p.158) 2. Identificação do tipo e delimitação da série documental: levantamento de informações sobre os elementos que caracterizam os documentos de arquivo, o tipo documental. Momento em que se estudam os caracteres internos e externos dos documentos, elementos de identidade que se refere a sua estrutura física (gênero, suporte, formato e forma) e ao seu conteúdo (função, atividade), para denominar o tipo e a série documental. A série documental constitui o objeto de estudo da arquivística e sobre ela versa toda proposta de tratamento técnico. Os dados obtidos são registrados em instrumentos próprios de cada etapa que fornecem os parâmetros teóricos para as análises que serão realizadas nas outras fases da metodologia arquivística, ou seja, avaliação, organização e descrição.
A identificação pode ser desenvolvida durante todas as fases do ciclo de vida dos documentos, podendo, portanto, incidir sobre o momento de sua produção, para efeito de implantação de programas de gestão de documentos, ou no momento de sua acumulação, para controlar fundos transferidos ou recolhidos aos arquivos, no âmbito dos sistemas de arquivo. No âmbito dos processos de identificação interessa verificar como a identificação de tipologias documentais esta relacionada com as atuais discussões em torno da teoria e da metodologia da diplomática.
É também nestes anos 80, a partir dos modernos estudos arquivísticos que a diplomática ressurge, “reinventada”, para alguns, ou “adaptada”, para outros, com o objetivo de aplicar os princípios teóricos e metodológicos aos documentos de arquivo.
A Diplomática é uma metodologia analítica de investigação que não se fixa preliminarmente no conhecimento dos órgãos produtores, mas nos procedimentos administrativos de criação dos documentos, sem desconsiderar, entretanto, as estruturas organizacionais e a competências a elas atribuídas. O estudo do documento é tomado como referencia, porque ele “fala por si mesmo”, refletindo as relações expressas entre a forma documental e o contexto administrativo de sua produção, conhecimento que fundamenta o desenvolvimento das funções arquivísticas em qualquer momento do ciclo de vida documental.
Paola Carucci define a diplomática como a “disciplina que estuda o documento singular ou,
GT2
561
se preferirmos, a unidade arquivística elementar, o documento, mas também o arquivo, o registro, analisando, sobretudo, os aspectos formais para definir a natureza jurídica dos atos, tanto na sua formação quanto nos seus efeitos”. A análise diplomática do documento associa-se, portanto ao “conhecimento dos modos nos quais se forma a vontade expressa no ato jurídico e o conhecimento da forma na qual o ato se manifesta, isto é, das características próprias do documento em cujo ato é representado” (CARUCCI, 1987, p. 27).Aautora ressalta que os requisitos para os estudos diplomáticos que foram identificados na critica os documentos medievais continuam válidos para a diplomática dos documentos modernos e contemporâneos, sobretudo agora que no ambiente eletrônico exige a identificação do documento arquivístico no interior do sistema de informação (CARUCCI, 1994, p.
65).
No Canadá, Luciana Duranti examina os princípios e conceitos desenvolvidos pelos teóricos diplomatistas para avaliar a autenticidade de documentos medievais, verificando se poderiam ser adaptados para analisar documentos produzidos pela burocracia moderna. O foco de sua preocupação teórica é a aplicação do método diplomático para o planejamento da produção dos documentos eletrônicos e a análise do valor probatório que eles apresentam. A autora a qualifica como diplomática arquivística, disciplina que “estuda o que é, e o que vem a ser os documentos, a relação estabelecida com o seu produtor e os fatos neles representados”, conceituando-a como “estudo das formas e dos processos de formação dos documentos de arquivo” (DURANTI, 1995, p.1). Nestes anos 80 a Espanha também se destaca no movimento de renovação teórica da diplomática, produzindo importantes estudos teóricos e de diplomática especial aplicados aos documentos administrativos, contexto no qual se destacam as contribuições Manuel Romero Tallafigo, Antonia Heredia Herrera, Vicenta Cortés e do Grupo de Trabalho dos Arquivistas Municipais de Madri, preocupados por definir o que entendemos por documento de arquivo e em identificar as partes que o integram, elencando seus caracteres internos e externos. Vicenta Cortés Alonso coordenou o Grupo de Arquivistas Municipais de Madri, pioneiro em aplicar a metodologia para a identificação de tipologias de documentos públicos para a realização de tarefas arquivísticas. O grupo inova ao aplicar a perspectiva genético-comparativa preconizada pela diplomática clássica, para identificar as séries acumuladas em arquivos e a partir da comparação com as atuais, normalizar as séries documentais para efeitos de tratamento arquivístico. A partir destes resultados inicia-se um movimento de formação de grupos de trabalhos na área. Outras iniciativas foram surgindo, adaptando o modelo às circunstancias e especificidades das administrações estudadas. No Brasil os textos publicados por Heloísa Liberalli Bellotto (1982 e 1990) são considerados como referencial teórico sobre tipologia documental e os conceitos abordados pela autora, foram incorporados à literatura arquivística e à prática desenvolvida nos arquivos do país. Esta autora traz para os estudos diplomáticos, a diferença entre espécie documental e tipo documental, o que não tinha sido abordado antes por outros autores. Esta diferença foi aplicada metodologicamente, nos trabalhos preparatórios de instrumentos de gestão, tais como as tabelas de temporalidade do Sistema
GT2
562
de Arquivos da USP, do Governo do Estado de São Paulo, do Arquivo Público Municipal de Campo Belo, com êxito e atualmente vem sendo aplicada como metodologia básica para o Programa de Gestão de Documentos do Governo do Estado do Rio de Janeiro, sob nossa orientação. A identificação, enquanto pesquisa realizada sobre os documentos de arquivo é efetuada com metodologia preconizada pela diplomática contemporânea, que confere ao trabalho arquivístico a dimensão da qualidade científica.
A construção do termo e do conceito de identificação Na década de 80, o problema comum compartilhado pela arquivística ibero-americana era a acumulação de documentos em depósitos de arquivos. Produto das experiências desenvolvidas em arquivos dos países envolvidos, o conceito de identificação e o método analítico que o sustenta foram construídos no interior do Grupo Ibero-Americano de Tratamento de Arquivos Administrativos, do qual participavam Espanha, Portugal, Brasil, México e Colômbia. O grupo estabelece as bases metodológicas da identificação e formula o conceito, caracterizando-a como fase independente no âmbito das metodologias arquivísticas, “antecedendo a avaliação e, ambas prévias a descrição no tratamento de fundos” (CONDE VILLAVERDE, 1991, p.17-18).
Este enfoque sob a metodologia da identificação vista como função independente no âmbito do processamento técnico, marcou a arquivística de países ibero-americanos. Pode-se verificar a influência desta corrente nos dicionários de terminologia arquivística e nas concepções de manuais de normas e procedimentos para a classificação e avaliação, publicados em 2004 pelos arquivos nacionais do México e Colômbia, para citar alguns exemplos.
Na Espanha, José Luís La Torre Merino e Mercedes Martín-Palomino y Benito, no manual “Metodología para la identificación y valoración de fondos documentales”, publicado em 2000, pela Escuela Iberoamericana de Archivos, em Alcalá Henares, sintetizam esta perspectiva ao afirmarem que “esta metodologia não significa uma mudança na tradição arquivística espanhola, senão a individualização e sistematização de uma série de tarefas, entre elas a identificação e avaliação de fundos documentais” (p.11, grifo nosso). Em 1992, Maria Luisa Conde Villaverde, lança as bases do conceito, afirmando que se entende por identificação a “fase do tratamento arquivístico que consiste na investigação e sistematização das categorias administrativas e arquivísticas em que se sustenta a estrutura de um fundo” (CONDE VILLAVERDE, 1991, p.18) e em 1993, esta definição é incorporada pelo Diccionario de Terminologia Arquivística espanhol (p.37). Entretanto, a aparição do termo identificação na literatura arquivística espanhola, num primeiro momento deu lugar a alguma confusão, já que não se localizava corretamente sua posição no contexto das tarefas arquivísticas. Alguns autores afirmaram que era uma fase de tratamento anterior à classificação, como para dicionário de termos arquivísticos do Serviço Regional de Arquivos da Comunidade de Madri (s/d), onde consta a seguinte definição de identificação:
Uma operação previa a classificação que conduz ao conhecimento do órgão,
GT2
563
das unidades administrativas, que produzem os documentos e suas funções, leis e atos normativos, que o originaram, tipos documentais e séries documentais produzidas no exercício de suas funções. Ou ainda para Molina Nortes; Leyva Palma (1996, p.72). Dentro desta fase da identificação se esta procedendo à classificação intelectual do fundo documental. Ou seja, com todo este material recolhido na fase da identificação, se pode elaborar um quadro de classificação que serve para dotar a documentação de uma estrutura sistemática que seja reflexo do funcionamento do órgão produtor. Merecem referência neste sentido os trabalhos de La Torre Merino e Martín-Palomino y Benito (2000), Alberch i Fugueras (2004, p.108) e Carmona Mendo (2004, p.41), grupo de autores espanhóis para os quais a identificação é considerada a primeira fase da metodologia arquivística que tem por finalidade o tratamento de fundos (administrativos ou históricos), através do “conhecimento dos elementos que constituem a série documental”, para estabelecer os critérios de organização do fundo (elaboração do quadro de classificação e a ordenação de suas séries documentais) propondo
as bases para a avaliação e descrição (CONDE VILLAVERDE, 1992, p. 43). Compete ao arquivo
central a identificação de fundos, devendo compartilhar com o arquivo intermediário a avaliação. “A
identificação se realizará preferencialmente sobre fundos administrativos, ainda que se possa realizá-
la sobre fundos considerados históricos”, destacam Torre Merino e Martín-Palomino y Benito (2000,
p.13).
No início a utilização desta terminologia não implicou numa mudança de propostas arquivísticas, senão que simplesmente era usada pelos autores como sinal de modernidade, como ressalta López Gómez (1998). O tempo foi consolidando esta pratica de trabalho, tornando-a definitiva no meio arquivístico espanhol. Os critérios vão sendo fixados em toda a legislação pertinente sobre sistemas de arquivos implantados no país, tendo como exemplo mais expressivo o Sistema de Arquivos Andaluz.
No Decreto 97/2000, que estabelece o Regulamento do Sistema Andaluz de Arquivos, a identificação é reconhecida como a “primeira fase do tratamento arquivístico, que consiste na análise da
organização e das funções das pessoas físicas ou jurídicas, publicas ou privadas e das séries documentais que produzem como base para a avaliação documental e para a organização e descrição arquivísticas.
A identificação é obrigatória para qualquer fundo documental e deverá se feita, preferencialmente,
nas áreas de produção documental” (art. 27). Define ainda os objetivos da identificação e avaliação na gestão documental, que permitirá “estabelecer as propostas de normalização, realizadas pelo arquivista em colaboração com os organismos gestores que afetarão as nomenclaturas das séries acumuladas, examinando seus procedimentos administrativos, a sua descrição e seu tratamento informático” (art. 30). Os formulários que foram utilizados para os estudos de identificação e avaliação aprovados pela Comissão Andaluza Qualificadora de Documentos Administrativos. A Espanha registra numerosas iniciativas de criação de grupos de trabalho para identificar
e avaliar documentos de arquivo. No âmbito municipal outras propostas se destacam, “com forte personalidade”, apresentando resultados que somados se traduzem numa “verdadeira teoria da gestão
de documentos em âmbito local”, como afirma Pedro López Gómez (1998).
GT2
564
O Brasil participou do movimento internacional iniciado na década de 80, contribuindo com suas experiências e reflexões
para construção de parâmetros metodológicos da identificação. Os projetos desenvolvidos pelo Arquivo Nacional, no período, dentro do Programa de Modernização Institucional- Administrativa, registram a mesma preocupação com a solução do problema da acumulação de fundos e da implantação de programas de gestão documental no âmbito da administração pública federal. Por outro lado, a situação de caótica de documentos acumulados nos depósitos do Arquivo Nacional, e nos órgãos que
compõe a estrutura do governo federal, justificou a criação de grupos de trabalho voltados para a solução dos problemas detectados. Em 1981, é criado o Grupo de Identificação de Fundos Internos (GIFI), com a finalidade de encaminhar uma solução para identificar os documentos acumulados na sede do Rio de Janeiro, pois dos “dois bilhões de documentos que compunham
o acervo, 50% não estava identificado e nem era conhecido de seus usuários e dos funcionários”, como afirma Celina Moreira Franco, então Diretora Geral do Arquivo Nacional (AN. Identificação de Documentos, 1985, p.5).
O maior problema enfrentado pelo grupo, ao iniciar suas atividades, foi a ausência de padrões metodológicos capazes de
fazer frente ao desafio.
Os manuais arquivísticos internacionais não apresentavam soluções para o problema colocado – o de identificar grandes volumes documentais em arquivos públicos -, pois nos países que os elaboraram, detentores quase exclusivo da produção de conhecimento na área de arquivologia, o desenvolvimento dos arquivos impediu que tal situação se configurasse (AN. Identificação de Documentos, 1985, p.5).
Ainda no mesmo ano, é criado outro grupo de trabalho, o Grupo de Identificação de Fundos Externos (GIFE), como
objetivo de “fornecer ao Arquivo Nacional m quadro global da documentação para possibilitar a criação de uma política de recolhimento, o planejamento de uma política de transferências, bem como a implantação de um arquivo intermediário”.
|
A |
experiência do grupo foi apresentada no V Congresso Brasileiro de Arquivologia, realizado em 1982, no Rio de Janeiro. |
|
O |
caráter inovador desta metodologia proposta para o “levantamento e identificação dos acervos” repercutiu no meio |
arquivístico brasileiro, servindo posteriormente como referencial para os trabalhos desenvolvidos pelos arquivos estaduais e municipais. (AN. Manual de Identificação, 1985, p. 7-9). Através da Divisão de Pré-Arquivo, o Arquivo Nacional, elaborou o Projeto de Gestão de Documentos, com o objetivo de estabelecer uma organização sistêmica dos arquivos dos órgãos públicos federais. Entre 1984 e 1986, realizou-se uma experiência-piloto, no âmbito do Ministério da Agricultura, cujos objetivos específicos previam as etapas do programa de gestão, ou seja, o “controle da produção, a avaliação e o controle sistêmico dos arquivos correntes e intermediários, e por fim assegurar as condições adequadas para implantação de recursos automatizados”. (AN. Manual de Levantamento da Produção, 1986, p.7). Usando o termo “levantamento da produção documental”, os procedimentos e os instrumentos propostos revelam a importância deste estudo prévio sobre o órgão produtor e seus documentos para efeitos de avaliação, perspectiva que caracteriza a metodologia da identificação, preconizada pela arquivística espanhola. As propostas metodológicas decorrentes do trabalho destes grupos se transformaram em manuais, denominados publicações técnicas: “Manual para identificação de acervos documentais para a transferência e/ou recolhimento aos arquivos públicos” (1985) do GIFE; “Identificação de documentos em arquivos públicos” (1985) do GIFI e o “Manual de levantamento da produção documental” (1986), resultado do projeto de gestão.
Nos objetivos das referidas publicações, o termo identificação aparece como fundamento do método de analise proposto para se iniciar o futuro tratamento dos fundos acumulados - “cujo texto se destina aos arquivos públicos do Brasil que desejam dispor de uma metodologia para identificação e registro de acervos documentais produzidos e acumulados pela administração pública.” (AN. Manual de Identificação, 1985, p.5) ou para se enfrentar o desafiante trabalho de controlar
GT2
565
os documentos no momento de sua produção, para efeito de avaliação dos conjuntos - “auxiliar aqueles que pretendem identificar os mecanismos de produção e trâmites documentais, tarefa essencial à aplicação de princípios da gestão documental” (AN. Manual de Levantamento da Produção, 1986, p. 9).
A utilização do termo, a definição dos métodos de trabalhos e a elaboração de instrumentos para se atingir as metas
propostas, indicam que no Brasil esta fase de pesquisa estava sendo tratada como etapa independente e necessária ante as demais para o desenvolvimento das práticas profissionais.
Quando a documentação não sofreu nenhum tipo de tratamento, é possível que também
não estejam fisicamente arranjadas (
implica nenhuma organização documental; na etapa da identificação, os documentos não sofrem qualquer arranjo físico. Esta é uma etapa importante, pois através da analise dos seus resultados pode-se retirar subsídios para a elaboração do modelo de arranjo (AN. Identificação de Documentos, 1985, p.8, grifo nosso).
Deve-se ficar claro, no entanto, que isto não
).
Ao se referirem especificamente à identificação como fase do trabalho arquivístico, os integrantes do GIFI, no Arquivo Nacional, dizem que é uma “etapa necessária à organização de acervos que não tenham recebido tratamento arquivístico algum. Visa não só estabelecer maior controle sobre esta documentação, como fornecer indicadores que possam nortear a
elaboração de um modelo de arranjo. Assim é preciso reconhecer a documentação antes de organizá-la” (AN. Identificação
de Documentos, 1985, p. 7).
As metodologias formuladas se somaram às discussões internacionais e foram divulgadas através de manuais, que passaram
a servir de modelos para as práticas desenvolvidas nos arquivos brasileiros. Este processo culminou com a formulação
do conceito incorporado pelo Dicionário Brasileiro de Terminologia Arquivística (2005), onde a identificação é vista como uma fase do processamento técnico dos arquivos e definida como “processo de reconhecimento, sistematização
e registro de informações sobre arquivos, com vistas ao seu controle físico e/ou intelectual”. O controle intelectual se refere às metodologias arquivísticas usadas para tratar tecnicamente documentos acumulados em arquivos. Trata-se de
um levantamento de dados sobre as características dos documentos arquivísticos para efeitos de classificação e descrição.
O controle físico, se refere à dados sobre documentos acumulados em depósitos de arquivos, para fins de formulação de
políticas de programas e sistemas de gestão e arquivos.
A partir dos anos 80 e durante toda a década dos 90, enquanto os arquivistas brasileiros
iniciavam suas reflexões teóricas e metodológicas e o processo de sensibilização para formulação de políticas de sistemas de arquivos, foi comum o uso dos diagnósticos de arquivo. No interior destas propostas, constavam tarefas especificas de identificação de documentos.
O objetivo destes processos de identificação de documentos em fase de acumulação,
preliminares a elaboração de projetos, deu origem a uma tradição no Brasil. Ana Maria de Almeida Camargo (1996, p. 11), se refere a este processo de identificação de depósitos de arquivos, como “um mapeamento necessário”, que está presente na justificativa das propostas registradas pela literatura arquivística brasileira. No Arquivo do Estado de SP, para a elaboração do diagnóstico da situação dos arquivos das Secretarias de Estado, tarefa preliminar a implantação do sistema, o “levantamento de dados”, é
considerado tarefa imprescindível à realização do diagnóstico.
O GIFE se referia ao processo como “identificação de acervos”, com a finalidade de
“levantamento e cadastramento de acervos documentais, para o estabelecimento de uma política nacional e uniforme de arquivos”. (AN. Manual de Identificação, 1985, p.31) e o GIFI, como
GT2
566
identificação, etapa necessária à “organização de acervos que não tenha recebido tratamento arquivístico algum” (AN. Identificação de Documentos, 1985, p.7). Heloisa Liberalli Belloto (2004, p.134) também contribui para a discussão sobre a identificação, abordando procedimentos para o tratamento de massas acumuladas em arquivos, formulando requisitos para a identificação de fundos, tarefa que considera preliminar e que deve ser realizada “antes de qualquer outro processamento técnico, na organização no arquivo permanente”. A partir dos textos publicados por Bellotto em 1982, e com novas abordagens em 1990, são divulgados no Brasil os estudos de análise documental desenvolvidos pelo Grupo de Arquivistas Municipais de Madrid e apresentados com originalidade os aspectos teóricos que fundamentam a tipologia documental. Na Espanha, entre os anos 80 e 90, a identificação foi amplamente discutida, sistematizada e reconhecida como função autônoma por um grupo de autores, aplicada às tarefas de classificação e avaliação. O conceito foi incorporado definitivamente, resultando na publicação de artigos e manuais, que apresentam os objetivos e resultados, método de análise e instrumentos próprios desta fase da metodologia arquivística. No âmbito da arquivística espanhola, o tema da identificação vem sendo objeto de reflexão para normalização.
No Brasil, a metodologia da identificação divulgada nas publicações técnicas do Arquivo Nacional e as propostas metodológicas de identificação aplicada à fundos e tipologias documentais, presentes nos textos de Heloísa Bellotto, demonstram a efetiva participação do país neste movimento de inovação metodológica que caracterizou o período. É um momento em que os arquivistas buscam parâmetros metodológicos para solucionar os problemas práticos encontrados nos arquivos. Luciana Duranti abre uma nova perspectiva para a arquivística, introduzindo o uso da metodologia diplomática na reflexão sobre o momento da produção do documento. Os arquivistas espanhóis, como Vicenta Cortés Alonso, Maria Luiza Conde Villaverde e Antonia Heredia Herrera, estão aplicando os mesmos princípios, primeiramente, nas tarefas da classificação e depois, na avaliação de documentos.
O termo identificação começa a ser usado indistintamente pela área, ora associado a funções específicas, ora designando uma função independente no tratamento documental. Celina Moreira Franco, na apresentação do Manual de Identificação de Documentos (1985, p.6), chama a atenção para a importância da aplicabilidade do modelo e da reflexão teórica sobre seus resultados, no sentido de construir uma tradição arquivística, onde, somente “a diversidade das experiências desenvolvidas em outros arquivos permitirá consagrar uma metodologia brasileira para uma realidade brasileira”.
Embora, o tema tenha sido inicialmente amplamente discutido pela área e em nível internacional este debate tenha avançado, aqui no Brasil, o assunto não foi suficientemente discutido e permanece uma longa lacuna de produção teórica sobre o assunto.
merecem
aprofundamento em suas análises:
• É possível reconhecer a identificação como função independente, e neste sentido utilizar os padrões estabelecidos no ensino da arquivologia?
• Podemos falar de uma metodologia de identificação, especificamente brasileira, que mereça uma sistematização dos métodos e instrumentos elaborados, a exemplo do que vem fazendo a Espanha?
Neste
contexto,
algumas
questões
inéditas
se
colocam
para
discussão
e
GT2
567
A necessidade da pesquisa sobre a gênese do fundo, sobre o estudo dos caracteres internos e externos do documento e de sua correta inserção no contexto de produção, como fundamento para tratá-lo tecnicamente, não é novidade teórica e a literatura registra um século de discussões sobre o tema.
O aspecto relevante desta proposta reside no fato da identificação ser, atualmente, reconhecida como uma função autônoma por uma corrente de teóricos espanhóis, os quais apresentam os objetivos e
resultados, o método de análise e instrumentos próprios e expressam, sobretudo, preocupações quanto
à normalização. Entretanto, esta concepção não é aceita de forma consensual na área, merecendo uma
análise mais detalhada quanto à utilização do termo e abrangência do conceito proposto nas tradições arquivísticas dos países que a formularam e dos autores que os referenciam em suas obras. Esta pesquisa tem por objetivo lançar bases teóricas para caracterizar a identificação como função independente no âmbito da metodologia arquivística, sistematizando-a na perspectiva da tradição arquivística brasileira. Nesta perspectiva, aliará uma dimensão teórica a uma dimensão aplicada. Do ponto de vista teórico, busca-se especificamente analisar a dimensão conceitual da identificação no
contexto das metodologias arquivísticas e sistematizar os procedimentos típicos destas fases, servindo como referencial metodológico para a realização de praticas arquivísticas desenvolvidas no Brasil. Na dimensão aplicada, tem por objetivo desenvolver estudos de caso de identificação arquivística no âmbito de programas de gestão de documentos e tratamento de massas documentais acumuladas em arquivos, verificando a aplicabilidade dos princípios teóricos e metodológicos da identificação. Como estudo de caso vem sendo desenvolvido o projeto de pesquisa “Identificação arquivística: utilizando a diplomática contemporânea como fundamento metodológico no Programa de Gestão de Documentos do Governo do Rio de Janeiro”. Neste estudo, serão aplicados os parâmetros da diplomática contemporânea para a identificação da tipologia documental objetivando a normalização de procedimentos para classificar e avaliar os documentos das Secretarias de Fazenda e de Planejamento do Governo do Estado do Rio de Janeiro no âmbito do Projeto de Gestão de Documentos (PGD), através de parceria institucional estabelecida entre o Arquivo Público do Estado
/ Casa Civil do Governo do Estado do Rio de Janeiro e a Universidade Federal Fluminense. Recortes temáticos dessa pesquisa vêm sendo abordados no âmbito de projetos de TTC em Arquivologia, PIBIC e do Mestrado em Ciência da Informação da UFF, integrando a produção do Grupo de Pesquisas “Gênese Documental Arquivística”, UFF/CNPq. Integram o grupo, pesquisadores
e alunos do Programa de Pós Graduação em Ciência da Informação (Mestrado) e do Curso de Graduação
em Arquivologia da UFF, que desenvolvem pesquisa de TTC e Iniciação Científica (PIBIC), além de técnicos da área de Gestão de Documentos do Arquivo Público do Estado do Rio de Janeiro e da Casa
Civil do Governo do Rio de Janeiro, que atuam no PGD RJ.
Considerações finais Na construção teórica do conceito de identificação, observa-se que na Espanha, o processo
GT2
568
pressupõe duas fases de levantamento de dados que se complementam para a realização da pesquisa, o órgão produtor e as tipologias documentais produzidas. No Brasil, as metodologias formuladas apontam mais um elemento a ser contemplado na identificação, muito presente na preocupação dos autores brasileiros, mas que não se encontra na tradição arquivística espanhola: o depósito de documentos como objeto de identificação para fins de implantação de sistemas de arquivos, aspecto típico da tradição construída no país. Na Espanha, um país de arquivística notadamente influenciada pela diplomática, o termo tipo documental vem sendo tradicionalmente usado na área para designar o documento de arquivo, embora seu uso seja típico da diplomática, No Brasil nem todos os processos de identificação chegaram o nível da identificação do documento e nas propostas que expressam esta preocupação, se comparadas entre si, observa-se uma disparidade de critérios usados para identificá-los. Este aspecto pode ser constatado na diversidade de modelos e de parâmetros usados nos modelos de identificação desenvolvidos no país. No Brasil a profusão de modelo e parâmetros conceituais usados para identificar documentos de arquivos, se explica pela ausência de preocupações quanto à padronização, questão que não vem sendo priorizada pela área. Esta situação se agrava diante da confusão terminológica e conceitual gerada pelo uso inadequado do termo assunto pelos arquivistas brasileiros e, sobretudo, da compreensão que se tem sobre ele, para identificar e denominar o documento de arquivo. Diferente da Espanha, que expressando preocupação com a normalização de parâmetros para compreender e tratar os documentos de arquivo, através da tipologia documental, alcançou significativos resultados teóricos e práticos no campo da identificação que destacaram o país no cenário arquivístico internacional. O tema da identificação de tipos documentais vem sendo discutido no país no âmbito de vários grupos profissionais. É na reflexão conjunta de dados identificados na tipologia documental de sistemas administrativos que os unem, que os arquivistas espanhóis encontraram a fórmula para a definição de requisitos normativos de gestão documental, seja em ambiente eletrônico ou convencional.
Nessa perspectiva, espera-se que os resultados de padronização de procedimentos arquivísticos alcançados no Programa de Gestão de Documentos do Governo do Estado do Rio de Janeiro (PGD-Rio), passem a servir de referencial para outras administrações públicas brasileiras, ressaltando a cooperação institucional como estratégia para o desenvolvimento da arquivologia brasileira.
Como docente na graduação de Arquivologia e pós-graduação do Departamento de Ciência da Informação espera-se ainda despertar o interesse científico dos alunos para recortes temáticos desta pesquisa, desenvolvidos em nível de TCC, Iniciação Científica e Mestrado, cujos resultados obtidos como produto destas reflexões possam trazer novos elementos para sistematização das tarefas arquivísticas realizadas nos parâmetros do rigor científico.
Referencias
|
• |
ALBERCH i FUGUERAS, Ramón. Los archivos, entre la memória histórica y la sociedad |
|
GT2 |
569 |
del conocimiento. Barcelona: Editorial UOC, 2004.
|
• |
ARQUIVO NACIONAL. Identificação de documentos em arquivos públicos. Rio de Janeiro, 1985. (Publicações Técnicas, 37) |
|
• |
ARQUIVO NACIONAL. Manual de identificação de acervos documentais para transferência e/ou recolhimento aos arquivos públicos. Rio de Janeiro, Ministério de Justiça / Arquivo Nacional, 1985. (Publicações Técnicas, 40) |
|
• |
ARQUIVO NACIONAL. Manual de levantamento da produção documental. Rio de Janeiro, 1986. (Publicações Técnicas, 44) |
|
• |
BELLOTTO, Heloisa Liberalli. Identificação de fundos. In: Arquivos permanentes; tratamento documental. 2 ed. Rio de Janeiro: FGV Editora, 2004. p.127-134. |
|
• |
BELLOTTO, Heloisa Liberalli. Tipologia documental em arquivística. Revista do Arquivo Municipal. São Paulo, n. 195, p. 9-17, 1982. |
|
• |
BELLOTTO, Heloisa Liberalli. Tipologia documental em arquivos: novas abordagens. Arquivo de Rio Claro. Revista do Arquivo do Município de Rio Claro. Rio Claro: Arquivo do Município de Rio Claro, v.0, n.1, p.4-15, 1990. |
|
• |
CAMARGO, Ana Maria de Almeida (coord). Diagnóstico dos arquivos da Faculdade de Filosofia, Letras e Ciências Humanas da Universidade de São Paulo. São Paulo: Centro de Apoio a Pesquisa em História / Departamento de História / FFLCH-USP, 1996. (Instrumentos de Pesquisa) |
|
• |
CARMONA MENDO, Concepción. Consideraciones sobre el metodo en archivistica. In: |
|
Documenta & Instrumenta. Madrid, Universidad Complutense de Madrid, v. I, 2004, p. 35- 46. Disponível em http://www.ucm.es/info/documen/htm/default.htm, acesso em 31 de agosto de 2005. |
|
|
• |
CARUCCI, Paola. Génesis del documento: redacción, clasificación y valor Jurídico. In: |
|
et al. Documento y archivo de gestión: diplomática de ahora mismo. Carmona: S&C Ediciones / Universidad International Menéndez Pelayo, 1994. p. 61-78. |
|
|
• |
CARUCCI, Paola. Il documento contemporaneo: diplomatica e criteri di edizione. Roma: |
|
La nuova Italia Scientifica, 1987. |
|
|
• |
CONDE VILLAVERDE, Maria Luisa. et al. La identificación y valoración de los fondos documentales de la administración estatal: problemas y metodología. Iberoamerica: identico tratamiento para una misma realidad. Primeras Jornadas sobre Metodología para la Identificación y Valoración de Fondos Documentales de las Administraciones Publicas, 1991. In: Actas …Madrid: Dirección de Archivos Estatales, 1992. p. 15-19. |
|
• |
CONDE VILLAVERDE, Maria Luisa. Manual de tratamiento de archivos administrativos. Madrid: Dirección de Archivos Estatales / Ministério de Cultura, 1992. |
|
• |
DICCIONARIO de Terminologia Archivística. Madrid: Ministerio de Cultura / Dirección de Archivos Estatales, 1993. |
|
GT2 |
570 |
|
• |
DICIONÁRIO Brasileiro de Terminologia Arquivística. Rio de Janeiro: Arquivo Nacional, 2005. |
|||
|
• |
DUPLÁ DEL MORAL, Ana. Conceptos básicos. Subdirección General de Archivos de la Comunidad de Madrid. Disponível em: http://www.madrid.org/clasartes/archivos/conceptos/ conceptos.html. Acesso em: 16 set 2005. |
|||
|
• |
DURANTI, Luciana. Diplomatica: nuevos usos para una antigua ciencia. Trad. Manuel Vazquez. Carmona: Asociación de Archiveros de Andalucia, 1995. |
|||
|
• |
DURANTI, Luciana. The archival bond. Archives and Museum Informatics. Vancouver (Canadá): Kluwer Academic Publishers, v.11, p. 213–218, 1997. |
|||
|
• |
HEREDIA HERRERA, Antonia. El principio de procedência y los otros princípios de la archivistica. São Paulo: Associação de Arquivistas de São Paulo, 2003. (Scripta, 5) |
|||
|
• |
LA TORRE MERINO, José Luis & MARTÍN-PALOMINO y BENITO, Mercedes. Metodología para la identificación y valoración de fondos documentales. Madrid: |
|||
|
Ministerio de Educación, Cultura y Deportes. S.G. de Información y Publicaciones, 2000. (Escuela Iberoamericana de Archivos: experiencias y materiales) |
||||
|
• |
LÓPEZ GÓMEZ, Pedro. Identificación y valoración de documentos en España a partir de |
|||
|
1975. |
In: Anales de Documentación. Revista de Biblioteconomia y Documentación. Murcia: |
|||
|
Servicio de Publicaciones / Universidad de Murcia, v. 1, 1998, p. 75-97. Disponível em : |
||||
|
http://www.um.es/fccd/anales/ad01/ad0106.html. Acesso em: 19 abr 2005. |
||||
|
• |
LÓPEZ GÓMEZ, Pedro. Los archiveros y sus investigaciones. Métodos de Información. v. 5, n. 22-23, 1998, p. 37-43. Disponível em http://eprints.rclis.org/archive/00001743/, acesso em 20 de setembro de 2005. |
|||
|
• |
MACNEIL, Heather. Trusting records: legal, historical and diplomatic perspectives. Vancouver (Canadá): Kluwer Academic Publishers, 2000. |
|||
|
• |
MENNE-HARITZ, Angelika. What can be achieved with archives? In: The concept of record: report from the Second Stockholm Conference on Archival Science and the Concept of Record, 30-31 May 1996. Stockholm: Riksarkivet, 1998. p.11-24. |
|||
|
• |
MOLINA NORTES, Juana y LEYVA PALMA, Victoria. Técnicas de archivo y tratamiento de la documentación administrativa. Guadalajara: ANABAD Castilla – La Mancha, 1996. (Textos de ANABAD Castilla – La Mancha, 2) |
|||
|
• |
RODRIGUES, Ana Célia. Tipologia documental como parâmetro de classificação e avaliação em arquivos municipais. Cadernos de Estudos Municipais. Universidade do Minho (Portugal): v.17/18, n. jun a dez, 2005. |
|||
|
• |
RODRIGUES, Ana Célia. Diplomática contemporânea como fundamento metodológico da |
|||
|
identificação de tipologia documental em arquivos. São Paulo: Universidade de São Paulo, |
||||
|
2008. |
Tese (Doutorado em História Social). (Mestrado em História Social). Faculdade de Filosofia, |
|||
|
Letras e Ciências Humanas, Universidade de São Paulo, São Paulo, SP. Disponível em: www. |
||||
|
Acesso em: 26 set. 2010. |
||||
|
GT2 |
571 |
|||
COMUNICAÇÃO
ORAL
MÉTODO DE COMPATIBILIZAÇÃO DE LINGUAGENS APLICADO A IMAGENS FOTOGRÁFICAS: UMA PROPOSTA DE AVALIAÇÃO
Joice Cleide Cardoso Ennes de Souza
Resumo: A avaliação de um sistema de recuperação de informação pressupõe a análise de seus diferentes subsistemas: seleção de documentos, indexação, linguagem documentária, busca e interface usuário-sistema, e o subsistema que compara as representações dos documentos com as representações das perguntas. Adotando as questions dos usuários de um banco de imagens como amostra, propõe- se a aplicação dos princípios de compatibilização como método para avaliar a linguagem de entrada com as solicitações dos usuários (saída). A partir da classificação das solicitações de busca, pôde-se identificar as categorias mais pesquisadas, de modo a avaliar, em uma segunda etapa, a indexação.
Palavras-chave: Compatibilização de linguagens. Imagem fotográfica. Avaliação de indexação.
1 INTRODUÇÃO
O principal papel de um serviço de informação é agir como uma interface entre uma população
de usuários e o universo de recursos informacionais (LANCASTER, 1979, p. 4). Para cumprir essa função, um conjunto documental que contempla um dado conhecimento registrado é representado com o objetivo de atingir as necessidades de sua comunidade usuária. Para empreender a avaliação de um sistema de recuperação de informação, deve-se analisar os
diferentes subsistemas que o compõem: seleção de documentos que farão parte da coleção, indexação
a ser adotada, vocabulário ou linguagem documentária, busca e interface usuário e sistema, e o subsistema que compara as representações dos documentos com as representações das perguntas (LANCASTER, 1979, p. 13).
O conhecimento é formado por uma rede de relações sociais, políticas e econômicas cujas
metas prioritárias de desenvolvimento são a sociedade da informação e a sociedade do conhecimento. Atualmente, as mudanças das mediações informacionais com a introdução de novas tecnologias de informação e comunicação inovam as formas de produção e comunicação do conhecimento. As formas de recuperação refletem a dinamicidade deste conhecimento; e, para que seja levada a efeito
a comunicação entre os estoques informacionais e o usuário, é importante uma avaliação contínua
do processo de indexação, incluindo as etapas de análise conceitual e tradução, e os instrumentos de representação do sistema de informação.
GT2
572
Este trabalho amplia o escopo da dissertação de Mestrado em Ciência da Informação 1 , quando
foi realizada a avaliação da linguagem documentária adotada na representação e recuperação da informação jornalística textual produzida pelo jornal O Globo, no site do Arquivo Premium.
A avaliação então empreendida destacou vários aspectos a serem observados durante a
elaboração de uma linguagem documentária para um sistema de informação. Mas tal avaliação não incluía outros gêneros documentais, como fotografias. Atualmente, a disseminação da produção fotográfica, com a popularização de mecanismos fotográficos, e a facilidade de divulgação, com a
proliferação de sites que oferecem hospedagem e visualização de fotografias, levam-nos a refletir sobre como representar as imagens e se essa representação atinge as necessidades de informação do usuário.
O objetivo desse trabalho é propor um método de avaliação da indexação de imagens
fotográficas em um sistema de informação, mediante aplicação do método de compatibilização de linguagens.
2 IMAGEM FOTOGRÁFICA: CRIAÇÃO E RECEPÇÃO
Desde sua criação, a imagem fotográfica é considerada fonte de informação, sendo necessário tratamento documental diferenciado para sua representação e recuperação. A sociedade atual está ambientada com a linguagem visual, estimulada com o advento da fotografia digital, o que permitiu a ampla disseminação da produção da fotografia e de seu acesso pela Internet. Rudolf Arnheim, citado por Aumont (2008, p. 78), propõe três aspectos a serem considerados em uma reflexão sobre a imagem e sua relação com o real: a imagem detentora de um valor de representação (representação de coisas concretas); detentora de um valor simbólico (representação de coisas abstratas) e detentora um valor de signo (representação de conteúdo não visível na imagem). Aumont esclarece que os três aspectos estão sempre presentes nas imagens, mas se manifestam com graus variados. Entendemos que, dependendo de nossos modelos mentais e culturais e do uso a ser feito da imagem fotográfica, cada aspecto em especial predominará. Kossoy (2002, p. 36) estuda a imagem a partir de dois conceitos: realidade interior e realidade
exterior. O autor expõe que a fotografia possui dois tempos: de criação e de representação, o efêmero
e o perpétuo. O primeiro fixa o acontecimento e a ação, é a primeira realidade ou realidade interior, que vai além do documento, expondo o oculto da imagem, registro do momento fugidio captado pelo
olhar do fotógrafo. Já a representação é o assunto registrado, a segunda realidade ou realidade exterior,
o nível aparente do documento (KOSSOY, 2002, p. 39). A perpetuação dos registros e a construção de
nossa memória são possíveis pelo tempo de representação, enquanto que a primeira realidade permite a construção de diferentes interpretações e formação de conceitos pelos indexadores e receptores. Logo, “a realidade da fotografia reside nas múltiplas interpretações, nas diferentes ‘leituras’ que cada
1 Dissertação defendida em 2007, sob a orientação da Profª Dra. Maria Luiza de Almeida Campos, convênio IBICT/UFF.
GT2
573
receptor dela faz num dado momento (
)”
(KOSSOY, 2002, p. 38).
A fotografia tem uma realidade própria que não corresponde necessariamente à realidade que envolveu o assunto, objeto do registro, no contexto da vida passada. Trata-se da realidade do documento, da representação: uma segunda realidade, construída, codificada, sedutora em sua montagem, em sua estética, de forma alguma ingênua, inocente, mas que é, todavia, o elo material do tempo e espaço representado, pista decisiva para desvendarmos o passado. (KOSSOY, 2002, p. 22).
A pluralidade de interpretações da imagem fotográfica é apontada por Kossoy (2007, p. 55), reforçando a sua natureza polissêmica, estando sua recepção dependente dos modelos mentais do receptor e dos seus objetivos ou usos em relação à fotografia. Schaeffer (1996, p. 66) discorre sobre os diferentes modos de recepção de uma imagem. Quando a fotografia é observada como traço/protocolo de experiência, sua principal função é ser prova do fato registrado, ressaltando-se a dimensão indicial da imagem, ou seja, remete a informação imagética diretamente ao referente, diminuindo ao máximo a dimensão icônica. Ao ser vista como recordação/ rememoração, a imagem fotográfica apresenta ênfase no potencial identificador do receptor, ou seja, o fator determinante para valoração da imagem é o conhecimento do observador, ou seja, seus modelos mentais e sua bagagem cultural. No caso da apresentação/mostração, ressalta-se a mensagem que a imagem pretender transmitir ao observador, como, por exemplo, nas fotografias publicitárias. Por fim, quando a imagem é observada enquanto descrição/testemunho, a informação a ela associada se reveste de relevância, como nas fotografias de caráter técnico e jornalístico. Paralelamente ao exposto acima, Gastaminza (1999, p. 121) arrola as seguintes competências a serem exigidas do observador de uma imagem: competência iconográfica (identificação de informações visuais); competência narrativa (compreensão do tema retratado a partir de uma narrativa); competência estética (identificação das técnicas e estilos fotográficos); competência enciclopédica (bagagem cultural); competência linguística (verificação da relação entre textos, legendas e o que foi retratado); e competência modal (identificação do tempo e do espaço da fotografia). No nosso entendimento, essas competências permitirão ao profissional de informação ter embasamento para a indexação de imagens fotográficas.
3 INDEXAÇÃO DE IMAGENS
Sendo a função de um sistema de recuperação da informação possibilitar a transferência de informação entre as fontes de informação (documentos) e os seus destinatários (usuários), o processo de indexação consiste em um subsistema de grande importância no processo de comunicação. Indexação é o conjunto de ações para atribuir termos de indexação, ou descritores, a documentos, para que posteriormente estes possam ser recuperados, de acordo com os conceitos selecionados designados por termos de indexação. É composto pelas etapas de análise conceitual (de
GT2
574
que trata o documento) e tradução (conversão dos termos obtidos a partir da análise conceitual, para a linguagem usada no sistema) (LANCASTER, 2004b, p. 8). Segundo Campos (2006), a seleção dos pontos de acesso de um documento influencia tanto
|
na |
representação como na recuperação da informação. Para a autora, o documento apresenta dois tipos |
|
de |
pontos de acesso: os aspectos objetivos/físicos e os aspectos subjetivos/intelectuais. Os primeiros |
“são aqueles relacionados à autoria; data; local entre outros que não necessitem de um processo de
interpretação”; já os aspectos intelectuais, evidenciam a necessidade “de uma análise interpretativa de seu conteúdo informativo” (CAMPOS, 2006, p. 19). Sob o ponto de vista biblioteconômico, os aspectos objetivos dizem respeito à catalogação, enquanto os subjetivos se referem à indexação. No âmbito da Arquivologia, a descrição arquivística engloba os dois aspectos. Uma das propriedades mais importantes de uma representação de conteúdo temático é sua extensão. Quanto mais informações são apresentadas, mais claramente a representação revela
o alcance do documento, e o usuário tem condições de avaliar se o mesmo satisfaz ou não sua
necessidade informacional. A propriedade de extensão de uma indexação está relacionada com o nível de recuperabilidade do sistema.
A indexação apresenta dois parâmetros: exaustividade e especificidade. Exaustividade consiste na medida da extensão em que os diferentes tópicos tratados em um documento são reconhecidos
e representados na indexação. O conceito oposto é seletividade, ou seja, o uso de poucos termos
de indexação. Já a especificidade significa representar o conteúdo no mesmo nível de documento. Quando o indexador faz uso de termos genéricos, dizemos que a indexação apresenta generalidade.
3.1 Análise de imagens
A literatura é vasta no tocante à análise de imagens. Destacamos Shatford (1986, p. 48), que
propõe o desenvolvimento de uma classificação facetada para imagem, adotando as facetas Quem,
O que, Onde e Quando. A autora faz um paralelo das facetas com as categorias de Ranganathan:
Personalidade, Matéria, Energia, Espaço e Tempo. Shatford (1986, p. 45) apresenta uma nova metodologia para análise da imagem, amparada em dois aspectos: DE (OF) e SOBRE (ABOUT). Com base nas perguntas “a imagem é De que?” e “a imagem é SOBRE o que?”, a autora propõe categorizar o assunto da imagem segundo seu significado factual (genérico e/ou específico) e sua tematicidade, respectivamente. No panorama nacional, Smit, em 1987, publica artigo a respeito do assunto, onde elucida que a descrição de uma imagem nunca é completa, exigindo orientações para nortear sua análise. Destaca
também o uso da imagem fora do seu contexto de produção, fato observado nas peças publicitárias, com exceção da produção fotográfica feita para esse fim específico. Segundo Smit, “analisar uma imagem significa, quer queiramos quer não, “traduzir” certos elementos dessa imagem de um código icônico para um código verbal” (SMIT, 1987, p. 103). Para a autora, mesmo adotando uma linguagem
GT2
575
documentária para padronizar a linguagem adotada no sistema, a transcodificação não garante unanimidade na interpretação. Smit (1987, p. 107) assinala que o usuário não exige uma indexação específica, uma vez que almeja obter como resultado de sua pesquisa um grupo de imagens que atenda sua solicitação e que lhe ofereça diferentes alternativas à sua escolha. Diante desse desafio, a autora propõe que a descrição de imagens atenda às perguntas: “QUEM (seres vivos), ONDE (ambiente), QUANDO (tempo), ONDE (espaço), O QUE (ação) e COMO (técnica)” (SMIT, 1987, p. 109). Apesar das categorias relacionadas por Smit se aproximarem das relatadas por Shatford (1986), em artigo publicado na revista Informare, Smit (1996, p. 32) aponta Ginette Bléry como a desenvolvedora dessa proposta de análise. No mesmo artigo, Smit propõe que a representação de imagem seja composta pelo seu conteúdo informacional (aquilo que a imagem mostra) e pela expressão fotográfica (forma usada para expressar o que se quer transmitir pela imagem) (SMIT, 1996, p.34). Em seus trabalhos sobre análise documentária da fotografia, Manini (2004) adota o conceito de dimensão expressiva em vez de expressão fotográfica, e ressalta que, apesar do conteúdo informacional ser decisivo para a recuperação da informação em uma busca por imagens, o que define a escolha por parte do usuário é a dimensão expressiva da imagem. Smit, citada por Manini (2004), esclarece que “a descrição de uma imagem nunca é completa”, uma vez que a imagem sempre oferece um aspecto que passou despercebido por ocasião da primeira análise. O mesmo profissional de informação pode identificar diferentes significações em uma mesma imagem, em momentos diferentes. A partir dessa afirmação, fazemos o seguinte questionamento:
como minimizar o ruído que ocorre na comunicação entre a imagem fotográfica e o usuário em um sistema de informação, se cada analista indexador possui experiências de vida e modelos mentais diferenciados, o que se reflete na indexação do documento imagético? Além de analisar a imagem fotográfica em si, compreendemos – como tratado por Cordeiro (2000, p. 199) – que é preciso contextualizar a fotografia, investigando seu processo produtivo, sua inserção dentro de um conjunto documental, o propósito de sua indexação e se a forma como a organização “olha” para aquele acervo é compartilhada com os potenciais usuários. No nosso entendimento, o método de compatibilização de linguagens, usado no âmbito do sistema de informação, permitirá avaliar a indexação de um dado acervo fotográfico a partir da verificação do nível de compatibilização existente entre a linguagem adotada na entrada (linguagem de indexação) com a linguagem usada na saída (estratégias de busca dos usuários).
4 AVALIAÇÃO DE LINGUAGENS
Os estudos de avaliação de serviços de informação apresentam diferentes enfoques na literatura da Ciência da Informação. Esta comunicação se deterá nos estudos de avaliação de linguagens e de indexação, com enfoque nos trabalhos de Keen sobre análise das linguagens no projeto Aberystwyth;
GT2
576
e em Lancaster, pelo respaldo teórico e metodológico para avaliação de serviços de recuperação. No que diz respeito à avaliação de linguagens de indexação, a visão global da prática avaliativa desenvolvida por Lancaster (2004a) é de suma importância na gestão de um serviço de informação. No livro “Avaliação de Serviços de Biblioteca”, o autor discorre sobre como fazer um estudo avaliativo
detalhado dos serviços de uma biblioteca a partir dos serviços sob demanda e de notificação (ou pró- ativos), inter-relacionando as diversas atividades da instituição. Entre as décadas de 1950 e 1970 se concentra um grande número de estudos avaliativos das linguagens de indexação em relação ao sistema, estando entre eles os projetos experimentais ASTIA, Cranfield I e II e Aberystwyth. Para efeito desse trabalho, destacamos o experimento entre linguagens de indexação empreendido por Michael Keen e J. A. Digger (PIEDADE, 1976, p. 15), no College of Libranship Wales, também conhecido como teste de Aberystwyth, além de pontuar autores que identificaram critérios que mesclam a prática da indexação com a avaliação de linguagens de indexação. O teste de Aberystwyth submeteu cinco diferentes linguagens selecionadas a partir dos critérios de controle de vocabulário e do esforço requerido para a utilização das linguagens (KEEN, 1973, p. 3). Foram analisados 800 documentos sobre Biblioteconomia e Ciência da Informação, nos oito testes comparativos realizados para avaliar a especificidade das linguagens de indexação e relações, exaustividade e especificidade da indexação, método de coordenação, precisão dos instrumentos de partição e operadores relacionais, além da provisão de contexto nas buscas nos arquivos. O estudo apresentou as seguintes conclusões (KEEN, 1973, p. 24 e 25):
|
1. |
Apesar da linguagem com menor especificidade apresentar o maior índice de revocação, o mesmo desempenho foi observado na linguagem não-controlada com alta especificidade e sem relações entre os termos; |
|
2. |
As linguagens com grande especificidade tiveram desempenho similar às que apresentam pouca especificidade; |
|
3. |
As linguagens mais extensas exigiram mais tempo de busca para obter uma alta revocação; |
|
4. |
Um aumento na exaustividade auxilia na recuperação dos documentos parcialmente relevantes, resultando em alta revocação. Mas a indexação exaustiva ou redundante não apresentou qualquer vantagem ou desvantagem sobre a indexação específica; |
|
5. |
O uso de instrumentos de precisão não influenciou na recuperação. |
A principal conclusão do projeto foi que não há diferenças significativas entre as linguagens de indexação no que diz respeito à eficiência e à eficácia na recuperação. Keen (1973, p. 34) esclarece
que os progressos nos estudos de avaliação de linguagens só serão possíveis quando pudermos relacionar revocação e precisão com os parâmetros de especificidade e relações das linguagens de indexação, o que não foi permitido no teste realizado em Aberystwyth. Com base na norma americana ANSI/NISO – Guidelines for the construction, format and
GT2
577
management of monolingual thesauri, Owens e Cochrane (2004) definem como avaliação de tesauro
o processo para determinar se um dado instrumento atinge seus principais objetivos, a saber: tradução
(fornecer meios de traduzir a linguagem natural dos autores, indexadores e usuários num vocabulário controlado usado para indexação e recuperação), consistência (promover consistência na atribuição de termos de indexação), indicação de relacionamentos (indicar os relacionamentos semânticos entre os termos) e recuperação (servir como meio de busca na recuperação de documentos). As autoras propõem os seguintes métodos de avaliação de tesauro: comparativo (com outros modelos de tesauros nacionais ou internacionais), formativo (testar o tesauro analisando sua performance na indexação e recuperação), de observação (acompanhamento do desempenho do tesauro) e estrutural (observação dos termos genéricos, específicos e associados). A partir dos estudos sobre avaliação da consistência da indexação em uma biblioteca de artes, Strehl (1998, p. 331) consolida em sua metodologia os seguintes critérios para analisar um instrumento de representação apurados na literatura da área e na sua atividade profissional: número de palavras por descritor, uso do singular e plural, sinônimos, descritores compostos (analisa o termo mais frequente, a perda de significado devido à fatoração, combinações ambíguas, se um dos termos é nome próprio ou adjetivo), termos homógrafos ou inconsistentes, rotação de descritores, relação entre assuntos redundantes, relação de um assunto com sua subcategoria, descritores que indicam período histórico, identificadores geográficos e assuntos compostos por identificadores geográficos e cronológicos. Uma vez que não existe uma política de indexação e vocabulário controlado para a área de artes visuais, a autora objetiva identificar os termos usados pelos indexadores e que não correspondam aos critérios definidos. Lopes (1985, p. 243) destaca que os estudos de avaliação estão associados ao desempenho do
serviço de indexação, à qualidade do produto oferecido pelo sistema e se ele atende às solicitações dos usuários. A autora propõe critérios para avaliar eficácia, custo/benefício e custo/eficácia de sistemas de indexação e resumo. Para a autora (LOPES, 1985, p. 254), custo/eficácia compreende o custo de uma biblioteca para manter o serviço. Lancaster (1979) aponta que um serviço de informação será eficiente se atender o usuário. Já custo/benefício, Lopes afirma que é a relação entre os custos e os benefícios de se possuir o sistema. Eficácia é definida por Lopes como sendo “a habilidade do SIR [serviço de indexação e resumo] em satisfazer as necessidades de informação do usuário, e inclui critérios e medidas relativos
à qualidade do produto e o tempo despendido para obtê-lo” (LOPES, 1985, p. 246). Para tanto, deve-
se também analisar: autoridade (aspecto relacionado ao responsável pelo tratamento informacional), cobertura (abrangência de um assunto em um dado acervo), revocação (capacidade de oferecer
todas as referências existentes na base de dados em relação a uma pergunta), precisão (capacidade de oferecer referências relevantes), novidade (referências relevantes obtidas pelo usuário e que ele não conhecia anteriormente), esforço do usuário (o trabalho que o usuário tem para obter uma informação precisa no sistema), tempo de resposta (tempo gasto nas buscas pelo usuário), produtos
GT2
578
oferecidos (os serviços oferecidos pelo sistema) e linguagem de indexação (interfere diretamente na satisfação do usuário uma vez que atua como mediadora no processo comunicativo entre a base de dados e o usuário). Lopes (1985, p. 254) contempla em linguagem de indexação os seguintes aspectos: linguagem usada, nível de exaustividade, nível de especificidade, e qualidade e correção na indexação. Lancaster define “a ‘boa indexação’ como a indexação que permite que se recuperem itens de uma base de dados durante buscas para as quais sejam respostas úteis, e que impede que sejam recuperados quando não sejam respostas úteis” (LANCASTER, 2004, p. 83). Evidentemente, no sistema de informação, os vários subsistemas interagem para que haja um bom desempenho. O autor destaca que o sistema deve oferecer o máximo de revocação, fato observado nas buscas em bancos de imagens, conforme exposto na seção anterior. Lancaster (2004, p. 85), ao analisar a qualidade da indexação, aponta que a “falha” na indexação pode acontecer nas etapas de análise conceitual e de tradução. O primeiro caso ocorre quando o profissional responsável não reconhece um assunto que tem potencial para a comunidade usuária do sistema, e quando há a interpretação inadequada de termos ao documento analisado. As falhas na tradução ocorrem quando se usa um termo geral para o assunto específico tratado no documento, em vez do termo específico, e quando se atribuem termos impróprios ao conteúdo temático. Problemas na análise conceitual e na tradução implicarão em falhas na revocação. Para avaliar o trabalho dos indexadores, Lancaster propõe um método com cinco pontos a serem seguidos, em que destacamos o item em que recomenda a comparação “entre a indexação com as estratégias de busca, a fim de determinar se os itens relevantes são recuperáveis ou não com os termos atribuídos” (LANCASTER, 2004, p. 87). No nosso entendimento, tal recomendação permite avaliar tanto a indexação quanto a linguagem de indexação adotada pelo sistema, além das estratégias de busca indicarem quais são as demandas de informação dos usuários. Lancaster (2004, p. 89) sistematiza em um quadro os fatores que podem influenciar na qualidade de indexação. Destacamos os fatores relacionados ao vocabulário (especificidade/ sintaxe, ambiguidade ou imprecisão, qualidade do vocabulário de entradas, qualidade da estrutura, disponibilidade de instrumentos auxiliares afins) e os fatores relacionados ao “processo” (tipo de indexação, regras e instruções, produtividade exigida, exaustividade da indexação). Tanto Lopes (1985) quanto Lancaster (2004) colocam em questão o conceito de precisão na indexação: quanto mais específica a indexação, mais precisa será a recuperação e o esforço do usuário em obter as informações desejadas. Contudo, ao buscar imagens fotográficas, o usuário objetiva uma grande revocação, para que, a partir do conjunto obtido, selecione a imagem que apresenta a dimensão expressiva que o atenda. Entendemos que a partir dos aspectos apontados pelos autores, poderemos avaliar a indexação aplicada às imagens fotográficas fixas, aplicando o método de compatibilização entre as questions dos usuários e a linguagem de indexação adotada pelo sistema de informação.
GT2
579
5 COMPATIBILIZAÇÃO DE LINGUAGENS
Esta pesquisa apresenta como referencial teórico os estudos de compatibilização e reconciliação de linguagens empreendidos por Neville (1970) e Dahlberg (1981). Considera-se ainda linguagens documentárias como linguagens artificiais, controladas, criadas dentro dos objetivos de uma organização/setor, a partir de um conjunto de documentos e domínio, para serem utilizadas na indexação e recuperação da informação em um determinado sistema de recuperação da informação. Para Neville (1972, p. 620), reconciliação é a possibilidade de integração e aproximação de sistemas que contemplam o mesmo tipo de literatura, mas que adotam diferentes tesauros. Neville (1972) parte do pressuposto de que na representação de um conteúdo os conceitos é que são indexados,
sendo as palavras-chaves ou descritores rótulos ou etiquetas linguísticas que identificam os conceitos.
O autor adota um tesauro como base e segue onze níveis de correspondência entre os termos dos
dois vocabulários, onde são analisados: correspondência exata entre palavras-chave, se o tesauro faz distinção entre homônimos, se usa palavras-chave sinônimas, entre outros. Dahlberg (1981), ao adotar a expressão compatibilização de linguagens de indexação, restringe os estudos de compatibilidade aos “sistemas ordenados”, definidos como sendo qualquer instrumento usado na organização, descrição e recuperação do conhecimento, composto por expressões verbais
ou notacionais para conceitos e suas relações, dispostos de uma forma ordenada. A compatibilização
entre sistemas ordenados é um dos métodos que permite avaliar o nível de compatibilidade conceitual entre os elementos, de forma a serem utilizados em conjunto (DAHLBERG, 1983, p. 5). A compatibilidade conceitual proposta por Dahlberg (1983, p. 6) compreende três fases:
coincidência conceitual: quando dois conceitos são equivalentes;
correspondência conceitual: quando a maior parte das características de dois conceitos combina; e
correlação conceitual: quando a correlação entre dois conceitos pode ser indicada.
Ao usar a expressão “sistemas ordenados”, Dahlberg amplia não só o conceito mas o universo de aplicação da metodologia de compatibilização, uma vez que flexibiliza a definição do instrumento a ser compatibilizado, podendo aí incluir as perguntas feitas pelos usuários, analisadas dentro de um contexto e que apresentam uma organização interna oferecida pelo sistema de recuperação. Segundo a autora (DAHLBERG, 1983, p. 5), compatibilidade é a qualidade de um sistema ordenado que permite que seus elementos possam ser usados juntos ou intercambiados com elementos de outro sistema ordenado.
6 RESULTADOS ESPERADOS E DISCUSSÃO
GT2
580
Como observado na seção anterior, Dahlberg (1981) descreve métodos para o estabelecimento de comparações verbais e conceituais entre linguagens de indexação. Caso a linguagem de indexação não apresente notas de aplicação ou definições dos conceitos, não será possível a construção da matriz conceitual, pedra de toque nos estudos da autora. Recomenda-se a compatibilização semântica com aplicação da metodologia de comparação verbal proposta por Dahlberg. Já os passos metodológicos propostos por Neville (1972) nos permitem integrar duas ou mais linguagens de indexação a partir das análises linguística e semântica. A correspondência linguística entre os termos de duas ou mais linguagens compreende a associação exata entre termos, estando as palavras no plural ou no singular. Há de se analisar os termos sinônimos e homônimos evidenciando a existência de palavras com mesma significação que outras e/ou com a mesma denominação. Ao identificarmos que as solicitações dos usuários são linguisticamente diferentes dos termos constantes da linguagem de indexação, apesar de apresentarem o mesmo significado, estamos analisando a correspondência semântica entre as palavras. Para a avaliação da linguagem de indexação, recomenda-se a aplicação dos critérios identificados por Souza (2007, p. 99) na literatura da área: estrutura dos termos, forma de apresentação, campo de abrangência, forma das palavras, estrutura semântica, relações de equivalência, software adotado pelo sistema de informação. Aplicamos a metodologia proposta em uma amostra de solicitações de busca de um banco de imagens de empresa de mídia, oferecido na Internet. O relatório totaliza 57.262 questions dos usuários com resultado igual a zero, no período de 2002 a 2010, organizadas alfabeticamente. Para a amostra, isolamos 2.251 expressões de busca iniciadas com a letra D, sendo 1.500 classificadas seguindo as categorias fundamentais de Ranganathan (PMEST). Contrapondo as categorias propostas por Smit (1987, p. 109), seria QUEM (seres vivos), O QUE (ação), COMO (técnica), ONDE (ambiente), ONDE (espaço), QUANDO (tempo). Obtivemos o seguinte resultado: Personalidade (916 solicitações), Matéria (1 solicitação), Energia (511 solicitações), Espaço (29 solicitações), Tempo (94 solicitações). Em Personalidade identificamos nomes de pessoas, novelas, instituições (organizações), documento iconográfico (desenhos diversos), entre outros. Tal número revela que as buscas por conceitos individuais (nomes próprios) são relevantes para o usuário que demanda imagens fotográficas. Outra categoria em destaque é Energia, que abrange todo tipo de ação ou situação que denota movimento. Particularmente, a estratégia de busca que descreve ação nos indica que o usuário, ao fazer a solicitação, já tem em mente a imagem que deseja. O próximo passo a ser realizado é compatibilizar a linguagem de indexação com a linguagem do usuário (questions) para poder avaliar tanto a linguagem como a indexação efetuada.
7 CONCLUSÃO A informação assume cada vez mais um papel relevante nas tomadas de decisão dentro das
GT2
581
organizações. Para que a plena recuperação seja atingida, faz-se necessária uma linguagem que
satisfaça tanto as necessidades dos usuários quanto as da instituição, com a consequente localização e aquisição da informação pesquisada. O sistema de informação deve oferecer ao usuário mecanismos que lhe possibilite o acesso à informação desejada de maneira eficaz e eficiente. O questionamento de como representar a informação textual foi ampliado para a informação imagética, sendo o desafio identificar como os usuários procedem para recuperar as imagens que atendam suas necessidades informacionais. Esta pesquisa propõe que a partir das questions dos usuários é possível mapear as facetas usadas na representação da imagem fotográfica, para fins de recuperação, para posterior avaliação da linguagem de indexação e da indexação propriamente dita, mediante aplicação do método de compatibilização de linguagens. Com a compatibilização há a aproximação de dois tipos de linguagem: do sistema e do usuário, oportunidade para que a comunicação seja efetivamente realizada. A polissemia da imagem fotográfica consiste no desafio a ser enfrentado pelo profissional de informação. Apesar disso, os ruídos no processo comunicativo devem ser minimizados, o que é possível com um acompanhamento
e atualização tanto dos instrumentos de representação como dos aspectos subjetivos e objetivos a serem descritos na imagem.
Abstract: Information retrieval system evaluation requires the analysis of its various subsystems:
selection of documents, indexing, documentary language, seach and user interface subsystem, and the comparison of the representations of documents with the users questions. It is proposed to apply the principles of compatibility as a method to evaluate the input language with the users requests (output). From the ranking of search requests, we could identify the most searched informational categories in order to evaluate the indexing.
Keywords: Language compatitilization. Image. Indexing evaluation
REFERÊNCIAS
AUMONT, J. A imagem. Campinas, SP: Papirus, 2008.
CAMPOS, M. L. A. Indexação e descrição em arquivos: a questão da representação e recuperação de informações, in Arquivo e Administração, v. 5, p. 17-31, 2006.
CORDEIRO, R. I. N. A narração da obra fílmica revelada por sua árvore genealógica: princípios para
a análise fílmica como processo comunicacional para a representação documentária. In: PINHEIRO, L. V. R.; GONZÁLEZ DE GOMEZ, M. N. (Orgs.). Interdiscursos da ciência da informação: arte, museu e imagem. Rio de Janeiro; Brasília: IBICT/DEP/DDI, 2000.
DAHLBERG, I. Conceptual compatibility of ordering systems, in International Classification, v. 10, n. 1, p. 5-8, 1983.
Towards establishment of compatibility between indexing languages, in International
GT2
582
Classification, v. 8, n. 2, p. 86-91, 1981.
GASTAMINZA, F. V. Manual de documentación fotográfica. Madrid: Sintesis, 1999.
KEEN, E. M. The aberystwyth index languages test, in Journal of Documentation, v. 29, n. 1, March 1973.
KOSSOY, B. Os tempos da fotografia; o efêmero e o perpétuo. São Paulo: Ateliê Editorial, 2007.
Realidades e ficções na trama fotográfica. São Paulo: Ateliê Editorial, 2002.
LANCASTER, F. W. Avaliação de serviços de bibliotecas. Brasília: Briquet de Lemos, 2004a.
Indexação e resumos: teoria e prática. Brasília: Briquet de Lemos, 2004b.
Information Wiley, 1979.
retrieval systems: characteristics, testing and evaluation. 2ª ed. New York: J.
LOPES, E. F. Avaliação de serviços de indexação e resumo: critérios, medidas e metodologia, in Revista da Escola de Biblioteconomia, Belo Horizonte, v. 14, n. 2, p. 242-256, set. 1985.
MANINI, M. P. Análise documentária de fotografias: leitura de imagens incluindo sua dimensão expressiva, in Cenário Arquivístico, Brasília, v. 3, n. 1, jan.-jun. 2004.
NEVILLE, H. H. Feasibility study of a scheme for reconciling thesauri covering a commom subject, in Journal Documentation, v. 26, n. 4, p. 313-336, December, 1970.
Thesaurus reconciliation, in Aslib Proceedings, v. 24. n. 11, p. 620-626, November 1972.
OWENS, L. A.; COCHRANE, P. A. Thesarurus evaluation, in Cataloguing and Classification Quartely, v. 37, n. 3/4, p. 87-102, 2004.
PIEDADE, M. A. R. Estudo comparativo de algumas linguagens de indexação: eficácia e tempo e pesquisa. Rio de Janeiro, 1976. Dissertação (Mestrado) Biblioteconomia e Documentação – Instituto Brasileiro de Bibliografia e Documentação; Universidade Federal do Rio de Janeiro, 1976.
SCHAEFFER, J. M. A imagem precária. Campinas, SP: Ed. Papirus, 1996.
SHATFORD, S. Analyzing the subject of a picture: a theoretical approach, in Cataloging and Classification Quartely, v. 6, n. 3, p. 39-62, 1986.
SOUZA, J. C. C. E. Avaliação de linguagem de indexação aplicada à informação jornalística:
estudo de caso. 2007. Dissertação (Mestrado em Ciência da Informação) - UFF/IBICT, Rio de Janeiro,
2007.
SMIT, J. W. A análise da imagem: um primeiro plano. In:
2ª ed. Brasília: IBICT, 1987, p. 99-112.
GT2
583
(Coord.)
Análise documentária.
A representação da imagem, in Informare – Cadernos do Programa de Pós-Graduação em Ciência da Informação, Rio de Janeiro, v. 2, n. 2, p. 28-36, jul./dez. 1996.
STREHL, L. Avaliação da consistência da indexação realizada em uma biblioteca universitária de artes, in Ciência da Informação, v. 27, n. 3, p. 329-355, set./dez. 1998.
GT2
584
COMUNICAÇÃO
ORAL
ORGANIZAÇÃO DOS CONTEÚDOS DE CONHECIMENTO PARA SITES: REPRESENTAÇÃO DAS ATIVIDADES DE PESQUISA EM LABORATÓRIO CIENTÍFICO DE BIOLOGIA MOLECULAR
Laura de Lira e Oliveira, Maria Luiza de Almeida Campos, Hagar Espanha Gomes (CNPq)
Resumo: O objetivo deste estudo é investigar as possibilidades metodológicas para representar os recursos de informação produzidos e utilizados em um ambiente específico de domínio interdisciplinar através da elaboração de um modelo de representação de uma atividade de pesquisa. A abordagem empírica está voltada para o domínio da Biologia Molecular que se desenvolve no cotidiano da atividade científica de um Laboratório de ponta. O trabalho no Laboratório inclui a pesquisa científica vinculada principalmente para a genômica dos Tripanosomatídeos e para as Doenças Tropicais Negligenciadas tais como a Doença de Chagas (T. cruzi) e outras tripanosomoses, leishmanioses (Leishmania spp), gerando informação e conhecimento científicos. A pesquisa focou
a organização dos conteúdos desse conhecimento gerado no Laboratório com ênfase na atividade
da anotação genômica. Para que a organização do conhecimento se faça de forma eficaz, a Teoria da Classificação foi aplicada, destacando-se como ferramenta da Ciência da Informação que auxilia na estruturação sistemática da informação gerada pela equipe de pesquisadores, mas as relações funcionais-sintagmáticas se revelaram importantes na organização de objetos heterogêneos. As metodologias utilizadas para a elaboração de um modelo de representação se pautaram na Análise de Domínio e na Etnometodologia para a identificação dos elementos presentes naquela atividade e no método facetado para a classificação desses elementos e foram definidas diretrizes voltadas para a representação de um modelo de uma atividade.
Palavras-chave: Organização do Conhecimento. Representação da Informação. Análise de Domínio. Etnometodologia.
1 INTRODUÇÃO
As doenças tropicais negligenciadas (DTNs), como a Doença de Chagas (T. cruzi) e outras tripanosomoses, leishmanioses (Leishmania spp), fazem um grande número de vítimas, sobretudo em
países subdesenvolvidos. As diversas pesquisas sobre o tema geram significativo volume de informações,
o que faz da busca pela contínua sistematização de instrumentos/ferramentas no âmbito de um laboratório
de pesquisa científica em genômica, um mecanismo facilitador do acesso aos conhecimentos já produzidos, acarretando a redução do impacto dessas enfermidades. Isso porque permite a disseminação das informações existentes entre os diversos laboratórios de pesquisa genômica no mundo assim como a elaboração de uma proposta de cooperação internacional das pesquisas genômicas. Percebe-se, assim, a necessidade de se apoiar questões concernentes ao mapeamento de um
GT2
585
modelo de representação para organizar os componentes de uma atividade científica, no caso, a atividade de anotação genômica em sites científicos, devido à necessidade de se organizar as informações geradas em um laboratório de Biologia Molecular. O laboratório estudado é um local de produção de conhecimento relativo àquela atividade genômica e por se tratar de uma atividade complexa foram utilizados alguns itens de Hjørland (2002) para identificação do domínio. Para entender a atividade e identificar o que deveria ser alvo da representação foi feita a observação das ações no ambiente por meio da Etnometodologia. E para organizar os elementos identificados foi utilizado o método de faceta que funcionou na identificação das categorias, mas que pode se mostrar insuficiente para organizar objetos heterogêneos que naturalmente surgem em uma atividade dentro de um laboratório de ponta. Desta forma, as relações ônticas 1 ou funcionais-sintagmáticas (DAHLBERG, 1978; 1993) foram utilizadas. No âmbito deste trabalho, o conhecimento no Laboratório compreende tanto as ações específicas dos recursos para análise de DNA quanto a inclusão de outros elementos para a realização desta atividade tais como: pesquisadores que compõem determinado projeto, suas atividades propriamente ditas de anotação genômica de organismos de interesse para as pesquisas do Laboratório, textos científicos, instituições que estão vinculados, parcerias com outros laboratórios, bancos de dados genômicos, entre outros.
O avanço tecnológico nos meios comunicacionais e informacionais tem propiciado uma
rapidez na representação e recuperação do conhecimento e da informação. Verifica-se, assim, a importância da Ciência da Informação que utiliza bases teóricas e metodológicas para lidar com questões voltadas à representação do conhecimento e da informação. (KUMAR, 1981) Optou-se por trabalhar com a utilização de sites, uma vez que estes trazem a possibilidade de acesso a informações produzidas em unidades geograficamente separadas e sua dinâmica tem
propiciado agilização nos processos internos dos laboratórios, tornando o trabalho mais produtivo, já que, simultaneamente, agregam e disseminam informações na Internet, confirmando-se como uma forma importante de compartilhamento da informação biomédica e processamento de conteúdo. (GILCHRIST, 2003; CHAU et al, 2006; STEWART, 2008; BLATECKY et al.,sd)
O modelo a ser representado tem como objetivo fazer parte de um site e irá interferir na
arquitetura e funcionalidade deste site. A informação estruturada pelo modelo de representação guiará a busca e recuperação da informação biomédica no âmbito da Biologia Molecular (GIBAS e JAMBECK, 2001;NUNES, 2002) e dos recursos por meio da navegação pelos pesquisadores.
1 A relação ôntica não tem a finalidade de estabelecer uma hierarquia entre os conceitos, mas a de determinar a natureza da
relação entre esses conceitos. No caso da pesquisa realizada, estas relações apresentam de forma clara uma atividade natural entre os objetos que ocorrem no mundo real, onde os objetos existem. (OLIVEIRA, 2011)
GT2
586
2 A ORGANIZAÇÃO DA INFORMAÇÃO EM SITES
As primeiras manifestações relacionadas ao uso de taxonomias em sites surgem no âmbito das arquiteturas de informação e gestão de conteúdo. Nesse contexto, algumas das questões que se apresentam no desenvolvimento de taxonomias em sites são as seguintes: Como os elementos serão usados para navegar ou realizar a busca da informação? E qual é o processo pelo qual eles serão adicionados ao sistema para a melhor recuperação da informação? Sabendo que gestão implica organização e organização implica classificação, os atuais desafios a fim de se gerir o conhecimento estão relacionados ao enorme e crescente volume de informação e à constante mudança em seu conteúdo. No âmbito de um domínio interdisciplinar como a Biologia Molecular - área analisada - o processo de classificar é bastante complexo e demanda uma estrutura normativa e prescritiva para organizar o conhecimento científico (GNOLI, BOSCH e MAZZOCCHI, 2007). A organização do conhecimento em categorias nesse campo interdisciplinar deve resultar em uma análise e interpretação acuradas dos fenômenos e argumentos do discurso dos especialistas que estão inseridos no Laboratório. Foram, então, sugeridas diretrizes metodológicas que corroboram o modelo de representação elaborado, mas que só foi possível sua elaboração após o percurso de busca das informações relevantes no ambiente do Laboratório, observação das ações dos pesquisadores e um processo de mapeamento e estruturação. Isto norteou aspectos metodológicos desta pesquisa em dois focos. O primeiro foi a forma de obtenção dos dados por meio da Identificação dos elementos a qual compreendeu: a) a análise de domínio, para entender o ambiente e levantar dados que, segundo Hjørland (2002) é a identificação dos elementos passíveis de serem observados no escopo da pesquisa e b) a Etnometodologia, para apreender a complexidade da atividade da anotação genômica, que é a forma de observar esses elementos. O segundo foco foi a Organização dos elementos por meio do método facetado (CAMPOS e GOMES, 2008),a fim de sistematizar os resultados e apresentá-los em um site.
2.1 Identificação dos elementos
a)Análise de domínio:
A análise de domínio proposta por Hjørland (2002) envolve as seguintes questões:
produção de guias de literatura ou portais especializados
construção de classificações especializadas e tesauros
indexação e recuperação nas especialidades
estudos empíricos de usuários
estudos bibliométricos
estudos históricos
estudos documentais e de gênero
estudos epistemológicos e críticos
estudos terminológicos, linguagens especializadas, bases de dados
GT2
587
semânticas e estudos de discurso
estruturas e instituições na comunicação científica
cognição científica, conhecimento especializado e inteligência artificial
Entretanto, nessa análise, deu-se destaque aos estudos empíricos de usuários, uma vez que em diferentes comunidades há diferentes necessidades de informação como análise de proteínas ou nucleotídeos, druggability, sequência genética. Além disso, estudos históricos foram analisados com a finalidade de se compreender documentos gerados pelas diversas comunidades antes da descoberta da estrutura doADN.Apartir do surgimento das “ômicas” houve uma mudança na identificação do cenário da Biologia (junção de várias áreas para um estudo mais particularizado, como a Bioinformática, por exemplo) o que revolucionou sua história. Conseqüentemente os estudos documentais e do gênero também foram analisados, já que os recursos diferenciados da Bioinformática geraram diferentes tipos de documentos além dos tradicionais livros, cadernos de campo e mesmo artigos impressos. Estes recursos deram lugar a bancos de dados genômicos, ontologias, softwares específicos voltados para a atividade de anotação genômica. Isto tem relação com a organização de conteúdos em sites porque estes são itens (objetos) indispensáveis para se obter as informações / recursos necessários para os profissionais realizarem suas pesquisas. Nestes novos recursos estão contidas as informações e não mais nos pesquisados anteriormente ao surgimento das novas tecnologias
b) Etnometodologia Como Macedo (2006) sinaliza, “Mais do que uma sociologia da vida cotidiana, a Etnometodologia é uma tentativa de análise dos aspectos fundamentais da ação e da significação implicada”. Dessa forma, por oferecer uma metodologia qualitativa, a pesquisa etnológica é apropriada para descrever a atividade dentro do laboratório, a qual se baseia justamente na ação dos pesquisadores a fim de fazer descobertas relativas a novas drogas para cura das DTNs, por exemplo. Embora Jules-Rosette (2007) apresente oito itens voltados para a Etnometodologia – conferir lista abaixo -, nem todos puderam ser levados em consideração no desenvolvimento da tese.
Indexalidade
reflexibilidade
descritibilidade
conceito de membro da sociedade
práticas das ações socializadas
contextualidade
competência única
abordagem da ação na cena social
Apenas dois deles se mostraram relevantes de imediato: a descritibilidade e o conceito de membro da sociedade. O primeiro por ser importante descrever as ações dos pesquisadores e os
GT2
588
documentos por eles elaborados, a fim de tornar a ambiência científica (onde o conhecimento é gerado) descritível, inteligível e analisável. O segundo por sinalizar que o pesquisador-observador (no caso o Cientista da Informação) precisa de certa forma, pertencer à comunidade na qual realiza o estudo, filiando-se como membro do grupo.
2.2 Organização dos elementos
O segundo aspecto metodológico adotado é o método facetado (RANGANATHAN, 1967; AITCHISON, 1970 CAMPOS, 2001; BROUGHTON, 2002), o qual apresenta cânones e princípios para a formação de estruturas hierárquicas que estão organizadas em facetas, reunidas em Categorias Fundamentais. Esse método possui hospitalidade, permite escalabilidade e possibilita múltiplos acessos. É ideal, portanto, para uso em sites, uma vez que permite a maior possibilidade de relação entre assuntos, bem como a incorporação de novos. Com a adoção do método de faceta, o que se verificou no levantamento dos dados (os elementos que integrariam o modelo) foi a necessidade de incluir não apenas os princípios de classificação (hierarquização), mas de associação entre eles. O método prevê a escolha de uma primeira faceta que determina o principal atributo pelo qual o modelo foi estabelecido e é seguida pelas demais facetas. Isso não significa que a ordem seja prescritiva, uma vez que o usuário pode fazer a busca por onde deseja, mas “geralmente a maioria usará a disposição básica disposta na tela” (DENTON, 2009). No caso do Laboratório, a tarefa está voltada para estudos genômicos de organismos causadores de doenças tropicais negligenciadas e, então, tornou-se primordial a escolha de ORGANISMOS como a primeira faceta a ser considerada. Isso não diminui a importância das demais facetas estabelecidas, mas tudo o que é feito em torno das pesquisas está voltado para aqueles estudos. A partir dos organismos (que são o objeto de pesquisa) então como um ponto de acesso, foram identificados os demais objetos: software para anotação genômica (recursos), pesquisadores envolvidos (recursos humanos) e os objetos a estes relacionados (projetos, publicações) Após a aplicação da metodologia acima apresentada, foram identificados os seguintes elementos para compor o modelo de representação. São eles:
|
|
ORGANISMOS |
|
|
ONTOLOGIAS |
|
|
ETAPAS NA ATIVIDADE DA ANOTAÇÃO GENÔMICA |
|
|
EQUIPE DE ANOTAÇÃO GENÔMICA |
|
|
PROJETOS |
|
|
PROGRAMAS |
|
|
BANCOS GENÔMICOS |
|
|
BANCOS DE PUBLICAÇÕES |
|
|
INSTITUIÇÕES |
|
Esses elementos identificados resultaram nas seguintes facetas – pontos de acesso -: |
|
|
GT2 |
589 |
ORGANISMOS, RECURSOS DE ANOTAÇÃO (in silico), EQUIPE DE ANOTAÇÃO GENÔMICA, PROJETOS e INSTITUIÇÕES e que são apresentados abaixo:
Além das relações lógicas em que os elementos das facetas estão distribuídos de forma hierárquica (mostrado com clareza na faceta: ORGANISMOS) o modelo evidenciou um grau maior das relações associativas, no caso as relações funcionais-sintagmáticas por se tratar, provavelmente, neste modelo, de objetos individuais.
GT2
590
2.2.1 Discussão do modelo
A metodologia adotada tornou possível que se desenhasse um modelo de sistema de informação que permite acesso tanto a informações ligadas diretamente às pesquisas quanto à gestão das atividades realizadas no Laboratório. As categorias foram úteis para organizar o primeiro nível e, em seu interior, foram identificadas relações lógicas (tipos de organismos, tipos de pesquisadores) e também as relações funcionais- sintagmáticas, permitindo assim que um objeto possa ser encontrado a partir de mais de um ponto de acesso, como mostram os exemplos a seguir no modelo:
Organismo A -> recursos associados -> Ontologias Recursos de anotação genômica -> Bancos de informação > Ontologias Organismo A ->Pesquisadores associados - Coordenador Equipe de anotação -> Cordenador -> Organismo A
Um recurso específico associado seria, por exemplo, um banco genômico de um dado organismo.
GT2
591
Como o objeto de representação é uma atividade, ela demanda a utilização de programas específicos para cada etapa em que esta atividade se realiza. Assim, temos, para a Etapa: Avaliação de qualidade, o programa Phred, para a Etapa: Análise de similaridade, os programas BLAST/FASTA/Interpro, e assim por diante. A tecnologia permite que um mesmo programa possa estar associado a mais de uma etapa. Por exemplo, a etapa de predição in silico de genes pode ocorrer em paralelo com a etapa de similaridade (WAGNER, 2006). As novas tecnologias da informação permitem maior flexibilidade de navegação. Assim, um mesmo objeto pode ser recuperado através de mais de um ponto de acesso: a partir de um pesquisador pode-se identificar seus diversos relacionamentos na atividade de anotação genômica e também no próprio Laboratório, isto é, o Organismo com o qual está envolvido, Projetos associados, sua Produção científica A elaboração do modelo viabilizou traçar diretrizes metodológicas para a construção de estruturas sistemáticas.
3 DIRETRIZES METODOLÓGICAS
As diretrizes são generalizáveis e podem ser aplicáveis em outros campos do conhecimento em que se necessite organizar e representar atividades/tarefas. Elas foram elaboradas de acordo com o caminho percorrido pelas metodologias adotadas na pesquisa e são:
|
• |
Para captura do conhecimento |
||
|
1 |
– Filiar-se como membro da comunidade |
||
|
2 |
- Descrever as ações dos pesquisadores |
||
|
3 |
- Identificar os temas do domínio |
||
|
4 |
- Estabelecer um recorte do domínio |
||
|
5 |
- Levantar a literatura relacionada com o recorte escolhido |
||
|
6 |
- Identificar e anotar as informações relevantes |
||
|
• |
Para organização/estruturação |
||
|
7 |
- Descrever a funcionalidade de cada objeto |
||
|
8 |
- Identificar as relações hierárquicas |
||
|
9 |
- Identificar as relações partitivas |
||
|
10 |
- Identificar as relações funcionais-sintagmáticas |
||
|
11 - Determinar as Categorias |
|||
|
• |
Para apresentação do modelo |
||
|
12 - Identificar a faceta inicial |
|||
|
13 - Observar o princípio da fórmula PMEST |
|||
|
GT2 |
592 |
||
4 CONSIDERAÇÕES FINAIS
A comunidade científica em genômica transita em diferentes áreas do conhecimento e lida com o surgimento de novas áreas. Sendo assim, o Cientista da Informação, devido à dinâmica do conhecimento, possui importante papel na busca permanente de novos recursos, na sua sistematização e na disponibilização em serviços de informação. Para isso, pode valer-se dos princípios de classificação, como os adotados nesta pesquisa, uma vez que são fundamentais em qualquer atividade que requeira organização de dados, de informação, de conhecimento. Em um Laboratório científico, torna-se evidente a importância de bancos de informação para verificar a validade, evitar repetição de pesquisas, com evidente desperdício de recursos e conseqüente frustração do pesquisador quando descobre que “chegou tarde”. O caminho de análise de domínio preconizada por Hjørland foi iniciado com ênfase na revisão da literatura gerada pelos pesquisadores que ali atuavam. Artigos, dissertações, teses e curriculum vitae tornaram-se documentos importantes e mesmo cruciais para a compreensão da atividade científica exercida pelos profissionais com especificidade na anotação genômica. Da mesma forma, foi feita consulta à bibliografia fora do âmbito do Laboratório, o que contribuiu na abordagem a que esta pesquisa se propunha. O percurso realizado indicava o que devia ser analisado, mas o como realizar esta análise só foi possível ao se postular a adoção da etnometodologia como método para capturar o conhecimento. Com isso, compreenderam-se melhor as atividades, complementando o que se obteve por meio do proposto pelo método da análise do domínio. Na coleta dos dados, verificou-se que não há um consenso na literatura quanto aos termos usados para designar os objetos das ações. Por exemplo, há alternância entre os termos programas/ ferramentas/software; bancos de dados/ontologia; sistemas de anotação/ferramenta de anotação. Isso evidencia a relevância de que não se deve pautar pelos nomes dos objetos conforme referenciados nas diversas fontes, mas na necessidade de caracterizá-los para melhor situá-los no modelo de representação. Assim, a padronização torna-se imprescindível para se estruturar um modelo, evitando, dessa forma, a sinonímia, por exemplo, (que poderia ser um complicador). No caso da atividade de anotação genômica, estabelece um controle sobre os procedimentos desta atividade. Ao iniciar o desenvolvimento do modelo de representação, partiu-se do pressuposto de que o método de faceta seria adequado, considerando que os sistemas de classificação existentes e utilizados em pesquisas de organização do conhecimento mostravam-se inadequados, em especial por serem hierárquico-enumerativos, portanto estáticos, voltados para bases de conhecimento. No caso da atividade de anotação genômica, o que se representa, de fato, são as atividades, as ações envolvidas no processo de anotação e, em uma visão sistêmica, os elementos associados. O que se manifesta são
GT2
593
objetos heterogêneos na realidade do Laboratório cuja relações funcionais-sintagmáticas se fizerem fortemente presentes. Acredita-se que um sistema de informação no modelo aqui proposto seja de grande utilidade e possa ser incluído em um site científico ou em outro contexto, no qual haja necessidade de recuperação de informação que apóie os cientistas envolvidos nas soluções de problemas. Entretanto, não se pode dizer que tal modelo, seja hermético e definitivo. Dada a dinamicidade das informações, tudo está sempre em desenvolvimento, acompanhando a modernidade das tecnologias e este modelo de representação não está imune a tais modificações.
Abstract: This study aims at investigating methodological possibilities to represent information resources produced and utilized in a specific environment of interdisciplinary domain through the elaboration of a model of representation of a research activity. The empiric approach is related to the Molecular Biology domain developed in the scientific activity of a modern Laboratory. The work in the Lab comprises scientific research related mainly to the genome of Trypanosomatids and Negleted Ttropical Diseases such as Chagas disease (T. cruzi) and other trypanosomosis, leishmaniosis (Leishmania sp.), generating information and scientific knowledge. The research focus the organization of content of this knowledge generated in the Lab emphasizing the activity of genome annotation. In order to achieve efficient knowledge organization, the Theory of Classification was applied, emphasizing it as tool of the Information Science that helps the systematic structuring of information developed by the research crew but the study demonstrated the importance of the functional-sintagmatic relations in the organization of heterogeneous objects. The methodology used for the elaboration of a model of representation is based on the analysis of domain and in the etnomethodology to the identification of the elements present in that activity and in the method used for the classification of these elements. Also, guidelines were defined to the representation of the model of an activity.
Keywords: Theory of Classification-1. Knowledge Organization-2. Information Representation-3. Domain Analysis-4. Etnomethodology-5.
REFERÊNCIAS
AITCHISON. J. The thesaurofacet: a multipurpose retrieval language tool. Journal of Documentation, 26 (3) p. 187-203, 1970.
BLATECKYA., GAMIEL K., RAMAKRISHNAN L., REED, D., REED, M. Building the bioscience gateway. (North Carolina Biosite. Disponível em: <http://www.ncbiosite.org>. Acesso em 13 fev, 2009.
BROUGHTON, Vanda. Faceted classification as a basis for knowledge organization in a digital environment; the Bliss bibliographic classification as a model for vocabulary management and the creation of multidimensional knowledge structures. New Review of Hypermedia and Multimedia. v. 7, issue 1, 2002. p. 67 – 102.
CAMPOS, Maria Luiza de Almeida. Linguagem documentária: teorias que fundamentam sua elaboração. Niterói: EdUFF, 2001. 133p.
GT2
594
CAMPOS, Maria Luiza de Almeida e GOMES, Hagar Espanha. Taxonomia e Classificação: o princípio de categorização. Data GramaZero – Revista de Ciência da Informação, v. 9, n. 4, agosto,
2008.
CHAU, Michael et al Building a scientific knowledge web site: The NanoPort experience. Decision Support Systems, (42) 1216-1238, Nov 2006.
DAHLBERG, Ingetraut. Ontical Structures and Universal Classification. Bangalore: Sarada Ranganathan Endowment for Library Sciences Series II, Sarada Ranganathan Lectures II, 1978.
Knowledge organization: its scope and possibilities. Knowledge Organization, v. 20, n.4, 1993. p. 211-222.
DENTON, William. How to make a faceted classification and put it on the web. Disponível em: <
http://www.miskatonic.org/library/facet-web-howto.html>. Acesso em 12 dez 2010.
GIBAS, C., JAMBECK, P. Desenvolvendo Bioinformática . Tradução de Cristina de Amorim Machado. Rio de Janeiro: Campus, 1st ed., 2001.
GIL, Henrique Urbano. El enfoque etnometodológico en la investigación científica. In: Liberabit:
Lima (Peru) Revista de Psicologia, número 13:89-91, 2007.
GILCHRIST, Alan. Thesauri, taxonomies and Ontologies – an etymological note. Journal of Documentation, v. 59, n. 1, 7-18, 2003.
GOMES, H. E; MOTTA, D.F. e CAMPOS, M.L.A. Revisitando Ranganathan: A Classificação na rede. 2006. Disponível em: < www.conexaorio.com/biti/ >.Acesso em: 13 abr 2008.
HJØRLAND, Birger. Domain analysis in information science. Eleven approaches – traditional as well as innovative. Journal of Documentation, vol. 58, no. 4, pp. 422-462, 2002.
JULES-ROSETTE, Benetta. Huit aspects principaux de l’Ethnomethodologie. In: Pratiques de formation (analyses), Ethnométhodologies, ( Université de Paris VIII),. numéro spécial de la revue Pratiques de formation, numéro double 11-12, 1985
KUMAR, Krishan. Theory of Classification. 2nd. Revised. New Dehli: Vikas Publishing House, 1981. 539p.
MACEDO, Roberto Sidnei. Etnopesquisa crítica, etnopesquisa – formação. Brasília: Líber Livro Editora, 2006.
NUNES, Everardo Duarte. Interdisciplinaridade: conjugar saberes. in: Saúde em debate, v. 26, n.62, p.249-258, set/dez, Rio de Janeiro, 2002.
OLIVEIRA, Laura de Lira e. Organização dos conteúdos de conhecimento para sites científicos: a representação da atividade de pesquisa em laboratório de Biologia Molecular de Tripanosomatídeos e Flebotomíneos. Tese (Doutorado), Universidade Federal Fluminense. Niterói,
GT2
595
RJ, 2011.
RANGANATHAN, S. R. Prolegomena to Library Classification. Bombay: Asia Publishing House,
1967.
STEWART, Darin L. Building Enterprise Taxonomies. USA: Mokita Press, 2008. 229 p.
WAGNER, Glauber. Geração e análise comparative de sequências genômicas de Trypanosoma rangeli. Dissertação (Mestrado) – Instituto Oswaldo Cruz. Rio de Janeiro, 2006.
GT2
596
COMUNICAÇÃO
ORAL
O CORDEL E AS LINGUAGENS DOCUMENTÁRIAS
Maria Elizabeth Baltar Carneiro de Albuquerque
Resumo
O estudo residiu na análise dos temas tratados na literatura popular de cordel, visando à expansão
da classe de literatura nas classificações bibliográficas, partindo da hipótese de que as classificações propostas por vários estudiosos da área, denominadas de ciclos temáticos, possibilitariam esta expansão. O corpus, constituído de mil duzentos e cinquenta folhetos foi selecionado, aleatoriamente, do acervo composto por 5.000 cordéis do Centro de Documentação do Programa de Pesquisa em Literatura Popular da Universidade Federal da Paraíba. Deste corpus, foram analisadas obras de trezentos e quarenta e cinco poetas, entre os mil e setenta e três autores que figuram no acervo. No trabalho, discorreu-se sobre a literatura popular, considerando o conceito, a origem e as classificações propostas por diferentes estudiosos deste tipo de literatura. A semiótica greimasiana constituiu a teoria básica, priorizando os investimentos semânticos de tematização e figurativização para análise dos discursos dos folhetos de cordel, complementando com as classificações bibliográficas, linguagens utilizadas na organização de acervos com o objetivo de agrupar documentos de um mesmo tema. A análise dos folhetos de cordel possibilitou a identificação e extração das figuras que conduziram aos temas, gerando 27 classes temáticas que irão compor a classe de Literatura Popular nas classificações bibliográficas.
Palavras-chave: Literatura Popular ─ Cordel. Classificação Bibliográfica. Representação do conhecimento. Semiótica. Ciência da Informação.
Resumo
O estudo residiu na análise dos temas tratados na literatura popular de cordel, visando à expansão
da classe de literatura nas classificações bibliográficas, partindo da hipótese de que as classificações propostas por vários estudiosos da área, denominadas de ciclos temáticos, possibilitariam esta expansão. O corpus, constituído de mil duzentos e cinquenta folhetos foi selecionado, aleatoriamente, do acervo composto por 5.000 cordéis do Centro de Documentação do Programa de Pesquisa em Literatura Popular da Universidade Federal da Paraíba. Deste corpus, foram analisadas obras de trezentos e quarenta e cinco poetas, entre os mil e setenta e três autores que figuram no acervo. No trabalho, discorreu-se sobre a literatura popular, considerando o conceito, a origem e as classificações propostas por diferentes estudiosos deste tipo de literatura. A semiótica greimasiana constituiu a teoria básica, priorizando os investimentos semânticos de tematização e figurativização para análise dos discursos dos folhetos de cordel, complementando com as classificações bibliográficas, linguagens utilizadas na organização de acervos com o objetivo de agrupar documentos de um mesmo tema. A análise dos folhetos de cordel possibilitou a identificação e extração das figuras que conduziram aos temas, gerando 27 classes temáticas que irão compor a classe de Literatura Popular nas classificações bibliográficas.
Palavras-chave: Literatura Popular ─ Cordel. Classificação Bibliográfica. Representação do conhecimento. Semiótica. Ciência da Informação.
GT2
597
1 Introdução
A Pós-Graduação em Biblioteconomia (1977-1996) e, posteriormente, em Ciência da Informação (1997-2001), na UFPB tem uma tradição histórica que deve ser considerada e foi reestruturada, tendo como área de concentração – Informação, Conhecimento e Sociedade. Essa área se desdobra em duas linhas de pesquisa, na qual destacamos Memória, organização, acesso e uso da informação que tem a seguinte ementa: envolver questões teóricas, conceituais, reflexivas e metodológicas voltadas à produção, apropriação, democratização, representação, usos e impactos da informação, e à proteção das memórias, do patrimônio cultural e identitário, associadas ou não às tecnologias de suporte. Nesse sentido, apresentamos um projeto de pesquisa cujo objeto de estudo contribui para esta linha de pesquisa. Por outro lado, o Departamento de Letras Clássicas e Vernáculas da UFPB, através do Programa de Pesquisa em Literatura Popular – PPLP criou um Centro de Documentação na Biblioteca Central, com o objetivo de difundir a literatura popular em suas mais variadas formas: literatura de Cordel, Poesia Oral Tradicional e Conto Popular. No entanto, falta-lhe o devido tratamento técnico para sua recuperação. Todo processo de recuperação da informação começa com o tratamento técnico dos itens
para, em seguida, disponibilizá-los para a circulação (empréstimo e/ou consulta). Para recuperar um determinado material informacional, no caso o folheto de cordel, o usuário necessita que o folheto esteja descrito, conforme os padrões de organização, de forma a permitir sua localização. Em um Sistema de Recuperação da Informação (SRI), destacamos três etapas principais: a indexação, o armazenamento e a recuperação propriamente dita. No entanto, a indexação é a etapa primordial, em que o tema principal do documento é identificado, para a efetividade e eficácia do sistema, pois permite reunir todos os documentos de um mesmo assunto sob um único tema, tornando maximizada
a chance de o usuário recuperar todos os itens de um mesmo assunto.
Ao conhecermos o Centro de Documentação do Programa de Pesquisa em Literatura Popular (PPLP) da Universidade Federal da Paraíba, durante a pesquisa do doutorado, observamos que, em seu acervo, a coleção de folhetos de cordel não atende aos padrões de organização, armazenagem
e recuperação. Os folhetos de cordel estão, em sua maioria, armazenados e organizados em ordem
alfabética de título, o que dificulta sua precisa recuperação. Diferentemente em outras bibliotecas estão organizados por autor (poeta). Para organizar tecnicamente a informação em acervos especializados, como é o caso da literatura popular de cordel, é necessário criar formas de representação e recuperação eficazes.
2 Literatura popular escrita: o cordel
O texto popular pode se apresentar nas modalidades oral ou escrito, cujos gêneros se destacam:
GT2
598
o romance, o conto, a cantiga, entre outros, como tipicamente orais e o cordel, escrito. O que não
significa dizer que não se possa passar de uma modalidade para outra, como afirma Batista (2005, p. 3) “Mesmo os de origem oral partiram um dia de uma escritura e o escrito (o cordel) tem por finalidade ser lido, cantado, representado”. O folheto de cordel não se constitui apenas de histórias passadas e tradicionais, é, sobretudo, uma produção dinâmica e esta produção é escrita, porém não é transmitida somente por meio de leitura silenciosa e individual. Ocorre através da oralidade, que se
materializa nas leituras comunitárias, fato comum nas regiões rurais do Nordeste do Brasil, graças aos aspectos da musicalidade dos versos presentes nos folhetos. A literatura de cordel é uma forma de poesia popular impressa. Sofreu influência dos povos espanhóis, franceses e principalmente, portugueses, cujo termo está relacionado à forma de apresentação dos folhetos, presos em barbantes (cordéis) nas feiras, praças e mercados populares. Sua origem está ligada à divulgação de histórias tradicionais, narrativas orais presentes na memória popular, chamados romances. Para Menezes (2006, p. 10) a história da literatura de cordel pode ser identificada por pelo menos três períodos bem característicos: no primeiro período boa parte dos textos concentrava-se em torno dos romances de cavalaria; no segundo a inserção do herói popular nordestino, tipicamente rural e no período mais recente o predomínio de folhetos considerados de acontecimentos. Cascudo (1939), em seu livro “Vaqueiros e Cantadores” considerou que os folhetos foram introduzidos no Brasil por cantadores que “improvisavam versos, viajantes pelas fazendas, vilarejos
e cidades pequenas do sertão”. O texto e a forma eram caracterizados pela oralidade, “em todo o
mundo, desde tempos imemoriais, a grande tradição da literatura escrita culta correspondeu sempre, em todas as culturas, a pequena tradição oral de contar” (MEYER, 1980, p. 3). O costume de contar histórias nas fazendas ou engenhos sempre foi muito presente. O Nordeste é a região brasileira em que os valores trazidos pelos colonizadores portugueses, nos séculos XVI e XVII, foram mais aceitos, absorvendo, consequentemente, este tipo de literatura, de manifestações culturais. Historicamente, a produção literária, sobretudo a escrita, foi privilégio de poucos, entretanto, as criações dos poetas clássicos passaram a ser cantadas através dos tempos:
No final do século XIX e começo do século XX, os cantadores de viola percorriam as fazendas, fazendo pelejas, cantando façanhas dos heróis da época, noticiando acontecimentos, criando um mundo fantástico de seres, com histórias mirabolantes e contos de fadas: divertiam e instruíam. Mas a cantoria tinha regras claras, tanto para composição do verso quanto para o procedimento do desafio, da peleja. Daí herdou o cordel o formato, trazendo da oralidade, da sonoridade do versos rimado, as regras para a palavra escrita. Além do formato, o cordel herda também as temáticas. Sempre juntas caminharam a cantoria e a literatura de cordel (SOUSA, 2007, p. 72).
É importante assinalar que os folhetos de cordel tratavam e tratam de uma grande diversidade de temas e de maneira geral, o poeta nordestino é conservador e os demonstra em seus escritos,
GT2
599
mantendo em seus versos uma postura ratificadora dos valores tradicionais, o que não significa afirmar que eles não escrevem fatos novos. “Assim, com histórias fabulosas e alguns títulos descomunais, os cordelistas conquistaram os eruditos e espalharam pelo Brasil sua irreverente arte poética nordestina
]” [
(ALMEIDA, 2009, p. 10).
3 Semiótica e linguagem
A semiótica de origem francesa, também conhecida como semiótica greimasiana, procura dar sentido ao discurso, através do percurso gerativo da significação, modelo teórico-metodológico, cujo escopo é estudar a produção e a interpretação de textos. Tal percurso apresenta três níveis – fundamental, narrativo e discursivo – que vão dos mais simples e abstratos aos mais complexos e concretos. Para Pais (1984, p. 49), o conjunto de discursos manifestados pertencentes a um universo de discurso, apresenta certas características comuns e constantes coerções configuradas de uma norma discursiva e processos de produção de ideologia, entendida como sistema de valores, de relações intertextuais e interdiscursivas. Os critérios de classificação e dos universos dos discursos, como os discursos literários e não-literários permitem delimitar muitos aspectos da tipologia do discurso.
Entretanto, quando se trata de discursos etnoliterários, particularmente da literatura popular, estes não se submetem a critérios que tipificam os discursos acima mencionados, pela complexidade e diversidade com que caracterizam uma identidade cultural. Greimas (2008) entende que o exercício da linguagem produz a manifestação semiótica sob
a forma de encadeamento de signos. Porém, propor metodologia de análise para explicar fenômenos linguísticos leva a crer que a análise dos signos produzidos pela articulação da forma da expressão
e do conteúdo só é possível quando os dois planos da linguagem são antes dissociados para serem
estudados e descritos, cada um separadamente. O autor citado acima não parte do signo para montar sua metodologia, mas daquilo que posteriormente denominará “figuras” (de acordo com a proposta de signo para Hjelmslev (1975, p. 51)), ou seja, unidades narrativas que produzem um bloco de significação. Sua semiótica está mais preocupada em descrever os processos de construção de sentido do que em entender os mecanismos de representação da realidade. Discorrendo sobre o percurso gerativo da significação, em que emergem as estruturas fundamental, narrativa e discursiva, cada uma com uma sintaxe e uma semântica, o presente estudo prioriza, nas análises dos discursos dos folhetos de cordel, a semântica discursiva, privilegiando os processos de tematização e figurativização com o fim específico de chegar à elaboração mais adequada de classes temáticas representativas da literatura popular. A semântica discursiva tem como componente a tematização – elementos abstratos presentes no texto – e a figurativização – elementos concretos presentes no texto – que dão concretude ao tema. As figuras do texto formam uma rede, uma trama e, para entendê-las, é necessário conhecer o primeiro nível temático que, como o nível figurativo, são palavras e expressões, que apresentam
GT2
600
traços comuns de significação e que podem ser agrupados. Esses traços comuns podem ser reduzidos a uma oposição semântica. É a partir desta oposição que se constrói a estrutura fundamental. A tematização e a figurativização são procedimentos semânticos da discursivização, estando ambas interligadas. Enquanto na tematização os traços semânticos são disseminados no discurso de forma abstrata, na figurativização são revestidos por traços semânticos sensoriais. Os elementos concretos que representam coisas, ações e qualidades encontradas no mundo natural, chamam de figuras e os elementos abstratos de temas. A relação existente entre as figuras apresentadas que darão sentido para que se descubra o tema subjacente a elas, é o que chamamos de “encadeamento de figuras”. É por intermédio dessas retomadas, encadeamento de referentes do mundo concreto que vão construir os encadeamentos figurativos, com o objetivo de tornar o texto coerente, seja com ideias do mundo real ou com a estrutura textual. Cada texto tem, pois, uma função diferente: os temáticos, explicam o mundo e os figurativos, criam simulacros do mundo. As sequências das figuras, ao serem organizadas em grupos, traduzem os temas subentendidos nos textos. Isto significa dizer que os temas e figuras estão interligados e criam seus respectivos percursos, por meio dos quais, podemos reconhecer “de que trata um texto”, auxiliando-nos, consequentemente, no desvelamento da sua significação. Fiorin (1990, p. 72) confirma essa relação entre o temático e o figurativo quando afirma que
os temas são palavras ou expressões que não correspondem a algo
existente no mundo natural, mas a elementos que categorizam, ordenam a realidade percebida pelos sentidos. As figuras, como elementos concretos são elementos ou expressões do mundo natural: substantivos concretos, verbos que indicam atividades físicas, adjetivos que expressam qualidades físicas.
] [
Evidencia-se, portanto, que os temas são depreendidos pelo que subjaz às figuras subordinadas, ou sob controle de um contexto, tornando viáveis as possibilidades significativas. Dessa forma, emergem segundo um cotejo minucioso das figuras que unem e se ordenam no interior do texto.
4 Linguagens documentárias
A Ciência da Informação é uma disciplina voltada para o estudo da produção, circulação e uso da informação. Em uma cultura existem vários tipos de conhecimentos e podemos distingui-los por seus usos e pelos diferentes grupos sociais que os produzem. No âmbito da Ciência da Informação, a organização do conhecimento diz respeito ao desenvolvimento de teorias em determinadas áreas de assunto com o objetivo de elaborar instrumentos para representarem essas informações. As principais características da representação da informação residem na substituição do texto do documento por sua descrição abreviada, utilizada
GT2
601
como um artifício para recuperar o que é essencial no documento, isto é, o tema. Arepresentação da informação envolve dois processos: a análise do assunto do documento, cujo resultado deve ser colocado numa expressão linguística, semanticamente relacionada e a atribuição de conceitos na utilização de um instrumento de padronização, aqui denominada de linguagem documentária, que garanta aos indexadores o uso dos mesmos conceitos para representar documentos semelhantes, possibilitando assim a comunicação entre usuários e os sistemas de informação. As linguagens documentárias são constituídas de sistemas de classificação bibliográficos, artificialmente construídos, a partir de uma linguagem natural presente nos documentos, com o objetivo de controlar o vocabulário de um determinado campo do saber. Estes vocabulários, por sua vez, são códigos artificiais, de signos normalizados que permitem uma representação mais efetiva e eficaz do conteúdo documental com a função de recuperar a informação nele contido, no momento
em que o usuário necessitar. Os sistemas de classificação decimais, como a Classificação Decimal de Dewey e a Classificação Decimal Universal, dentre outros, são tipos de linguagens documentárias, quando permitem agrupar documentos segundo o seu conteúdo, visando ao armazenamento e à recuperação da informação. No presente trabalho, buscou-se compor um conjunto de saberes da Literatura Popular, relacionando-os entre si com aspectos hierárquicos, através do estabelecimento de relações entre temas e figuras extraídos dos folhetos de cordel, de acordo com o conceito ou conceitos que cada léxico representa.
O reconhecimento da importância da Literatura de Cordel, enquanto patrimônio histórico
e cultural do povo, principalmente, da população brasileira nordestina, levou-nos ao estudo deste tipo de literatura e o seu tratamento para recuperação nos acervos das bibliotecas. O estudo reside, essencialmente, em analisar os temas tratados na literatura popular, especificamente, nos “folhetos de cordel”, visando à expansão da classe de Literatura nas Classificações Bibliográficas, considerando que a esta classe não atendem os parâmetros teórico-conceituais da Literatura Popular. Investigar os diversos temas da Literatura Popular de Cordel, a partir do conhecimento produzido foi um desafio, pois tudo nos leva a crer que linguagens em estilos diferentes podem transmitir o mesmo conteúdo e uma classificação precisa para a descrição científica, como assevera Menezes (2006, p. 2):
Da exatidão da classificação depende a exatidão do estudo ulterior. Todavia, posto que a classificação tenha o seu lugar na base de todo o estudo, ela própria deve ser o resultado de um exame preliminar aprofundado. Ora, é justamente o universo que podemos observar: a maioria dos pesquisadores começa pela classificação, introduzindo-a de fora no corpus quando, de fato, deveriam deduzi-la a partir deste.
A sociedade contemporânea tem enfrentado constantes mudanças culturais que possibilitam
uma nova forma de pensar, e a análise sócio-histórica de uma sociedade pode ser elaborada de acordo
GT2
602
com a percepção da linguagem adotada por ela. Linguagem não enquanto código, mas como produto de sua própria cultura.
é através da análise da ideologia
que ele reflete. O poeta popular nordestino é conservador, por excelência. Há que examinar detidamente cada conteúdo dos folhetos, através da linguagem
e das idéias que ali transparecem com espontaneidade (O QUE
, 2006, p. 1).
[
]
uma maneira de identificar o cordel [
]
As transformações sociais, culturais, políticas e técnicas e o surgimento de redes mundiais de informação impõem a necessidade de se tratar o conteúdo dos documentos, de maneira racional e analítica, com o fim de obter uma melhor representação da informação produzida. A classificação por assuntos ou bibliográfica é utilizada com o objetivo de se agruparem os documentos sob o mesmo tema. Como forma de tornar mais ágil sua recuperação. O documento é considerado como “qualquer unidade, impressa ou não”, passível de catalogação e indexação, que compreende a possibilidade de representar o seu conteúdo informacional. E isto ocorre quando são criados códigos de classificação bibliográficos. As classificações bibliográficas são consideradas como instrumentos na organização de acervos. A sua organização lógico-hierárquica faz com que os documentos sejam armazenados, obedecendo a áreas de assuntos existentes e classificáveis do conhecimento. A Classificação Bibliográfica Universal, como a Dewey Decimal Classification – CDD e a Classificação Decimal Universal – CDU são consideradas como parâmetros para organizar o universo bibliográfico. Entretanto, a representação do conhecimento passa pela compreensão de princípios, fundamentos teóricos e elementos constitutivos de um determinado campo do saber. As classificações bibliográficas, até o presente momento, inserem a literatura de cordel no âmbito do folclore. Tal tratamento é inconsistente quando se trata de um instrumento de controle de vocabulário, que representa a expressão da cultura popular. Nesse sentido, pretendemos contribuir para a expansão da classe de literatura nas classificações bibliográficas, através da análise do folheto de cordel, objeto deste estudo, que passará a ser tratado nos acervos das bibliotecas por princípios terminológicos com uma estrutura sistematizada de conceitos, o que permitirá a sua organização, recuperação e disseminação da informação dentro da classe de Literatura e não na classe de Folclore. E a “explicitação desses conceitos e princípios passa pela discussão sobre os modelos de organização do conhecimento” segundo Pereira e Bufrem (2005, p. 29). A organização do conhecimento, enquanto área de estudo, se diferencia em duas concepções de conhecimento: uma, enquanto processo cognitivo individual constitui-se em uma certeza subjetiva ou objetivamente conclusiva da existência de um fato ou do estado de um caso adquirido por meio de reflexão; e a outra, enquanto algo sobre o qual existe certo consenso social. Os sistemas de organização do conhecimento existem desde os tempos remotos e estão presentes em todas as áreas do conhecimento humano, de modo mais simples aos mais complexos.
GT2
603
Desde a Antiguidade, existe a preocupação em classificar e organizar todo e qualquer material
e deu ao homem a importância em registrar a história, preservando assim a memória e a cultura de
qualquer povo. Enquanto fenômeno social, a classificação, devido a seu formato e ao seu tratamento, torna-se a representação temática do conhecimento, visto que as diversas sociedades existentes são agrupadas para atenderem às necessidades de organização e de comunicação, como afirma Costa (1998, p. 66):
Encontramos inúmeros exemplos de classificação inscrita e actuantes no mais variados domínios das relações sociais, tal como se nos apresentam no quotidiano. Basta pensar na maneira como as pessoas tratam umas as outras, ou se referem a terceiras, atribuindo estatutos de superioridade ou inferioridade social, considerando uma distintas e outras vulgares, uma sérias e outras desonestas, uma competentes e outras incapazes, umas merecedoras de mais respeito e outras de menos, e por aí afora.
Nesse sentido, entende-se que a classificação bibliográfica responde, simultaneamente, a uma necessidade de organização interna das unidades de informação quanto à recuperação, visando à comunicação dos conteúdos armazenados e aos seus usuários. Reconhecendo os diferentes objetos que permeiam o mundo em que vivemos, o homem também colecionou “os modos de conhecimento e as cosmologias que elaborava na forma de mitos” (MENEGAT, 2005, p. 5), fatos e narrativas que passadas adiante o homem construiu um determinado modo de pensar o mundo, assim como as coisas que o constituem. Deste modo, o homem tentou dar uma ordem às suas coleções, para representar seu pensamento ou desejo, contribuindo dessa maneira, para a determinação e desenvolvimento de classificações do conhecimento. Instituições como museus, arquivos e bibliotecas, respeitando cada uma, sua organização, origem e a função que
é dada aos documentos, têm características comuns até hoje, por preservarem a memória coletiva. Coletar, organizar, identificar, catalogar e classificar qualquer tipo de suporte informacional constituem atividades que norteiam o tratamento de seus acervos e que fazem dessas instituições, depositárias de coleções, que constituem parte da história de diferentes culturas. Nesse sentido, os sistemas de classificação não são permanentes, com formas e sentidos definidos, porque a História, como assevera Vickery (1980, p. 187),
apresenta uma série de épocas culturais. Cada uma corresponde a um
certo período de anos nos quais o conhecimento apresenta uma estrutura mais ou menos unificada que pode ser expressa numa classificação, mas cada nova
época exige uma nova classificação.
] [
Cabe, contudo, inicialmente conceituar o termo em questão. Classificação é um processo definido, segundo Piedade (1983, p. 9) com a finalidade de “dividir em grupos ou classes, segundo as
diferenças e semelhança. É dispor os conceitos, segundo suas semelhanças e diferenças, em certo número de grupos metodicamente distribuídos”.
GT2
604
Definido o termo classificação, este se caracteriza pelo processo de agrupar as informações de forma que suas relações de analogia se sobressaiam, para que as ciências, o saber ou os documentos possam ser compreendidos de forma precisa. Assim sendo, o processo de conhecimento se realiza, fundamentalmente, através da analogia. Ao classificar, segmentamos o conteúdo a partir de referências que já possuímos, formando agrupamentos em função de suas propriedades comuns. Processo similar ocorre na área da Ciência da Informação, ao se construirem representações de conteúdo operadas por analogia e generalizações, procurando a partir de traços comuns, reunir conceitos, numa tentativa de organizar a informação e de garantir sua recuperação.
6 CLASSIFICAÇÕES DA LITERATURA DE CORDEL
Na tentativa de propor a expansão da classe de Literatura Popular nas Classificações Bibliográficas, objetivo da tese intitulada Literatura popular de cordel: dos ciclos temáticos às classificações bibliográficas, deparamos inicialmente com a questão das propostas de alguns estudiosos, que ora as classificam por temas, ora por “tipologias” e ora por “ciclos temáticos” e, ainda, por “gêneros”. É neste universo de múltiplos temas, como o romance, a valentia, o gracejo,
o desafio, o encantamento, o heroísmo, a religião, a moral, a sátira, a história e muitos outros que o cordel é estudado, pesquisado e debatido em ciclos literários como manifestação da cultura popular. A literatura de cordel revela a luta de classes, o fosso que as separa e o imaginário popular, que fortifica o dia-a-dia de algumas pessoas. Assim, refletir acerca da natureza e da função da
literatura popular através dos folhetos de cordel é estudar o processo de evolução cultural do homem,
é estudar a arte por ele mesmo produzida. Cândido (1989, p. 53) fala da presença da linguagem, fator determinante para a classificação de uma obra ser ou não literária, quando assevera:
A arte, e, portanto a literatura é uma transposição do real para o ilusório por meio de uma estilização formal de linguagem que propõe um tipo arbitrário de ordem para as coisas, os seres, os sentimentos. Nela se combinam um elemento de vinculação à realidade natural ou social, e um elemento de manipulação técnica, indispensável à sua configuração, e implicando em uma atitude de gratuidade.
Daí, iniciaram-se as inquietações, aguçando a curiosidade de conhecer estas classificações realizadas por folcloristas, sociólogos, antropólogos, que apresentam propostas as mais diversas e, supostamente, contraditórias. Necessário se fez, inicialmente, definirem-se alguns aspectos preliminares de tais denominações, para verificar se poderíamos considerá-las como ponto de partida para a proposta daquele estudo. Entretanto, apresentamos neste artigo apenas a definição de ciclos temáticos. Para se entender esta classificação, buscamos em Houaiss (2001) a definição de ciclo e temática:
GT2
605
a primeira compreende uma “série de fatos que ocorrem periodicamente” e a segunda corresponde
a um “conjunto dos temas que caracterizam uma obra literária ou artística”. Ao aglutinarmos os
dois termos, ainda, no nível de tentativas, teríamos: conjunto dos temas que caracterizam uma obra literária ou artística, com ocorrências periódicas, ou conjunto de obras, de uma época, sobre um
determinado tema, conceitos estes, também, equivocados, devido à fluidez, a versatilidade dos poetas
e diversidade de temas conservados e transmitidos por narrativas inspiradas, criadas ou recriadas do imaginário tradicional que nos chegaram através da Península Ibérica. Dos estudiosos pesquisados, encontramos três estrangeiros que propõem uma classificação por
tipos e categorias, mas que não atendem às variações e diversidades temáticas do cordel brasileiro. No Brasil, muitos estudiosos se aventuraram no caminho da classificação temática da literatura de cordel. Identificamos doze classificações, que para alguns consideravam Tipologia e para outros Ciclos Temáticos. A maneira como o cordel está sendo classificado nas bibliotecas e as tentativas de classificá- lo exige o estabelecimento de classes temáticas que permitam e possibilitem, de maneira uniforme,
a armazenagem, a organização e a recuperação dos folhetos de cordel pelo tema tratado por eles.
Conhecer as classificações já existentes foi fundamental. Observamos que estes estudiosos criaram suas próprias classificações, rejeitaram as de outros, fizeram acréscimos e arranjos; outras extensas, inconsistentes, redundantes, confusas, com misturas de gêneros, tipologias e temas, entretanto, não conseguiram fugir das classificações por ciclos temáticos, que é outro equívoco que salta aos olhos, porque os temas são recorrentes e independentes do seu tempo na história e no imaginário. Diante da análise das classificações apresentadas, corroboramos com Propp (1973, p. 12), quando nos mostra a necessidade de iniciar um trabalho mais analítico para se ter uma classificação correta da literatura de cordel.
Uma classificação exata é um dos primeiros passos da descrição científica. Da exatidão da classificação depende a exatidão do estudo ulterior. Todavia, posto que a classificação tenha o seu lugar na base de todo estudo, ela própria deve ser o resultado de um exame preliminar aprofundado. Ora, é justamente o inverso que podemos observar: a maioria dos pesquisadores começa pela classificação, introduzindo-a de fora no corpus quando, de fato, deveriam deduzi-la a partir deste.
Assim, considerando as teorias apresentadas, iniciamos nossa pesquisa pela leitura e análise dos folhetos de cordel, o que possibilitou a identificação e extração das figuras que conduziram aos temas, gerando assim vinte e sete classes temáticas, que irão compor a classe de Literatura Popular nas classificações bibliográficas. Os resultados das análises, primeiramente, foram apresentados em forma de quadros e em seguida por um quadro resumo dos folhetos de cordel analisados por classe. Descrevemos os percursos temáticos e seus revestimentos figurativos, graficamente representados por mapas conceituais, como ferramenta para demonstrar as relações semânticas
GT2
606
existentes entre os temas e figuras na composição das classes temáticas. O uso destes mapas possibilitou a visualização dos temas e figuras destacados em caixa de textos e palavras de ligação, figurativizam e tematizam, representadas por linhas e setas, que explicitam as relações entre eles. Aqui, vale ressaltar que não existe mapa conceitual “correto”. O mapa é construído a partir da maneira de ver, sentir e agir do pesquisador, por ser uma ferramenta muito flexível e que pode ser usada em uma variedade de situações com diferentes finalidades.
A descrição das classes temáticas elaboradas, ao final, permitirá ao bibliotecário, indexar os folhetos de cordel de forma precisa, além de garantir que um mesmo sistema ou sistemas afins usem os mesmos conceitos para representarem documentos semelhantes, bem como facilitará a comunicação entre o indexador, o usuário e o sistema com a utilização de um mesmo vocabulário.
7 CLASSES TEMÁTICAS DA LITERATURA DE CORDEL
Das 27 classes temáticas propostas, apresentamos, neste artigo, apenas a classe temática Bravura e Valentia, como amostra dos resultados obtidos da análise de 60 folhetos de cordel.
|
TÍTULOS DOS FOLHETOS |
FIGURAS |
CONTEXTO |
TEMAS |
|||
|
Encontro de Zé lapada com Chico topa tudo |
Violento |
Cada qual mais violento |
Violência |
|||
|
Encontro de Kung Fu e Lampião |
Meteu-lhe a faca |
Depressa meteu-lhe a faca |
||||
|
O |
crente e o cachaceiro |
Meteu |
O crente meteu a biblia Na cara do cachaceiro |
|||
|
As aventuras de João desmantelado |
Venceu |
Foi quem venceu na [estória |
Vitória |
|||
|
O |
encontro de Rodolfo Cavalcante |
Cangaceiros |
Mais de 30 cangaceiros |
Cangaço |
||
|
com Lampião Virgulino |
||||||
|
Quadro – CLASSE TEMÁTICA: BRAVURA E VALENTIA |
||||||
|
TÍTULOS DOS FOLHETOS |
FIGURAS |
CONTEXTO |
TEMAS |
|||
|
O |
ataque de Mossoró ao bando de |
Cangaceiros |
Já prestou pra cangaceiros |
Cangaço |
||
|
Lampião |
||||||
|
Lampião – herói nacional |
Cangaceiro |
A vida de cangaceiro |
||||
|
Jararaca arrependido porque matou um |
Vou falar num cangaceiro Que com Lampião andou |
|||||
|
menino |
||||||
|
Lampião era o cavalo do tempo atrás |
Fez Lampião cangaceiro |
|||||
|
da |
besta vida |
|||||
|
Diário de Chão Brilhante |
Um cangaceiro gigante Fiel aos seus Camaradas |
|||||
|
GT2 |
607 |
|||||
|
Biografia de Lampião |
O |
famoso cangaceiro |
||
|
Beija Flôr e Teodoro |
E |
cada um cangaceiro |
||
|
Lampião vai ao inferno buscar Maria |
Transformou-se em |
|||
|
Bonita |
[cangaceiro |
|||
|
Jesuíno Brilhante o cangaceiro-gentil |
Cangaço |
Revirando o seu destino |
||
|
A |
entrar para o cangaço |
|||
|
Lampião: herói ou bandido? |
Uma marca que o [cangaço conheceu |
|||
|
Eis um pouco de história de Jesuino |
Para o mundo do cangaço |
|||
|
Brilhante |
||||
|
Lampião o capitão do cangaço |
Do grande rei do cangaço |
|||
|
Volta seca um menino no cangaço |
Do cangaço nas entranhas |
|||
|
História completa de Lampião e Maria |
Do cangaço o soberano |
|||
|
Bonita |
||||
|
José Colatino, o cabra que levou 99 |
O Carranca arrependeu-se De se meter no cangaço |
|||
|
surras |
||||
|
Sombras do cangaço ou a versão de Maria Bonita |
Pois te sigo qual cangaço |
|||
|
Duelo de gigantes |
Cangaço |
Pra no cangaço Ingressar [ ] Este aí é o cangaceiro |
||
|
Cangaceiro |
||||
|
Jararaca o cangaceiro militar |
Cangaço |
Apareceu o cangaço Com bandoleiros locais |
||
|
Bandoleiros |
||||
|
O |
sucessor de Lampião Corisco |
Cruel |
Foi talvez o mais cruel Cangaceiro do Nordeste |
|
|
Cangaceiro |
||||
|
O |
cangaço, sua origem e os bravos |
Cangaceiro |
Cangaceiro tem coragem Sete vidas como gato |
|
|
cangaceiros |
Coragem |
|||
|
A chegada de Lampião no inferno |
Lampião |
Saiba que sou Lampião |
||
|
A candidatura de Lampião para |
Lampião, homem viril |
|||
|
presidente da república |
||||
|
Visita de Lampião a Juazeiro |
Chegou aqui na cidade |
|||
|
A |
famosa cabroeira |
|||
|
Desse bravo Lampião |
||||
|
Lampião – herói de meia tigela |
Quem planta espinho não [pode Colher flor, só colhe [espinho, Foi isso que Lampião |
|||
|
Nascimento, vida e morte do cangaceiro Zé Baiano |
Bandido |
Um bandido desumano |
||
|
Asa Branca a inteligência a serviço do |
Bandoleiro |
Respeitava a serviço do [cangaço Do regime bandoleiro |
||
|
cangaço |
||||
GT2
608
Maria Bonita – A eleita do rei
Para seguir Lampião O temido bandoleiro
Quadro – CLASSE TEMÁTICA: BRAVURA E VALENTIA
|
TÍTULOS DOS FOLHETOS |
FIGURAS |
CONTEXTO |
TEMAS |
||
|
Labareda o capador de covardes |
Bandoleiros |
Os audazes Bandoleiros |
Cangaço |
||
|
Antonio Silvino – A justiça acima da lei |
Receberam os bandoleiros |
||||
|
O |
homem que não sabia que se chamava |
Assassino |
O |
desumano assassino |
Banditismo |
|
José |
|||||
|
Os coronéis do Nordeste |
Banditismo |
Na vida do banditismo Cumpriu o seu destino |
|||
|
O |
grande debate de Lampião com |
Bandido |
Não sabes que sois bandido Roubados de vida humana |
||
|
S.Pedro |
|||||
|
As bravuras de Justino pelo amor de |
Medo |
Nunca assumi [compromisso Com covardia ou com medo |
Hesitação |
||
|
Terezinha |
|||||
|
Nascimento Grande um gigante da |
Desafiado |
Sempre foi desafiado |
Luta |
||
|
capoeira |
|||||
|
Briga de Chico Torto com Salustrino |
Briga |
Se |
gostar mesmo de briga |
||
|
Pancada |
Ta com o diabo de lado |
||||
|
A |
briga do rapa com o camelô |
Agarraram |
Os dois ali se agarraram Com o maior desatino |
||
|
O |
coronel Mangagá e o seringueiro do |
Brigada |
O |
Mangagá avançou |
|
|
Norte |
Deram começo a brigada |
||||
|
O vaqueiro valente apaixonado |
Derrubou |
Alonso com uma pernada Derrubou logo uns dez |
|||
|
A pega do boi bargado no sertão |
Brigar |
O |
boi se fez a brigar |
||
|
jaguaribano |
|||||
|
A |
briga de Chico trovão com Oswaldo |
Brigando |
Do meu pai morrer [brigando Demonstrando valentia |
||
|
Ventana |
|||||
|
Virginio o juiz do grupo de Lampião |
Algoz |
Para julgar suas vítimas Transformava-se em algoz |
Crueldade |
||
|
Epopéia do boi Corisco ou a morte do vaqueiro desconhecido |
Encurralar |
Para lhe encurralar Nunca apareceu ninguém |
Prisão |
||
|
Jerônimo e Paulina o prêmio da bravura |
Valente |
Jerônimo por ser valente Foi quem venceu a questão |
Valentia |
||
|
Venceu |
|||||
|
India Necy |
Valente |
É |
mais valente que os índios |
||
|
Força |
Tem força e é valorosa |
||||
|
História do valente Vilela |
Valente |
De um homem muitovalente |
|||
|
Histórias do herói vaqueiro Zé Romão na pega de bois barbatãos |
Pegou |
Pegou muito barbatão |
Valentia |
||
|
Barbatão |
|||||
|
GT2 |
609 |
||||
|
Anita Garibaldi “A heroína dos dois |
Guerreira |
Como guerreira, atacava, Dava apoio com precisão |
||||
|
mundos” |
||||||
|
As aventuras do filho de Antonio Cobra |
Coragem |
O |
gigante da coragem |
|||
|
Choca |
||||||
|
Morreu o valente Tenório |
Foi um homem de coragem |
|||||
|
História do valente sertanejo Zé Garcia do seu navio |
Se o Garcia tem coragem De pegar o barbatão |
|||||
|
A |
vida de peão de rodeio |
Por isso precisa ter |
||||
|
A |
coragem pra montar |
|||||
|
História de Mariquinha e José de Sousa |
Valentão |
Estou muito satisfeito Temos um genro valentão |
Valentia |
|||
|
Leão |
||||||
|
O |
covarde marinheiro que salvou a |
Salvou |
Neste momento o marinheiro [ |
Salvação |
||
|
tripulação |
] |
|||||
|
Junto do que afundava |
||||||
|
E |
à tripulação salvou |
|||||
|
Quadro – CLASSE TEMÁTICA: BRAVURA E VALENTIA |
||||||
|
TÍTULOS DOS FOLHETOS |
FIGURAS |
CONTEXTO |
TEMAS |
|
Os amores de Chiquinha e as bravuras de Apolinário |
Bravo |
Dum homem bravo que [brigue De vinte e seis qualidades |
Bravura |
|
Biografia de Sebastião Pereira e Silva de Serra Talhada |
Comandava |
Comandava cangaceiros Na lama e na poeira |
Liderança |
|
Quadro – CLASSE TEMÁTICA: BRAVURA E VALENTIA |
|||
Dos cordéis que constituem a classe temática bravura e valentia, emergiram os temas
violência, vitória, cangaço, banditismo, hesitação, luta, crueldade, prisão, valentia, salvação, bravura e liderança.
Os vocábulos violento, meteu e a expressão meteu-lhe a faca figurativizam o tema violência,
caracterizando a ação exercida com ímpeto, força contra a vida.
O vocábulo venceu figurativiza o tema vitória, abordado como forma de superação de
obstáculos que conduziu o herói a conquistar o seu valor. Os vocábulos cangaceiros, cangaceiro, cangaço, banditismo, cruel, coragem, Lampião, bandido e bandoleiro figurativizam o tema cangaço, representando os malfeitores que andavam em bandos pelos sertões do Nordeste, sob a liderança de Lampião. Os vocábulos assassino, banditismo e bandido figurativizam o tema banditismo, marcado pela violência rural exercida pelos chefes políticos locais, para o estabelecimento e manutenção da ordem, formada pela interrelação de valores patrimoniais e paternalísticos responsáveis pela submissão da população rural. O vocábulo medo figurativiza o tema hesitação, sentimento demonstrado pelo receio de fazer
GT2
610
algo por se sentir ameaçado fisicamente. Os vocábulos desafiado, briga, agarraram, brigada, derrubou, brigar e brigando figurativizam o tema luta, cuja intencionalidade é estabelecida pelo domínio sobre o oponente, o
indivíduo. O vocábulo algoz figurativiza o tema crueldade, representando o sofrimento causado pelo bando liderado por Lampião.
O vocábulo encurralar figurativiza o tema prisão, caracterizando a perseguição a animais até
encerrar a caça. Os vocábulos valente, força, pegou, barbatão, guerreira, coragem, valentão figurativizam
o tema valentia, ação que mostra vigor, proeza, façanha e força diante de algumas adversidades ou necessidades da vida. O vocábulo salvou figurativiza o tema salvação, que se refere à libertação de um estado indesejável, de escapar de uma situação em que o indivíduo se encontra em perigo.
O vocábulo bravo figurativiza o tema bravura, caracterizando o indivíduo corajoso, capaz de
enfrentar perigos que colocam sua vida em risco.
O vocábulo comandava figurativiza o tema liderança, representando o comando de tropas de
cangaceiros, tendo como líder Sebastião Pereira e seu sucessor Lampião. Observemos a seguir o mapa conceitual da classe temática bravura e valentia com a relação hierárquica de temas e figuras.
Figura 1 – Mapa conceitual – bravura e violência
GT2
611
7.1 Descrição da classe temática Bravura e Valentia
Contam as bravuras dos cangaceiros e dos “amarelinhos que ninguém dá nada por eles”, mas que são capazes de lutar e vencer homens fortes. Valentia, coronelismo, banditismo e jagunçagem, Lampião, Antônio Silvino, Corisco.
8 Conclusão
O folheto de cordel tem características próprias que o diferenciam das peças populares
GT2
612
orais, mas a elas está vinculado na poesia ritmada, na rima, na sonoridade que corroboram para a assimilação do texto, permitindo que o ouvinte perpetue a estória em muitas outras. Com ilimitados temas, retratando a realidade e o imaginário popular brasileiro, numa linguagem poética e de fácil memorização que contribui grandemente para incentivar os relacionamentos sociais, esta literatura popular vem atraindo a atenção de estudiosos do mundo inteiro como fonte pesquisa. No entanto, as bibliotecas têm enfrentado grandes desafios na tentativa de criar instrumentos
eficazes para armazenagem, organização e recuperação deste suporte. Nas classificações bibliográficas,
a literatura popular de cordel encontra-se inserida na classe “folclore”, uma vez que a ela vem sendo
atribuído o mesmo status da literatura oral que não possui autor conhecido e que se encontra vinculada
a épocas e locais os mais remotos. Entretanto, o cordel tem autoria conhecida, sobretudo no Brasil
onde, a partir dos finais do século XIX, quando Leandro Gomes de Barros inicia a publicação em série de folhetos que versava sobre múltiplos temas. Observamos também que vários estudiosos da área apresentaram classificações para a Literatura Popular de Cordel, denominadas de “Ciclos Temáticos”, o que nos levou a considerar, como hipótese, a possibilidade de utilizá-las para expandir a classe de Literatura Popular nas classificações bibliográficas. Entretanto, as análises apresentadas nesta tese levaram-nos a negar a hipótese levantada em princípio, fazendo com que nosso foco, em relação aos ciclos temáticos, fosse direcionado aos temas tratados nos cordéis. Este procedimento culminou na elaboração de 27 classes temáticas:
Agricultura, Biografias e Personalidades, Bravura e Valentia, Cidade e Vida Urbana, Ciência, Contos, Crime, Cultura, Educação, Esporte, Erotismo, Feitiçaria, Fenômeno Sobrenatural, História, Homossexualismo, Humor, Intempéries, Justiça, Meio Ambiente, Moralidade, Morte, Peleja, Poder, Político e Social, Religião, Romance, Saúde. Doença.
Considerando a criatividade dos nossos poetas e o corpus analisado, estas classes não se esgotam em si mesmas, como tantas outras classificações propostas. Porém, temos a convicção de que estamos mais próximos de atender aos parâmetros teórico-conceituais da literatura popular e aos padrões de organização, armazenagem e recuperação dos folhetos de cordel nas bibliotecas, através da análise dos temas e figuras que a semiótica greimasiana possibilitou. Portanto, esta classificação temática responde, simultaneamente, pela expansão da classe de Literatura Popular nas classificações
bibliográficas e pela necessidade de organização interna das bibliotecas quanto à recuperação, visando
à comunicação dos conteúdos armazenados nos folhetos de cordel e a seus usuários.
Abstract: This study is an analysis of the themes covered by the Cordel Literature, which seeks to expand the topic of literature in bibliographic classifications, assuming that the classifications proposed by various scholars in the field, called thematic cycles, would enable this expansion. The corpus, consisting of one thousand two hundred and fifty booklets was selected randomly and the collection consists of 5,000 cordels of the Documentation Center of Research in Folk Literature of
GT2
613
the Federal University of Paraiba. In this corpus, we analyzed the works of three hundred forty- five poets, among one thousand and seventy-three authors listed in the inventory. At this work, we spoke out about the Folk literature, considering its concept, origins and classifications proposed by different scholars. The basic theory used was the Greimasean Semiotics, prioritizing semantic investments of figurativization and thematization for reflection and discourse analysis of the cordel booklets, complemented with the bibliographic classifications, languages used in the organization of collections aiming to gather the documents of a same theme. The analysis of the cordel booklets enabled the identification and extraction of the figures that led to the themes, therefore creating 27 thematic groups that will compose the Folk literature topic in bibliographic classifications.
Keywords: Folk Literature ─ Cordel. Bibliographic Classification. Knowledge Representation. Semiotics. Information Science.
Referências
ALBUQUERQUE, Maria Elizabeth B.C de. Literatura popular de cordel: dos ciclos temáticos à classificação bibliográfica. 2011. 311 f. Tese (Programa de Pós-graduação em Letras) – Universidade Federal da Paraíba, João Pessoa, 2011.
ALMEIDA, Sandemburg Oliveira de. A oralidade da literatura de cordel na obra do escritor Nei Leandro de Castro “As pelejas de Ojuara”. Disponível em: <http://www.cchla.ufrn.br/humanidades/
ARTIGOS/GT15/ENSAIO_DAS_PELEJAS_COM_RESUMO%5B1%5D.pdf> Acesso em: 10 dez. 2009
BATISTA, Maria de Fátima B. de Mesquita. Do oral ao escrito: limites entre o romance oral e o folheto de cordel. Santa Barbara Portuguese Studies, Santa Barbara, v. 9, p. 1-10, 2005
CÂNDIDO, Antonio. Direitos humanos e literatura. In: FESTER, A.C. Ribeiro et al. Direitos
humanos e
São Paulo: Brasiliense, 1989.
CASCUDO, Luis da Câmara. Vaqueiros e cantadores. Porto Alegre: Globo, 1939.
COSTA, A.F. Classificações sociais. Leitura, Lisboa, v. 3, n. 2, p. 65-75, out. 1977/ abr. 1998.
FIORIN, José Luiz; SAVIOLI, Francisco Platão. Para entender o texto: leitura e redação. São Paulo:
Ática, 1990.
GREIMAS, A. J. ; COURTÉS, J. Dicionário de semiótica. São Paulo: Contexto, 2008.
HJELMSLEV, Louis. Prolegômenos a uma teoria da linguagem. São Paulo: Perspectiva, 1975.
HOUAISS, Antonio. Dicionário da língua portuguesa. Rio de Janeiro: Objetiva, 2003.
MENEGAT, Rualdo. A epistemologia e o espírito do colecionismo. Episteme, Porto Alegre, n. 20, p. 5-12, jan./jun. 2005
GT2
614
MENEZES, Eduardo Diatahy B. de. Das classificações temáticas da literatura de cordel: uma querela inútil. [S.l.: S.n.], 200?. Disponível em: <http://www.secrel.com.br/jpoe sia/ediatahy01c. html>. Acesso em: 18 jan. 2006.
MEYER, Marlyse. Autores de cordel. São Paulo: Abril Cultural, 1980. PAIS, Cidmar Teodoro. Aspectos de uma tipologia dos universos de discurso. Revista Brasileira de Lingüística, São Paulo, v. 7, n.1, p. 43-65, 1984.
O QUE é cordel. Disponível em: <http://www.cordelon.hpg.ig.com.br>. Acesso em: 25 jan. 2006.
PEREIRA, Edmeire Cristina; BUFREM, Leilah Santiago. Princípios de organização e representação de conceitos em linguagens documentárias. Enc. BIBLI: R. eletrônica de Bibl. Ci. Inform., Florianópolis, n. 20, 2º semestre de 2005.
PIEDADE, Maria Antonieta Requião. Introdução à teoria da classificação. 2. ed. rev. e aum. Rio de Janeiro: Interciência, 1983.
PROPP, V.I. Morphologie du conte. Paris: Bétique. 1973.
SOUSA, João Bosco Alves de. Contando histórias – fazendo História. São Paulo: EDUC, 2007.
VICKERY, Brian C. Classificação e indexação nas ciências. Rio de Janeiro: Brasilart, 1980.
GT2
615
COMUNICAÇÃO
ORAL
BIASES NA REPRESENTAÇÃO DO CONHECIMENTO: UMA ANÁLISE DA QUESTÃO FEMININA EM LINGUAGENS DOCUMENTAIS BRASILEIRAS
Suellen Oliveira Milani, José Augusto Chaves Guimarães
Resumo: A representação do conhecimento, enquanto processo, assim como os instrumentos que a permeiam e os produtos que dela decorrem, não são neutros, estando imbuídos de valores morais. Nesse cenário, emergem problemas de biases na representação do conhecimento, tais como questões de gênero, categorizações dicotômicas e falta de garantia e hospitalidade cultural. No tocante à questão da mulher, há uma carência de literatura relativa à representação e ao delineamento de seu quadro epistemológico, tornando-se necessário verificar em que medida os termos relativos à questão feminina estão eventualmente inseridos sob bias nos instrumentos da área. Para tanto, verificou-se a presença dos termos: feminilidade; feminina(s); feminino(s); feminismo(s); feminista(s); materna(o); maternal; mulher(es), e os respectivos termos em inglês: female; femininity; feminism; feminist; maternal; motherly; woman(en), nas linguagens documentais brasileiras: Terminologia de Assuntos da Fundação Biblioteca Nacional, Vocabulário Controlado Básico, Vocabulário Controlado USP e Classificação Decimal de Direito. Cada termo identificado nas linguagens documentais alfabéticas teve seu descritor e não-descritores registrados, bem como notas de escopo, remissivas, termos relacionados e relações hierárquicas, enquanto as incidências relativas à linguagem documental hierárquica foram sistematizadas de acordo com as diretrizes propostas por Olson (1998). Os resultados apresentam ocorrências de biases e também sugestões para atenuá-las, possibilitando, assim, subsídios para discussões posteriores. Em conclusão, recomenda-se que reflexões continuem sendo realizadas, a fim de constatar e prevenir biases na representação do conhecimento e, se os profissionais da informação não forem capazes de preveni-las ou solucioná-las, a mera possibilidade da existência das mesmas deve ser informada aos usuários.
Palavras-chave: Representação do conhecimento. Linguagens documentais. Bias.
1 INTRODUÇÃO
A Ciência da Informação (CI) vem ampliando seu universo de pesquisas para além das tradicionais questões de recuperação, acesso e disseminação da informação e, atualmente, as investigações têm dado ênfase ao estudo dos aspectos epistemológicos com o objetivo de sedimentar cientificamente a área. Assim sendo, observa-se uma crescente reflexão sobre seus processos (análise documental, por exemplo), auxiliados por instrumentos (classificações, listas de cabeçalhos de assunto, tesauros etc.), a fim de gerar produtos autorizados e defensáveis (por exemplo: índices,
GT2
616
resumos e notações de classificação). Nesse contexto, o estudo dos aspectos éticos em organização do conhecimento (OC) responde
a preocupações que vêm pautando a área por quase três décadas (DAHLBERG, 1992, LÓPEZ-
HUERTAS, 2008b). Entretanto, essa temática ainda necessita de um aprofundamento, pois, como destacam Fernández-Molina e Guimarães (2002), a mesma tem sido abordada tradicionalmente em
termos de prática profissional relacionada à produção e uso da informação, muitas vezes mesclada com medidas de recuperação da informação ou, ainda, entendida como inerente a um conceito genérico e fluido de bom senso e bem fazer da área. De acordo com Milani e Guimarães (2011b), os estudos éticos evidenciam um grande interesse de natureza deontológica voltado especificamente para os códigos de ética profissional, como bem demonstra a coletânea internacional organizada por Vaagan (2002). Por outro lado, procurando abordar o assunto sob um ponto de vista mais axiológico, os autores Froehlich (1994), Gorman (2000), Koehler e Pembertom (2000), entre outros, têm abordado
o fazer profissional como um todo e de forma mais verticalizada. No entanto, essa preocupação tem
sido mais evidente em atividades profissionais de produção e uso da informação, e também na gestão de unidades e sistemas de informação, ficando a descoberto a questão intermediária fundamental: os processos de organização. Especificamente no contexto da organização do conhecimento, têm-se as reflexões iniciais de Berman (1993), Hudon (1997), Beghtol (2002, 2005), Fernández-Molina e Guimarães (2002), García Gutiérrez (2002), Olson (2002, 2003), Guimarães e Fernández-Molina (2003), Van der Walt (2004), Bair (2005), Fernández-Molina et al. (2005), Guimarães et al. (2005, 2008), Pinho (2006), Guimarães (2006b) e Milani e Guimarães (2010, 2011a). Nessa abordagem axiológica, distintas
temáticas têm encontrado abrigo (aspectos políticos, religiosos, raciais etc.), dentre os quais se destaca
a questão da mulher como um domínio do conhecimento interdisciplinar, em cujo âmbito delimita-se
o problema específico desta pesquisa: em que medida os termos relativos à questão feminina estão inseridos sob biases 1 nos instrumentos de representação do conhecimento? Considerando que a representação do conhecimento se desenvolve no contexto de uma cultura
e visa a disponibilizar informações aos usuários, torna-se fundamental garantir que estes possam
sentir-se refletidos nas representações dos conteúdos documentais. Por conseguinte, a existência de biases nesses produtos, os quais devem atuar como substitutos do conhecimento (surrogates of
1 Cumpre destacar a opção por manter o termo original bias(es) em inglês - correspondente a sesgo(s), em espanhol - por abranger, em língua portuguesa, os termos: viés, tendência, inclinação, desvio (entendido aqui na sua dimensão metafórica de information detour, ou seja, a busca por um caminho alternativo), pelos seguintes motivos: a) a origem e consolidação dessa discussão teórica ocorreu na literatura de língua inglesa, seguindo-se uma discussão na literatura em língua espanhola do termo sesgo; b) a inexistência dessa discussão no âmbito da literatura em língua portuguesa na área de OC; c) a percepção, após análise mais aprofundada da questão, que o termo inglês bias é polissêmico e traduzi-lo apenas por desvio, por exemplo, configurar-se-ia inadequado por ser restritivo, pois bias abrange não apenas desvio, entendido como uma rota alternativa tomada face à rota original, mas também viés, tendência ou inclinação, conforme mencionado acima. Desse modo, optou-se pela utilização do termo em inglês a exemplo do que ocorre igualmente na área de OC com o termo aboutness que, na literatura em língua portuguesa, já foi traduzido por tematicidade, atinência ou sobrecidade sem que, no entanto, se conseguisse atingir toda a abrangência semântica do termo em inglês.
GT2
617
knowledge, conforme Olson, 2002), poderia afastar os usuários do sistema de informação como um todo, por nele não se verem refletidos ou incluídos. Desse modo, e em continuidade a estudos anteriores (GUIMARÃES, 2003, 2006a), tem-se como objetivo analisar a ocorrência de biases nas linguagens documentais brasileiras no que se refere à questão da mulher comparando-as com a realidade internacional a partir da literatura. Ressalta-se que os resultados ora apresentados são fruto de uma dissertação de mestrado (MILANI, 2010), os quais foram, por sua vez, apresentados no âmbito da International Society for Knowledge Organization: Chapter for Canada and United States (MILANI; GUIMARÃES, 2011a).
2 A QUESTÃO FEMININA EM REPRESENTAÇÃO DO CONHECIMENTO
Tomando como ponto de partida o valor ético garantia cultural (proposto por Beghtol, 2002)
como síntese dos valores identificados por Guimarães et al. (2008) 2 e o problema biased representation, abrangendo os problemas éticos misrepresentation, racismo, marginalização, imparcialidade ou crença na neutralidade, viu-se a necessidade de investigar como as mulheres têm sido representadas nas linguagens documentais brasileiras e se alguma bias seria percebida nesse contexto. Para tanto, fez-se uma primeira incursão teórica acerca das biases no tocante à mulher na representação do conhecimento. Assim, de acordo com Milani e Guimarães (2010), essa questão está relacionada a problemas como preconceito e discriminação (BERMAN, 1993), gênero (OLSON, 2002, LÓPEZ-HUERTAS; TORRES, 2005), categorizações dicotômicas em sistemas de classificação ou tesauros (GUIMARÃES, 2006b) e falta de garantia cultural (BEGHTOL, 2002). Esclarece-se que um substituto do conhecimento - um rótulo - é construído sob biases “[ ] quando deixa de incluir diversos aspectos, desprivilegia grupos e temas fora de uma norma aceita” (OLSON, 2002, p. 15, tradução nossa). Na representação do conhecimento, observam-se exemplos de biases principalmente
gênero, sexualidade, raça, idade, habilidade, etnicidade, linguagem e religião, [as
quais] têm sido descritas como limites para a representação da diversidade e para os efetivos serviços
relacionados a “[
]
2 Têm-se como valores éticos: a) Aqueles valores maiores (ou supravalores) que permeiam toda a atividade informacional: respeito
à Privacidade, Autoria (direito autoral), Acessibilidade, Liberdade, Segurança, Equidade, Diversidade e Minimização de riscos; b) Aqueles antes havidos como requisitos profissionais, na medida em que integram a essência do fazer profissional na área:
Competência, Eficiência, Flexibilidade, Confiabilidade, Reconhecimento profissional, Atualidade, Autonomia, Consciência de poder
e Cooperação; e c) Aqueles antes havidos como meras medidas de OC, mas que hoje se integram ao universo axiológico da área:
Precisão, Garantia cultural, Exaustividade, Consistência, Facilidade de uso e Hospitalidade do sistema. Decorrendo da negativa dos valores, surgem os problemas que podem ser categorizados em dois contextos: a) Problemas que permeiam o mundo atual : Divisão digital, Pornografia, Envio de lixo eletrônico, Substituição do profissional pela tecnologia e Violência; b) Problemas que afetam diretamente as atividades de OC, quando do exercício profissional : Vigilância, Censura, Falta de garantia cultural, Negligência, Direcionamento informacional, Ineficiência profissional, Má representação, Racismo, Falta de clareza, Marginalização, Crença na neutralidade, Difamação, Idiossincrasia, Inacessibilidade informacional, Terminologia preconceituosa e Traduções inadequadas.
GT2
618
biblioteconômicos a populações diversas” (OLSON, 2002, p. 7, tradução nossa). No contexto específico da OC, destacam-se alguns estudos sobre questões de gênero e suas possíveis biases, sendo eles: perspectivas de gênero e discriminação de “minorias” na CDU (SANTOS; MADINA; SERRA, 1999); a exclusão social presente nas linguagens documentais (CARO CASTRO; SAN SEGUNDO MANUEL, 1999); a forma pela qual a mulher é representada e nomeada na CDU (MORÁN SUÁREZ; RODRIGUÉZ BRAVO, 2001); a organização e representação do conhecimento na Internet sobre questões de gênero (LÓPEZ-HUERTAS; BARITÉ, ROQUETA, 2002); a análise da representação terminológica em quatro tesauros direcionados às questões da mulher - Europa, Espanha, Itália e Brasil (LÓPEZ-HUERTAS; TORRES; BARITÉ, 2004); abordagem teórica na qual constatou-se que, em relação aos domínios que envolvem grupos marginalizados, os especialistas compensam a falta de linguagem acrescentando uma expressão inequívoca da interdisciplina, como gênero, mulheres etc. (LÓPEZ-HUERTAS, 2006); a comparação entre as culturas diferentes de dois países, Espanha e Uruguai, as quais podem influenciar o desenvolvimento de um campo de conteúdo como os Gender Studies, bem como afetar a OC em sistemas de informação (LÓPEZ-HUERTAS, 2008a); e a questão da mulher nas listas de cabeçalho de assunto e nos tesauros (RODRIGUÉZ BRAVO, 2007). Os referidos estudos salientam e exemplificam discriminações de gênero, afirmando que “[ ] há a necessidade de um modelo de organização do conhecimento ideal para cada domínio” (LÓPEZ- HUERTAS; TORRES; BARITÉ, 2004, p. 38, tradução nossa). Outro problema citado pelos autores é a falta de uniformidade da representação do conteúdo documental e a ênfase na representação de aspectos de gênero ligados apenas à sexualidade (especialmente com a homossexualidade), vida familiar ou relacionamentos pessoais. A partir dos estudos de Rodríguez Bravo (2006) referentes ao Thesaurus UNESCO, European Women’s Thesaurus e Library of Congress Subject Headings, destaca-se que nestes últimos, por
exemplo, os cabeçalhos refletem as tradicionais discriminações sociais em relação à mulher, enfatizando aspectos como situação conjugal, sexualidade e procedimentos relacionados à maternidade. Assim, ao referir-se às linguagens documentais, seria recomendável incluir as comunidades
segundo sua condição étnica, linguística, política, religiosa, nacional,
(CARO CASTRO; SAN SEGUNDO MANUEL, 1999, p. 105,
ideológica, social, econômica [
discursivas marginalizadas “[
]
]”
tradução nossa). As autoras citam ainda a falta de atualização, adequação e concretização dos critérios de elaboração, ou seja, a falta de políticas de gestão das linguagens documentais. Nas linguagens documentais tradicionais,
a presença feminina é escassa porque a linguagem institui o masculino como
universal, como genérico [buscando, talvez, uma economia de linguagem], e também inadequada porque seu discurso de representação do conhecimento mantém os estereótipos femininos, oferecendo uma imagem anacrônica da mulher e apresentando mostras de sexismo (RODRÍGUEZ BRAVO, 2007, tradução nossa).
] [
GT2
619
Especificamente nas questões femininas, Olson (2002, p. 9, tradução nossa) constata que, em
temas que envolvem a representação da mulher e para a mulher, as padronizações têm três problemas comuns:
• Tratam as mulheres como exceções às normas masculinas;
• Isolam as questões da mulher para separá-las do resto do conhecimento; ou
• Omitem essas questões inteiramente.
López-Huertas e Torres (2005) enfatizam mais concretamente essas biases, ou seja:
• Considerar generalidade como masculinidade;
• Considerar que o sujeito da anticoncepção é a mulher;
• Termos masculinos usados no plural com o conteúdo semântico de homens e mulheres;
• Nas expressões formadas por substantivo + adjetivo, observa-se a tendência de criar descritores femininos e omitir seus correspondentes masculinos. Embora esses termos e estruturas se justifiquem do ponto de vista histórico e gramatical, eles geram prejuízos a determinadas comunidades discursivas no tocante ao acesso e recuperação da informação. Sendo assim, os mecanismos disponibilizados pela Documentação para as linguagens documentais podem oferecer elementos para uma maior democratização das mesmas. Em geral, todos os conteúdos documentais referentes às mulheres são rotulados a partir da entrada Mulheres. Nos tesauros produz-se
uma maior simetria no tratamento do feminino e do masculino. As listas de
cabeçalhos reservam à mulher um espaço específico e apresentam um abundante número de cabeçalhos para permitir representar a temática feminina oculta no grosso do vocabulário da lista (RODRÍGUEZ BRAVO, 2007, tradução nossa).
] [
Têm-se, então, muitos vazios terminológicos, frequentemente motivados por vazios culturais no caso de traduções e versões. Assim, “O grau de precisão da terminologia pode chegar a ser um fiel indicador do nível de desenvolvimento dessa temática em culturas diferentes” (LÓPEZ-HUERTAS; TORRES, 2005, tradução nossa). Ao desenvolver uma linguagem documental para amparar os estudos das mulheres, deve-se refletir primeiramente sobre como o masculino será representado. López-Huertas e Torres (2005, tradução nossa), afirmam que “é uma questão importante, porque a forma de fazê-lo pode estar marcada por uma ideologia que incida negativamente sobre a objetividade desejável.” Há uma tendência lógica que orienta evitar descritores que incluam os termos Mulher ou Mulheres como elemento nuclear. Considerando que as atitudes sociais devem ser modificadas em respeito aos marginalizados e excluídos, nesse sentido a linguagem documental constitui um excelente meio para aplicar-se essa reflexão. Para tanto, possíveis auxílios são apresentados por Rodríguez Bravo (2007), sendo eles:
GT2
620
• Inserção da mulher sem que ocorra a ocultação do masculino, ou seja, esforços em
eliminação de estereótipos sexistas das linguagens documentais, busca
do equilíbrio entre a presença do homem e da mulher e eliminação de masculinos como falsos genéricos” (RODRÍGUEZ BRAVO, 2007, tradução nossa).
• Inserção de notas que autorizem a utilização do feminino e/ ou o emprego de cabeçalhos/ descritores sintagmáticos para distinguir o masculino do genérico quando não houver outra opção;
• Inserção de qualificadores de gênero junto aos cabeçalhos/ descritores, sendo eles “(M)” e “(H)” quando a temática não representar a humanidade em geral. Uma vez detectado o problema no cenário internacional e constatada a carência de literatura referente à representação do conhecimento, mais especificamente em temas ligados à mulher, procedeu- se à análise da forma pela qual as mulheres são representadas nas quatro linguagens documentais brasileiras de maior utilização no país.
busca da “[
]
3 METODOLOGIA
Para a identificação dos termos relacionados à questão feminina, utilizou-se um domínio conceitual composto pelos termos: feminilidade; feminina(s); feminino(s); feminismo(s); feminista(s); materna(o); maternal; mulher(es), bem como seus correspondentes em inglês: female; femininity; feminism; feminist; maternal; motherly; woman(en). O domínio estabelecido, no qual procurou-se englobar a mulher, a teoria feminista e a situação feminina, foi objeto de busca nas seguintes linguagens documentais brasileiras: Terminologia de Assuntos da Fundação Biblioteca Nacional (TAFBN), Vocabulário Controlado Básico (VCB), Vocabulário Controlado USP (VCUSP) e Classificação Decimal de Direito (CDDireito). Com relação às linguagens documentais alfabéticas, cada termo identificado gerou uma ficha de registro contendo seu descritor, nota de escopo, relação de equivalência (UP/ USE), relação associativa (TR) e relação hierárquica (TG/ TE). Já para a análise da linguagem documental hierárquica, a ficha de registro foi preenchida respondendo às categorias baseadas em Olson (1998): notação, conceito classificatório, contexto hierárquico e nota. A TAFBN, realizada e gerenciada pela Fundação Biblioteca Nacional (Rio de Janeiro - RJ), consiste em uma adaptação dos Library of Congress Subject Headings para as necessidades informacionais do Brasil. Essa linguagem contém aproximadamente 37.949 descritores somados a 128.077-assunto tópico, 20.360-geográfico, 2.819-subdivisões de assunto. O VCB (com aproximadamente 9.500 descritores) e o VCUSP (com cerca de 30.796 descritores de assunto somados a 11.432-geográfico e histórico, 43-gênero e forma, 1.070-profissões e ocupações, e 575-qualificadores) são as duas linguagens documentais de maior alcance no país. O primeiro atende a uma rede cooperativa de bibliotecas sediadas em Brasília e integrantes dos Poderes
GT2
621
Legislativo, Judiciário e Executivo da Administração Federal e do Governo do Distrito Federal. O segundo, o mais abrangente sistema brasileiro de bibliotecas universitárias, serve às áreas do conhecimento inerentes às atividades de ensino, pesquisa e extensão da maior universidade do país, a Universidade de São Paulo (São Paulo - SP). A CDDireito foi concebida originalmente por Carvalho (2002) como uma expansão da classe 340 (referente ao Direito) da Classificação Decimal de Dewey. Trata-se de um sistema específico e amplamente utilizado por essa área, uma vez que possibilita a adaptação da classificação de Dewey, cujo sistema jurídico baseia-se no Common Law, à realidade jurídica do Civil Law, que prepondera nos países da América Latina e da Europa Continental. Finalizada a fase de coleta e sistematização de todos os termos encontrados, realizou-se a análise de cada contexto a partir de uma grade baseada nos estudos de Olson (2002) e López-Huertas e Torres (2005). Cabe destacar que os dados foram analisados do ponto de vista da percepção da questão feminina e amparados na literatura sobre a mulher e a organização do conhecimento, não sob a perspectiva da teoria feminista.
4 ANÁLISE DOS RESULTADOS
Os resultados revelaram um conjunto de 360 descritores (68,33% na TAFBN, 11,67% no VCB, 16,39% no VCUSP e 3,61% na CDDireito) e, desse corpus, foi possível extrair as seguintes dimensões temáticas: Criminalidade, Cultura, Direito, Educação, Feminismo, História, Indivíduo, Maternidade, Religião, Saúde e Esporte, Sexualidade, Sociologia, Trabalho. Nesse universo, observou-se que 108 descritores (30% do total) apresentaram mais de uma incidência nas linguagens documentais. A análise desses resultados evidenciou aspectos específicos relativos às biases, os quais são comentados a seguir.
4.1 Terminologia de Assuntos da Fundação Biblioteca Nacional (TAFBN)
Na TAFBN, observa-se um conjunto mais amplo e variado de biases, como:
a) O descritor específico Periódicos para mulheres, sem que haja o correspondente Periódicos para homens, o que remete a uma ideia de tratamento “excepcional” dado ao feminino;
b) Educação sanitária figura como termo específico do descritor Educação feminina, sendo
que os aspectos ligados à educação sanitária não necessitam incluir qualificadores de gênero;
c) Utiliza-se o descritor Lesbianismo no âmbito do comportamento sexual das mulheres, o
que denota dois tipos de biases: a utilização do sufixo -ismo (revelador de vício) em vez de Mulheres lésbicas, e a relação dessa questão unicamente com o aspecto sexual, deixando de lado a dimensão
GT2
622
afetiva, legal etc.;
d) Reforça-se um estereótipo social a partir da previsão da remissiva Mulheres fatais usado
para Mulheres sedutoras; e) As especificidades ligadas a aspectos religiosos levam à ideia de que as mulheres sejam
exceções às normas masculinas, como revela a nota de escopo do descritor Mulher (Teologia cristã):
“Usado para obras que tratam da teologia cristã do sexo feminino. Obras sobre a teologia do gênero humano e de pessoas do sexo masculino, do ponto de vista de duas ou mais religiões, entram em Homem (Teologia cristã). Obras sobre a teologia cristã do gênero humano entram em Homem (Teologia)”;
f) Em relação ao esporte e à educação física, destaca-se a tentativa da TAFBN de incluir a
mulher em algumas especificidades, como futebol, ginástica, modelagem física, treinamento com
peso e voo livre deixando de incluir outros esportes, o que revela uma tendência em tratar as mulheres como exceções às normas masculinas e considerar generalidade como masculinidade; g) No âmbito da atuação profissional, algumas profissões aparecem diretamente no feminino (arquitetas, advogadas, compositoras, filósofas etc.), ao passo que em outras atividades utiliza-se o
(mulheres na aeronáutica, em vez de aeronautas, mulheres no serviço público,
em vez de servidoras públicas, mulheres jornalistas, em vez de jornalistas etc.), revelando que a atuação profissional da mulher ocorre tradicionalmente em algumas áreas privilegiadas.
termo mulher em
4.2 Vocabulário Controlado Básico (VCB)
No âmbito do VCB, tem-se:
a) O adjetivo masculino aparece em apenas um descritor em toda a linguagem relacionado a
Homossexualismo, o que revela ser a questão masculina considerada o gênero ou a regra e a feminina, a exceção;
b) Saúde da Mulher revela uma tendência em salientar aspectos relacionados à educação
sanitária, sexualidade e maternidade. Nesse sentido, observa-se uma relação associativa com descritores como Anticoncepcional e Planejamento familiar, levando à falsa ideia de que o sujeito único da anticoncepção é a mulher. Comparativamente às demais linguagens analisadas, o VCB revelou uma concepção mais equânime entre homem e mulher.
4.3 Vocabulário Controlado da USP (VCUSP)
Com relação ao VCUSP, observam-se particularmente as seguintes biases:
a) Mulheres espancadas e Mulheres maltratadas relacionados à Violência na Família, o que
denota que a violência contra a mulher só ocorre no âmbito familiar e geralmente ligada a mulheres
GT2
623
casadas, excluindo, portanto, as demais situações femininas. Além disso, tem-se um descritor genérico (família) para representar agressões a um indivíduo específico (mulher);
b) Mulher delinquente previsto ao lado de descritores como Deliquente juvenil, Deliquente
habitual, Deliquente Passional, Delinquente político, Delinquente sexual, levando à ideia de que o fato de o autor ser mulher representa uma modalidade específica de crime;
c) Feminismo hierarquicamente subordinado a Mulheres, sendo que, atualmente, caracteriza
um movimento que ampara tanto mulheres como homens em suas lutas e reflexões.
4.4 Classificação Decimal de Direito (CDDireito)
Na CDDireito, por sua vez, observam-se mais nitidamente as seguintes biases:
a) Mulheres delinquentes (Alcoólatras, alienadas, prostitutas etc.), no âmbito do Direito
Penal e subordinado a Delinquentes ou criminosos e suas espécies, revela a consideração da mulher em uma situação específica ou excepcional, ficando a questão masculina abrigada pelo descritor
genérico. Destaca-se ainda o fato de que Alcoólatras e Alienadas deveria estar amparado em classes relacionadas à saúde e apenas Prostitutas poderia estar inserido sob criminalidade;
b) Direitos da mulher em geral aparece apenas no âmbito do Direito de família, subordinado a
Mulher casada, Autoridade marital, Autorização marital, o que cria uma noção falsa de dependência das temáticas;
c) A notação Sexo. Condição da mulher no Direito Civil apresenta-se subordinada à notação
Circunstâncias que influem sobre o estado e a capacidade Jurídica, o que confere à mulher uma situação de inferioridade;
d) No âmbito penitenciário, Instituições penitenciárias para mulheres e para meninas está
subordinado a Outros estabelecimentos penitenciários, o que caracteriza uma situação de explícita excepcionalidade e marginalização, pois, em um contexto de equidade, poder-se-ia pensar em Instituições penitenciárias para homens e para meninos ao lado de Instituições penitenciárias para mulheres e para meninas. Outra bias já salientada por Santos, Madina e Serra (1999) dá-se pelo fato
de não haver um critério para determinar mulheres e meninas, nem um critério de idade para pertencer
a cada instituição.
5 DISCUSSÃO
A TAFBN, por ser uma lista de cabeçalhos de assunto, mantém todos os termos referentes
à mulher sob os cabeçalhos de assunto mulher e mulheres. Essa linguagem documental busca ser
igualitária; entretanto, ao mesmo tempo em que designa diversos termos para amparar a questão feminina, observa-se uma quantidade significativamente menor de termos inserida sob os cabeçalhos de assunto homem e homens. Além disso, ao introduzir os conteúdos relativos à questão feminina abaixo
GT2
624
dos cabeçalhos de assunto mulher e mulheres, a linguagem documental está reproduzindo biases
inerentes à própria linguagem natural, ou seja, tratar os assuntos femininos como exceções e considerar
o masculino como genérico. Uma vez que visa abranger todas as áreas do conhecimento, a TAFBN apresentou maiores
indícios de biases, sendo eles relacionados a periódicos para mulheres, educação sanitária, lesbianismo, femme fatale, mulher (teologia cristã), esporte e educação física, e atuação profissional. Quanto às biases, o VCB deveria rever a escassez da presença do adjetivo masculino em seus descritores, bem como os relacionamentos do descritor Saúde da mulher. Apesar das biases ora destacadas, percebe-se um cuidado dos gerenciadores do VCB em amparar a questão feminina, além de valer-se dos mecanismos que a linguagem disponibiliza para fazê-lo, revelando uma concepção mais equitativa das relações entre mulheres e homens. No VCUSP, destinado primeiramente a dar suporte às atividades de ensino, pesquisa e extensão da Universidade de São Paulo mas também utilizado por outras instituições de ensino superior do país, foram detectadas biases referentes a mulheres espancadas, mulher delinqüente e feminismo. A CDDireito, enquanto uma expansão da classe 340 da Classificação Decimal de Dewey, tem como objetivo inserir as especificidades do Direito brasileiro nesse contexto classificatório, mas as biases encontradas nessa linguagem foram as de maior impacto negativo no que diz respeito à questão feminina, sendo elas: mulheres delinquentes, direitos da mulher em geral, sexo - condição da mulher,
e instituições penitenciárias para mulheres e para meninas. Comparativamente, apenas a bias referente a mulheres delinquentes se repetiu no VCUSP e na CDDireito, sendo que no primeiro caso aparece como uma biotipologia criminal, e no segundo, vinculada a alcoólatras, alienadas e prostitutas, enquanto espécies de delinquentes ou criminosos. Deve-se enfatizar a necessidade de mais reflexões e aplicações dos mecanismos disponibilizados pelas linguagens documentais, os quais poderiam aprimorar os contextos, como demonstram os dois exemplos a seguir:
Terminologia de Assuntos da Fundação Biblioteca Nacional (TAFBN) Descritor: Esterilização das mulheres
UP Esterilização feminina UP Female sterilization UP Mulheres - Esterilização UP Women - Sterilization UP Sterilization, Female TR Infecundidade feminina TE Esterilização tubária TE Histerectomia
Vocabulário Controlado Básico (VCB) Descritor: Esterilização (controle de natalidade)
GT2
625
UP Esterilização da mulher UP Esterilização feminina TR Controle de natalidade TR Planejamento familiar TG Anticoncepcional
Em ambos os exemplos utilizaram-se mecanismos disponíveis na linguagem documental, mas percebe-se no primeiro uma abordagem voltada exclusivamente para o procedimento médico da esterilização e relacionado ao fator infecundidade. Já no segundo, a esterilização é inserida como uma possibilidade anticoncepcional e remetida a questões de planejamento. Nos dois casos as relações sintagmáticas poderiam ter sido mais exploradas, incluindo-se, por exemplo, os seguintes termos relacionados (TR): Esterilização do homem e/ ou Vasectomia. Ressalta-se que no VCB, Vasectomia aparece como termo específico (TE) de Anticoncepcional
e como termo relacionado (TR) de Controle de Natalidade. Por outro lado, na TAFBN, Vasectomia
e Anticoncepção aparecem como termos específicos (TE) do descritor Esterilização (controle de natalidade).
6 CONCLUSÕES
À vista do corpus analisado, confirmam-se as seguintes biases apresentadas pela literatura:
as principais linguagens documentais brasileiras tratam as mulheres como exceções às normas masculinas ou omitem essas questões inteiramente (OLSON, 2002); utilizam termos masculinos usados no plural com o conteúdo semântico de homens e mulheres, bem como há uma tendência de criar descritores femininos e omitir seus correspondentes masculinos (LÓPEZ-HUERTAS; TORRES, 2005). Essas biases, apresentadas por López-Huertas e Torres (2005) e confirmadas pela presente pesquisa, são reflexos do sexismo inerente à própria linguagem natural. Por outro lado, as seguintes possibilidades de biases apresentadas pela literatura não foram confirmadas nesta investigação: as linguagens documentais brasileiras não isolam as questões da mulher para separá-las do resto do conhecimento (OLSON, 2002) e também não consideram que o sujeito da anticoncepção é apenas a mulher (LÓPEZ-HUERTAS; TORRES, 2005). Assim, reitera-se que, no tocante à gestão das linguagens documentais, a reflexão e aplicação de mecanismos, tais como relações associativas ou sintagmáticas, relações de equivalências, relações hierárquicas ou paradigmáticas e notas de escopo, notas explicativas ou definições, explorados em todas as suas potencialidades, criariam e aperfeiçoariam contextos, deixando-os mais inclusivos e equitativos. Muitos autores e a própria International Society for Knowledge Organization vêm enfatizando a necessidade de realizar e estimular reflexões acerca da responsabilidade social do profissional
GT2
626
da informação. Cabe a este a responsabilidade não apenas de tornar o conhecimento registrado e socializado acessível aos usuários, mas também permitir que os mesmos compreendam os mecanismos que perpassam as linguagens documentais e, consequentemente o processo de representação do conhecimento como um todo, bem como os princípios e a missão subjacentes à unidade ou sistema de informação. Conclui-se que, embora não seja possível evitar as biases, os mecanismos citados acima podem elucidar ou revelar sua ocorrência e, se os profissionais da informação não forem capazes de fazê-lo, a mera possibilidade da existência das mesmas deve ser informada aos usuários. Desse modo, os profissionais da informação se tornariam mais responsáveis face a biases, que passariam de um contexto de hidden biases para o de responsible biases. Finalmente, sugere-se que os primeiros passos nesse sentido podem ser sintetizados em dois pontos: a) a publicação de reflexões sobre esse tema e afins; e b) a discussão da não existência de neutralidadeeaexistênciadasbiasesnarepresentaçãodoconhecimentocomalunosdeBiblioteconomia, Arquivologia, Ciências da Informação e de áreas correlatas e, ainda, com profissionais dessas áreas em cursos de atualização e especialização.
Abstract: The process of knowledge representation, as well as its tools and resulting products are not neutral but permeated by moral values. This scenario gives rise to problems of biases in representation, such as gender issues, dichotomy categorizations and lack of cultural warrant and hospitality. References on women’s issues are still scarce in the literature, which makes it necessary to analyze to what extent the terms related to these particular issues are inserted in the tools in a biased way. This study aimed to verify the presence of the terms female, femininity, feminism, feminist, maternal, motherly, woman/women within the following Brazilian indexing languages: Subject Terminology of the National Library, University of Sao Paulo Subject Headings, Brazilian Senate Subject Headings and Law Decimal Classification. Each term identified in the first three alphabetical documentary languages generated a registration card containing both its descriptors and non-descriptors, as well as scope notes, USE/UF, RT, and BT/NT relationships. As for the analysis of LDC, a hierarchical language, the registration card was filled out by following the categories proposed by Olson (1998). The results showed signs of biases, which enabled the proposition of guidelines that may contribute to minimize them and to open the way for further discussions. In conclusion, reflections on these issues should continue to be carried out, in order to identify and prevent biases in knowledge representation, and if information professionals cannot do so, they should warn users that biases are likely to occur.
Keywords: Knowledge representation. Indexing languages. Bias.
REFERÊNCIAS
BAIR, S. C. Toward a code of ethics. Technical Services Quarterly, New York, v. 23, n. 1, p. 13-26,
2005.
BEGHTOL, C. A proposed ethical warrant for global knowledge representation and organization systems. Journal of Documentation, London, v. 58, n. 5, p. 507-532, 2002.
GT2
627
BEGHTOL, C. Ethical decision-making for knowledge representation and organization systems for global use. Journal of the American Society for Information Science and Technology, New York, v. 56, n. 9, p. 903-912, 2005. BERMAN, S. Prejudices and antipathies: A Tract on the LC Subject Heads Concerning People. 2. ed. Jeffersin; North Carolina; London: McFarland & Company, Inc., 1993. CARO CASTRO, C.; SAN SEGUNDO MANUEL, R. Lenguajes documentales y exclusión social. In: LÓPEZ-HUERTAS, M. J.; FERNÁNDEZ-MOLINA, J. C. (Ed.). La representación y la organización del conocimiento en sus distintas perspectivas: su influencia en la recuperación de la información. Granada: Universidad de Granada, 1999. p. 101-108. CARVALHO, D. de Q. Classificação Decimal de Direito. 4 ed. rev. e atual. Brasília: Presidência da República, 2002. Disponível em: <www.planalto.gov.br>. Acesso em: 06 junho 2009. DAHLBERG, I. Ethics and knowledge organization: in memory of Dr. S. R. Ranganathan in his centenary year. International Classification, Frankfurt, v. 19, n. 1, p. 1-2, 1992. FERNÁNDEZ-MOLINA, J. C. et al. Aspectos éticos de las nuevas tecnologías de la información y la comunicación y su reflejo en la organización del conocimiento. In: GASCÓN, J.; BURGUILLOS, F.; PONS, A. (Org.). La dimensión humana de la organización del conocimiento. Barcelona:
Universitat de Barcelona, 2005. p. 177-186. FERNÁNDEZ-MOLINA, J. C.; GUIMARÃES, J. A. C. Ethical aspects of knowledge organization and representation in the digital environment: their articulation in professional codes of ethics. In:
LÓPEZ-HUERTAS, M. J. (Ed.). Challenges in knowledge representation and organization for the 21 st century: integration of knowledge across boundaries. Würzburg: ERGON Verlag, 2002. p. 487-492. (Advances in Knowledge Organization, 8). FROEHLICH, T. J. Ethical concerns of information professionals in an international context. In:
ALVAREZ-OSSORIO, J. R.; GOEDGEBUURE, B. G. (Ed.). New worlds in information and documentation. Amsterdan: Elsevier; FID, 1994. p. 459-470. GARCÍA GUTIÉRREZ, A. Knowledge organization from a “culture of the border” towards a transcultural ethics of mediation. In: LÓPEZ-HUERTAS, M. J. (Ed.). Challenges in knowledge representation and organization for the 21 st century: integration of knowledge across boundaries. Würzburg: ERGON Verlag, 2002. p. 516-522. (Advances in Knowledge Organization, 8). GORMAN, M. Our enduring values: librarianship in the 21 st century. Chicago; London: ALA, 2000. GUIMARÃES, J. A. C. A dimensão teórica do tratamento temático da informação (TTI) no universo científico da International Society for Knowledge Organization - ISKO. Marília:
UNESP, 2006a. Projeto de Produtividade em Pesquisa apresentado ao CNPq referente ao período:
mar. 2007-fev. 2010. GUIMARÃES, J. A. C. Aspectos éticos do tratamento temático da informação (TTI):
elementos para sua caracterização a partir da interface das dimensões profissional, pedagógica e investigativa na área da Biblioteconomia no Mercosul. Marília: UNESP, 2003. Projeto Integrado de Pesquisa apresentado ao CNPq referente ao período: 2003-2006. GUIMARÃES, J. A. C. Aspectos éticos em organização e representação do conhecimento (ORC):
uma reflexão preliminar. In: GONZÁLEZ DE GÓMEZ, M. N.; ORRICO, E. G. D. (Org.). Políticas de memória e informação: reflexos na organização do conhecimento. Natal: EDUFRN, 2006b. p.
237-264.
GUIMARÃES, J. A. C. et al. Aspectos éticos en organización y representación del conocimiento:
un análisis de la bibliografia científica en busca de una categorización preliminar de valores. In:
GASCÓN, J.; BURGUILLOS, F.; PONS, A. (Org.). La dimensión humana de la organización del conocimiento. Barcelona: Universitat de Barcelona, 2005. p. 278-285. GUIMARÃES, J. A. C. et al. Ethics in the Knowledge Organization Environment: an overview of
GT2
628
values and problems in the LIS literature. In: ARSENAULT, C.; TENNIS, J. T. (Ed.). Cultural and Identity in Knowledge Organization. Würzburg: ERGON Verlag, 2008. p. 340-346. (Advances in Knowledge Organization, 11). GUIMARÃES, J. A. C.; FERNÁNDEZ-MOLINA, J. C. Los aspectos éticos de la organización y representación del conocimiento en la revista Knowledge Organization. In: FRÍAS, J. A.; TRAVIESO, C. (Org.). Tendencias de investigación en organización del conocimiento. Salamanca: Universidad de Salamanca, 2003. p. 809-816.
HUDON, M. Multilingual thesaurus construction: integrating the views of different cultures in one gateway to knowledge and concepts. Knowledge Organization, Würzburg, v. 24, n. 2, p. 84-91,
1997.
KOEHLER, W.; PEMBERTON, J. M. A search for core values: towards a model code of ethics for information professionals. Journal of Information Ethics, Jefferson, v. 9, n. 1, p. 26-54, 2000. LIBRARY of Congress Subject Headings. Disponível em: <http://www.loc.gov/cds/lcsh. html#lcsh20>. Acesso em: 08 jan. 2009.
LÓPEZ-HUERTAS, M. J. Análisis del dominio interdisciplinar para la representación y organización del conocimiento. In: GONZÁLEZ DE GÓMEZ, M. N.; ORRICO, E. G. D. (Org.). Políticas de memória e informação: reflexos na organização do conhecimento. Natal: EDUFRN, 2006. p. 209-
235.
LÓPEZ-HUERTAS, M. J.; BARITÉ ROQUETA, M. -G. Knowledge representation and organization of gender studies on the Internet: towards integration. In: LÓPEZ-HUERTAS, M. J. (Ed.). Challenges in knowledge representation and organization for the 21 st century: integration of knowledge across boundaries. Würzburg: ERGON Verlag, 2002. p. 393-403. (Advances in Knowledge Organization,
8).
LÓPEZ-HUERTAS, M. J. Cultural impact on Knowledge Representation and Organization in a Subject Domain. In: ARSENAULT, C.; TENNIS, J. T. (Ed.). Cultural and Identity in Knowledge Organization. Würzburg: ERGON Verlag, 2008a. p. 340-346. (Advances in Knowledge Organization,
11).
LÓPEZ-HUERTAS, M. J. Some current research questions in the field of knowledge organization. Knowledge Organization, Würzburg, v. 35, n. 2/3, p. 113-136, 2008b. LÓPEZ-HUERTAS, M. J.; TORRES, I.; BARITÉ, M. Terminological representation of specialized areas in conceptual structures: the case of gender studies. In: MCILWAINE, I. (Ed.). Knowledge organization and the global information society. Würzburg: ERGON Verlag, 2004. p. 35-39. (Advances in Knowledge Organization, 9). LÓPEZ-HUERTAS, M. J.; TORRES, I. de. Terminología de género. Sesgos, interrogantes, posibles respuestas. Datagramazero: Revista de Ciência da Informação, Rio de Janeiro, v. 6, n. 5, 2005. MILANI, S. O. Estudos éticos em representação do conhecimento: uma análise da questão
feminina em linguagens documentais brasileiras. 2010. 141 f. Dissertação (Mestrado em Ciência da Informação) - Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2010. MILANI, S. O.; GUIMARÃES, J. A. C. Biases in Knowledge Representation: an Analysis of the Feminine Domain in Brazilian Indexing Languages. In: NORTH AMERICAN SYMPOSIUM ON KNOWLEDGE ORGANIZATION, 3., 2011a, Toronto. Proceedings
2011.
MILANI, S. O.; GUIMARÃES, J. A. C. Bias in the indexing languages: theorethical approaches about feminine issues. In: GNOLI, C.; MAZZOCCHI, F. (Ed.). Paradigms and conceptual systems in Knowledge Organization: Proceedings of the Eleventh International ISKO Conference, Rome, 23-26 February 2010. Würzburg: ERGON VERLAG, 2010. (Advances in Knowledge Organization, 12). p. 424-429.
GT2
629
MILANI, S. O.; GUIMARÃES, J. A. C. Problemas éticos em representação do conhecimento: uma abordagem teórica. DataGramaZero - Revista de Ciência da Informação, Rio de Janeiro, v. 12, n. 1, fev. 2011b. MORÁN SUÁREZ, M. A.; RODRÍGUEZ BRAVO, B. La imagen de la mujer en la clasificación decimal universal (CDU). In: EXTREMEÑO PLACER, A. (Ed.). La representación y Organización del Conocimiento: metodologías, modelos e aplicaciones. Alcalá de Henares: Universidad de Alcalá, 2001. 1 CD-ROM. OLSON, H. A. Mapping beyond Dewey’s boundaries: constructing classificatory space for marginalized knowledge domains (Dewey Decimal Classification excludes some groups). Library Trends, Champaign, v. 47, n. 2, p. 233-254, 1998. OLSON, H. A. The power to name: locating the limits of subject representation in libraries. Dordrecht: Kluwer Academic Publisher, 2002. OLSON, H. A. Transgressive deconstructions: feminist/ postcolonial methodology for research in Knowledge Organization. In: FRÍAS, J. A.; TRAVIESO, C. (Org.). Tendencias de investigación en organización del conocimiento. Salamanca: Universidad de Salamanca, 2003. p. 731-740. PINHO, F. A. Aspectos éticos em representação do conhecimento: em busca do diálogo entre Antonio García Gutiérrez, Michèle Hudon e Clare Beghtol. 2006. 123 f. Dissertação (Mestrado em
Ciência da Informação) - Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília,
2006.
RODRÍGUEZ BRAVO, B. La integración de la dona en els llenguatges documentals: una utopia necessària. BiD: textos universitaris de biblioteconomia i documentació, Barcelona, n. 18, 2007. Disponível em: <http://www2.ub.edu/bid/consulta_articulos.php?fichero=18rodri1.htm>. Acesso em: 24 jun. 2009. RODRÍGUEZ BRAVO, B. The Visibility of Women in Indexing Languages. In: BUDIN, G.; SWERTZ, C.; MITGUTSCH, K. (Ed.). Knowledge Organization for a Global Learning Society. Würzburg: ERGON Verlag, 2006. (Advances in Knowledge Organization, 10). p. 413-422. SANTOS, T. M.; MADINA, A. M.; SERRA, R. S. CDU: perspectiva de género y discriminación de minorías. In: GARCÍA MARCO, F. J. (Ed.). Organización del conocimiento en sistemas de información: actas del III Encuentro de ISKO - España. Zaragoza: Universidad de Zaragoza, 1999. p. 103-118. TAFBN - Terminologia de Assuntos da Fundação Biblioteca Nacional. Disponível em: <http://www.
bn.br/portal/?plugin=Isbn&url=http://catalogos.bn.br/scripts/odwp012k.dll?INDEXLIST=assuntos_
pr:assuntos&tit=Terminologia%20de%20Assuntos>. Acesso em: 07 jan. 2008. VAAGAN, R. A. The ethics of librarianship: an international survey. Munchen: K. G. Saur, 2002. VAN DER WALT, M. S. Round-table: Ethics in knowledge representation and organization. In: LÓPEZ-HUERTAS, M. J. (Ed.). Challenges in knowledge representation and organization for the 21 st century: integration of knowledge across boundaries. Würzburg: ERGON Verlag, 2002. (Advances in Knowledge Organization, 8). VCB - Vocabulário Controlado Básico. Brasília: Biblioteca Acadêmico Luiz Viana Filho, 2007. (Edições da Biblioteca do Senado Federal, 2). 1 CD-ROM. Disponível em: <http://www.senado.gov. br/sf/biblioteca/RVBI/publicacoes.asp>. Acesso em: 09 jan. 2008. VCUSP-Vocabulário Controlado da Universidade de São Paulo. Disponível em: <http://143.107.73.99/ Vocab/Sibix652.dll>. Acesso em: 06 jan. 2008.
GT2
XII ENANCIB 2011
630
COMUNICAÇÃO
ORAL
SEMIOSE E ANÁLISE DE ASSUNTO EM ÍCONES COMEMORATIVOS DA GOOGLE: IMPLICAÇÕES DA EXPERIÊNCIA COLATERAL NA REPRESENTAÇÃO DA INFORMAÇÃO ICONOGRÁFICA EM AMBIENTES DIGITAIS
Maria Aparecida Moura
Resumo: Este estudo teve por objetivo compreender o processo de análise de assunto de iconografias entre estudantes da disciplina de indexação do curso de Biblioteconomia em uma universidade pública brasileira. A partir da identificação, análise e representação informacional dos ícones comemorativos apresentados na interface de pesquisa do motor de busca Google, analisaram- se os gestos de representação da informação iconográfica. Tomaram-se por referência os conceitos de signo, semiose, ícone, índice, símbolo, experiência colateral, interpretação sã e paranóica. O estudo evidenciou a importância do alargamento da experiência estética e sócio-cultural do analista como base para representação e recuperação da informação em contextos digitais em rede. Palavras-chave: analise de assunto, informação iconográfica, semiótica,
1 INTRODUÇÃO Os ícones comemorativos Google (doodles) são alterações imagéticas inseridas na logomarca da empresa adotada na interface de pesquisa do buscador com o propósito de ressaltar fatos históricos, culturais e científicos locais ou globais vinculados às datas selecionadas. Os doodles são desenhos livres, mais ou menos automáticos, que as pessoas realizam em situações corriqueiras, tais como durante uma reunião, fixação de conteúdos, situações tediosas, dentre outras. Em geral os elementos icônicos presentes nos doodles remetem ao universo semiótico de referência no qual o sujeito encontrava-se inserido ou fazem alusão ao tema que envolveu a conversação ou reflexão, por exemplo. Ressalta-se que até os anos 1920 os doodles foram pouco percebidos, mas com o surgimento do surrealismo evidenciou-se fortemente as suas marcas psicanalíticas por destacar o papel do inconsciente na representação verbal e imagética. Essa centralidade proposta pelo movimento artístico- literário surtiu efeitos na ação criativa.
GT2
631
Figura 1 - Galateia de esferas - Salvador Dali 1952
No caso da Google, a estratégia teve inicio em 1998 e vinculavam-se ícones de eventos comemorativos globais ao símbolo da empresa como formar de ampliar o potencial informacional e de expandir as representações sociais da marca e do evento destacado. No ano 2000, foi criado um doodle para o evento comemorativo da Queda da Bastilha consolidando assim a estratégia info-comunicacional da empresa em relação aos eventos sócio- históricos. Ao longo do período de estabilização e expansão do projeto, a Google constituiu uma equipe de designers que se ocupa da gestão e adequação do símbolo da empresa aos elementos icônicos memoráveis do evento comemorativo escolhido. Assim, a empresa já produziu cerca de 1000 doodles, sendo 300 com base nos eventos específicos do calendário americano e 700 associados aos demais países do mundo. Nos últimos anos, os doodles ganharam um apelo transmidiático ao introduzir novas estratégias de recuperação seletiva da informação associada ao evento, incorporar música, vídeo e elementos interativos. Em vista dessa estratégia da empresa e considerando a importância do motor de busca nas atividades de recuperação da informação em contexto mundial, indagou-se nesse trabalho sobre a percepção de alunos de Biblioteconomia acerca dos eventos sócio-históricos destacados nos referidos doodles. De que modo os alunos de Biblioteconomia percebem, identificam e interagem com os referidos ícones? Como a experiência colateral desses sujeitos afeta a análise de assuntos que os mesmos são capazes de realizar acerca dos eventos sugeridos pelos ícones? Qual é a natureza da interpretação realizada e quais as repercussões na representação da informação iconográfica em ambientes digitais? Nesse trabalho abordaremos a análise de assunto em interface com alguns conceitos semióticos relacionados à semiose e à interpretação, apresentar-se-á o corpus e a metodologia de análise dos dados e as considerações finais do trabalho.
GT2
632
2 ANÁLISE DE ASSUNTO, SEMIOSE E ICONOGRAFIAS DIGITAIS
Nós últimos anos aumentou expressivamente a sobreposição de conteúdos informacionais suportados por elementos iconográficos. Tais alterações exigem que os mediadores da informação transitem de forma proficiente entre as múltiplas formas de reprodução da informação garantindo a representação do conteúdo informacional de modo coerente. No contexto de representação da informação, a análise de assunto se refere à etapa de apreciação do conteúdo informacional de um documento com propósito de representação em sistemas de informação. Essa etapa é precedida pela leitura técnica. Segundo Naves apud Fujita (2003), a análise de assunto envolve grande complexidade, pois, além do problema da terminologia, existe a influência direta das pessoas que a executam, conhecida como subjetividade, pela qual o indexador interpõe seus próprios valores em sua atuação de intermediário entre autores e usuários, ainda que a tarefa do indexador seja determinar, de forma precisa, o conteúdo. Fujita (2003: p. 10) destaca o papel de três variáveis que atuam no processo de análise de assunto: o leitor, o texto e o contexto,
“o processo de análise de assunto reveste-se de uma subjetividade característica, dadas às circunstâncias e elementos envolvidos, pois, a partir da leitura do documento pelo indexador, é realizado um processo de comunicação interativo entre três variáveis: leitor, texto e contexto.”
A evolução na elaboração de produtos multimídia ampliou a necessidade de compreendermos o papel das imagens na estruturação dos conteúdos informacionais e o sua função na recuperação da informação. Historicamente a organização da informação tem dedicado atenção às manifestações da informação ora com foco no conteúdo textual e em outras circunstâncias no conteúdo iconográfico. Todavia, o processo de aprendizagem da atividade de análise de assunto tem se concentrado na representação dos conteúdos textuais em detrimento do papel da imagem na composição da mensagem. Buscando compreender a articulação desses elementos na composição dos conteúdos informacionais enfatiza-se que para Santaella e Nöth (1998) a imagem como signo icônico pertence à classe dos ícones e remete a própria ideia de signo. Para a autora a hegemonia do código encontra-se nas interfaces, sobreposições e intercursos entre imagem e palavra.
“o signo de imagem se constitui de um significante visual (representamen para Peirce), que remete a um objeto referência ausente e evoca no observador um significado (interpretante) ou uma idéias do objeto. Já que o princípio de semelhança possibilita ao observador unir três elementos constitutivos do signo, não é de estranha que o conceito de imagem seja reencontrado nas denominações de cada um dos três constituintes.” (Santaella e Nöth, 1998:
p. 38)
De acordo com Pinto (1995), o ícone é um signo que se refere ao objeto que denota apenas em virtude de seus caracteres próprios, caracteres que ele igualmente possui quer tal objeto realmente exista ou não. A função signica do ícone é, assim, a de exibir em si traços de seu objeto para uma mente. É algo que esgarça e força nosso sentido. Ex: pintura figurativa (era possibilidade / relações
GT2
633
de comparação). O símbolo dirige-se para o futuro em termos de regularidade ou lei, pois é aquele signo que será representado em seu interpretante como signo de seu objeto. Em outras palavras, o interpretante de um símbolo é previsível porque seu objeto já é conhecido. Já o índice, em contraposição ao ícone, em vez de exibir em si traços do objeto (característica do ícone) aponta para fora de si na direção do objeto. Nesse sentido,
Fica bem fácil presumir que o que presenciamos é um comércio de sentidos distribuídos socialmente por dispositivos midiáticos que, conquanto tendo sempre existido, adquirem agora um peso que cresce exponencialmente e quase oblitera a espontaneidade do psiquismo intersubjetivo para carregar nas tintas de uma interobjetividade simbólica. Além do mais, forçoso é reconhecer que esse item do nosso álbum de memória de imagens já convencionais, sempre retroalimentado pelas nossas relações interobjetivas, espraia-se para além dos limites de uma arte para se disseminar e alcançar outros domínios da experiência. (PINTO, 2009: p. 46)
Enfrentar tais questões requer que retomemos o sentido dado por Peirce ao conceito de semiose, que é definida nos seguintes termos:
“A ação dinâmica, ou ação de força bruta, física ou psíquica, ou tem lugar entre dois sujeitos (tanto se reagem igualmente um sobre o outro, ou um é paciente e o outro o agente, inteira ou parcialmente) ou de uma forma qualquer resultante de ações similares entre pares. Mas por” semiose “entendo, pelo contrário, uma ação ou influência que consiste em ou envolve
a cooperação de três sujeitos, o signo, o objeto e o interpretante, influência trirrelativa
essa que não pode, de forma alguma, ser resolvida em ações entre pares. Semeieosis, no período grego ou romano, à época de Cícero já, se bem me recordo, significava a ação de praticamente qualquer espécie de signos; e a minha definição confere a tudo o que assim se comporta a denominação de ‘signo’.” (PEIRCE, CP 5484) (grifos nossos).
Conforme é possível notar, nessa passagem de Peirce, a semiose é, pois, um produto resultante do processo natural do signo, ou seja, a geração ad infinitum dos interpretantes. Tais interpretantes remetem, sempre, para frente o destino e a completude da cadeia sígnica, apresentando um tipo de opacidade que não nos permite capturá-lo de modo definitivo. Ao delimitar a semiose nestes termos, Peirce deu ao conceito um caráter mais amplo, desvinculando-o de um possível estreitamento que poderia torná-lo um produto objetivo circunscrito apenas às ações humanas. Tal observação parece do nosso ponto de vista, fundamental, sobretudo porque, conforme salienta Eco, Peirce não se interessou ostensivamente pelos objetos enquanto propriedades, mas como ocasiões e experiências ativas. Contudo, ressalte-se que esse ponto de vista nada tem de idealismo, conforme aponta Eco:
“O círculo da semiose se fecha a todo instante e jamais se fecha. O sistema de sistemas
semióticos, que poderia parecer um universo cultural idealisticamente separado da realidade,
de fato leva a agir sobre o mundo e a modificá-lo; mas cada ação modificadora se converte,
por sua vez, num signo e dá origem a um novo processo semiósico.” (ECO, 1979:30).
Eco estabelece em sua análise uma distinção fundamental entre interpretação e semiose, destacando que, sob a primeira, repousam as possibilidades mais concretas de intervenção humana,
GT2
634
enquanto que, sob a segunda, o poder de determinação fica mais vinculado à ação natural do signo. Neste caso, o interpretante, produto objetivo da relação entre objeto e signo, não impõe, necessariamente, restrições quanto ao sentido correto a ser apreendido. A semiose sempre vai gerar algum interpretante, quer seja ele convergente ou divergente àquele presente na relação sígnica, pois,
“O signo é capaz de determinar o interpretante porque dispõe do poder de gerá-lo, ou seja,
o interpretante é uma propriedade objetiva que o signo possui em si mesmo, haja um ato
interpretativo particular que o atualize ou não. O interpretante é uma criatura do signo que não depende estritamente do modo como uma mente subjetiva, singular, possa vir a compreendê-lo.” (SANTAELLA, 1995:85).
A interpretação, por seu turno, é mais restritiva na direção da compreensão correta do objeto. Sendo assim, exige a delimitação dos rumos a serem tomados na direção da interpretação. Em função disso, é possível estabelecer critérios definidores da qualidade interpretativa de um dado produto comunicativo. Todavia, no caso da semiose, esse juízo de valores não se coloca de forma tão definitiva, visto que o signo, compreendido ou não, tem o poder de gerar alguma semiose
possível, inaugurando, assim, uma cadeia sígnica que ocorre ad infinitum. Derivando essas reflexões para o universo da criação com recursos digitais, é possível compreender que:
- A cooperação exigida do receptor em processos interpretativos ficou mais instrumentalizada pelas possibilidades concretas de mobilização dos sentidos (visão, audição, tato).
- O criador possui, hoje, instrumentos expressivos que o possibilitam fornecer ao receptor estoques de prenoções que o permitem agir interpretativamente de maneira mais harmoniosa em relação ao modo como o autor agiu gerativamente.
• Conforme demarca Eco (1979):
“Dissemos que o texto postula a cooperação do leitor como condição própria de atualização. Podemos dizer melhor que o texto é um produto cujo destino interpretativo deve fazer parte do próprio mecanismo gerativo. Gerar um texto significa executar uma estratégia de que fazem parte previsões dos movimentos de outros – como, aliás, em qualquer estratégia. Na
estratégia militar (xadrezística – digamos em toda estratégia de jogo), o estrategista projeta um modelo de adversário. Se efetuo este movimento- aventurava Napoleão –, Wellington deveria reagir assim. Se executo este movimento – argumentava Wellington –, Napoleão
deveria reagir assim. (
o autor costumeiramente quer levar o adversário a vencer, ao invés de perder.” (ECO,
1979:39).
A analogia só pode ser invalidada pelo fato de que, num texto,
)
Se essa estratégia ocorre de modo evidente no universo do signo linguístico, o que dizer então do mundo hipermidiático? Acredita-se que nesses contextos os recursos para acossar a sensibilidade do receptor ocorrem de forma mais intensa e integrada. Do nosso ponto de vista, parece que a tão propalada abertura das obras contemporâneas à intervenção criativa por parte do receptor esbarra, ainda hoje, no projeto semiósico concebido na gênese. Lembrando as palavras do próprio Eco (1997:27), que podem ser estendidas também aos contextos de criação e recepção digital, parece que “no decorrer das últimas décadas os diretos dos intérpretes foram exagerados”. Assim o autor ressalta:
“Dizer que a interpretação (enquanto característica básica da semiótica) é potencialmente ilimitada não significa que a interpretação não tenha objeto e que corra por conta própria.
GT2
635
Dizer que um texto potencialmente não tem fim não significa que todo ato de interpretação possa ter um final feliz”. (ECO, 1997:28).
No caso específico das relações que o receptor estabelece no interior da obra, cabe ao mesmo definir se adota uma conduta de exercício ilimitado da semiose ou se interpreta o texto com base numa perspectiva definida de boa interpretação. Porém, trata-se de um processo altamente subjetivo, no qual o receptor nem sempre tem clareza do curso de suas ações e das variáveis envolvidas. Contudo, a cooperação na direção de boa interpretação não deve confundir-se como a atualização das intenções do autor, mas como atualização do que se encontrava subjacente ao próprio objeto comunicativo. Assim, Eco (1979) enfatiza que a cooperação textual refere-se à articulação de estratégias discursivas empreendidas pelos leitores e autores no texto e não possui relação direta e necessária com as intenções extratextuais empreendidas pelos receptores. Eco (1997) chega mesmo a tipificar a interpretação. Com relação ao processo interpretativo, ele o subdivide em dois tipos de interpretação: sã e paranóica. Ainterpretação sã é a capacidade de reconhecer os limites das estruturas textuais, compreendendo que de uma relação mínima não se pode querer extrair o máximo, sob o risco de provocar deformações ao pensamento do autor. Por outro lado, a interpretação paranóica caracteriza-se pela excessiva atenção dada as pistas deixadas pelo autor. Neste caso, o leitor se perde na indagação dos motivos “secretos” que o levaram a escolher determinada estrutura em detrimento de outras. A superestimação da importância das pistas (dados analógicos) deve-se muitas vezes à tendência a se considerar, no processo interpretativo, os elementos mais imediatamente aparentes como significativos. Entretanto, esta atitude de “leitura suspeita” desloca o olhar do leitor, impedindo-o de interpretar o texto em sua complexidade. Parece, então, que na relação entre receptor e autor, que ocorre por intermédio do objeto comunicativo, a possibilidade de interpelar a semiose gerada pelo leitor ocorre, objetivamente, através e na ampliação da experiência colateral do sujeito. Pois é ela que tem o poder de reger as “inexplicáveis” conexões estabelecidas pelos sujeitos na composição dos interpretantes. O contexto digital horizontalizou de certo modo os fluxos de produção e trocas de informações. Nesse sentido, reduziu as marcas contextuais que permitiam aos mediadores da informação apreendê- la em contexto. Além disso, há nos dias de hoje as evidências dos cenários semióticos. Tais cenários referem-se a representações de uma estrutura genérica ou modelo controlado para a especificação e modelagem de um produto de informação que forma versões ou realizações concretas. Visam garantir o reconhecimento e a legitimação de documentos no espaço e no tempo e contam com uma composição estrutural que revela as representações e o projeto semiósico e funcional no qual se explicita o pacto de leitura proposto. (Stockinger, 1999. p. 146). Nesse contexto, a experiência colateral se refere à familiaridade que o interprete e tem com aquilo que o signo denota.
GT2
636
Acredita-se que no caso específico da análise e descrição de informações iconográficas é requerido que o analista, conforme ressalta Eco, possua competência variadamente circunstancial; tenha capacidade de desencadear pressuposições e reprimir idiossincrasias além de recuperar com máxima aproximação possível os códigos do emitente. As referidas categorias permitem compreender de análise e tradução da informação em contextos de representação informacional.
3 A METODOLOGIA E ANÁLISE DOS RESULTADOS DO ESTUDO
Para o desenvolvimento do estudo proposto, identificou-se um conjunto de doodles produzidos e divulgados na interface do motor de busca Google nos últimos anos com propósito de compreender como os alunos de Biblioteconomia analisam os assuntos subjacentes aos ícones comemorativos em contextos digitais. Para tanto, foram selecionadas duas turmas de graduação que cursavam a disciplina indexação no segundo semestre de 2010 e no primeiro semestre de 2011 no curso de Biblioteconomia em uma universidade pública brasileira. A amostra foi composta por 65 estudantes que na ocasião cursavam o terceiro período da graduação. Foi inserido no experimento um conjunto formado por quinze doodles e solicitado aos sujeitos da pesquisa que identificassem o referente do ícone comemorativo e as razões para a identificação encontrada. Cabe ressaltar que, embora a prática de inserção dos doodles comemorativos seja relativamente comum e naturalizada na interface do buscador há mais de 10 anos, causou admiração entre os sujeitos da pesquisa a sua regularidade e diversidade temática.
GT2
637
Figura 2 – Doodles sonorizados e/ou animados para remeter ao universo semiótico dos homenageados Les Paul, Marta Graham, Charles Chaplin, Freddie Mercury e o jogo Pac Man’s, respectivamente.
Figura 3- Doodle em homenagem ao paisagista Burle Marx
Dentre os quinze doodles selecionados para a amostra, apresentamos nesse trabalho um conjunto composto por onze ícones associados aos seus referentes imagéticos encontrados na Web. Todavia, na proposta do experimento não foram inseridos os referentes, pois a sua identificação integrava o propósito da análise. Na composição da amostra incorporaram-se dois cineastas: Akira Kurosawa, Alfred Hitchcock; um músico brasileiro: Tom Jobim; um fenômeno natural: Eclipse; um cientista: Einstein; um escritor:
Arthur Conan Doyle, um pop star: Michael Jackson e quatro artistas plásticos: Diego Velásquez, Frida Kahlo, Leonardo da Vinci, Michelangelo. Foi pedido aos sujeitos da pesquisa que descrevessem o contexto semiótico do ícone a partir de sua experiência colateral em relação à imagem apresentada. A atividade teve uma duração de cerca de 90 minutos e despertou bastante discussão sobre os elementos icnográficos representados. As análises de assunto dos ícones foram representadas por frases ou palavras-chave que remetiam ao contexto semiótico da imagem do ponto de vista do analista.
GT2
638
|
REFERÊNCIA |
DOODLE |
|
|
|
|
|
|
|
|
|
|
|
|
GT2
639
|
REFERÊNCIA |
DOODLE |
|
|
|
|
|
|
|
|
Figura 4 – Imagens selecionadas para o experimento
GT2
640
Tabela 1 - Análise de assunto de ícones Google
Os doodles que geraram o maior índice de reconhecimento do referente da imagem foram:
Leonardo da Vinci (13%), Michael Jackson (13%), e o fenômeno natural do eclipse (11%). O único ícone com referências brasileiras (Tom Jobim) teve um reconhecimento de 11%. Os ícones que obtiveram os mais baixos índices de reconhecimento do referente foram: Akira Kurosawa (26%) e Diego Velásquez (26%). No quadro abaixo, sistematizamos alguns elementos das representações seguidas pelos termos através dos quais os analistas assinalaram o universo semiótico dos ícones propostos para análise. Adotaram-se as categorias de interpretação sã e paranóica de Eco (1997) para identificar os elementos que compuseram as análises realizadas. As palavras grifadas em vermelho assinalam elementos do contexto semiótico do referente dos ícones, mas que em virtude da composição proposta pelo analista inserem discrepâncias na representação informacional. Notou-se forte deslizamento de referências semióticas entre o evento comemorativo e os elementos que compõem a produção criativa do homenageado como, por exemplo: Conan Doyle e Sherlock Holmes, Einstein e Física, Leonardo da Vinci e Mona Lisa, Hitchcock e Pássaros (filme), Michael Jackson e moonwalk (dança), Michelangelo e Davi.
|
INTERPRETAÇÃO SÃ |
INTERPRETAÇÃO PARANÓICA |
|
|
AKIRA KUROSAWA |
Imagem do homenageado, cenário, câmera, cinema, diretor de cinema famoso. |
Inventor da câmera, importante japonês, famoso de Hollywood, aniversário do cinema, fotografia. |
GT2
641
|
ALFRED HITCHCOCK |
Suspense, cinema, foto, Psicose (filme), pássaros (filme). |
|
|
ARTHUR CONAN DOYLE |
Indícios, investigação, Holmes, literatura, romance policial, mistério. |
Dia do espião, dia do detetive. |
|
DIEGO VELÁSQUEZ |
Obra, artista, roupas de época. |
Marc Chagall, família real brasileira, Revolução francesa, teatro, três mosqueteiros, burguesia. |
|
ECLIPSE |
Sol coberto, lua, sol. |
|
|
EINSTEIN |
Ciência, teoria da relatividade, energia, física, cientista. |
Dia do físico, centenário da física, dia do cientista, data importante. |
|
FRIDA KAHLO |
Imagem do homenageado, obra |
Tarsila do Amaral, primavera, dia da indiana, |
|
LEONARDO DA VINCI |
Obra, invenções, imagens renascentistas, homem, Mona Lisa. |
|
|
MICHAEL JACKSON |
Sapato, meias, dança. |
|
|
MICHELANGELO |
Obra, escultura, Davi, arte italiana, Renascimento. |
Aniversário da Grécia, Dia do escultor, Dia da filosofia, dia do renascimento. |
|
TOM JOBIM |
Piano, chapéu, Rio de Janeiro, óculos, bossa nova. |
Férias |
Tabela 2 - Analise das representações dos sujeitos da amostra
Percebeu-se no contexto analisado que, conforme assinala Pinto (2009: p. 48),
|
A |
imagem funciona duplamente como índice de seu objeto e índice de seu signo, isto é, ela |
|
se |
refere àquilo que ela gera e àquilo que a gerou de forma simultânea. Esse ethos imagético |
|
índice de um conjunto de dispositivos — argumentos a que a narrativa dos seres vivos obedece. é |
|
Acredita-se que a dificuldade na análise e representação informações iconográficas reside exatamente na ambivalência da imagem nesse contexto, no qual as diferentes técnicas de congelamento da significação para fins de representação são, por vezes suplantada pela forte carga semiótica oriunda da experiência colateral do analista.
GT2
642
4 CONSIDERAÇÕES FINAIS
O experimento realizado nos permitiu compreender a dinâmica e os processos semiósicos que presidem a análise de assunto de iconografias e a ampliação de sua complexidade em contextos no qual a imagem está associada a elementos textuais e que exigem um olhar ampliado para articulação da expressão do discurso em seus elementos constitutivos. Foi possível também constatar a necessidade de ampliação de experiências de formação acadêmica voltadas à análise e representação da informação iconográfica em virtude de sua intensa adoção em ambientes digitais em rede. Os fundamentos teóricos de base semiótica se mostraram essenciais para a explicação do fenômeno de representação informacional em contexto e evidenciou o caráter subjetivo do gesto de representação da informação. Assim, percebeu-se a necessidade de valorizar e ampliar as experiências estéticas e sócio-culturais no processo de formação como elementos centrais para o alargamento da experiência colateral do analista da informação em contexto. Acredita-se que em ambientes digitais não é mais suficiente reter as regras e normas de representação e mediação da informação. Assim, considerando-se o caráter essencialmente intelectual da atividade de representação da informação, é preciso ampliar o repertório semiótico do analista da informação desde a sua formação acadêmica. Sobretudo, porque o texto, conforme salienta Eco (1978), é um mecanismo econômico que depende de um movimento cooperativo, consciente e ativo por parte do leitor. Reconhecer os repertórios semióticos e suas funções na composição do discurso pode representar um diferencial na formação do indexador requerido no contexto de economia da atenção em rede. Essa nova dinâmica informacional realiza-se pela interposição de infinitas manifestações imagéticas compostas por uma vasta iconografia de síntese e/ou historicamente constituídas e reconhecidas.
Abstract: This study aimed to understand the process of subject analyses of the iconographies among students of the discipline of indexing practices in library science course in a Brazilian public university. From the identification, analysis and representation of commemorative icons presented on the interface of search Google search engine, it was analyzed the representation gesture of iconographic information. It was adopted as reference the concepts of sign, semiosis, icon, collateral experience, interpretation sane and paranoid. The study highlighted the importance of the extension of aesthetic experience and socio-cultural in the academic formation as the basis to knowledge organization and information retrieval in digital environments. Keywords: subject analyses, iconographic information, semiotics
5 REFERÊNCIAS ECO, Umberto. O leitor–modelo. In:
GT2
Lector in fabula. São Paulo: Perspectiva, 1979. p. 35-49.
643
ECO, Umberto. Entre autor e texto. In:
Martins Fontes, 1997. p.79 -104.
FUJITA, Mariângela Spotti Lopes. A identificação de conceitos no processo de análise de assunto para indexação. Revista Digital de Biblioteconomia e Ciência da Informação, Campinas, v.1, n.1, p. 60-90, jul./dez.2003.
FOSKET, A.C. A abordagem temática da informação. São Paulo: polígono, 1973.
GOOGLE. Holiday and events. Disponível em: http://www.google.com/logos/ Acesso em 05. ago.
2011.
GRIBOULLAGE. Disponível em: http://www.gribouillage.net/ Acesso em 05. ago. 2011.
MOURA, Maria Aparecida. Semiótica e mediações digitais: criação e recepção de hipermídias. Orientador: Arlindo Machado. 2002. 208f. Tese (Doutorado em Comunicação e Semiótica) – Pontifícia Universidade Católica de São Paulo, São Paulo, 2002.
MOURA, Maria Aparecida, SILVA, Ana Paula, AMORIM, Valéria Ramos de. A concepção e o uso das linguagens de indexação face às contribuições da semiótica e da semiologia. Revista informação e sociedade. v. 12 n.1. 2002. Disponível em: http://www.informacaoesociedade.ufpb.br. Acesso em:
Interpretação e superinterpretação. São Paulo:
12. mar. 2010.
MOURA, Maria Aparecida. Informação, ferramentas ontológicas e redes sociais AD HOC: a interoperabilidade na construção de tesauros e ontologias. Revista informação e sociedade, v. 19, n.1, p. 59-73, 2009.
NAVES, Madalena Martins Lopes, KURAMOTO, Hélio (orgs). Organização da informação:
princípios e tendências. Brasília: Briquet de Lemos, 2006.
PEIRCE, C. S. Collected papers: versão eletrônica. Bloomington: Past Masters, 1995.
PINTO, Julio. 1, 2, 3 da Semiótica. Belo Horizonte: UFMG. 1995.
PINTO, Julio. Um ethos imagético? Revista Galáxia, São Paulo, n. 17, p. 41-48, jun. 2009.
SANTAELLA, Lúcia, NÖTH, Winfried. Imagem: cognição, semiótica, mídia. São Paulo: Iluminuras,
1998.
STOCKINGER, P. Les nouveaux produits d’ information : conception et sémiotique du document. Paris: Hermes,1999.
GT2
644
COMUNICAÇÃO
ORAL
PROTÓTIPO DE UM SISTEMA DE SUBMISSÃO DE ARTIGO CIENTÍFICO PARA PERIÓDICO ELETRÔNICO SEMÂNTICO EM CIÊNCIAS BIOMÉDICAS
Leonardo Cruz da Costa
Resumo: Problema: publicações eletrônicas, apesar dos avanços das TIs, são ainda apoiadas no modelo impresso. O formato textual dificulta que programas possam ser usados para o processamento “semântico” do conteúdo do artigo científico. Objetivos: descreve a implementação de um protótipo de um sistema de submissão de artigo científico para periódico eletrônico, em ciências biomédicas, capaz de extrair o conhecimento do texto do artigo e representá-lo em formato “inteligível” por programas, tornado possível, futuramente, a recuperação semântica. Fundamentação teórico metodológica: o protótipo é a implementação parcial da proposta de OCCA (MARCONDES, 2005) um modelo para representar os elementos semânticos que constituem o conhecimento contido em um artigo científico, baseado em elementos do Método Científico (hipotético-dedutivo). O objetivo desse modelo é servir de base para publicações semânticas. Resultados: resultados dos testes com o protótipo envolvendo pesquisadores-autores são relatados.
Palavras-chave: publicações eletrônicas, representação do conhecimento, comunicação científica.
1 INTRODUÇÃO
Segundo Shera e Cleveland (1977), após a Segunda Guerra, uma enorme quantidade de informações foram produzidas devido ao aumento do número de cientistas, de pesquisas e do desenvolvimento de tecnologia, gerando expressões como, “explosão bibliográfica” ou “caos documentário” (BRADFORD, 1961). Esse fenômeno conduziu a uma grande preocupação quanto ao registro, acesso, recuperação e divulgação da informação e de documentos. Uso das tecnologias de informação, no sentido de intervir neste processo, procurando aperfeiçoar o acesso aos pesquisadores à informação relevante, não é novo. As We May Think, texto publicado em 1945 por Vannevar Bush, por exemplo, argumentava que o esforço científico deveria ser concentrado em deixar o conhecimento humano mais acessível e propunha uma máquina denominada Memex.
Porém, se, antes, para a obtenção de informações, era necessário se dirigir a uma biblioteca, atualmente tais informes podem estar armazenados em um pen drive. Contudo, o conhecimento continua sendo codificado em um formato textual, para ser lido por pessoas, e não em um formato legível por programas, permitindo que “inferências”, “decisões” e “argumentações” automáticas pudessem ser realizadas sobre o conteúdo do texto. Vislumbra-se, então, investir na web semântica,
GT2
645
como forma de contribuir positivamente na recuperação de documento relevantes para ciência.
A web semântica é uma extensão da web atual, onde a informação possui um significado
bem definido (BERNERS-LEE, 2001). Os documentos na web passam a ser representados através de metadados semânticos que descrevem o que significa a informação contida no documento. O
significado é expresso de acordo com um conjunto de conceitos e relações de um domínio específico
e expresso através de uma ontologia. A ontologia representa um sistema conceitual que normaliza o discurso em um dado domínio. Assim, as descrições sobre o documento estão, portanto, de acordo com um sistema conceitual, estabelecendo um significado claro e não ambíguo para aquilo que se descreve.
Podemos proceder a uma analogia das descrições baseadas em uma ontologia com a indexação por meio de um vocabulário controlado. Ambas apoiam a recuperação de documentos, porém as descrições com base em ontologias passam a contar com recursos semânticos que ultrapassam os limites das palavras chaves e dos operadores lógicos comumente usados nas máquinas de buscas.
Passa, em consequência, a ser possível a construção de agentes de software aptos a “compreender” e
a processar de forma “inteligente” (inferir) o conteúdo descrito pelo metadados semânticos.
Desta maneira, podemos entender que as metas da web semântica mostram-se mais ambiciosas do que simplesmente permitir indexar melhor a informação. O documento digital, dentro do contexto da web semântica, processado por agentes inteligentes pode-se constituir em nova e poderosa ferramenta cognitiva.
Esse cenário do documento científico digital - com seu conteúdo representado em formato legível por programas - trará novas perspectivas para a validação, registro, recuperação, disseminação e aprendizagem de novos conhecimentos: a publicação de artigos científicos na web, com essa característica, pode vir a ser uma ferramenta cognitiva onde suas potencialidades estão longe de serem avaliadas (MARCONDES, 2005).
A publicação de resultados, na web mesmo apoiada em uma infraestrutura como a que é
projetada para a web semântica, torna-se um desafio. Entretanto, definir como a comunidade científica
publicará os resultados em um formato apropriado, para que a sua recuperação ultrapasse os limites impostos pelo modelo impresso, configura um problema ainda sem solução.
A construção de um protótipo de um sistema de submissão, objetivo desse trabalho, encontra-
se no âmbito desse contexto, permitindo criar condições para a descrição da semântica, e a futura recuperação e validação do novo conhecimento e de seu processamento por agentes de software, apoiando, de forma muito mais significativa, o trabalho do pesquisador. As tarefas a serem realizadas pelos autores, no sistema, são similares àquelas que eles já desempenham quando do envio de seu trabalho, para publicação, em um periódico científico, repositórios ou bibliotecas digitais.
GT2
646
2 REFENCIAL TEÓRICO
Os artigos científicos eletrônicos são para serem lidos, discutidos, debatidos e validados por pessoas. Porém, são meras cópias digitais de sua versão em papel, eles não incorporam as potencialidades previstas na web semântica (MARCONDES, 2005), uma extensão da web atual, onde a informação possui um significado bem definido permitindo melhor interação entre os computadores e as pessoas (BERNERS-LEE, 2001); em outras palavras, os metadados não incorporam descrições que permitam um processamento mais inteligente dos documentos pelos sistemas de recuperação de informação. Segundo Passin (2004) a literatura sobre web semântica apresenta diversas e diferentes visões, entre elas, a de que deve permitir que os dados disponíveis e “ligados” na internet possam ser usados por máquinas não só para propósitos de exibição, mas para automatização, integração e uso por várias aplicações. E ainda, ela deve ter como função, a criação de uma web que possibilite o uso de agentes inteligentes para que se possa recuperar e manipular a informação de maneira automática e precisa utilizando o contexto no qual ela está inserida ao invés unicamente de palavras-chave. O princípio básico da web semântica é tornar possível expressar e representar a semântica dos dados através de outros esquemas descritivos, objetivando a precisão dos significados, ou seja: um esquema que descreva quais os conceitos existentes em certo domínio e como eles se relacionam. Como um modelo conceitual, que serve como uma representação abstrata dos elementos de informação. Esse esquema é representado numa ontologia. A ontologia é similar a um dicionário, taxonomia ou glossário, porém com estrutura e formalismo que possibilita computadores processar seu conteúdo. Ela consiste de um conjunto de conceitos, axiomas e relações, e representa uma área de conhecimento. Diferente da taxonomia ou glossário permite estabelecer relações arbitrárias entre conceitos, propriedades lógicas e semânticas de relações tais como: transitividade, simetria e inferência lógica sobre as relações. Do ponto de vista da informação a ser distribuída a respeito de um documento, metadados podem ser utilizados de maneira melhorar descrições do conteúdo do mesmo (PASQUINELLI, 1997) sem a limitação da descrição como um produto da catalogação. Assim, neste ponto, cabe uma questão: poderiam os campos dos metadados, responsáveis pela representação do conteúdo, incorporar relações, permitindo ligações entre eles e atribuindo um maior sentido à descrição? Na busca pela resposta para a questão acima Marcondes et al. (2005) propõe uma ontologia (OCCA) como um modelo para representar os elementos semânticos que constituem o conhecimento contido em um artigo científico, baseado em elementos do Método Científico (método hipotético- dedutivo) e na forma como eles aparecem em artigos científicos. O objetivo desse modelo é servir de base para publicações semânticas, uma nova forma de publicar artigos científicos. A publicação semântica fornece uma maneira dos computadores compreenderem a estrutura e até mesmo o significado das informações publicadas, tornando a pesquisa de informações e a integração de dados mais eficiente. Desta forma, os metadados que descrevem o conteúdo do artigo são representados como uma instância
GT2
647
de OCCA, de modo a tornar seu conteúdo processável por programas. Por meio de OCCA é possível representar quatro diferentes tipos de artigos (Teóricos, Experimentais-exploratórios, Experimentais-indutivo e Experimentais-dedutivos), cada um baseia-se em diferentes raciocínios, estratégias de argumentação e pressupostos observados em diferentes tipos de artigo científico (MARCONDES et al., 2009). A proposta de OCCA se baseia na concepção de que o conhecimento científico consiste em propor e provar a existência de relações entre fenômenos e relações entre fenômenos e a suas características (BUNGE, 1998), (MILLER, 1947), até então desconhecidas. OCCA é constituído de elementos semânticos como a questão de pesquisa, a hipótese e a conclusão. Enquanto a questão de pesquisa se caracteriza como uma pergunta de caráter geral e não como relação, as hipóteses, ao propor uma relação entre fenômenos, têm importância decisiva quanto à manifestação do conhecimento novo em ciência. Uma RELAÇÃO, para OCCA, tem a forma de um antecedente, uma relação e um consequente, como uma 3-tupla (antecedente, relação, consequente). A relação pode ser um tipo de relação específica como “causa”, “afeta”, “indica”, ou um tipo de relação tem_característica que define uma característica do antecedente, enquanto o antecedente e o consequente referem-se aos fenômenos estudados pelo autor. Por convenção utiliza-se a palavra relação em maiúscula para referenciar a 3-tupla e em minúscula quando se referir à relação específica contida na 3-tupla. Outro aspecto apontado por OCCA é que a RELAÇÃO pode, também, ser mapeada para ontologias públicas, estabelecendo uma ligação entre o artigo e o conhecimento público disponível e validado. A falta de mapeamento entre os elementos da RELAÇÃO e a ontologia pode indicar evidências de novas descobertas por causa da falta de representação de tais elementos na ontologia (MALHEIROS, 2010).
3 O PROTÓTIPO DE UM PROCESSO DE SUBMISSÃO
Como o processo de submissão tem por objetivo que os próprios autores, no momento de submeterem seus trabalhos, forneçam informações sobre os resultados de sua pesquisa, assume-se que o autor é o mais capaz de identificar os pontos importantes do seu trabalho e a sua principal contribuição. Para apoiar o autor na tarefa de expressar por meio de uma RELAÇÃO sua principal contribuição, optou-se por direcionar o foco de atenção para a conclusão do artigo tornando-a o elemento chave para o processo de submissão. Enquanto as hipóteses são declarações sobre características de objetos, relações, associações e, até mesmo, declarações negativas (hipótese nula), as conclusões são as que expressam as afirmações resultantes do trabalho; além disso, elas comumente fazem parte dos resumos estruturados e os autores, possivelmente, estão mais acostumados a informar do que as hipóteses. Assim, assume-se que a principal afirmação científica contida no artigo científico se manifesta através da conclusão do autor.
GT2
648
Ao propor aqui um processo de submissão, implementado através de um protótipo de um sistema web, é necessário criar condições para que o autor através de um diálogo (com o sistema) consiga informar de maneira adequada a RELAÇÃO que melhor representa sua principal contribuição, isto é, a conclusão do trabalho sob a forma de uma RELAÇÃO. Porém, espera-se um nível de dificuldade
elevado na construção dessa interface com o usuário, isso é explicado pelo fato de se exigir do autor
o domínio de vários conhecimentos que impactam diretamente na usabilidade do sistema. Expressar a RELAÇÃO possui alta exigência cognitiva do autor, pois vários fatores dependem de sua compreensão, como por exemplo: O que é o antecedente, consequente e a própria relação? O que é uma RELAÇÃO? Como mapear essa RELAÇÃO com uma ontologia pública? O que é uma
ontologia pública? Todos esses aspectos devem ser compreendidos, identificados e indicados em um momento crítico que é o envio da versão final do artigo para um periódico. Na tentativa de aliviar a pressão desses fatores sobre os autores, toma-se como princípio, que
o sistema de submissão contará com uma tarefa de extração da RELAÇÃO de forma automática. Sua função é propor (sugerir) a RELAÇÃO ao autor, que poderá aceitá-la ou não. Acredita-se que
a apresentação de uma RELAÇÃO ao autor, mesmo que imprecisa, facilite a condução do diálogo,
criando meios de diminuir as exigências cognitivas e facilitando a compreensão daquilo que o sistema necessita para registrar. A tarefa de extração da RELAÇÃO é apoiada em técnicas de processamento de linguagem natural (PLN) como as implementadas pelo programa MMTx - http://mmtx.nlm.nih.gov/, programa esse que identifica os termos controlados do UMLS – Unified Medical Language System. A escolha do UMLS como suporte ao trabalho está apoiada no fato dele possuir uma infraestrutura pronta e disponível livremente para o processamento de texto, além disso, conhecimento é organizado como uma rede semântica, em que termos estão estruturados em grandes categorias como organismos, estruturas anatômicas, funções biológicas e químicas, eventos, objetos físicos e descritos em um metatesauro. Outro aspecto que apoia essa escolha é que o UMLS possui um conjunto de relações, que coincide com a proposta de representação do conhecimento de OCCA, sendo, portanto, de especial interesse para esta pesquisa. O foco em artigos científicos da área biomédica é motivado pelo fato de que os mesmos seguem um rígido padrão formal em seus textos. Esse padrão é comumente chamado de IMRAD (Introduction, Method, Results Abstract and Discussion), isso torna mais fácil o processamento automático do texto por contar com seções bem definidas e vocabulários médicos consagrados. Assim, a tarefa de extração da RELAÇÃO é desenvolvida como parte da estratégia do processo de submissão de artigos. A RELAÇÃO é obtida automaticamente, por meio do processamento do texto
e servirá para iniciar o diálogo com o autor para que ele possa interagir com o sistema e representar a conclusão do trabalho como uma RELAÇÃO. O processamento do texto, para a extração da RELAÇÃO, apoia-se em uma abordagem híbrida
GT2
649
que utiliza tanto técnicas oriundas do PLN e técnicas estatísticas. As técnicas do PLN utilizadas se desenvolvem de acordo com a perspectiva da teórica da gramática gerativa de Chomsky (1957) e as estatísticas sob a perspectiva da representação do texto através de seus termos, que são valorados através de sua frequência e peso, mais especificamente sob a inspiração do trabalho de Edmundson (1969) que propõe modificações no método de Luhn (1958), ao estabelecer que as palavras, além de sua frequência, passassem a ter pesos de acordo com o local e características dentro do texto.
3.1 O Processo de submissão Uma visão geral do processo de submissão é representada por meio da figura 1. A seguir são descritas cada atividade que compõe o processo de submissão.
Atividade 1: envio do artigo científico (upload do artigo)
A tarefa de envio do arquivo assemelha-se a outras já conhecidas em sistema computacionais, como anexar um arquivo em uma mensagem eletrônica.
Atividade 2: obtenção de dados gerais do artigo
Essa tarefa tem por objetivo obter informações do autor, com relação ao contexto do trabalho, a importância do estudo e como o artigo pode ser classificado (experimental, teórico, etc.).
Figura 1- Visão geral processo de submissão
GT2
650
Atividade 3: extração do objetivo
A extração do objetivo baseia-se na identificação de frases indicativas (por ex. The aim of our
study is
e introdução) (SWALES, 1990). A partir de uma análise realizada e a identificação de vários tipos de frases indicativas (COSTA, 2008) foi possível elaborar um modelo de regras para a extração automática. O objetivo do autor é posteriormente utilizado na tarefa de extração da RELAÇÃO.
em pontos específicos do texto, por causa de sua alta concentração nessas partes (abstract
)
Atividade 4: validação do objetivo
O conjunto de frases selecionadas como indicativas do objetivo é apresentado ao autor para
que ele tome a decisão e informe qual representa melhor o objetivo do seu trabalho, já que o texto pode conter várias frases indicando o objetivo (COSTA, 2008).
Atividade 5: descrição da conclusão
Cabe ao autor descrever a principal conclusão do trabalho. O texto da conclusão será processado com o intuito de sintetizá-lo por meio de uma RELAÇÃO.
Atividade 6: extração automática da RELAÇÃO
Essa atividade tem por objetivo transformar a conclusão de sua forma textual para RELAÇÃO (antecedente, relação, consequente). Com este fim, duas hipóteses são estabelecidas: 1) As relações são expressas por típicos marcadores léxicos, restringindo-se, aos verbos, verbos substantivados (nominalização) e termos ou conceitos médicos específicos; e 2) As relações interessantes acontecerão entre as macroproposições mais relevantes. Dois passos são empregados: a) Identificação das Macroproposições Relevantes e b) Identificação da Relação Propriamente Dita.
Subatividade 6.1: identificação das macroproposições relevantes
Tem por finalidade limitar o espaço de pesquisa na busca da relação, restringindo a quantidade de termos a serem verificados. A identificação das macroproposições se baseia em três etapas: pré- processamento da frase da conclusão, determinação dos sintagmas da frase e o cálculo da importância do sintagma.
- pré-processamento da frase de conclusão
A conclusão é submetida a um pré-processamento automático que tem por objetivo eliminar
apostos, vírgulas e textos entre parênteses.
- determinação dos sintagmas da frase
Após o pré-processamento é realizada a identificação dos sintagmas que formam a oração. Utiliza-se o programa MMTx, que além de fornecer os sintagmas, apresenta, também, as unidades em sua forma “condensada”, isto é, o programa retira os artigos, preposições que iniciam os sintagmas.
GT2
651
- cálculo da importância do sintagma – pesagem do sintagma
A estratégia usada é identificar os dois principais sintagmas da frase de conclusão, usando-os como limites (inferior e superior) (figura 2) e estabelecendo um intervalo para a busca da relação. Os sintagmas mais importantes são aqueles que possuem os termos mais importantes. A atribuição da relevância é baseada na pontuação obtida por meio de uma função linear, utilizando a frequência dos termos que compõe a conclusão e os pesos estabelecidos de acordo com cada “local” no artigo. Se o termo da oração da conclusão ocorre, também, no objetivo - obtido na atividade de extração do objetivo - no título e nas palavras-chave, a frequência é multiplicada por pesos atribuindo uma maior importância.
Figura 2 - Identificando os sintagmas mais importantes
Subatividade 6.2: identificação da relação propriamente dita
A identificação da relação se baseia na hipótese de que elas são expressas por típicos marcadores léxicos, aqui restritos, aos verbos, aos verbos substantivados (nominalização) e aos termos ou conceitos médicos específicos. No exemplo anterior, entre congenital toxoplasmosis e pregnancy (os limites) ocorrem dois sintagmas, um nominal (the occurrence) e outro verbal (prevent) tomado imediatamente como candidato à relação (figura 3).
Figura 3 - Um candidato a RELAÇÃO
O nominal (the occurrence) é submetido a um processo de verificação de nominalização. Esta verificação toma como base uma consulta ao Wordnet, obtendo as possíveis nominalização do termo. Caso o substantivo esteja relacionado diretamente a um verbo, esse passa a ser candidato à relação. Para identificar os conceitos e termos médicos utiliza-se o programa MMTx. Na frase a seguir o conceito antibiotics é definido no vocabulário MeSH como “substances produced by microorganisms that can inhibit or suppress the growth of other microorganism”.A ideia básica é utilizar os verbos (produce, inhibit, suppress), contidos na definição do conceito como marcadores (candidato) de uma possível relação (figura 4).
GT2
652
Figura 4 - Identificando um conceito médico associado aos verbos produce, inhibit, suppress
Atividade 7: validação da RELAÇÃO
Essa atividade tem por finalidade a confirmação, ou não, da RELAÇÃO produzida automaticamente. O autor é exposto às informações geradas (antecedente, relação, consequente) sendo possível a alteração de todos os elementos se necessário (figura 5).
Figura 5 - Validação da RELAÇÃO
Atividade 8: mapeamento da RELAÇÃO para a ontologia pública
A função do mapeamento é prover um sentido (semântico) para os elementos da RELAÇÃO por meio de ligações deles com uma ontologia pública, neste caso o UMLS. Assim, essa atividade objetiva identificar se os elementos que compõem a RELAÇÃO podem ser mapeados ou não para uma base de conhecimento público, isto é, se cada elemento já está conceitualmente descrito na ontologia. Para o mapeamento do antecedente e do consequente é utilizado o programa MMTx que relaciona termos a conceitos do metatesauro do UMLS e para tipos semânticos da rede semântica. A tabela 1 apresenta os seguintes mapeamentos para o antecedente systematic serological screening during pregnancy.
Tabela 1 - Candidatos Para Mapeamento do Antecedente
GT2
653
|
Antecedente |
Cód. Conceito |
Nome |
Tipo Semântico |
|
systematic |
C0205473 |
Serologic |
Functional Concept |
|
serological |
C0220909 |
Aspects of disease screening |
Functional Concept |
|
screening |
C0220908 |
Screening procedure |
Health Care |
|
Activity |
|||
|
during |
C1409616 |
Special screening finding |
Finding |
|
pregnancy |
C0032961 |
Pregnancy |
Organism Function |
Embora o MMTx seja um instrumento valiosíssimo, ele não possui suporte ao mapeamento de relações, no sentido desejado aqui. Para buscar esse mapeamento foi criado um dicionário que relaciona as 54 relações do UMLS a um conjunto de verbos. A construção do dicionário foi guiada pela análise manual da definição de cada uma das relações do UMLS, utilizando-se de dois critérios:
1) Interpretação do texto da definição de acordo com o nome atribuído a relação; e 2) Observação dos verbos utilizados na definição. Para cada verbo contido na definição foram obtidos verbos sinônimos, através de consultas ao Wordnet (um dicionário semântico para a língua inglesa, desenvolvido na Universidade de Princeton), que mantinham o mesmo sentido obtido pela interpretação da definição. Os verbos sinônimos, juntamente com os verbos contidos na definição, passam a compor o dicionário e são associados à relação. Uma vez construído o dicionário, a tarefa de mapeamento da relação passa a ser uma simples consulta ao dicionário, que busca identificar as relações do UMLS às quais o verbo está associado.
Atividade 9: validação dos mapeamentos
GT2
654
Figura 6 - Validando os mapeamentos para a UMLS
A etapa anterior descreveu a geração de possíveis mapeamentos da RELAÇÃO para conceitos do UMLS. Contudo, na busca de tais mapeamentos vários conceitos, vários tipos semânticos (como apresentado na tabela 1) e relações podem ser gerados. O autor necessita escolher, ou não, os mapeamentos mais adequados, para estabelecer o sentido desejado para a RELAÇÂO. A etapa de validação dos mapeamentos se dá por meio da interface do sistema de submissão no qual o usuário é exposto a esse conjunto de informação e opta, atribuindo o sentido desejado (figura 6).
Atividade 10: geração da instância da ontologia OCCA
Na última atividade os elementos da RELAÇÃO são representados como instâncias de OCCA e um arquivo no formato XML é gerado (figura 7).
<Relation>
<Antecedent> systematic serological screening programs during pregnancy</Antecedent> <Relation>prevent</Relation> <Consequent>elevated number of infants with congenital toxoplasmosis</Consequent> <Map_Antecedent> <string>Screening procedure - Health Care Activity</string> </Map_Antecedent>
<Map_Relation>Stops, hinders or eliminates an action or condition. <Map_Consequent> <string>Toxoplasmosis, Congenital - Disease or Syndrome</string> </Map_Consequent> </Relation>
</Map_Relation>
Figura 7 - Trecho da instância de OCCA
4 AVALIAÇÃO E RESULTADOS OBTIDOS
A avaliação teve como objetivo testar se o protótipo que implementa o processo de submissão proposto é apropriado para a tarefa de representar a principal conclusão do artigo, em forma de RELAÇÃO. Trata-se de um teste de usabilidade do protótipo do sistema de submissão, isto é, testar em condições reais de funcionamento e com usuários reais (autores) o software. O material a ser utilizado é o artigo científico fornecido pelo próprio autor. Para realizar o teste, foi definido um protocolo com o objetivo de normalizar as informações fornecidas para as pessoas envolvidas no teste. O protocolo estabeleceu com clareza os procedimentos a serem executados durante o teste, especificando-os e padronizando-os, bem como a definição das variáveis quantitativas e as tabulações obtidas e sua posterior organização e compilação para análise. Para a avaliação da satisfação do usuário (avaliação qualitativa) foi aplicado um questionário de pós-teste (System Usability Scale). Para testar o software (protótipo) foram convidados seis professores pesquisadores da
GT2
655
Universidade Federal Fluminense (Instituto Biomédico), que submeteram ao protótipo seus trabalhos
já publicados em diferentes revistas internacionais em língua inglesa. Todas as interações dos autores
foram gravadas e posteriormente analisadas. Os testes realizados com os usuários revelaram algumas informações importantes. O tempo esperado, para realizar todas as tarefas, foi de 15 minutos. O maior tempo consumido foi de 17 min. 17 s. (avaliador 3), enquanto o menor tempo 9 min. 24 s. (avaliador 4), sendo tempo médio obtido de 12min 23s dentro das margens projetadas (figura 8).
Figura 8 - Tempos gasto em cada tarefa pelos avaliadores e pelo protótipo (automática).
Figura 9 - Percentual sobre média de tempo despendido em cada tarefa.
Porém, ao analisar as médias de tempos despendidos (figura 9), em cada tarefa individualmente, identifica-se a existência de dois “gargalos”, na obtenção dos dados gerais (Obter Dados Gerais) e na definição da conclusão (Informar a Conclusão). Em média, as duas tarefas consumiram 55% do tempo gasto. Na primeira tarefa, é exigido do autor o fornecimento de informações, com relação ao contexto do estudo e a sua importância, e, na segunda, a descrição da principal conclusão. O tempo gasto está em função do fato de que o autor é convidado a argumentar, no momento da submissão,
o porquê da importância de sua pesquisa e qual a sua principal conclusão. Tais informações podem
GT2
656
estar “diluídas” no texto do artigo, exigindo atenção e precisão na descrição; isso faz com que as tarefas despendam um tempo elevado para sua execução. Ora, tais tarefas poderiam ser eliminadas do processo, adotando como pré-requisito a utilização do resumo estruturado, isto é, o texto do artigo científico contaria com o abstract no formato de resumo estruturado, onde rótulos indicam claramente o contexto, a principal conclusão do trabalho, entre outros. Com relação aos tempos obtidos nas tarefas de extração automática, tanto para o objetivo quanto para relação, se observa um elevado tempo para o primeiro (9% em média do tempo total gasto) se comparado ao segundo (1% em média do tempo total gasto).
Figura 10 - Tempos obtidos pela extração automática do objetivo.
Constatou-se, também, para a extração do objetivo, uma considerável variação nos tempos (34s., no melhor caso, e 2min. 27s. no pior, com uma média de 1 min. 8s.) (figura 10). Isso pode ser explicado em função do número de sentenças, que ocorrem em cada artigo, a serem analisadas para que se extraia o objetivo. Contudo, a adoção de um resumo estruturado, como sugerido anteriormente, conduz, além da eliminação das tarefas de Obtenção dos Dados Gerais do Artigo e a Obtenção da Conclusão, a eliminação, também, da tarefa de Extração do Objetivo, pois, como é comum no resumo estruturado (BAYLEY; ELDREDGE, 2003), a indicação do objetivo, a tarefa de extração de tal elemento torna-se desnecessária, gerando uma diminuição não só no número de etapas do processo, como também, no tempo total. Com relação à extração da relação, o tempo médio obtido foi de 9s, representando apenas 1% do tempo despendido com o conjunto total de tarefas (figura 11).
Figura 11 - Tempos obtidos para a extração automática da relação.
GT2
657
Um aspecto identificado, porém ainda não explicado, é a variação nos tempos obtidos. Em alguns casos (avaliação 1 e 3), o tempo despendido (5 segundos) para a extração da relação foi três vezes menor que para outro caso (15 segundos na avaliação 2), embora o número de palavras empregadas na conclusão (40 palavras no primeiro e 39 no terceiro) seja maior que a utilizada na segunda avaliação (27 palavras). Possivelmente, o tempo não está em função do número de palavras e, sim, no tipo construção sintática e o uso de determinadas palavras na oração. As discordâncias apresentadas pelos avaliadores, com relação ao software, estão relacionadas
a um único aspecto: os conceitos apresentados eram muito gerais e não representavam adequadamente
o antecedente e o consequente da relação. Isso se deve ao instrumento utilizado – a UMLS – para o mapeamento da relação. Embora a UMLS (na versão 2010) abarque 2.201.360 conceitos e 9.976.458 nomes de conceitos (termos), os artigos escolhidos abordavam assuntos bem específicos, o que dificultou a adoção de conceitos mais apropriados para a representação. Ao terminar o uso do protótipo, os pesquisadores responderam o System Usability Scale
(SUS- vide em: <hell.meiert.org/core/pdf/sus.pdf>), um questionário simples, padronizado, validado
e utilizado como uma ferramenta para medir o nível de usabilidade de um sistema. Composto de 10
quesitos, utilizando a escala Likert, permite obter uma visão global das avaliações subjetivas com respeito à usabilidade, por meio de uma pontuação geral. De uma maneira geral, a avaliação da usabilidade foi considerada adequada (83,75), com boas perspectivas de uso, pelos autores, de um futuro um sistema a ser construído com essa proposta.
4.1 Limitações
A primeira limitação imposta desde o início do trabalho foi a de que apenas a principal
conclusão do artigo científico seria tratada. Essa limitação objetivava manter a atenção voltada para
o problema de representar a conclusão como uma RELAÇÃO; ao considerar a possibilidade de tratar
várias conclusões, outros problemas seriam somados, o que poderia tornar a discussão da obtenção da RELAÇÃO ofuscada. Tal limitação deve ser eliminada com a continuação do estudo, visto que se trata da primeira tentativa de implementação do modelo OCCA. A segunda limitação foi o número de
autores disponíveis para efetuar os testes. A dificuldade de acesso a autores que se dispusessem a testar
o protótipo foi bastante grande. Tentativas de contato, através de editores de periódicos nacionais, não foram frutíferas, até o momento, o que acabou limitando o número de autores-avaliadores para teste.
5 CONSIDERAÇÕES FINAIS
O processo submissão proposto, implementado por meio de um protótipo, estabelece uma exigência fundamental para o autor, a de que ele crie uma RELAÇÃO para representar sua principal
GT2
658
conclusão, de maneira que ela possa contribuir, não só para a recuperação do trabalho, como também para ser utilizada nos relacionamentos com outros trabalhos, através de associações automáticas, aumentado assim às possibilidades de recuperação de informação. Tal exigência obriga o autor a ser conciso, reduzindo o seu principal resultado a umas poucas palavras, a uma RELAÇÃO. Convidar o autor a ser conciso não é uma ideia nova, diversos mecanismos foram propostos com este fim para auxiliar na recuperação do artigo científico, tais como, as palavras-chave, as terminologias padronizadas, os resumos estruturados, entre outros. A novidade é que, diferente das palavras-chave, que são normalmente “soltas”, a construção de sentido é realizada através de uma RELAÇÃO. Essa forma de reescrever seu principal resultado pode ser comparada com o texto para
a divulgação científica, em que o autor deve reformular seu discurso, a fim de torná-lo inteligível a
uma sociedade constituída de leigos. No caso da RELAÇÃO, ela é a forma proposta para que ele reformule seu discurso de maneira que se torne inteligível a um programa de computador. A metodologia proposta na forma de um processo de submissão combinando o processamento linguístico do texto e as respostas obtidas através da interação com o usuário (autor) teve como base, técnicas e práticas encontradas na Ciência da Informação. Como exemplo, cita-se, o uso de frequência de termos, palavras chaves, muito utilizadas em indexação automática e estudos bibliométricos.
O sistema de submissão, com as características propostas aqui, deverá ampliar as funcionalidades dos atuais programas de autopublicação de modo a permitir a um autor publicar seu artigo simultaneamente, em formato textual legível por pessoas, e em formato “inteligível” por programas.
A exigência de acesso, tempo e motivação criam um “gargalo” para a busca de resultados. Ao
encontrar um artigo científico é necessário localizar e extrair a informação desejada e isso só pode ser realizado percorrendo todo o corpo do artigo para identificar seus resultados fundamentais que devem ser avaliados dependendo da habilidade e experiência do leitor, do tamanho do próprio artigo
e se bem organizado, bem escrito e completo.
Vários mecanismos foram sendo criados ao longo dos anos como forma que diminuir essas restrições: vocabulários controlados, métodos de indexação, indexação automática, resumos estruturados.
Modificações na forma de publicar um artigo científico, como proposta, deve ser considerada
nesta tese como natural, dada à contínua evolução tecnológica e da própria comunidade científica, tal ponto é salientado por Meadows (1974) ao afirmar que muitas das mudanças por que tem passado
o artigo científico estiveram relacionadas com o crescente aumento e complexidade da comunidade
científica - com a consequente necessidade de melhorar a eficiência de suas atividades de comunicação.
Ainda segundo o mencionado autor, o volume sempre crescente de informações expande- se na mesma velocidade, tanto para as antigas gerações de pesquisadores quanto para nós e que
a sensação de “estar afogado em informações” já era lugar-comum há muitos anos. Mas, se antes
GT2
659
os pesquisadores restringiram sua atenção a determinados temas - criando desta forma uma maior especialização na ciência, de tal modo que a informação que precisam absorver continuava a situar-se dentro de limites aceitáveis - hoje esses limites já alcançam dimensões gigantescas.
Não podemos negar que os atuais estudos na CI devem muito às práticas documentárias desenvolvidas a partir do final do século XIX, pois foram as primeiras a contemplar o tratamento da informação (FROHMANN, 2004). Porém, apesar dos aportes das TIs para facilitar a publicação, a busca e o acesso ao texto final de documentos eletrônicos, o processo sociocultural em que se baseia e que apoia a comunicação científica continua o mesmo, dentro do paradigma da Biblioteconomia e da Ciência da Informação. Informar-se sobre os artigos científicos é tarefa fundamental no exercício da prática científica. Entretanto, mesmo com o advento dos computadores e dos instrumentos de busca o que se consegue obter, normalmente, é muito mais “informação” ou “dados” do que “conhecimento” (ZIMAN, 1979).
O documento científico digital, publicado na web, que hoje já é construído e estruturado dentro de um formalismo muito grande poderia, então, transformar-se, no sentido de incluir, além de suas partes textuais tradicionais o conhecimento declarado pelo autor. Isso faria com que as práticas documentárias sofressem alterações por um lado e, por outro, viabilizaria a recuperação e a disseminação não só do documento, mas, também, do conhecimento nele contido materializando, assim, a visão de Ziman (ZIMAN, 1979), do conhecimento científico como um empreendimento coletivo, em que a contribuição de um pesquisador se soma, como “mais um tijolo na construção do edifício da ciência”.
ABSTRACT Problem: Electronic publications, in spite of the progress of TIs, are still based on the printed text model. The textual format hinders programs from being used for the “semantic” processing of the contents of scientific articles. Objective: this work describes the implementation of a prototype of a system of submission of scientific articles for scholarly electronic publishing, in biomedical sciences capable of extracting knowledge from the text of the article and to represent it in “intelligible” format for programs. Theoretical-methodological bases: the prototype is the partial implementation of the proposal of OCCA (MARCONDES, 2005), a model to represent the semantic elements that form the knowledge contained in a scientific article, based on elements of the Scientific Method (hypothetical- deductive). The objective of that model is to serve a basis for semantic publications. Results: results are related to testing the prototype involving researcher-authors.
Keywords:
electronic
Semantic publishing.
GT2
publishing,
knowledge
660
representation,
scientific
communication,
5
REFERÊNCIAS
BAYLEY, L.; ELDREDGE, J. The structured abstract: an essential tool for researchers. Hypothesis, v.17, n.1, p.11-13, Spring. 2003.
BERNERS-LEE. W3C Data Formats. The World Wide Web Consortium Note. Disponível em:<http://www.w3.org/TR/NOTE-rdfarch>. Acesso em: 23/10/2008.
BRADFORD, S. C. Documentação. Rio de Janeiro: Fundo de Cultura, 1961.
BUNGE, M. Philosophy of science: From Problem to Theory. New Brunswick, London:
Transaction Publishers, 2v, 1998. 607p.
BUSH, V. As we may think. The Atlantic Monthly, July, 1945. Disponível em: <http://www. theatlantic.com/unbound/flashbacks/computer/bushf.html> Acesso em: 1 jun. 2004.
CHOMSKY, N. Syntactic structures. The Hague: Mouton & Co.,1957. 117p.
COSTA, L. C.; MARCONDES, C. H. Padrões linguísticos para identificar elementos de ontologia In: Seminário de Pesquisa em Ontologia no Brasil, Niterói, 2008. Poster.
DING, J.; VISWANATHAN, K.; BERLEANT, D.; HUGHES, L.; WURTELE, E. S.; ASHLOCK, D.; DICKERSON J. A.; FULMER, A.; SCHNABLE, P. S. Using the Biological Taxonomy to Access Biological Literature with PathBinderH. Bioinformatics, v.21, n.10, p. 2560-2562, maio. 2005.
EDMUNDSON, H. P. New methods in automatic extracting. Journal of the ACM , v.16, p.264-285,
1969.
FROHMANN, B. Documentation redux: prolegomenon to philosophy of information. United States of America: Library Trends, Winter, 2004.
GILLILAND-SWETLAND, A. J. Setting the Stage: Defining Metadata. In: MURTHA BACA (Ed.). Introduction to Metadata: Pathways to Digital Information. Los Angeles: Getty Information Institute, 2000. 48p.; pp.12.
LUHN, H. P. The automatic creation of literature abstracts. IBM Journal of Research and Development, v.2, n.2, p.159–165.1958.
MALHEIROS, Luciana Reis. A identificação de traços de descobertas científicas pela comparação do conteúdo de artigos em Ciências Biomédicas com uma ontologia pública. Tese (Doutorado em Ciência da Informação) - Programa de Pós-Graduação em Ciência da Informação convênio UFF/ IBICT, Niterói, 2010.
MARCONDES, C. H. Da comunicação científica ao conhecimento público: artigos científicos digitais como bases de conhecimento. In: Encontro da Associação Nacional de Pesquisa e Pós-graduação em
Ciência da Informação, 6., 2005, Florianópolis, Anais
Florianopolis, 2005. (CD-ROM).
GT2
661
; MENDONÇA, R. M. A; MALHEIROS, L. R.; COSTA, L. C.; MORAES, G. V. A publishing
system to extract and represent the knowledge content of scientific articles on health science in
machine-processable format. In: International Conference on Electronic Publishing, 13, 2009, Milão.
Proceedings
Milão: Edizione Nuova Cultura, 2009. (CD-ROM). Disponível em:<elpub.scix.net>.
Acesso em: 1 ago. 2009.
MEADOWS, A. J. Communication in science. London: Butterworths, 1974. 248 p.
MILLER, D.L. Explanation versus description. Philosophical Review, v.56, n.3, p.306-312, 1947.
PASSIN, T. B. Explorer’s guide to the semantic web. United States of America: Manning Publications Co.Greenwich, 2000. 300p.
PASQUINELLI, A. Information technology directions in libraries: a sun microsystems white paper. Disponível em:<http://www.infoperpus.8m.com/artikel/00005.htm>. Acesso em: 20 mar. 2010.
SHERA, J. H.; CLEVELAND, D. B. History and foundations of information science. Annual Review of Information Science and Technology, v.12, p.249-275, 1977.
SWALES, J. M. Genre analysis: english in academic and research settings. Nova Iorque: Cambridge University Press, 1990.
ZIMAN, J. Conhecimento público. Belo Horizonte: Itatiaia, São Paulo: Editora da Universidade de São Paulo, 1979.
GT2
662
COMUNICAÇÃO
ORAL
A LEITURA DE IMAGENS FOTOGRÁFICAS:
PRELIMINARES DA ANÁLISE DOCUMENTÁRIA DE FOTOGRAFIAS
Miriam Paula Manini
Resumo: Com o objetivo de continuar apontando etapas necessárias à preparação de uma criteriosa análise documentária de fotografias, este trabalho aborda alguns tipos de leitura de imagens, alguns leitores de imagens, a importância do verbal na leitura de imagens, as diferenças entre texto e discurso visual, a semiologia barthesiana e os dois níveis de leitura de imagens e a leitura de imagens fotográficas para alguns autores. Através de estudo bibliográfico, de leituras promovidas no âmbito de nosso grupo de pesquisa e em disciplinas ministradas na pós-graduação pôde-se levantar alguns enfoques para o assunto. O que interessa aqui é a abordagem histórica e documental da leitura de imagens fotográficas depositadas em acervos institucionais. Ainda que um pouco de Psicanálise, Sociologia, Arte e Filosofia possam fazer parte de tal análise, o foco desta comunicação será a leitura que deve ser feita por profissionais de acervos fotográficos de arquivos, centros de documentação e museus no tratamento documental da imagem, e a abordagem, ainda que breve, da leitura de recepção feita por usuários (pesquisadores de imagens).
Palavras-chave: Fotografia. Leitura de imagens. Análise Documentária de Fotografias.
1 INTRODUÇÃO
‘Ver uma imagem’ abrange atividades diversas e divergentes que fogem de toda descrição geral. A hipótese contrária, defendida pelos teóricos da ‘codificação icônica’, isto é, a idéia da existência de uma ‘gramática de leitura’ universal se dando em mensagens controláveis, é contestada pelo simples fato de que a recepção das imagens depende essencialmente de nosso conhecimento do mundo, sempre individual, diferente de uma pessoa para outra, e não possuidor de traços de codificação.
) (
a imagem fotográfica é um artefato: pressupõe sempre a existência
de regras de utilização que são públicas. Algumas dessas regras regem a recepção fotográfica como tal, isto é, prescrevem atitudes necessárias à recepção da imagem como imagem fotográfica, enquanto outras são simplesmente de contexto, isto é, limitadas às dinâmicas receptivas
motivadas por estratégias comunicacionais específicas. (SCHAEFFER, 1996, p. 98)
Através de um estudo bibliográfico e de leituras promovidas no âmbito de grupos de pesquisa e
GT2
663
disciplinas de pós-graduação pode-se levantar alguns enfoques possíveis para o assunto: a necessidade de saber ler fotografias antes de se empreender a análise documentária. Um dos enfoques seria o psicanalítico, que partiria para observações sobre a iconologia, o onírico e o imaginário. Outro enfoque seria algo mais sociológico, que observaria comportamento, incidência de algum fato e costumes de uma época através, por exemplo, de retratos de família. Uma terceira abordagem da leitura de imagens fotográficas poderia estar voltada para uma análise de cunho artístico, que detectasse a que escola pertence o fotógrafo ou em que tendência se encaixa a fotografia. Outra possibilidade em que a leitura de imagens fotográficas poderia ser observada – e com muito mais pertinência e riqueza de detalhes – seria com relação às narrativas fotográficas seqüenciais (exemplos: sequências fotográficas, ensaios temáticos, fotonovela e foto-romance). Em tais textos imagéticos, a categoria do tempo narrativo está muito presente e conduz, por si só, a leitura sequencial das imagens 1 . Outra leitura de fotografias possível de se fazer é a antropológica: muitos costumes, hábitos, preferências de vestuário, relações familiares e grupais são desvendados pelos antropólogos através de registros e análises fotográficas. Contudo, em meio a tantas possibilidades, o que interessa aqui é a abordagem histórica e documental da leitura de imagens fotográficas depositadas em acervos institucionais. Ainda que um pouco de Psicanálise, Sociologia, Arte e Filosofia possam fazer parte de tal análise, o foco desta comunicação será a leitura que deve ser feita por profissionais de acervos fotográficos de arquivos, centros de documentação e museus no tratamento documental da imagem, e abordar, de passagem, a leitura de recepção feita por usuários (pesquisadores de imagens).
2 ALGUNS LEITORES DE IMAGENS
Um bom documentalista de imagens deve ser um bom pesquisador. A leitura pura e simples que faça de uma fotografia, imbuído apenas de sua visão de mundo e da bagagem de conhecimentos adquiridos ao longo de sua vida – seu repertório pessoal ou seu conhecimento enciclopédico – não são suficientes para abarcar uma gama certamente múltipla de detalhes que possa conter uma imagem, ainda mais se ela fizer parte de um conjunto documental maior. Neste momento – de leitura de documentos fotográficos –, a pesquisa é fundamental, seja para identificar pessoas que aparecem na imagem através de alguma informação presente no restante do acervo, seja para definir o local da imagem através de documentos manuscritos, seja para datar uma fotografia através do reconhecimento do processo de produção da imagem, entre outras possibilidades. Pode-se tentar ler uma imagem através do ponto de vista do fotógrafo, definindo enquadramento, atentando para a composição, observando o ângulo escolhido, como veremos. O fotógrafo, ao produzir
1 Ver, para mais detalhes, Manini (1993).
GT2
664
uma imagem, está construindo significados, uma vez que a fotografia pode ser analisada segundo a tríade peirceana: ela pode ser um ícone, um índice ou um símbolo 2 (ou pertencer a mais que uma destas categorias ao mesmo tempo). A fotografia enquanto documento é sempre um índice, uma vez que indica um fato; ela é testemunho, vestígio e marca da realidade, pois se trata de uma representação por conexão física com
o referente 3 . Assim, a leitura que o fotógrafo faz da realidade é uma e a leitura a que o documentalista procede é outra, não devendo esta última, necessariamente, suplantar a primeira em uma medida muito larga. A leitura do documentalista é também, contudo, uma construção de significados, construção esta que deve ser bem menos subjetiva, pessoal, e muito mais cuidadosa que aquela feita pelo fotógrafo, já que é esta leitura que será recuperada, em primeiro lugar, pelo usuário do acervo. É através da leitura do documentalista que serão elaboradas a descrição e a indexação do documento fotográfico. Na construção de significados realizada durante a leitura de uma imagem fotográfica ocorrem dois processos – a informação e a interpretação – e eles se dão da seguinte maneira:
• a informação ocorre em primeiro lugar, pois a imagem – ao contrário do texto – dá-se a ver inteira, através de uma visualização que pode durar segundos; seria uma leitura de superfície e que chamaremos de primeiro nível;
• a interpretação vem depois, uma vez que o conjunto de informações vai ser reunido para que ela se dê; tais informações são de origem não só visual, mas também textual; aqui a imagem será melhor contextualizada; seria uma leitura em profundidade e que chamaremos de segundo nível. É necessário enfatizar, sempre, que preconceitos, crenças, costumes e opiniões pessoais devem ser evitados ao extremo na leitura de quaisquer documentos. No caso de fotografias isto parece se agravar à medida que a imagem pode fazer brotar um sem-número de interpretações e de outras imagens na tela mental de quem as lê, fazendo com que a polissemia da imagem real dê vazão a uma polissemia de imagens só existentes no imaginário do leitor. Na ação dos leitores de imagens, o documentalista lê para o pesquisador. O pesquisador lê diferente, pois enquadra a imagem numa outra perspectiva. Será mesmo este o papel do documentalista:
mastigar a informação fotográfica para o usuário? Será por isto que existem poucos trabalhos que usam a fotografia como tema e mais como ilustração e/ou exemplo? Distribuindo os níveis de leitura entre o leitor documentalista e o leitor usuário, temos a seguinte situação:
• Leitura superficial do documentalista à ele se informa a respeito do que trata a imagem;
• Leitura em profundidade do documentalista à ele vai interpretar o conteúdo da imagem;
2 Fotografia como ícone: espelho do real; fotografia índice: prova do real; fotografia como símbolo: transformação do real
(DUBOIS, 1986).
3 A questão da verdade de uma imagem não será abordada neste trabalho, embora se reconheça que esta discussão é importante.
GT2
665
aqui ele é tão pesquisador quanto o usuário;
• Leitura superficial do usuário à ao visualizar a fotografia, ele diz “quero” ou “não quero” esta imagem e só vai proceder à leitura em profundidade se disser “quero”;
• Leitura em profundidade do usuário à sua análise da imagem pode ser igual ou diferente daquela feita pelo documentalista (e que, muitas vezes, norteou sua pesquisa). Certamente será diferente se a utilizar não como ilustração, mas como objeto de estudo de seu trabalho. Se um pesquisador está interessado, por exemplo, em analisar em que condições era fotografado o ex-presidente Lula durante seu mandato através da observação de algumas imagens, certamente sua leitura das fotografias será diferente daquela feita pelo documentalista. É relevante interrogar onde deve parar a pesquisa feita pelo documentalista para que este não faça o trabalho do usuário, para que o documentalista não “mastigue” todas as informações, não esmiúce em interpretações uma imagem fotográfica e faça com que o usuário a relegue a mera ilustração. Por outro lado, é papel do documentalista extrair ao máximo os significados de um documento
fotográfico, aliando o sentido superficial da leitura de uma fotografia à história do conjunto documental maior de que ela, na maioria das vezes, faz parte. Ao usuário cabe fazer da imagem o uso que lhe aprouver: ele pode querer duplicar informações, reforçando com uma foto um dado já registrado através da escrita. Se for, por outro lado – muito raro, infelizmente –, fazer da imagem fotográfica seu objeto de pesquisa 4 , extraindo-lhe muito mais significados que aqueles apresentados pelo documentalista e pelo próprio acervo, tanto melhor. Em um acervo de grandes proporções, com uma quantidade muito grande de imagens, com poucos funcionários para realizarem o trabalho que envolve a leitura de fotografias de que estamos falando, levando em conta, ainda, as várias deficiências na formação desses profissionais, além de contingências ligadas à falta de estímulo, desinteresse profissional, baixos salários e parcas condições de trabalho, será que há tempo, consciência, viabilidade e outras tantas coisas para se realizar, efetivamente, estes dois níveis de leitura de imagens de que estamos tratando (mormente a leitura em profundidade)? Talvez, futuramente, novas pesquisas possam responder a tais perguntas e, quem sabe, novos estudos sobre o usuário possam igualmente responder às seguintes questões 5 :
• O documentalista tem o direito de realizar a tarefa que talvez coubesse ao pesquisador?
• O documentalista tem competência para tal?
• Que tipo de usuário questiona o trabalho do documentalista, rejeitando a leitura feita por ele?
4 Ver, para maiores detalhes sobre pesquisa de imagens, Manini (1996/1997) e, para um exemplo de utilização da fotografia como objeto de pesquisa, ver De Paula (1998).
5 Tais questionamentos, ligados à recuperação e à recepção da informação, estão mesmo carecendo de estudos aprofundados dentro de nossa área.
GT2
666
A leitura do usuário (cientista social, historiador ou antropólogo, entre outros), quando ele se utiliza da fotografia, seja como ilustração ou objeto de análise, está relacionada com algo previamente interpretado pelo autor, pelo fotógrafo, seja a fotografia uma imagem histórica, um documento, ou não.
Muito embora a leitura de uma fotografia tenha um caráter histórico, uma vez que sobre a imagem que se apresenta sempre há algo a dizer, e ainda que se remeta à ideia do “isto foi” de Barthes (1984) 6 , para aplicar à fotografia um papel de documento, de registro da realidade, é bom que não se deixe perder o fato de que o olhar do fotógrafo já é um detalhe importantíssimo na transformação da realidade histórica, ainda que este fotógrafo seja o próprio cientista social, o próprio antropólogo, o próprio historiador. Seu olhar – que acaba sendo o da própria câmera – é pleno de idiossincrasias, saberes e juízos. Na observação da fotografia documental, sabe-se que “aquilo foi”, mas se sabe também que pode haver inúmeros pontos de vista sobre o assunto. Em suma, a leitura ideal a ser feita pelo profissional de acervos fotográficos deve abarcar o que segue:
• Deve ser um bom pesquisador e logo tomar conhecimento do conjunto documental maior de que fazem parte as fotografias que irá tratar;
• Deve também possuir conhecimentos sobre a técnica que envolve a produção fotográfica, sobre linguagem fotográfica e sobre processos fotográficos históricos (do daguerreótipo à fotografia digital);
• É desejável que leve em consideração a participação do fotógrafo na construção de significados que terá que extrair das imagens e traduzir em linguagem documentária;
• Necessita estar imbuído de uma predisposição epistemológica que o leve a escolher uma metodologia de leitura (seja a lente de Barthes, Peirce, Dubois ou outro autor aqui não mencionado) que seja preparatória da análise documentária;
• Precisa concentrar-se em extrair significados das imagens que atendam às necessidades informacionais de seus usuários.
3 O VERBAL NA LEITURA DE IMAGENS
A leitura de um texto ou a leitura de uma fotografia, construídos pelos sinais que ambos são, é o estabelecimento de nexos possíveis entre esses sinais através de operações mentais, não a percepção da realidade (referente) que uma vez talvez os tenha motivado. E nesse ‘talvez’ está toda a questão, porque nada nos garante, no texto ou na fotografia, que neste momento vemos e lemos, que os seus referentes tenham alguma vez existido materialmente, isto é, tenham sido reais. A realidade do referente não é uma condição da existência da escrita ou da fotografia. (CASTRO, 1993, p. 231-232)
6 Barthes afirma que, se algo foi fotografado é porque “isto foi”, “isto aconteceu”, ainda que se tenha representado a cena (a fotografia e seu análogo).
GT2
667
A leitura tem o pré-requisito de sua existência na escrita. Pode-se dizer então que a leitura
existe desde que algum tipo de registro, de sinal gráfico ou mensagem tenha sido impresso, desenhado ou rabiscado em alguma superfície. Se ler é decifrar, interpretar e fixar um texto – texto, aqui, num amplo sentido – e se a leitura
existe desde que a escrita apareceu, então a primeira leitura que se fez, provavelmente, foi de imagens, de registros pictografados em paredes de cavernas. Sem dúvida é uma história muito longa esta que envolve a leitura de imagens. Contudo, a leitura de imagens fotográficas é bem mais jovem: existe desde que a fotografia foi inventada, há pouco mais de um século e meio. Impossível desviar desta comparação necessária e tentadora: a leitura do texto escrito e a leitura do texto fotográfico. Faz-se, aqui, uma breve colocação em paralelo e não uma análise profunda desta relação certamente rica em observações e conclusões 7 . Nesta colocação de fotografia e escrita lado a lado, a abordagem é sobre uma única imagem e não a sequências. Desta forma, pode-se pensar que o texto escrito trabalha mais com a categoria do tempo narrativo em seu discurso, enquanto a fotografia – embora ela seja tão insistentemente chamada de recorte temporal – apresenta algo de fundamentalmente espacial. No livro de F. Smith – Compreendendo a leitura (SMITH, 1989) – lê-se que o título de um texto monitora o cérebro do leitor. No caso dos títulos de fotografias, e mesmo de suas legendas, há algo a dizer. Certamente que o título de uma imagem fala sobre o que o autor (o fotógrafo ou o autor do título) teve necessidade de chamar a atenção dos observadores. Neste aspecto, o título de uma fotografia pode monitorar, dirigir o olhar do observador. O deslizamento do olhar do leitor estará fortemente ancorado ao título dado à imagem. Acontece, porém, um fato curioso nos acervos fotográficos em geral: uma ampla maioria de imagens chega às instituições sem título, sendo este, muitas vezes, atribuído pelo documentalista no momento do tratamento da informação fotográfica. Aqui ocorre um movimento interessante: o documentalista lê a fotografia, faz-lhe uma descrição e, a partir disto, batiza a imagem. Neste caso, este título atribuído vai monitorar a leitura que o usuário fará da imagem, mas vai monitorar antes mesmo que o pesquisador veja a imagem, pois geralmente, na recuperação da informação, a parte textual é que conduz o interesse do usuário.
O caso da legenda exige um pouco mais de atenção, pois na relação verbal/visual ela pode
comentar a fotografia, contando a respeito desta toda uma história cujo cunho de verdade pode ou não ser contestado. Há casos também em que a fotografia ilustra uma legenda, pois o texto se mostra mais
denso, mais importante e a imagem serve apenas como uma confirmação do verbal.
A escrita apela para o imaginário: é o leitor que constrói cenários, visualiza personagens,
recria relações, reelabora sentidos. A fotografia dá a ver um recorte; ela é um dado, mas um dado
7 Ver, para mais detalhes, Manini (1993).
GT2
668
polissêmico: o que a visão proporciona está ali, à frente do receptor; o imaginário do leitor poderá, contudo, adivinhar o extra-campo, aquilo que a imagem não dá a ver, mas que certamente a circundava no momento da tomada. A leitura do verbal é muito mais lenta que a leitura instantânea da fotografia, muito embora se esteja falando, aqui, da leitura da informação (primeiro nível) e não da interpretação (segundo nível). Enquanto o texto escrito descreve todo um cenário ou acontecimento, o texto fotográfico é
incompleto e seletivo ao recortar aquilo que vai dar a ver. O visual, por vezes, pode parecer sintético
e objetivo, em contraposição a um verbal analítico e prolixo. A imagem confirma, certifica e até mesmo retifica, ainda que a cena fotografada seja uma invenção, uma encenação; ela existiu e, como tal, foi registrada. O verbal, apesar de elucidativo, tem uma raiz longínqua (a oralidade mítica) no ficcional, no ilusório, no legendário. Não se pretende, com esta contenda, afastar o verbal do visual, mas, antes, compreender o papel de cada um nesta imbricada trama que é a análise documentária de imagens. Como reduzir uma imagem a um conjunto de palavras sem lhe ocultar algo de fundamental? Como mudar de código e dizer “a mesma coisa” ou “algo semelhante” ao leitor? Toda escolha carrega em si uma renúncia.
4 TEXTO E DISCURSO VISUAIS
Ao tentar transportar as noções de Texto e Discurso para as análises que estão sendo
empreendidas com relação às imagens fotográficas, chega-se à conclusão de que o Texto Fotográfico
é a linguagem fotográfica, podendo a expressão desta linguagem ser um retrato, uma paisagem, uma
natureza morta, etc.; e que o Discurso Fotográfico é a técnica fotográfica, através da qual se pode criar uma fotografia autoritária, bucólica, política, artística, etc. Há uma leitura que o próprio fotógrafo faz da fotografia. Não se quer dizer com isto que é
o autor da fotografia – ou somente ele – que pode proceder a esta leitura, mas que ela é, por assim dizer, fotográfica. Há todo um conjunto de interpretações que se pode fazer em termos da linguagem fotográfica, do uso de suas técnicas e até de trucagens na montagem, na construção de um discurso. Um bom exemplo, já largamente utilizado, é a fotografia de um líder tomada de baixo para cima; o resultado nos dá toda uma imponência, uma sensação mesmo de liderança e de poder do personagem visto como alguém maior, engrandecido. O contraponto também é verdadeiro: uma massa de operários fotografada de cima para baixo; a noção de pequenez de cada indivíduo e, ao mesmo tempo, o coletivo dando a idéia de massa se acomodam na imagem, passam a idéia de união
e da obrigação de ter que reivindicar, de ter que pedir ou exigir sempre estando em grupo. Outro
exemplo é o close; ele pode dar dramaticidade ou suscitar emoções variadas. Um instantâneo dá, quase sempre, a ideia de ação, surpresa ou susto. Em termos de composição de uma imagem fotográfica, é necessário observar os lados da fotografia; a divisão do espaço segundo os elementos que o compõem; a relação de quantidade de elementos presentes no lado esquerdo e no lado direito, a parte de cima e a parte de baixo; o peso
GT2
669
entre claros e escuros ou cores fortes e cores claras; o uso do retângulo que contém a foto (o mais usual) no sentido horizontal (repouso, distância e frieza) ou no sentido vertical (ação, proximidade, calor); a importância (ou não) daquilo que ocupa o centro da imagem; a textura da mesma; a presença de elementos que compõem/constroem linhas geométricas; grande contraste entre claro e escuro; o excesso ou a falta de iluminação; isso tudo e muito mais é composição, e muito importante na leitura de uma fotografia. O equipamento também vai interferir na linguagem e no discurso: uma lente grande-angular pode dar uma sensação de deformação à imagem; uma teleobjetiva oferece pouca profundidade de campo. Da mesma maneira, o formato utilizado – 35 mm (o mais comum, usado comercialmente), 6 X 6 cm, 3 X 4 cm (fotos de documentos) – participa desta construção. Antigamente, com o uso da fotografia analógica, a sensibilidade do filme também entrava em jogo: 100 ASA, 400 ASA, etc.: um filme de 400 ASA (normalmente utilizado para fotografar em ambientes com pouca claridade) quando usado para fotografar ao ar livre, sob o sol de verão, ao meio- dia, proporciona uma imagem mais clara. Há outro ponto muito importante na leitura de fotografias, notadamente no que se refere à sua datação: o reconhecimento do processamento utilizado. Caso se esteja analisando, por exemplo, uma fotografia como um daguerreótipo (imagens em preto-e-branco, bem antigas, guardadas hermeticamente em estojos ricamente adornados com couro e veludo), pode-se saber, de imediato ou com alguma pesquisa, que se trata do primeiro tipo de fotografia prática – a fotografia hoje mais comumente conhecida – possível de ser obtida de 1837 até a virada para o século XX. Caso seja necessário datar uma fotografia em cores (as mais comuns), sabe-se que elas podem ter sido produzidas a partir da década de 1940. A fotografia Polaroid foi inventada em 1948 e as albuminas (fotografias antigas, amareladas, quase perdendo o registro, produzidas com clara de ovo) existiram até o final do século XIX. Estes detalhes técnicos, algumas vezes visuais, táteis e microscópicos podem dizer algo, pelo menos, sobre o período em que foi produzida a imagem, possibilitando um balizamento da data no caso de não haver um registro exato da mesma. Como se vê, muito da técnica concorre para que o discurso do texto fotográfico aconteça. E tudo aqui é importante na efetiva leitura do texto visual para fins documentários.
5 BARTHES E OS DOIS NÍVEIS DE LEITURA DE IMAGENS
Retomando a tradição barthesiana; certamente as noções de denotação e de conotação estão indissociáveis de tal exercício de leitura de imagens. A denotação, enquanto leitura de superfície (primeiro nível), estaria para o que se denomina, aqui, informação, assim como a conotação, enquanto leitura em profundidade (segundo nível), estaria para o que se chama de interpretação. Segundo Roland Barthes (1990), a mensagem denotada é o próprio analogon e a mensagem conotada é aquela possível de ser lida pelo indivíduo, pela sociedade ou por um grupo:
GT2
670
O paradoxo fotográfico consistiria então, na coexistência de duas mensagens:
uma sem código (seria o análogo fotográfico) e a outra codificada (o que seria a ‘arte’ ou o tratamento, ou a ‘escritura’, ou a retórica da fotografia); estruturalmente, o paradoxo não é, sem dúvida, a conjunção de uma mensagem conotada: aí está o estatuto provavelmente fatal de todas as comunicações de massa; é que a mensagem conotada (ou codificada) desenvolve-se, aqui, a partir de uma mensagem sem código. (BARTHES, 1990, p. 14)
E prossegue:
Graças a seu código de conotação, a leitura da fotografia é, pois, sempre histórica; depende sempre do ‘saber’do leitor, tal como se fosse uma verdadeira língua, inteligível apenas para aqueles que aprenderam seus signos. Afinal, a ‘linguagem’ fotográfica não deixa de recordar algumas línguas ideográficas em que se mesclam unidades analógicas e signaléticas, com uma pequena diferença: o ideograma é interpretado como um signo, enquanto a ‘cópia’ fotográfica pode ser considerada a denotação pura e simples da realidade. Reencontrar esse código de conotação seria, pois, isolar, recensear e estruturar todos os elementos ‘históricos’ da fotografia, todas as partes da superfície fotográfica que retiram sua própria descontinuidade de um certo saber do leitor, ou de sua condição cultural. (BARTHES, 1990, p. 21-22)
Barthes (1990) fala, ainda, de três tipos de mensagem possíveis na leitura de uma fotografia:
a linguística, a icônica codificada (imagem literal, denotada) e a icônica não codificada (imagem
simbólica, conotada). A mensagem linguística é aquela relacionada a um texto – verbal – que, de alguma forma, cerca a fotografia: título, legenda, comentário, descrição. Ela ajuda na denotação da imagem, no deslindamento do sentido literal de sua mensagem; orienta a leitura da imagem, conduzindo o leitor “por entre os significados da imagem, fazendo com que se desvie da alguns e assimile outros” (Barthes, 1990, p. 33). A mensagem linguística trabalha com a fixação: é elucidativa e seletiva, portanto, controladora e repressiva, pois limita a liberdade de significados, a polissemia da imagem. A mensagem icônica codificada está relacionada à imagem literal, denotada. Ela é uma imagem em seu estado original, virgem de conotações, objetiva ao extremo, e inocente. Na fotografia,
a relação entre significado e significante é de registro e não de transformação e, sendo a fotografia uma mensagem sem código, o mito do natural fotográfico fica aqui reforçado.
GT2
] [
a fotografia instaura, na verdade, não uma consciência do estar aqui do
671
objeto (o que qualquer cópia poderia fazer), mas a consciência do ter estado aqui. Trata-se, pois, de uma nova categoria de espaço-tempo: local-imediata e temporal-anterior; na fotografia há uma conjunção ilógica entre o aqui e o antigamente. É, pois, ao nível dessa imagem denotada, ou mensagem sem código, que se pode compreender plenamente a irrealidade real da fotografia; sua irrealidade é a irrealidade do aqui, pois a fotografia nunca é vivida como uma ilusão, não é absolutamente uma presença, e é necessário aceitar o caráter mágico da imagem fotográfica; sua realidade é a de ter estado aqui, pois há, em toda fotografia, a evidência sempre estarrecedora do isto aconteceu assim:
temos, então, precioso milagre, uma realidade da qual estamos protegidos. (BARTHES, 1990, p. 36)
A mensagem icônica não codificada tem a ver com a imagem simbólica, com a imagem conotada ou cultural. A imagem é ultrapassada pelos sistemas do sentido graças à variabilidade de léxicos possíveis na leitura.
O que constitui a originalidade desse sistema é que as possibilidades de leitura de uma mesma lexia (uma imagem) é variável segundo os indivíduos
). (
investido na imagem (saber prático, nacional, cultural, estético); esses tipos de saber podem ser classificados em uma tipologia; tudo se passa como se a imagem se expusesse à leitura de muitas pessoas, e essas pessoas podem perfeitamente coexistir em um único indivíduo: a mesma lexia mobiliza
[léxico é] uma parte do plano simbólico (da linguagem)
léxicos diferentes. (
A diversidade das leituras não é, no entanto, anárquica, depende do saber
)
que corresponde a um conjunto de práticas e de técnicas; é exatamente o caso das diferentes leituras da imagem: cada signo corresponde a um conjunto de
‘atitudes’[
].
(BARTHES, 1990, p. 38)
Há, como se vê, várias possibilidades de leitura da imagem fotográfica: a leitura do que ela é, a leitura do que ela representa, a leitura do que ela ilustra, etc. Há também a leitura que o fotógrafo (o criador da imagem) faz do mundo e do objeto fotografado. Talvez se possam aplicar aqui as teorias de Peirce e/ou Panofsky. Caso se use Peirce, através de Dubois (1986), tem-se: a leitura da fotografia como ícone, a leitura da fotografia como índice e a leitura da fotografia como símbolo. Caso se aplique Panofsky: a leitura da fotografia pré-iconográfica, a leitura da fotografia iconográfica e a leitura da fotografia iconológica 8 .
8 “O nível ‘pré-iconográfico’ refere-se ao reconhecimento do espectador de um objeto ou de um ato representado; o
‘iconográfico’ refere-se ao lugar de uma representação dentro de um conjunto de convenções para produzir significação específica reconhecível; o ‘iconológico’ refere-se ao uso inovador do tema pelo artista, dentro de parâmetros culturais capazes de gerar uma
GT2
672
Manini (2002), ao propor uma análise documentária de imagens pautada na semiótica peirceana, demonstra a intenção de diminuir ao máximo o caráter subjetivo que uma análise desse tipo pode suscitar. De fato, a leitura do documentalista prepara a do usuário. Em meio a esta relação entre dois sujeitos está o objeto fotográfico. Contudo, este objeto não é só matéria, papel emulsionado, sensibilizado e processado; este objeto contém informação, ela foi descrita e dela nasceu um título; a informação foi interpretada e contextualizada. Para se ler uma fotografia é necessário, entre outras coisas, ter conhecimento de linguagem fotográfica, alguma informação sobre história da arte, informações precisas sobre processos fotográficos históricos, saber distinguir um instantâneo de uma fotografia de estúdio, descobrir uma trucagem, entre outras tantas coisas. Há ainda algum mistério em torno dos processos cognitivos envolvidos na leitura de imagens de qualquer tipo e também as fotográficas. Na apreensão dos significados, o que a imagem fotográfica possui de particularidade certamente é a relação de absoluta contiguidade que mantém com seu referente. Este fato, em si, já diferencia em muito a leitura da imagem fotográfica da leitura de qualquer outro tipo de imagem. Tudo que é fotografado existe no mundo real e, por causa desta realidade, pode ser apreendido, descrito e explicado. A apreensão de significados pode ocorrer já no primeiro nível da leitura proposto, através do reconhecimento referencial de tudo que está na imagem. A descrição da imagem – que seria a leitura que se faz para o outro – parece ser uma ponte, um elo entre o reconhecimento automático referencial e o início de uma interpretação da imagem. A explicação, a atribuição mais absoluta de sentido, a razão maior de ser da imagem fotográfica analisada é já o segundo nível de leitura: a interpretação; trata-se da descrição da fotografia não só em termos de seus referentes, mas da importância e da inter-relação dos mesmos com o mundo, com o mundo que é o acervo documental inclusive. Ler uma fotografia vai desde saber seu processo de produção (albumina, colódio, gelatinas, etc.) até reconhecer, na imagem, personalidades famosas da história. Miguel (1993) diferencia leitura de fotografia de análise do texto fotográfico. Para ela, ler uma fotografia é descrevê-la, enquanto analisar uma fotografia é procurar os significados próprios da imagem. Talvez isso possa ser comparado às leituras de primeiro e de segundo nível – ou à denotação e à conotação barthesianas.
6 A LEITURA DE IMAGENS FOTOGRÁFICAS PARA ALGUNS AUTORES
] [
ser interpretada, mas não pode ser lida. Pode-se e deve-se falar de qualquer
Uma imagem é um signo que apresenta esta particularidade: pode e deve
significação implícita, que requer a imaginação do espectador para sua elucidação.” (ALEGRE, 1998). Ou, mais simplificadamente, o nível pré-iconográfico refere-se ao que há de genérico, o iconográfico ao específico e o iconológico ao abstrato.
GT2
673
imagem; no entanto, a imagem em si mesma não é capaz de fazê-lo. Aprender
a ‘ler uma foto’ não será, antes de tudo, aprender a respeitar seu mutismo? A
linguagem falada pela imagem ventríloqua é a de quem a olha. E, no Ocidente, cada época teve sua maneira de ler as imagens da Virgem Maria e do Cristo, assim como teve sua maneira de estilizá-las. Essas ‘leituras’ nos dizem mais sobre a época considerada do que sobre os quadros. São sintomas tanto como análises. (DEBRAY, 1993, p. 59)
Na sua defesa de que a palavra pode ser lida mas a imagem não, Régis Debray (1993), no seu
Vida e morte da imagem, chama a atenção para o fato de que toda palavra tem sinônimos e acepções
– enquanto uma imagem é sempre um enigma,
podendo ter cinco bilhões de versões potenciais, ou seja, cada ser humano sobre a Terra pode ter uma interpretação diferente da mesma imagem. Debray (1993) faz pensar sobre a questão da interpretação. Para ele, não há percepção de uma imagem sem a efetiva interpretação da mesma. Uma imagem, no momento em que é visualizada num primeiro olhar, é puramente ficcional, uma vez que dela ainda não se extraiu sua realidade, a “verdade” a respeito das coisas que mostra. A leitura propriamente dita de uma imagem só é feita neste segundo nível, o da interpretação, momento em que se constroem os mais efetivos significados da imagem, a razão de sua existência enquanto linguagem, enquanto sentido, enquanto significado apreendido, decifrado, contextualizado e fixado: lida. A leitura de uma imagem fotográfica pode se configurar em uma linguagem já que decifra o texto visual, produzindo-lhe um sentido através do conhecimento prévio, enciclopédico, ideológico, histórico e técnico do leitor:
variadas – em muitas, mas não em todas as línguas
A leitura verbal apoia-se no domínio da sua competência; ensina-se a ler pela
compreensão do encadeamento lógico, coordenado, subordinado ou misto
das estruturas frásicas do texto verbal. Aprende-se a ler e desenvolve-se esse aprendizado.
A leitura não-verbal é uma maneira peculiar de ler; visão/leitura, espécie de
olhar tátil, muitissensível, sinestésico. Não se ensina como ler o não-verbal.
É mais um desempenho do que competência porque, sendo dinâmico, o
não-verbal exige uma leitura, se não desorganizada, pelo menos sem ordem preestabelecida, convencional ou sistematizada. Porém, o não-verbal aprende com o verbal a qualidade da sua competência e o rigor da sua organização. Dadas a provisoriedade e a falibilidade da leitura não-verbal, é óbvio que ela não detém e não produz um saber; tal como na leitura verbal, porém, sem
GT2
674
dúvida, ela aciona um processo de conhecimento a partir da experiência e do exercício quotidiano da sua prática: a capacidade associativa e a produção de inferências, conhecimento como interpretação. (FERRARA, 1986, p. 26)
Já para Lima (1988), a leitura da fotografia tem como base a História, a Semiologia e a
Psicologia. A interpretação do fato registrado só é possível com o conhecimento dos acontecimentos que lhe deram origem. Ao mesmo tempo, é preciso que se conheça minimamente a teoria dos signos.
A Psicologia, segundo ele, estaria ligada à inter-relação entre fotógrafo, fotografado e leitor. Entretanto, o que Lima traz de mais interessante é o paralelo que faz entre a escrita com
palavras e a foto(luz)-grafia:
Poderíamos dizer que o que é uma palavra na escrita alfabética é, na escrita icônica, um componente. Esses componentes se dividem basicamente em três grupos:
|
1. |
os componentes vivos; os humanos e os animais, |
|
2. |
os componentes móveis; certos fenômenos e elementos naturais, |
|
3. |
os componentes fixos; os objetos de toda forma. |
Entre esses elementos há uma relação hierárquica que constitui regra fundamental na escrita fotográfica. Quando uma foto contém um componente vivo, este domina sempre os outros; o que pode variar é a sua intensidade e a sua supremacia emocional. Os componentes móveis dominam sobre os componentes fixos, qualquer (sic) que sejam seus tamanhos respectivos. O conhecimento disso assegura à fotografia uma leitura fácil, rápida e eficaz. (LIMA, 1988, p. 19)
Na leitura de documentos fotográficos, contudo, a importância dos componentes pode ser suplantada pelo fato registrado. Assim, ainda que um componente vivo esteja sendo retratado em
primeiro plano, talvez a sua ação, a sua atitude e o que ele representa no fato retratado ultrapassem
a importância do indivíduo em si. Ou, por outro lado, pode-se estar aqui fazendo referência a dois
níveis de leitura: uma leitura icônica (daquilo que a fotografia é, uma leitura denotativa) e uma leitura indicial (daquilo que se depreende da imagem, uma leitura conotativa) 9 . Lima quase toca neste aspecto que tanto interessa aos objetivos maiores deste estudo:
A leitura de uma fotografia é (
)
bidimensional e prospectiva. Ela se dá de acordo
com os componentes existentes dentro da imagem. (
)
A imagem é a combinação de duas estruturas: a estrutura geométrica e a estrutura
9 Sob este aspecto, seria interessante visitar Schaeffer (1996), pois ele trata do ícone indicial e do índice icônico.
GT2
675
perceptual. A estrutura geométrica é uma estrutura estática, simétrica, onde há proporções: um lado deve corresponder ao outro, em cima e embaixo. A estrutura perceptual é uma estrutura dinâmica, uma descrição anatômica e particularizada, orgânica – e assimétrica, não geométrica. O que vale aí são os valores visuais sentidos pelo homem através da visão, da forma. ( )
É a combinação dessas duas estruturas, contrapostas, que se sustentam mutuamente
e a expressão visual para nós é imbuída de vida e de expressividade porque expressa exatamente a nossa estrutura. ( ) Quando lemos um texto, uma ação ótica e uma ação mental se desenvolvem
simultaneamente. O leitor decifra as letras uma após a outra, assimilando
o sentido de cada palavra, estabelece as relações entre as palavras e toma
finalmente conhecimento do conteúdo da frase. A leitura de uma foto se decompõe em três fases: a percepção, a identificação, a interpretação. A percepção é puramente ótica: os olhos percebem as formas e as tonalidades dominantes sem as identificar. ( ) A leitura de identificação é uma ação às vezes ótica, às vezes mental, como a
leitura de um texto. O leitor identifica os componentes e registra mentalmente
) (
7 CONCLUSÕES
o seu conteúdo.
a interpretação é uma ação puramente mental. É nesse estado que se manifesta o caráter polissêmico da fotografia. (LIMA, 1988, p. 20-22)
] [
presente para o analfabeto, para aqueles que só percebem visualmente, porque nas imagens os ignorantes vêem a história que têm de seguir, e aqueles que não sabem as letras descobrem que podem, de certo modo, ler. Portanto, especialmente para a gente comum, as imagens são equivalentes à leitura. (MANGUEL, 1997, p. 117)
o que a escrita torna presente para o leitor, as imagens tornam
De todas as considerações aqui tecidas, somadas às idéias de Barthes, de alguma forma pertinentes a este trabalho, somadas ainda à interpretação que Philippe Dubois faz da teoria dos signos de Peirce aplicada à fotografia, o mais importante é ter em conta os dois níveis de leitura levantados: o primeiro nível (informação) e o segundo nível (interpretação). Certamente esta é uma categorização entre outras possíveis – como as que, inclusive, são apresentadas ao longo desta comunicação. Contudo, é igualmente importante especificar que, ao falar em informação, não se está fazendo referência exatamente à ideia de redução de incertezas, mas à apresentação de dados: o leitor de imagens fotográficas olha a imagem pela primeira vez e percebe dela alguns pontos iniciais. Da mesma forma, quando se fala em interpretação não se está fazendo referência a nada
GT2
676
subjetivo, muito ao contrário. Esta não é uma interpretação como se fosse possível dizer “a minha interpretação desta imagem” ou “a interpretação que tal museu deu àquela imagem” ou, ainda, “a
interpretação deste documentalista é assim
documentalista – leitor de quem se está falando – olha a imagem fotográfica pela segunda, pela terceira, pela enésima vez e penetra em sua profundidade, por assim dizer, histórica. Pesquisa, busca, pergunta, analisa, compara, comenta: tudo isto baseado na recuperação que espera ver feita daquela informação contextualizada, fora de toda opinião pessoal, de toda subjetividade, para que possa, enfim, democratizar ao usuário os dados levantados, assim como a própria imagem faz com quem não sabe ler, uma vez que não existem analfabetos visuais para o primeiro nível de leitura aqui proposto.
Talvez um termo melhor fosse contextualização: o
”.
Abstract: In order to continue pointing steps needed to prepare a careful analysis of documentary photographs, this paper addresses some types of reading images, images of some readers, the importance of oral reading of images, the differences between text and visual discourse, Barthesian semiology and two levels of reading images and reading images for some authors. Through literature study, reading promoted within our research group and in subjects taught in graduate school was able to raise some approaches to the subject. What matters here is the historical approach of reading and documentary images deposited in institutional collections. Although a bit of Psychoanalysis, Sociology, Art and Philosophy can be part of this analysis, the focus of this communication will be the reading that should be done by photographic collections professionals in archives, documentation centers and museums in the documentary image, and approach, albeit brief, reading reception made by users (photo research).
Keywords: Photography. Reading images. Analysis of Documentary Photography.
REFERÊNCIAS
ABRIL, Gonzalo. Cortar y pegar; La fragmentación visual em los origines Del texto informativo. Madrid: Ediciones Cátedra, 2003. (Signo e Imagen, 79). ALEGRE, Maria Sylvia Porto. Reflexões sobre iconografia etnográfica: por uma hermenêutica visual. In: FELDMAN-BIANCO, Bela, MOREIRA LEITE, Míriam L. (org.). Desafios da imagem:
fotografia, iconografia e vídeo nas Ciências Sociais. Campinas: Papirus, 1998, p. 75-112. BARTHES, Roland. A câmara clara: nota sobre a fotografia. Rio de Janeiro: Nova Fronteira, 1984.
BARTHES, Roland. O óbvio e o obtuso: ensaios críticos III. Rio de Janeiro: Nova Fronteira, 1990. CASTRO, E. M. de Melo e. O fim visual do século XX & outros textos críticos. São Paulo: EDUSP,
1993.
DEBRAY, Régis. Vida e morte da imagem: uma história do olhar no Ocidente. Petrópolis: Vozes,
1993.
DE PAULA, Jeziel. 1932: imagens construindo a história. Campinas: Editora da UNICAMP/
GT2
677
Piracicaba: Editora UNIMEP, 1998. (Coleção Tempo e Memória, 7). DONDIS, Donis A. Sintaxe da linguagem visual. 3 ª ed. São Paulo: Martins Fontes, 2007. (Coleção a). DUBOIS, Philippe. El acto fotografico: de la representación a la recepción. Barcelona: Paidós, 1986. (Paidós Comunicación, 20). FERRARA, Lucrécia D’Aléssio. Leitura sem palavras. São Paulo: Ática, 1986. (Princípios, 100). GERVEREAU, Laurent. Ver, compreender, analisar imagens. Lisboa: Edições 70 (Arte e Comunicação,
89).
JOLY, Martine. A imagem e sua interpretação. Lisboa: Edições 70, 2002. (Arte e Comunicação, 80). LIMA, Ivan. A fotografia é a sua linguagem. Rio de Janeiro: Espaço e Tempo, 1988. (Coleção Antes, Aqui e Além). MANGUEL, Alberto. Uma história da leitura. São Paulo: Companhia das Letras, 1997. MANGUEL, Alberto. Lendo imagens: uma história de amor e ódio. São Paulo: Companhia das Letras, 2001. MANINI, Miriam Paula. O verbal e o visual no caso do Foto-Romance. Campinas, 1993. Dissertação (mestrado) - Instituto de Artes, UNICAMP. MANINI, Miriam. Os usos da iconografia no ensino e na pesquisa: o acervo multimeios do Arquivo Edgard Leuenroth. Cadernos AEL, Campinas, n. 5/6, p. 221-244, 1996/1997. MANINI, Miriam P. Análise documentária de fotografias: um referencial de leitura de imagens fotográficas para fins documentários. São Paulo, 2002. Tese (doutorado) – Escola de Comunicações e Artes, USP. MANINI, Miriam P. Leitura de informações imagéticas: ajustes ainda necessários ao “novo” paradigma, in MANINI, Miriam P.; MARQUES, Otacílio G.; MUNIZ, Nancy C. (org.s). Imagem, memória e informação. Brasília: Ícone Editora, 2010, p. 11-31. MIGUEL, Maria Lúcia C. A fotografia como documento. Uma instigação à leitura. Acervo, Rio de Janeiro, v. 6, n. 1/2, p. 121-132, 1993. PANOFSKY, Erwin. Significado nas artes visuais. São Paulo: Perspectiva, 1976. (Coleção Debates,
99).
ROUILLÉ, André. A fotografia; entre documento e arte contemporânea. São Paulo: SENAC, 2009. SCHAEFFER, Jean-Marie. A imagem precária: sobre o dispositivo fotográfico. Campinas: Papirus, 1996. (Campo Imagético). SMITH, F. Compreendendo a leitura. 3 ª ed. Porto Alegre: Artes Médicas, 1989.
GT2
678
COMUNICAÇÃO
ORAL
ORGANIZAÇÃO CONCEITUAL DO DOMÍNIO DE INSTRUMENTOS MUSICAIS COM BASE NA TEORIA DO CONCEITO
Adriana Olinto Ballesté
Organização conceitual do domínio de instrumentos musicais com base na Teoria do Conceito Resumo: Apresentamos uma proposta para a organização conceitual de instrumentos musicais de cordas dedilhadas usando a Teoria do Conceito definida por Dahlberg (1978a, 1978b) e metodologias de elaboração de tesauros (Lancaster, 1985; Lopéz-Huertas, 1997; Gomes, 1996; Dodebei, 2002). Discutimos as bases teóricas para a delimitação do domínio, apresentamos as fontes utilizadas para a pesquisa terminológica, descrevemos o processo de organização conceitual e introduzimos uma proposta de ficha terminológica específica para o domínio de instrumentos musicais de cordas dedilhadas. Consideramos ter dado os primeiros passos para a efetiva organização do domínio.
Abstract: For the conceptual organization of musical instruments a proposal is presented according to Dahlberg’s Concept Theory and thesaurus construction. Delimitation of domain is discussed and a specific terminological data entry form for musical instruments is proposed. First steps for an effective domain organization are taken.
Introdução
Os instrumentos musicais de cordas dedilhadas 10 estão presentes em todos os continentes e no século XIV e XV, durante a Era das Grandes Navegações, foram difundidos e trocados entre distintas culturas. Os Portugueses trouxeram os instrumentos de cordas usados na Europa para o Brasil e estes foram aos poucos se espalhando por todos os cantos do país e hoje são marcantes na música brasileira. Porém traçar a história desses instrumentos no Brasil não tem sido fácil, pois as fontes históricas são parcas e de difícil acesso, além disso, as grafias e significados dos termos relacionados variam de acordo com a região, grupo social e período histórico. Procurando contribuir para traçar esse perfil histórico, ajudando a desvendar os caminhos da música e dos instrumentos musicais no Brasil, direcionamos nossa pesquisa para a investigação da terminologia
10 Consideramos, nesta pesquisa, instrumentos de cordas dedilhadas aqueles que têm braço e caixa de ressonância e sejam
tocados com os dedos da mão esquerda apoiados no braço e os dedos da mão direita pinçando as cordas. Incluiremos dentre esses, como já é habitual na área, os instrumentos que são tocados com o auxílio de uma palheta ou um plectro, como o bandolim. Ficando excluídos desta pesquisa os instrumentos que se tocam com arco (violino, viola, violoncelo e contrabaixo), muito embora esses eventualmente sejam possam ser tocados com os dedos da mão direita.
GT2
679
dos instrumentos musicais, usando como fontes de pesquisa métodos de estudos de viola, violão e guitarra e dicionários de música publicados em língua portuguesa desde o final do século XVIII até o final do século XIX.
Delimitação do domínio
A delimitação do domínio levou em consideração três parâmetros: o idioma, a organologia e o
período histórico.
Como desejávamos fazer a organização terminológica de um domínio em língua portuguesa não houve dúvidas quanto a escolha do idioma a ser pesquisado, o português.
A organologia, o estudo dos instrumentos de música que envolve distintos ramos relacionados a
instrumentos musicais, tais como: a classificação, a terminologia, a história, a construção, foi utilizada para auxiliar na delimitação do domínio. Nos baseamos no sistema de classificação de instrumentos musicais proposto por Hornbostel & Sachs (1914) 11 . Consideramos apenas instrumentos classificados como alaúdes ou guitarras com braço e caixa, descritos no subgrupo dos cordofones, e ainda dentro desse subgrupo consideramos apenas os instrumentos de cordas dedilhadas. 12
O período histórico determinado para a pesquisa foi o século XIX e as datas limítrofes foram
estabelecidas pelas publicações relacionadas aos instrumentos musicais que seriam possíveis fontes de pesquisa. O marco inicial foi fixado no ano de publicação do primeiro método para cordas dedilhadas, Nova arte de viola: que ensina a tocalla com fundamento sem mestre, escrito em 1789 por Manoel
e paixão” de saber tocar bem a
da Paixão Ribeiro, que escreveu motivado pelo “ardente desejo [
viola e por constatar que haviam poucos professores de viola na cidade de Coimbra, “que além de raros se faziaõ misteriozos”. O marco final foi determinado pela publicação do primeiro dicionário especializado em música escrito em Portugal por Vieira, em 1899, “movido pelo desejo de ser útil”, pois, segundo o autor, na música “a mesma coisa tem variado muitas vezes de nome, o mesmo nome tem designado e designa differentes objectos”.
]
Fontes de pesquisa As fontes de pesquisa escolhidas foram os métodos para instrumentos de cordas dedilhadas e os dicionários de música escritos e concebidos originalmente em língua portuguesa ou traduzidos para o
11 Esse sistema, que tem como base estrutural o sistema de Classificação Decimal Dewey – CDD <http://www.oclc.org/
dewey/about/> é o mais utilizado nos museus de música. Os instrumentos são divididos em quatro grupos: os idiofones, instrumentos rígidos que produzem o som pela vibração de seu próprio corpo, como as baquetas e o triângulo; os membranofones, ou instrumentos de membranas, nos quais o som é produzido pela contração e descontração de uma membrana, como o tambor; os aerofones, ou
instrumentos de “ar”, em que uma coluna de ar vibra produzindo o som, como a flauta e a trompa; e os cordofones, ou instrumentos de cordas, em que a vibração das cordas produz o som como o violão e o violino.
12 Para atualizar e facilitar a classificação dos instrumentos muitos museus têm feito adaptações ao sistema de Hornbostel
& Sachs, uma dessas é a distinção na forma de tocar o instrumento. No caso dos cordofones tem sido adotada a distinção entre os instrumentos que são tocados com o arco – instrumentos de cordas friccionadas (ex: violinos e violas) – e os que são tocados com os dedos – instrumentos de cordas dedilhadas (ex: violão, bandolim, guitarra).
GT2
680
português no período delimitado para a pesquisa, ou seja, de 1789 a 1899. No Quadro 1 listamos os métodos para cordas dedilhadas selecionados para a pesquisa e no Quadro 2 listamos os dicionários de música selecionados que foram escritos em língua portuguesa no século XIX.
Quadro 1: Métodos para guitarra, viola e violão
|
RIBEIRO, Manoel da Paixão. Nova arte de viola: que ensina a tocalla com fundamento sem mestre. Coimbra: Real Officina Da Universidade, 1789. |
|||
|
LEITE, Antonio da Silva. Estudo de guitarra em que se expoem o meio mais facil para aprender a tocar este instrumento. Porto: Officina typographica de Antonio Alvarez Ribeiro, 1796. |
|||
|
VARELLA, Domingos de São José. Compendio de musica, theorica, e prática, que contém breve instrucção para tirar musica. Liçoens de acompanhamento em orgaõ, cravo, guitarra, ou qualquer outro instrumento em que |
|||
|
se pode obter regular harmonia. Medidas para dividir os braços das violas, guitarras, &c e para a canaria do |
|||
|
Orgão Porto : Typ. de Antonio Alvarez Ribeiro, 1806. |
|||
|
S.M.M.P. Methodo pratico de conhecer e formar os tons, ou acordes na viola. Coimbra: Real Imprensa da Universidade, 1826. |
|||
|
J.P.S.S., Arte de Muzica para viola franceza. Braga: Typ. Bracharense, 1839. |
|||
|
CARCASSI, Matteo. Methodo completo de Violão [ |
]. |
Raphael Coelho Machado (trad.), c. 1850. |
|
|
VIEIRA, Miguel José Rodrigues. Indicador de accordos para violão tendo por fim adestrar em mui pouco tempo a qualquer individuo, ainda sem conhecimentos de musica, no acompanhamento do canto e instrumentos. Pernambuco: Typographia Imparcial da Viuva Roma, 1851. |
|||
|
AGUEDO, Manuel Nunes. Methodo geral para viola franceza: extrahido de diversos methodos os mais acreditados. 2ª ed., Porto: [ed. do autor], 1856. |
|||
|
Methodo para aprender guitarra sem auxílio de mestre offerecido à Mocidade Elegante da capital por um amador. Lisboa: Typ. De Christovão Augusto Rodrigues, 1875. |
|||
|
MAIA, Ambrósio Fernandes & VIEIRA, D. L. Apontamentos para um methodo de guitarra: acompanhados de |
|||
|
littographias representado as escallas [ |
]. Lisboa: Lallemant Frères, 1875. |
||
|
BARROS, Jose Antonio Pessoa de. Methodo de violão. Guia material para qualquer pessoa aprender em muito pouco tempo independente de mestre e sem conhecimento algum de música. 2ª ed. H.Laemmert & Cª [1876]. |
|||
|
RENTE, Adolfo Alves. Methodo elementar e pratico de viola franceza (violão): para aprender a tocar este |
|||
|
instrumento sem musica e sem o auxilio do mestre Lisboa: Avellar Machado,[ca. 1880]. |
|||
|
ANJOS, João Maria dos. Novo methodo de guitarra ensinando por um modo muito simples e claro a tocar este instrumento por musica ou sem musica. Lisboa: Antonio Maria Pereira, 1889. |
|||
Quadro 2: Dicionários de música escritos em língua portuguesa no século XIX
|
MACHADO, Raphael Coelho. Diccionario musical. Rio de Janeiro : Typ. Franceza, 1842. |
|
|
FÉTIS, Francois-Joseph. Diccionario das palavras : que habitualmente se adoptão em música. Traduzido e acrescentado por José Ernesto D’Almeida. Porto: Cruz Coutinho, 1858. |
|
|
VIEIRA, Ernesto. Diccionario musical contendo todos os termos technicos música. 2ª ed. Lisboa: Lambertini, 1899. |
ornado com gravuras e exemplos de |
GT2
681
Para cada fonte foi preparada uma ficha com informações sobre a obra e o autor contendo os seguintes campos: título da obra; data; tipo (se método ou dicionário); imprenta; descrição física; localização da obra (podendo ser um endereço na Web ou a Biblioteca e sua localização física); autor da obra; dados sobre o autor; público alvo (normalmente mencionado pelo autor); as referências citadas, contexto de época (normalmente referido pelo autor); conteúdo do método ou dicionário; notas diversas; imagens selecionadas (arquivos digitais de imagens); e anexos (arquivo digital com o método ou dicionário). Na Figura 1 apresentamos um exemplo de ficha criada para organizar as informações sobre as fontes de pesquisa consultadas.
|
Título da obra |
RIBEIRO, Manoel da Paixão. Nova arte de viola: que ensina a tocalla com fundamento sem mestre. Coimbra: Real Officina Da Universidade, 1789. |
|
Código da fonte |
3 |
|
Tipo |
Método |
|
Data |
1789 |
|
Imprenta |
Coimbra: Real Officina Da Universidade |
|
Descriçao física |
51 p., ilustrações e partituras |
|
Localização da obra |
Real Gabinete Português de Leitura. Rua Luís de Camões, 30 – Centro - Rio de Janeiro - Brasil. Website: <http://www.realgabinete.com.br> Consulta no local. |
|
Biblioteca Nacional de Portugal. Website: <http://www.bn.pt> Consulta na Web: |
|
|
http://purl.pt/index/geral/aut/PT/62865.html |
|
|
Autor |
RIBEIRO, Manoel da Paixão |
|
Sobre o autor |
“Professor licenciado de Grammática Latina, e de ler, escrever, e contar em a Cidade de Coimbra”. Ele afirma ter sido aluno de José Maurício (compositor português), ao qual dedica uma modinha. |
|
Datas do autor |
[17--] |
|
Público alvo |
“qualquer pessoa que tenha interesse” [em tocar viola]. “obra útil a toda a qualidade de Pessoas; e muito principalmente às que seguem a vida litteraria, e ainda as Senhoras. |
|
Referencias |
Encyclopedia Pariziense ; Diccionario de Rousseau ; Elementos de Muzica de Rameau |
GT2
682
|
Contexto |
Primeiro método de viola em língua portuguesa que se tem notícia. O autor |
||
|
escreveu pelo “ardente desejo [ |
] |
e paixão” de saber tocar bem a viola e por |
|
|
constatar que haviam poucos professores de viola na cidade de Coimbra, “que além de raros se faziaõ misteriozos”. |
|||
|
Conteúdo |
A obra é dividida em duas partes nas quais são expostas “regras”. A primeira parte é dedicada a questões teóricas “trata de regras externas, e especulativas”: |
||
|
do modo de pontear a viola, do encordoamento, da afinação, de questões teóricas musicais (claves, notas), da formação dos pontos (acordes). A segunda parte é dedicada a questões práticas: escalas, compassos, figuras e acompanhamento. No final são apresentadas estampas grandes que ilustram o braço da viola, mostrando escalas e posições, “posturas ou pontos naturaes, e accidentaes” e, ainda partituras de modinhas e minuetos. |
|||
|
Notas |
o autor afirma que não conhecia em seu tempo outra obra sobre viola. |
||
|
Imagens |
ribeiro_capa.jpg; ribeiro_estampa1.jpg; ribeiro_estampa2.jpg |
||
|
Anexos |
ribeiro.pdf |
||
Figura 1: Exemplo de ficha para as fontes de pesquisa
Construção dos conceitos
Com as fontes selecionadas e descritas iniciamos o processo de seleção terminológica utilizando como base a Teoria do Conceito (Dahlberg, 1978a, 1978b, 1981) que, diferente da terminologia convencional, que objetiva sistematizar o termo (símbolo lingüístico). A proposta é a sistematização do conceito entendido como uma unidade do conhecimento, onde o conhecimento é considerado a totalidade das afirmações sobre o mundo.
Se o conhecimento pode ser visto como a totalidade de proposições verificáveis sobre o mundo, existindo, em geral, em documento ou na cabeça das pessoas, então o conhecimento pode ser visto como existindo, também, em toda afirmação verdadeira (em qualquer
julgamento) e em todas as proposições científicas que obedecem a um postulado verdadeiro.
] [
que podem ser considerados unidades de conhecimento, então essas unidades podem ser
passíveis de verificação científica (Dahlberg, 1978a, p. 143). 13
Se nossa ciência é construída sobre proposições e estas por sua vez em componentes
O conceito é, portanto, construído com base nas afirmações sobre coisas reais (itens empíricos). E, como argumenta Dahlberg (1978a, p. 143), se o homem tem a habilidade para fazer afirmações sobre coisas reais e sobre idéias que existem somente na sua mente, pode-se elaborar um modelo para a construção de conceitos de forma pragmática. Na Figura 2 mostramos o modelo para a construção de conceitos, proposto por Dahlberg (1978a,
13 If knowledge may be regarded as the totality of true propositions about this world, existing – in general – in documents or
in the head of persons, then knowledge may be seen to exist also in every true statement (in every judgment) and in all of the scientific
If our sciences are built up on propositions and these in turn on components which may
propositions which obey the truth postulate [
be looked at as knowledge units, then such units must be amenable to scientific verification.
]
GT2
683
p. 143), com exemplos relacionados ao domínio de instrumentos musicais de cordas dedilhadas. Na primeira etapa (A) é selecionado um item de referência, ou seja, um referente, a partir de um universo de itens do mundo empírico - idéias, objetos, fatos, leis, propriedades, ações. Na segunda etapa (B) são feitas afirmações a partir da análise das suas características, que podem ser verificadas e aceitas como afirmações verificáveis. Na etapa (C), a síntese das afirmações verificáveis é designada em uma forma verbal – termo ou nome – que será utilizada no universo do discurso.
Figura 2: Exemplo de aplicação do modelo para a construção de conceitos, formulado por Dahlberg (1978a), aplicado ao domínio de instrumentos de cordas dedilhadas.
Dahlberg (1978a) propõe a representação do conceito em um triângulo conceitual que simboliza as etapas de A, B e C mostradas na Figura 2. Os vértices do triângulo representam as componentes do conceito: o vértice (A) representa o referente que é a fonte da criação do conceito; o vértice (B) representa as características do conceito; e o vértice (C) representa a forma verbal que é a última parte a ser determinada. Os lados representam as atividades ou relações que contribuem para a formação do conceito: o lado (A, B) representa a predicação; o lado (B, C), a designação; e o lado (C, A), a
GT2
684
denotação. Na Figura 3 mostramos o triângulo conceitual composto com um exemplo relacionado ao conceito guitarra.
Figura 3:Triângulo conceitual proposto por Dahlberg (1978a) aplicado ao conceito guitarra no domínio de instrumentos de cordas dedilhadas.
A soma dos enunciados formulados sobre um determinado item referencial resulta no conceito, que pode ser entendido como uma tríade composta por um referente, por suas características (ou enunciados) e por sua forma verbal (Dahlberg, 1978b). É importante observar que, nessa concepção, o conceito é a união de todos os seus elementos, que se articulam entre si de forma estruturada. O conceito, convencionalmente considerado “unidade de pensamento”, deixa de ser algo tão abstrato, sendo considerado “unidade de conhecimento” (Dahlberg, 2006).
Seleção dos itens de referência
Na primeira etapa da construção dos conceitos do domínio de instrumentos musicais, ou seja, na escolha dos itens de referência, tomamos como exemplo a metodologia usada por Lopéz-Huertas (1997) na elaboração de um tesauro de instrumentos musicais. A autora previamente seleciona alguns itens de referência chamados de unidades de análise e, em seguida, busca e compila em quatro dicionários especializados 14 definições para essas unidades. Em sua experiência, foram selecionados dez instrumentos musicais como unidades de análise: alaúde, balalaika, bandolim, banjo, cravo, harpa, mandola, violoncelo, violino, ukelele. 15
14 Dicionários utilizados por Lopéz-Huertas: Peña, J and Anglés, H. Diccionario de la música labor. Barcelona. Labor, 1954;
Pérez, M. Diccionario de la música y los músicos. Madrid, Istmo, 1985; Valls, M. Diccionario de la música. 4th. ed. Madrid: Alianza Editorial, 1982; Sardá, A. Léxico tecnológico musical en varios idiomas. Madrid. Unión Musical Española, 1929.
15 A seleção de instrumentos musicais feita por Lopéz-Huertas não deve ter levado em consideração um rigoroso critério
musicológico muito provavelmente porque a preocupação principal do trabalho deve ter sido a experiência metodológica de elaboração desse tesauro.
GT2
685
Para o nosso domínio de instrumentos de cordas dedilhadas selecionamos as unidades de análise de acordo com delimitação do domínio definida: alaúdes ou guitarras com braço e caixa 16 de cordas dedilhadas usados em Portugal e no Brasil no século XIX. No Quadro 3 mostramos as unidades de análise selecionadas.
Quadro 3: Unidades de análise selecionadas no domínio de instrumentos de cordas dedilhadas
UNIDADES DE ANÁLISE
Guitarra
Guitarra portugueza
Viola
Viola franceza
Violão
Após a seleção das unidades de análise compilamos a partir das fontes – métodos de estudo e dicionários – as definições originais dos autores para as unidades de análise. No Quadro 4 são mostrados alguns exemplos de compilações feitas a partir de definições originais dos autores para o item de referência ‘guitarra’.
Quadro 4: Definições originais de ‘guitarra’
|
Estudo de guitarra em que se expoem o meio mais facil para aprender a tocar este instrumento de Antonio da Silva Leite (1796) |
||||||||
|
A Guitarra, que segundo dizem, teve sua origem na Gram-Bretanha [ |
] |
As Cordas da Guitarra [ |
] |
devem-se ferir |
||||
|
com a polpa dos dedos, e também com as pontas das unhas [ |
] (p. 25). |
|||||||
|
A guitarra consta de seis Cordas (Primas, Segundas, Terceiras, Quartas, Quinta, e Sexta) quatro saõ dobradas, e |
||||||||
|
duas, singélas. As dobradas saõ as quatro primeiras, que vem a ser: as Primas, Segundas, Terceiras, e Quartas e as singélas saõ as duas ultimas, que saõ a Quinta, e a Sexta. (p. 27) |
||||||||
|
[ |
] Dos signos, que competem a cada huma das Cordas [ |
] |
||||||
|
[Cordas soltas: 6ª. Do; 5ª: Mi; 4ª Sol; 3ª Dó; 2ª Mi; 1ª Sol] |
||||||||
|
Compendio de musica, theorica, e prática [ |
] Domingos de São José Varella (1806) |
|||||||
|
A Guitarra, que está em uso, se póde aperfeiçoar, accrescentando-lhe huma 7ª. corda nos bordões, com a seguinte ordem: 1ª. em G, 2ª. em E, 3ª. em C, 4ª. em A, 5ª. em F, 6ª. em D, 7ª. em B, bmol: principiando em G sobreagudo, e acabando em Bmol [B bmol] grave. (p. 53) |
||||||||
|
Diccionario das palavras: que habitualmente se adoptão em música de, François-Joseph Fétis (1858) |
||||||||
16 Na classificação de Hornbostel & Sachs a classe alaúdes ou guitarras com braço e caixa se refere a instrumentos que têm
uma caixa de ressonância constituída por um tampo inferior e outro superior, unidos por uma lateral de madeira (costilha). Nessa classe se incluem a viola e a guitarra, mas não o alaúde tradicional, pois este se encaixa na classe alaúdes arcados com braço e corpo em forma de meia esfera.
GT2
686
|
Guitarra. Instrumento de cordas com um braço dividido por trastos onde pousão os dedos. Dedilhão-se as cordas d’este Instrumento com a mão direita. Consta a guitarra de dez cordas metallicas, formando a prima e as três |
||||
|
immediatas quatro grupos de duas cordas cada um, affinadas em uníssono pela seguinte ordem, Sol, Mi, Do, Sol, Mi, |
||||
|
Do ( |
) antes que se introduzisse o Piano, era entre nós o Instrumento favorito das Damas. |
|||
|
Diccionario musical contendo todos os termos technicos [ |
] |
de Ernesto Vieira (1899) |
||
|
Guitarra portugueza, s. f. O nosso instrumento popular por excellencia, é uma imitação tradicional da cithara usada na Edade média, pertencente, como o bandolim, à família dos alaudes. O proprio nome é identico, pois guitarra não é mais do que a modificação de cithara. Na sua qualidade de filha do alaude arabe, foi naturalmente conservada pelos jograes moiriscos não sendo portanto sem fundamento que alguns escriptores estrangeiros lhe teem chamado guitarra moirisca. (Vieira, 1899, 271) |
||||
Nessas compilações identificamos novos itens de referência que podem ser vistos no Quadro 5.
Quadro 5: Novos itens de referência selecionados a partir da compilação nas fontes
ITENS DE REFERÊNCIA
Alaúde
Arcichitarra
Arciviola
Bandolim
Bandurra
Cavaquinho
Cithara
Guitarra com teclas
Guitarrão
Machete
Teorba
Violão
Dentre esses novos itens de referência estão instrumentos que não se encaixam na definição inicial de alaúdes ou guitarras com braço e caixa de cordas dedilhadas. O fato de esses instrumentos aparecerem nas compilações não nos surpreendeu, pois na realidade eles, mesmo que indiretamente, fazem parte do universo de instrumentos de cordas dedilhadas utilizados no século XIX.
Identificação das características
Com os itens de referência selecionados buscamos identificar nas compilações os atributos, que são considerados as características dos conceitos, que, como afirma Dahlberg (1978b, p. 102), “cada enunciado apresenta (no verdadeiro sentido de predicação) um atributo predicável do referente que, no nível de conceito, se chama característica”. No Quadro 6 listamos atributos relacionados ao item de referência ‘guitarra’ observados nas compilações originais dos autores que foram mostradas no Quadro 4.
GT2
687
Quadro 6: Atributos relacionados ao item de referência guitarra
|
GUITARRA: ENUNCIADOS / CARACTERÍSTICAS |
||
|
origem na Gram-Bretanha |
||
|
As cordas devem-se ferir com a polpa dos dedos |
||
|
As cordas devem-se ferir com a ponta das unhas |
||
|
consta de seis Cordas |
||
|
Afinação [Leite]: 6ª. Do; 5ª: Mi; 4ª Sol; 3ª Dó; 2ª Mi; 1ª Sol |
||
|
Afinação [Varella]: 7ª Si; b 6ª. Do; 5ª: Mi; 4ª Sol; 3ª Dó; 2ª Mi; 1ª Sol |
||
|
Instrumento de cordas |
||
|
Braço dividido por trastos |
||
|
trastos onde pousão os dedos |
||
|
Dedilhão-se as cordas [ |
] |
com a mão direita |
|
dez cordas metallicas |
||
|
quatro grupos de duas cordas affinadas em uníssono pela seguinte ordem, Sol, Mi, Do, Sol, Mi, Do |
||
|
era entre nós o Instrumento favorito das Damas |
||
|
instrumento popular por excellencia |
||
|
imitação tradicional da cithara |
||
|
pertencente à família dos alaudes |
||
|
não é mais do que a modificação de cithara |
||
|
filha do alaude |
||
|
conservada pelos jograes moiriscos |
||
As características, representadas no vértice (B) do triângulo conceitual, também são consideradas conceitos, mas no momento de análise de um determinado conceito a característica é considerada apenas um elemento desse conceito (Dahlberg, 1978a, p. 145).
Definição da forma verbal dos conceitos
A definição da forma verbal, ou seja, definição do termo preferencial pelo qual o conceito será designado no universo conceitual é a terceira etapa do modelo de construção do conceito e vértice (C) do triângulo conceitual. Na linguagem natural é muito comum que palavras equivalentes representem um mesmo
GT2
688
conceito, mas na construção de uma linguagem artificial, como tesauros e ontologias, para facilitar o acesso somente um termo é considerado preferencial e os outros são considerados não preferenciais. No domínio analisado as mudanças grafológicas que ocorreram durante o século XIX deixaram marcas evidentes e para a escolha dos termos preferenciais levamos em conta os tipos de dispersão encontrados na língua portuguesa: as dispersões léxicas, simbólicas e sintáticas, cujos exemplos mostramos no Quadro 7.
Quadro 7: Tipos de dispersão
|
TIPO DE DISPERSÃO |
EXEMPLO |
|
|
DISPERSÃO LÉXICA |
Sinônimos |
Trastes, divisoens d’arame |
|
DISPERSÃO SIMBÓLICA |
Grafias diferentes |
Baxos, bordões |
|
Abreviaturas |
1ª corda, primas |
|
|
DISPERSÃO SINTÁTICA |
Gênero / número |
Trastos, trasto; prima, primas |
Na escolha do termo preferencial foram adotados alguns critérios determinados caso a caso:
em alguns casos adotamos o termo com grafia mais moderna entre as citadas nas fontes, em outros, o termo com grafia mais difundida na época e em outros tivemos que considerar os dois termos pois representavam conceitos distintos. Os termos utilizados atualmente, mesmo que não tenham sido citados nas fontes de época, foram incluídos como termos não-preferenciais visando facilitar o acesso. Encontramos também casos de polissemia, ou seja, de termos homógrafos, que, ao contrário das dispersões semânticas, ocorrem quando dois conceitos diferentes são expressos pela mesma forma verbal. Nas linguagens artificiais, os termos homógrafos recebem um qualificador, incluído após a forma verbal entre parênteses.
Categorias do domínio
A organização do domínio implica na organização dos conceitos em categorias. No processo de organização conceitual a comparação entre as características dos conceitos permite estabelecer relações que auxiliam na compreensão das categorias. Segundo Dahlberg (1972) “as relações entre os conceitos podem, portanto, ser definidas pela posse comum de certas características em conceitos diferentes”. A partir das compilações pudemos extrair diversas relações entre os conceitos, que podem ser hierárquicas, partitivas, de oposição e funcionais. Na Figura 4 mostramos um exemplo de relação partitiva para o conceito ‘guitarra’ e suas partes constitutivas, com base na definição de Vieira (1899), mostrada no Quadro 8.
GT2
689
Quadro 8: Definição de ‘guitarra’ [portuguesa] feita por Vieira (1899).
A caixa de ressonancia da guitarra é em forma de pera, como a do bandolim, com a differença
de ser muito mais larga, quase circular. O fundo é chato como o do violão, e o tampo harmonico tem ao centro a boca ou espelho. O braço sahindo da caixa termina como cravelhal, que nas guitarras
ordinarias é plano e um pouco inclinado para traz [
em dezesete tastos ou pontos divisorios para sobre elles se apoiarem os dedos. No alto do ponto, proximo ao cravelhal, está a pestana, que é uma pequena travessa por onde passam as cordas antes de se enrolarem nas cravelhas ou de se prenderem ao grampo do leque.
O ponto, que se assenta sobre o braço é dividido
]
Figura 4: Relações partitivas do conceito ‘guitarra’.
Um exemplo de categorias definidas para o domínio de instrumentos musicais de cordas dedilhadas pode ser visto na Figura 5.
Figura 5: Exemplo de categorias
|
SUBCATEGORIAS |
CATEGORIAS ESPECÍFICAS |
EXEMPLO |
|
BÁSICAS |
||
|
Propriedade |
Material constitutivo |
de arame |
|
Cor [da corda] |
amarelo |
|
|
Forma de tocar |
com a ponta das unhas |
GT2
690
|
Objeto |
Instrumento |
viola |
|
Parte constituinte dos instrumentos |
cravelha |
|
|
Acessório |
pestana postiça |
|
|
Parte do corpo humano |
[dedo] anular |
|
|
Processo |
Processo musical |
afinar, tocar, pontear, encordoar |
|
Função social |
acompanhador de modinhas |
1.
Dahlberg (1978a) e Ranganathan (1967) utilizam a noção de categoria tanto como um recurso para o entendimento da natureza do conceito, como para a formação de estruturas conceituais para a sistematização do conhecimento. A definição das categorias em um domínio é um processo paulatino que depende de um conhecimento mais aprofundado do domínio. Se, por um lado, a classificação auxilia no processo de organização do conhecimento em um domínio particular, a organização das características dos conceitos, de suas relações e a definição de sua forma verbal facilita a classificação dos conceitos em categorias. É uma via de mão dupla.
1. Definições Conceituais
Para a organização conceitual a definição dos conceitos, segundo Dahlberg (1978b), é uma questão fundamental. Essa definição é uma restrição, uma delimitação e uma fixação do conteúdo de um conceito, dada pela intensão do conceito, ou seja, pelo conjunto de suas características. “A intensão do conceito é a soma total das suas características. É também a soma total dos respectivos conceitos genéricos e das diferenças específicas” (Dahlberg, 1978b, p. 105).
É recomendável que a definição de um conceito contemple todos os tipos de relacionamentos entre os conceitos, de forma que podemos ter definições do tipo genérica, específica, partitiva, de oposição e funcional. Apresentamos no Quadro 9 uma possível definição para o conceito ‘guitarra’.
Quadro 9: Definição para o conceito ‘guitarra’
GUITARRA
Instrumento musical de cordas dedilhadas, têm em geral seis cordas duplas, tampo de madeira em forma de pêra, tendo ao centro uma boca, o fundo é chato, tem cravelhas de metal e é própria para solo ou para acompanhar o canto e outros instrumentos
A definição dos termos e conceitos é um processo que ocorre em duas etapas. A primeira, a “compreensão conceitual”, ocorre no início do processo, a partir das definições das características do conceito. A segunda, a “definição propriamente dita”, ocorre após a organização do termo em uma rede de relacionamentos com outros termos o que define os “limites semânticos” do termo em um
GT2
691
dado domínio (Dodebei, 2002). Essas etapas podem se repetir de forma cíclica até o final do processo.
2. Ficha terminológica
Um recurso essencial para a organização e o acesso aos dados é a ficha terminológica. A ficha vai sendo construída durante todo o processo. Iniciamos o trabalho utilizando uma ficha proposta por Gomes (2009), mas aos poucos fomos percebendo a necessidade de inclusão de campos específicos e consideramos a possibilidade de criar uma ficha especial como pode ser visto no exemplo do Quadro 10 de ficha para o conceito ‘guitarra’, com a inclusão de vínculos, com as definições originais compiladas e com imagens e outros recursos, que mostramos como exemplo no Quadro 11.
Quadro 10: Exemplo de ficha terminológica proposta para o conceito ‘guitarra’.
|
GUITARRA |
|
|
É um instrumento de cordas dedilhadas |
|
|
Origens |
Grã-Bretanha (Leite); modificação da cithara (Vieira) |
|
Função social |
Em Portugal era o Instrumento favorito das Damas |
|
Termos equivalentes |
Viola de mão, banxa, chitarra, kitarah ou kuitra (árabe), guiterne (francês) |
|
Relações hierárquicas superiores |
|
|
Instrumento de cordas dedilhadas |
|
|
Relações hierárquicas inferiores |
|
|
guitarra portugueza; arcichitarra; guitarra com teclas; guitarrão |
|
|
Relações partitivas e características |
|
|
caixa de ressonância |
em forma de pêra |
|
costas |
Deve ser chato de madeira muito secca |
|
costilhas |
de madeira muito secca |
|
boca |
circular |
|
tampo harmônico |
de madeira mais leve de veia fina e rígida (Leite) |
|
cravelhame |
plano e um pouco inclinado para trás (Vieira, guitarra portugueza) |
|
trastos |
Doze trastos (Leite); 17 trastos (Vieira, guitarra portugueza; Varella, guitarra e viola) |
GT2
692
|
cordas |
dez cordas as quatro primeiras são dobradas e duas últimas singelas (Leite, Fétis) A guitarra é armada com doze cordas afinadas aos pares (Vieira, guitarra portugueza) |
|
|
nome das cordas |
Primas, Segundas, Terceiras ou Toeiras, Quartas, Quinta, e Sexta |
|
|
tipo de cordas |
metálicas (Fétis, Vieira) |
|
|
pestana |
||
|
cavalete |
||
|
Relações funcionais e características específicas |
||
|
Acessórios |
Pestana postiça (Leite) |
|
|
Afinação |
1ª. Sol; 2ª. Mi; 3ª. Dó; 4ª. Sol; 5ª. Mi; 6ª. Do (Leite, Fetis, Vieira) (afinação natural, Vieira) 1ª. Sol, 2ª. Mi, 3ª. Dó, 4ª. Lá, 5ª. Fá, 6ª. Ré, 7ª. Si bemol (Varella - a 7ª. é opcional) 1ª. Sol; 2ª. Fá; 3ª. Dó; 4ª. Sol; 5ª. Fá; 6ª. Si bemol (afinação fado, Vieira) |
|
|
Forma de tocar |
Com a polpa dos dedos; com as pontas das unhas; pontear (tocar sobre o ponto); dedilhar; rasgado |
|
|
Usado para/como |
Acompanhamento e solo |
|
|
Instrumentos associados |
Viola; violão; bandolim e bandurra |
|
|
Processos relacionados |
guitarreiro (fabricante de guitarra); guitarrista (tocador de guitarra); ferir as cordas; pontear (tocar sobre o ponto) entrastar; afinação; afinar |
|
|
Citado por |
Leite (1796); Vieira (1899); Fétis (1858); Varella (1806) |
|
|
Anexos |
leite_extensão_p37.jpg; leite_afinacao_guitarra.bmp; |
|
|
leite_ilustra_guitarra.jpg; leite_ilustra_guitarra.jpg; [ |
] |
|
Quadro 11: Vínculos com as compilações das definições originais
GT2
693
|
VÍNCULO 1 |
Fétis, 1858 |
|||||
|
Instrumento de cordas com um braço dividido por trastos onde pousão os dedos. Dedilhão-se as cordas d’este Instrumento com a mão direita. Consta |
||||||
|
a guitarra de dez cordas metallicas, formando a prima e as três immediatas quatro grupos de duas cordas cada um, affinadas em uníssono pela seguinte |
||||||
|
ordem, Sol, Mi, Do, Sol, Mi, Do [ |
] antes que se introduzisse o Piano, era |
|||||
|
entre nós o Instrumento favorito das Damas |
||||||
|
VÍNCULO 2 |
Leite, 1796, p. 25 |
|||||
|
A |
Guitarra, que segundo dizem, teve sua origem na Gram-Bretanha, he hum |
|||||
|
instrumento que pela sua harmonia, e suavidade tem sido aceito por muito Póvos, que achando-a capáz de supprir por alguns instrumentos de maior |
||||||
|
vulto, como o Cravo, e outros [ |
] |
|||||
|
A |
guitarra consta de seis Cordas (Primas, Segundas, Terceiras, Quartas, |
|||||
|
Quinta, e Sexta) [ |
] |
|||||
|
[ |
] doze divisoens d’arame, que ordinariamente atravessaõ o ponto [ |
] |
||||
|
Machado, 1855 |
||||||
|
VÍNCULO 3 |
s.m, instrumento de seis cordas de arame antigo, e de nenhum préstimo na orchestra. |
|||||
|
Anjos, 1889 |
||||||
|
A |
guitarra é composta de um tampo, um fundo, dois aros e um cavalleste |
|||||
|
VÍNCULO 4 |
collocado sobre o tampo; á extremidade do braço chama-se cabeça, logar onde se collocam as doze caravelhas, de chave ou de leque; n’ellas se prendem as cordas, que são doze, a saber: duas primas, a que se dá o nome de sol agudo; duas segundas, cujo nome é mi; duas toeiras, cujo nome é do; bordão de primas, que é sol; bordão de segundas, que é mi; e bordão de toeiras, que é do. |
|||||
|
Anônimo, 1875 |
||||||
|
Posição da guitarra e modo de tocar |
||||||
|
A |
curvatura do aro direito da guitarra deve apoiar sobre a coxa esquerda |
|||||
|
VÍNCULO 5 |
do tocador, de modo que descance perfeitamente entre o peito e a perna esquerda, e que o braço esquerdo cujo ante braço descança o braço da guitarra, fique desembaraçado e liberto para que a mão esquerda possa correr rapidamente todos os pontos como melhor se verá na estapa em frente |
|||||
|
do frontispicio. (p. 21) |
||||||
Considerações finais
A experiência de organização conceitual dos instrumentos musicais foi um primeiro passo na direção da construção de um instrumento para sua organização efetiva, tal como um tesauro ou uma ontologia.
A seleção de fontes é uma parte essencial do trabalho. Verificamos que seleção deve se restringir às obras mais importantes, escolhidas por um especialista no domínio. Um exagero na quantidade de fontes utilizada demandaria um trabalho extra sem necessidade e não acrescentaria muito ao universo terminológico.
Foi surpreendente perceber que as unidades de análise, ou seja, os primeiros itens considerados
GT2
694
para análise realmente vão, como um imã, trazendo novos itens até formar um campo conceitual representativo.
A organização das compilações dos textos originais em fichas inseridas em uma base de dados
informatizada facilitou as inevitáveis idas e vindas entre as etapas de trabalho.
O trabalho com um domínio datado no século XIX distante da realidade atual foi um desafio
para a definição dos conceitos e da forma verbal. Acreditamos que essa questão deve ser motivo ainda de futuras discussões e contribuições.
Existe ainda muito trabalho para organizar, representar e disponibilizar o conhecimento na área de instrumentos musicais, mas demos um primeiro passo criando um modelo de organização e mostramos que as metodologias convencionais da Organização do Conhecimento, tesauros e Teoria do Conceito não só podem, como dever ser consideradas molas mestras para a organização conceitual.
Referências Bibliográficas
DAHLBERG, Ingetraut. Teoria do conceito. Ciência da Informação, Rio de Janeiro, v.7, n.2, 1978a,
p.101-107.
DAHLBERG, Ingetraut. A referent-oriented, analytical concept theory for INTERCONCEPT. International Classification, v.5, n.3, 1978b, p.142-151. DAHLBERG, Ingetraut. Conceptual definitions for INTERCONCEPT. International Classification, v.8, n.1, 1981, p.16-22. GOMES, Hagar Espanha. Elaboração de tesauro documentário: aspectos teóricos e práticas. Disponível em: <http://www.conexaorio.com/biti/tesauro>. Acesso em fevereiro de 2009. HORNBOSTEL, Erich M. von & SACHS, Curt Sachs. Classification of Musical Instruments:
Anthony Baines and Klaus P. Wachsmann (translation). Originally published in 1914. The Galpin Society Journal, vol. 14, Mar., 1961, p. 3-29. RIBEIRO, Manoel da Paixão. Nova arte de viola: que ensina a tocalla com fundamento sem mestre. Coimbra: Real Officina Da Universidade, 1789.
VIEIRA, Ernesto. Diccionario musical contendo todos os termos technicos [
gravuras e exemplos de musica. Pacini (ed), 2ª ed. Lisboa: Lambertini, Typ Lallemant, 1899.
] ornado com
GT2
695
COMUNICAÇÃO
ORAL
TAXONOMIA FACETADA NAVEGACIONAL: AGREGANDO VALOR ÀS INFORMAÇÕES DISPONIBILIZADAS EM BIBLIOTECAS DIGITAIS DE TESES E DISSERTAÇÕES
Benildes Coura Moreira dos Santos Maculan, Gercina Angela Borém de Oliveira Lima
Resumo: Este artigo apresenta o resultado de uma pesquisa de mestrado que investigou o uso de uma taxonomia facetada navegacional (TAFNAVEGA) como instrumento de organização da informação, para dar consistência e padronização aos conteúdos informacionais de teses e dissertações. Teve como objetivo facilitar o acesso às informações, a partir da navegação através dos termos da estrutura facetada. O ambiente de pesquisa foi uma biblioteca digital de teses e dissertações (BDTD) de uma unidade informacional específica, tendo como insumo as teses e dissertações particularmente oriundas da linha de pesquisa Organização e Uso da Informação (OUI). A TAFNAVEGA é composta por dez categorias fundamentais temáticas (CAFTE) e por um algoritmo para extração de conceitos, denominada matriz categorial temática para trabalhos acadêmicos. A metodologia incluiu o uso da teoria da análise de domínio para a identificação do domínio, do usuário da BDTD e de suas necessidades informacionais, assim como do Modelo de Leitura Documentária, de Fujita e Rubi (2006), para o desenvolvimento da matriz categorial para trabalhos acadêmicos. Para a criação das categorias fundamentais temáticas foi utilizado o método da análise de conteúdo, com a técnica da análise categorial temática Os resultados demonstraram que o mecanismo TAFNAVEGA pode facilitar a exploração, busca e recuperação dos conteúdos dos documentos, dando acesso a dados tais como teorias, métodos e instrumentos de coleta de dados. Concluiu-se que esse instrumento auxilia o pesquisador em sua atividade profissional e permite maior visibilidade ao conteúdo disponível na biblioteca digital de teses e dissertações, sem sobrecarregá-lo de informações.
Palavras-chave: Taxonomia facetada navegacional. Navegação facetada. Busca e recuperação da informação. Biblioteca de teses e dissertações. Matriz categorial para trabalhos acadêmicos.
1 INTRODUÇÃO
O ser humano é essencialmente social, ligado a diferentes grupos de interesses, tradicionalmente transmitindo seu conhecimento a outro e também recebendo saberes de outros. A disciplina Ciência da Informação (CI) notadamente se ocupa em entender esses fluxos de informação, em distintos ambientes, desenvolvendo formas de facilitar seu acesso e uso (BORKO, 1968), o que permite expandir o conhecimento da humanidade acerca da ciência e tecnologia.
GT2
696
O saber científico é dinâmico e primordial no desenvolvimento da sociedade, num ciclo aberto de reconstrução, se transformando, aperfeiçoando e ampliando. A ciência passa sempre por revisões em suas teorias, seja por não mais se adaptarem à realidade empírica existente ou devido à descoberta de novos fenômenos. Sendo assim, as teorias científicas são falíveis e estão, continuamente, sendo substituídas ou recondicionadas, principalmente para se ajustarem à época histórica ou científica. A evolução da ciência acontece com a possibilidade de replicação, quando um novo conhecimento emerge a partir de algo já descoberto. Nesse sentido, a comunicação científica tem importante papel, pois permite o acesso às diferentes abordagens teóricas, epistemológicas e práticas que estão sendo utilizadas nas pesquisas, e também aos resultados obtidos nas mesmas. Na academia, há manifesta preocupação com a comunicação e difusão do conhecimento advindo de pesquisas já concluídas, como forma de obter visibilidade institucional, legitimando e promovendo maior prestígio entre os pares. Nesse sentido, uma significante iniciativa de instituições de ensino superior é a criação de bibliotecas digitais para a disponibilização de teses e dissertações. Com isso, pretende-se facilitar o acesso a esse tipo de documento e evitar esforços replicados em pesquisas sobre mesmo tema ou temas semelhantes. Contudo, é importante destacar que ainda pode ser considerado difícil recuperar os conteúdos detalhados das pesquisas finalizadas. As teses e dissertações possuem conteúdo especializado, utilizando linguagem formal e específica para a área ou domínio, através de uma terminologia própria. Não obstante, são produzidas em linguagem natural, o que ocasiona casos de sinonímia (palavras com significados iguais) ou até mesmo de homonímia (identidade fonética e/ou gráfica de palavras com significados diferentes). Essa particularidade causa dificuldade na comunicação e compartilhamento do conhecimento registrado nesses documentos. Esse fato é comumente agravado por problemas na indexação dos documentos, pois as palavras-chave atribuídas nem sempre são representativas de toda a temática tratada ou os resumos informativos estão incompletos, ocorrências essas já amplamente ressaltadas na literatura da área (BORKO; CHATMAN, 1963; VIEIRA, 1988; NOGUEIRA, 1997; GIL LEIVA; FUJITA; RUBI, 2008; ELIEL, 2008; SOUZA, 2009). Outra dificuldade está relacionada à busca avançada, geralmente realizada através do uso da lógica booleana (or, and e not), utilizada para ampliação ou refinamento de resultados. Esse recurso pode ajudar na recuperação de informações mais específicas em uma biblioteca digital, mas a maior parte dos usuários finais não está apta a utilizar tal opção. Os motivos para esse impedimento podem advir de diferentes fatores, seja porque o usuário não consegue acompanhar as mudanças tecnológicas (barreira tecnológica), por comodismo (barreira psicológica) (FIGUEIREDO, 1987), ou mesmo porque o utente considera as buscas booleanas de difícil compreensão (BAEZA-YATES; RIBEIRO- NETO, 1999). A decorrência desse cenário justificou a pesquisa de mestrado intitulada “Taxonomia facetada navegacional: construção a partir de uma matriz categorial para trabalhos acadêmicos”, que criou uma taxonomia facetada para navegação, como opção de busca em bibliotecas digitais de teses e
GT2
697
dissertações. O recurso prioriza as necessidades de informação dos pesquisadores, com vistas a
promover acesso mais facilitado aos resultados detalhados das pesquisas e dar maior visibilidade ao conhecimento científico acumulado nesse tipo de documento. Neste artigo, primeiramente são apresentadas as características textuais de documentos acadêmicos do tipo teses e dissertações. Em seguida, descreve-se o desenvolvimento da taxonomia facetada navegacional (TAFNAVEGA), com sua conceituação, princípios de navegação hipertextual
e os procedimentos da metodologia utilizada. Por fim, demonstram-se os resultados e conclusões.
2 DOCUMENTOS ACADÊMICOS DO TIPO TESES E DISSERTAÇÕES Para a CI, o documento é a materialidade de um registro informacional que proporciona identificar e apreender seu conteúdo (RABELLO, 2009), pois um “documento” pode ser, desde
a concepção de Otlet, qualquer objeto de informação que tenha caráter representativo (CUNHA;
CAVALCANTI, 2008). Esse significado de “documento” está também expresso na norma que regula
a prática da análise de documentos, a NBR-12676:1992. Essa norma determina que documento é
“qualquer unidade, impressa ou não, passível de catalogação ou indexação”, e ainda acrescenta que:
Esta definição se refere não apenas a materiais escritos ou impressos em papel ou suas versões em microforma (p. ex.: livros, jornais, diagramas, mapas), mas também a suportes não-impressos (p. ex.: registros legíveis por máquinas, filmes, gravações sonoras), objetos tridimensionais e realia usadas como espécimens (NBR-12676, 1992, p.2).
Aliado a isso, Buckland (1991) indica a tangibilidade da unidade informacional (informação), ao apontar que ela pode ser disseminada em SRIs através de três distintos usos: 1) informação como processo (transmissão e comunicação); 2) informação enquanto conhecimento (reduzir incertezas através do uso); 3) informação na perspectiva de objeto (qualquer “coisa”). Os documentos acadêmicos compreendem todo tipo de produção da comunidade científica.
Incluem-se nesse arrolamento os documentos abordados neste artigo, do tipo teses e dissertações, que têm como característica apresentar o resultado de pesquisa com tema único e escopo bem delimitado. A diferença entre esses dois tipos de documentos é pouco significativa. As teses devem oferecer uma contribuição real para a questão levantada, com alto grau de profundidade de estudo, enquanto as dissertações devem priorizar a demonstração da capacidade de aplicação de método científico
e a habilidade de sistematização do aluno, sem que seja esperado dele um aporte original. Esses
documentos têm caráter didático (MARCONI; LAKATOS, 2010) e devem respeitar as regras e normas técnicas para a normalização textual, de modo a facilitar a comunicação e o compartilhamento das informações contidas neles. No Brasil, a Associação Brasileira de Normas Técnicas (ABNT), é o órgão responsável por essa regulamentação técnica, sendo ainda representante de entidades internacionais tais como a International Organization for Standardization (ISO) e International Elecrotechnical Commission (IEC). No tocante à elaboração dos documentos acadêmicos do tipo teses e dissertações, as diretrizes que prevalecem são as da Norma NBR 14724:2011. Outras normas complementam-na, quais
GT2
698
sejam: NBR 10520:2002 (Citações), NBR 6023:2002 (Informação e documentação – Referência – Elaboração), NBR 6024:2003 (Numeração progressiva das seções de um documento escrito), NBR 6027:2003 (Sumário), NBR 6028:2003 (Resumo), NBR 6034:2004 (Índice), NBR 12225:2004 (Títulos de lombada). Segundo a Norma ABNT NBR 14724 (2011, p.8), as teses e dissertações possuem três partes fundamentais: parte introdutória, desenvolvimento e uma conclusão. A segunda parte, de desenvolvimento da pesquisa, é a mais complexa do documento textual e inclui quatro elementos principais: 1) revisão de literatura (outros estudos acerca do tema estudado); 2) descrição detalhada da metodologia (pressupostos, amostra, métodos, técnicas, instrumentos e processos); 3) resultados obtidos durante o desenvolvimento da pesquisa; 4) discussão dos resultados alcançados. Nesse contexto, o desenvolvimento da taxonomia facetada navegacional (TAFNAVEGA) teve como parâmetro essa estrutura textual dos documentos acadêmicos do tipo teses e dissertações.
3 DESENVOLVIMENTO DA TAXONOMIA FACETADA NAVEGACIONAL A TAFNAVEGA foi desenvolvida a partir do universo de pesquisa representado pelas teses e dissertações defendidas entre os anos 1998 e 2009, no Programa de Pós-Graduação em Ciência da Informação (PPGCI) da Escola de Ciência da Informação (ECI), da Universidade Federal de Minas Gerais (UFMG). No arrolamento desses documentos obteve-se um total de 290 trabalhos (62 teses e 228 dissertações). Desse total, determinou-se o corpus de estudo, por amostragem não-probabilística (ou subjetiva), do tipo intencional (por julgamento), indicado para investigações de cunho exploratório, como no caso da pesquisa realizada, principalmente se o universo é homogêneo (MALHOTRA, 2001, p.316). Como resultado, obteve-se um corpus constituído por documentos provenientes da linha de pesquisa “Organização e Uso da Informação” (OUI), disponibilizadas no banco de dados da biblioteca digital de teses e dissertações da instituição (BDTD/ECI/UFMG), totalizando 41 documentos (12 teses e 29 dissertações).
3.1 Uma conceituação para taxonomia facetada navegacional
Em sua expressão mais tradicional, uma taxonomia apresenta um domínio na forma de uma simples hierarquia. Uma taxonomia facetada, por sua vez, apresenta um domínio em facetas e, em cada faceta, há uma hierarquia. Essa característica permite estabelecer relações entre as facetas, indicando a multidimensionalidade de um termo nesse mesmo domínio. Em ambiente digital, o termo “navegação” refere-se à possibilidade interativa utilizada pelo usuário para acessar informações em um banco de dados. Isso pode ser atestado pela descrição do verbete “navegação” no Dicionário de Biblioteconomia e Arquivologia:
pesquisar (ou navegar) em um programa, procurar comandos, percorrer um documento e
GT2
buscar informações [
satisfazer suas necessidades de informação [
folheio de objetos com conteúdo (CUNHA; CAVALCANTI, 2008, p.257).
]
[que é o] processo dos usuários interagindo com um sítio visando
],
[navegando] em sítios por meio de busca e
699
Percebe-se, nessa definição, a possibilidade de o usuário explorar o conteúdo de um banco de dados através da navegação. Bonilla (2005, p.139) acrescenta que “a navegação está baseada nas indexações e associações de idéias [sic] e conceitos, organizados sob a forma de links, os quais agem como portas virtuais que abrem caminhos para outras informações”. Esse sentido de “associação de ideias” sugere a imagem de uma navegação facetada, abordagem empregada para facilitar a interrelação e a recuperação de informações, que vem sendo denominada de “paradigma de navegação facetada” (faceted browsing paradigm) (BROUGTHON, 2006; TZITZIKAS; ANALYTI, 2007; SACCO; TZITZIKAS, 2009). Tunkelang (2009) afirma que uma navegação facetada possibilita que o usuário elabore sua busca progressivamente e garante que ele a refine, apresentando as diferentes opções de escolhas e eliminado a possibilidade de “resultados vazios”, uma vez que somente mostra as facetas nas quais há conteúdos de informação. Para a criação de uma taxonomia para navegação (navegacional), decompõe-se o conteúdo de um documento ou domínio em categorias e facetas, com base em conceitos e nas relações existentes entre as facetas, a partir de uma lógica de organização pré-estabelecida, tal como a página de busca da Microsoft Network (<http://search.msn.com/>) ou da HomeAdvisor (<http://homeadvisor.msn. com/>) (CONWAY; SLIGAR, 2002, on-line). Partindo do exposto, pode-se definir “taxonomia facetada navegacional” como um sistema de categorias, onde cada categoria possui uma hierarquia de facetas e subfacetas, cuja subdivisão obedece a um mesmo critério pré-estabelecido, permitindo atribuir diferentes dimensões (multidimensional) a um objeto. Esse sistema é organizado sob a forma de links, o que proporciona recurso de navegação e acesso, possibilitando que o usuário interaja e explore o conteúdo informacional do banco de dados, filtrando e restringindo sua busca em conformidade com sua escolha de facetas (MACULAN, 2011).
3.2 Princípios de navegação hipertextual O hipertexto (ou hipermídia) é um sistema para visualização de informações que pode conter itens tais como textos, áudio, vídeos ou imagens, ligados entre si de forma unidirecional ou multidirecional (links), de tal maneira que facilita a busca de informação. O termo “hipertexto’ foi cunhado em 1965, por Theodor Nelson, com o Projeto Xanadu (NELSON, 1999). Entretanto, considera-se o oN-Line System (NLS) como o primeiro sistema operacional de hipertexto, apresentado ao público em 1968, criado para facilitar o processo de armazenamento e recuperação de documentos em bibliotecas digitais. Conklin (1988, p.424) conceitua hipertexto como “uma janela na tela, associada com objetos em um banco de dados, e ligações [links] estabelecidas com esses objetos, graficamente (rótulos) ou em banco de dados (metadado)”. Para ser considerado hipertextual, um sistema deve permitir aos usuários navegar por nodos de informação, explorando e obtendo as informações disponibilizadas em meio digital.
GT2
700
Segundo Furtado (2010), atualmente há duas vertentes sobre o conceito de hipertexto: uma de associação de ideias e outra relacionada à conexão de ideias. A primeira mencionada considera o hipertexto como uma associação não linear de ideias, quase casual, tal como pensava Bush. A outra vertente sugere que as conexões de um hipertexto são associações controladas, condicionadas à intencionalidade da comunicação de ideias de quem o cria, geralmente visando atingir não um único usuário, mas a uma comunidade de usuários. Nessa segunda vertente, subentende-se que a liberdade de navegação do usuário de um hipertexto está limitada às associações permitidas pelo sistema e imputadas pela intenção de comunicação do designer. Adotando essa última premissa, conclui-se que em todo hipertexto há um propósito comunicativo pré-estabelecido, ainda que sua estrutura não sequencial e não linear permita escolher distintos caminhos e em diferentes ordens. Esse é o mesmo sentido de uma navegação facetada, na qual um usuário pode iniciar sua busca progressiva em qualquer ponto da taxonomia, dentre um conjunto limitado de itens e conexões. Organizado dessa forma, o banco de dados adquire a característica de um sistema hipertextual que facilita o acesso e a recuperação de informações. A estruturação de informações através de taxonomias facetadas vem sendo comparada com interfaces de busca em sites comerciais (e-commerce). Cabe ressaltar, entretanto, que do ponto de vista teórico da CI, o recurso disponibilizado nessas interfaces nem sempre pode ser denominado de navegação facetada. Para a CI, uma taxonomia facetada é uma cadeia de relações, na qual se perde a noção de ordem hierárquica. Nessa cadeia não se pode determinar a maior importância de uma faceta em relação a outra, uma vez que elas estão associadas sob diferentes tipos de relações, sugerindo o sentido de cadeia de relações multidimensional e multidirecional (MACULAN, 2011). O que se percebe em distintas interfaces de buscas em sites comerciais são informações (ou produtos) estruturadas a partir de um único aspecto (atributo), ou sob até no máximo três aspectos. Considera-se que essa característica impede ou restringe demasiadamente a visão multidimensional e multidirecional do objeto em questão, condição obrigatória para que uma navegação possa ser considerada facetada, dentro dos princípios das teorias da CI. Como exemplo de navegação facetada pode ser citado o sistema FLAMENCO (disponível em <http://flamenco.berkeley.edu/>), que destaca-se como um dos primeiros e o mais citado exemplo na literatura da área. Ele é composto por um conjunto de textos representados em um banco relacional, a partir de um modelo facetado pré-estabelecido, permitindo definir termos e criar hierarquias entre eles. No desenvolvimento da taxonomia facetada navegacional (TAFNAVEGA) houve a preocupação em aplicar uma metodologia que mantivesse esses princípios – multidimensional e multidirecional –, buscando preservar as associações já existentes entre as diferentes partes textuais dos documentos do tipo teses e dissertações.
GT2
701
3.3 Metodologia de desenvolvimento da TAFNAVEGA
A TAFNAVEGA é constituída por dez categorias fundamentais temáticas (CAFTE) e pelo algoritmo representado pela Matriz Categorial Temática para trabalhos acadêmicos (matriz), utilizada para a análise conceitual nas teses e dissertações durante o “processo de extração de conceitos”. De forma sintetizada, os procedimentos para seu desenvolvimento estão apresentados a seguir.
3.3.1 Identificando o domínio, o usuário e suas necessidades informacionais
Como primeiro procedimento para o desenvolvimento da TAFNAVEGA, identificou-se o
domínio e o usuário da BDTD, assim como as necessidades informacionais desse utente, aplicando-se
o método da teoria da análise de domínio (TAD). Esse método foi principalmente baseado nos estudos
de Hjorland e na literatura especializada sobre a comunidade científica, consistindo na realização de
quatro etapas: 1) identificação do domínio; 2) análise de dados; 3) modelagem do domínio; 4) coleta
e seleção de dados e validação. A primeira etapa, de identificação do domínio, foi concretizada a partir das seguintes indagações:
qual é o domínio? o domínio é conhecido? que tipo de informações esse domínio produz?. Para responder a essas questões houve a análise dos documentos para identificar a qual domínio ele
pertence, qual sua função dentro desse ambiente e as razões subjacentes para os fluxos de informação nesse campo (HJORLAND, 2002). Ao término das análises nessa etapa, concluiu-se que o domínio
é o programa de pós-graduação stricto sensu da ECI-UFMG, especificamente aquele que produz
documentos acadêmicos do tipo teses e dissertações. Em seguida, a etapa de análise de dados foi realizada para identificar os pontos centrais que
caracterizam o domínio, estabelecendo relações e funções entre as informações, a partir dos seguintes questionamentos: quem produz as informações identificadas na etapa anterior? com qual propósito a informação é produzida? a quem interessa o uso das informações produzidas?. Para obter respostas
a essas indagações, a análise foi baseada nas prescrições da teoria da análise de domínio (TAD) que
afirmam que o fluxo de informação é determinado no seio da comunidade de discurso, a partir da observação de quem a produz, comunica e usa. A partir disso, verificou-se que o produtor de teses e dissertações é sempre um pesquisador de carreira ou de circunstância e que, como cientista, é membro da comunidade científica. A finalidade dessa produção é ser aprovado perante uma banca de doutores (área acadêmica), dentro de um mesmo campo de conhecimento ou entre campos interdisciplinares. Considerou-se que, em sentido stricto sensu, todo pesquisador aplica procedimentos metodológicos sistemáticos, que é parte inerente de sua atividade profissional e é exigido que esteja atualizado nos temas de seu campo de atuação científica, como forma de obtenção de reconhecimento por seus pares. Na terceira etapa, de modelagem do domínio, efetivou-se a seleção dos tipos de informações mais adequados ao objetivo proposto, em conformidade com os dados identificados na etapa anterior.
GT2
702
Nessa seleção determinou-se que em atividade profissional o pesquisador necessita de informações sobre ideias, abordagens, teorias, métodos e técnicas que fundamentem e auxiliem em sua própria produção. Assim, seguindo a lógica da TAD, definiu-se: a) quem produz: a comunidade científica; b) quem comunica: as instituições (quando disponibilizam digitalmente); c) quem usa: a própria
comunidade acadêmica, representada pelo pesquisador, em atividade profissional. Deliberou-se, ainda, que a Biblioteca de Teses e Dissertações (BDTD) em questão é disponibilizada pela instituição ECI- UFMG e o serviço de informação foi desenhado para atender, prioritariamente, aos pesquisadores. Por último, na etapa de coleta e seleção de dados e validação, houve a validação da etapa anterior, utilizando a literatura especializada da área e o histórico do domínio, assim como consultas aos especialistas. A pergunta norteadora foi: quem é este “não-usuário total” a quem
o conteúdo dos trabalhos acadêmicos, do tipo teses e dissertações, pode interessar?. O termo
“não-usuário total” nesse contexto tem um sentido específico, que é o daquele usuário que não usa um serviço porque acredita que tem outros meios de conseguir a informação ou porque não está ciente de que há aquele tipo de serviço disponível para ele. Nessa etapa foram utilizadas
diferentes fontes da literatura, tais como Targino (2000), Kuhn (2006), Cunha e Cavalcanti (2008), Alvarado e Oliveira (2008), além das fontes de metodologia científica, Severino (2007), Marconi e Lakatos (2010) e Silva (2010), e de fontes oficiais que estabelecem diretrizes para os programas de mestrado e doutorado. Em resumo, as necessidades de informação do pesquisador no exercício da profissão foram identificadas como: a) temas que já foram investigados, para apreender o que já foi feito e para avançar em seu conhecimento; b) métodos e teorias utilizados nas pesquisas, com a para ampliar o conhecimento e aprimorar teorias e métodos científicos existentes; c) resultados alcançados nas pesquisas, para entender, expandir e aplicar o conhecimento científico
já conhecido, sem incorrer em retrabalhos.
Após a identificação do domínio, do usuário e suas necessidades de informação, seguiu-se com o desenvolvimento da taxonomia facetada navegacional (TAFNAVEGA), com a determinação das categorias fundamentais temáticas (CAFTE) e, depois, passando à apresentação do algoritmo utilizado para a extração de conceitos dos documentos da amostra.
3.3.2 Determinação das categorias fundamentais temáticas (CAFTE)
O conjunto CAFTE foi determinado utilizando o método da Análise de Conteúdo, com a técnica da análise categorial temática (ACT), aplicada com a proposta metodológica de Moraes (1999). Seguindo essa proposta, estabeleceu-se primeiramente o objetivo pretendido com o serviço de informação, que foi “verificar qual conjunto de conceitos é necessário para representar a estrutura textual das teses e dissertações, de forma que possa ser utilizado como categorias fundamentais temáticas na TAFNAVEGA” (MACULAN, 2011, p.102). Em seguida, para atender ao objetivo, foram executadas cinco etapas: 1) preparação das informações; 2) unitarização ou transformação do
GT2
703
conteúdo em unidades de conteúdo e de registro; 3) categorização ou classificação das unidades em categorias; 4) descrição; 5) interpretação. Na primeira etapa, de preparação das informações, foram analisados todos os documentos da amostra (41 teses e dissertações), garantindo que atendesse ao critério de representatividade dentro do domínio. O segundo passo, a etapa de unitarização ou transformação do conteúdo em unidades de conteúdo e de registro, foi um processo contínuo durante a aplicação da metodologia e do manuseio e análise dos documentos. As unidades de conteúdo (UC) e as unidades de registro (UR) foram obtidas a partir da transformação do conteúdo respeitando-se a estrutura textual dos documentos do tipo teses e dissertações (ABNT-14724, 2011) e nas seguintes fontes especializadas sobre metodologias de pesquisa: Severino (2007), Marconi e Lakatos (2010) e Silva (2010), conforme pode ser observado no QUADRO 1.
QUADRO 1 – Consolidação da estrutura textual de documentos acadêmicos
|
PARTE TEXTUAL |
SUBPARTES |
|
(unidade de contexto) |
(unidade de registro) |
|
Introdução |
Tema Tempo e espaço Problema Objetivos Justificativa Metodologia Referencial teórico |
|
Desenvolvimento |
Revisão literatura Hipóteses e variáveis Fundamentação teórica Métodos e técnicas Análise e interpretação |
|
Conclusão |
Conclusão (em relação às hipóteses e objetivos) |
Fonte: Baseado na ABNT-14724:2011, Severino (2007), Marconi e Lakatos (2010) e Silva (2010).
Essa consolidação foi utilizada como base que deu origem ao primeiro conjunto CAFTE, procedimento efetivado na terceira etapa, de categorização ou classificação das unidades de conteúdo (UC) e de registro (UR) em categorias, que está discriminado a seguir. Esse primeiro conjunto foi determinado a priori, de forma dedutiva, denominado pela técnica de análise categorial temática
GT2
704
(ACT) de “categorias iniciais”, resultando na seguinte codificação: C1.Tema; C2.Dimensão; C3.Ação; C4.Causa e efeito; C5.Fundamento teórico; C6.Métodos; C7.Coleta de dados; C8.Ponto de vista do autor/perspectiva; C9.Principais resultados alcançados. Ainda nessa terceira etapa, houve a validação do conjunto de “categorias iniciais”, a partir dos critérios prescritos pela ACT de atender às características: válidas, exaustivas e homogêneas; mutuamente exclusivas; e consistentes. Essa validação foi formulada durante toda a aplicação da técnica, até o término da etapa quatro, de descrição. Como primeiro passo da quarta etapa, houve nova validação do conjunto de “categorias iniciais”, através da descrição de cada uma das categorias, numa abordagem qualitativa, chegando-se ao seguinte conjunto e codificação, denominada pela ACT de “categorias intermediárias”: C1.Tema; C2.Ambientação; C3.Escopo; C4.Causa e efeito; C5.Fundamento teórico; C6.Métodos; C7.Coleta de dados; C8.Ponto de vista do autor/perspectiva; C9.Resultados. Em seguida, esse conjunto de “categorias intermediárias” foi novamente validado, com uma adequação semântica e terminológica, além de reformulação da ordem lógica das categorias, o que resultou no conjunto codificado de “categorias finais”, empregado na TAFNAVEGA: C1.Tema; C2.Objeto empírico; C3.Escopo; C4.Ambientação; C5.Tipo de pesquisa; C6.Coleta de dados; C7.Métodos; C8.Fundamento teórico; C9.Fundamento histórico/contextual C10.Resultados. Na quinta e última etapa, de interpretação, foi realizada uma análise interpretativa do resultado alcançado, também com uma abordagem qualitativa, comparando o conjunto final CAFTE com a literatura especializada da área. Essa comparação foi impetrada a partir da Norma NBR 14724:2011 e das fontes especializadas já discriminadas anteriormente, no que concerne à recomendação para a estrutura textual de teses e dissertações. A conclusão da interpretação indicou que o conjunto final CAFTE é a “representação simplificada” do conteúdo dos documentos, tal como apresentado por Marconi e Lakatos (2010, p.93). Percebeu-se que esse conjunto reflete as partes mais estáveis da estrutura textual do documento, transformando-se em um modelo do mesmo, fazendo prevalecer a ideia do todo do documento. Concluída a determinação das dez categorias fundamentais temáticas (CAFTE) da TAFNAVEGA, passou-se para a criação da matriz para a análise conceitual, que foi obtida a partir do desenvolvimento de um algoritmo para o “processo de extração de conceitos” nos documentos. Esse algoritmo se baseou na metodologia criada por Fujita e Rubi (2006) para o Modelo de Leitura Documentária (MLD), usado pelas autoras na indexação de artigos da área das ciências biológicas.
3.3.3 A criação do algoritmo da matriz categorial temática
No procedimento de criação do algoritmo da matriz, foi desenvolvida uma sequência de tarefas, com instruções claras e bem definidas, com o objetivo de extrair os conceitos para alimentar o conjunto final CAFTE. Esse algoritmo é composto de uma tabela adaptada do Modelo de Leitura
GT2
705
Documentária (MLD) elaborado por Fujita e Rubi (2006) e utilizando a mesma metodologia, que consiste na formulação de três colunas, apresentadas a seguir. A primeira coluna foi composta pelos conceitos representativos da estrutura textual dos documentos do tipo teses e dissertações, que é o conjunto final CAFTE (indicadas anteriormente como “categorias finais”). A segunda coluna acomodou os “questionamentos”, conforme sugerido pela norma NBR 12676:1992 e pelos princípios de análise do sistema de indexação PRECIS (FUJITA; RUBI, 2006). Os questionamentos representam a abordagem sistemática que foi aplicada durante a análise conceitual nos documentos. Na última coluna foram indicadas as partes da estrutura textual das teses e dissertações nas quais podem ser encontradas as respostas aos questionamentos da segunda coluna.
QUADRO 2 – Matriz categorial para trabalhos acadêmicos (teses e dissertações)
|
PARTE DA |
|||
|
CONCEITOS CAFTE |
QUESTIONAMENTOS (NORMA 12.676) e PRECIS |
ESTRUTURA TEXTUAL |
|
|
C1. |
RESUMO / INTRODUÇÃO (problema, justificativa, objetivos) RESUMO / INTRODUÇÃO (problema, justificativa, objetivos) / METODOLOGIA |
||
|
TEMA |
Qual o assunto de que trata o documento? |
||
|
C2. |
|||
|
OBJETO |
Qual o objeto empírico do estudo em questão? Qual objeto foi utilizado e/ou analisado na pesquisa? |
||
|
EMPÍRICO |
|||
|
O |
que pretende a pesquisa, de forma geral |
RESUMO / INTRODUÇÃO (problema, justificativa, objetivos) |
|
|
e específica, que seja relevante determinar? |
|||
|
C3. ESCOPO |
A de atender (aprimorar, avaliar, analisar, identificar, contribuir, etc.)? que objetos a pesquisa tem intenção |
||
|
C4. |
O |
tema, objeto empírico e/ou ação são |
|
AMBIENTAÇÃO
considerados no contexto de um lugar específico ou ambiente?
RESUMO / INTRODUÇÃO (problema, justificativa, objetivos) / METODOLOGIA
GT2
706
|
PARTE DA |
||
|
CONCEITOS CAFTE |
QUESTIONAMENTOS (NORMA 12.676) e PRECIS |
ESTRUTURA TEXTUAL |
|
C5. |
Tendo em vista a natureza (básica, aplicada), a abordagem (quantitativa, qualitativa), os objetivos (exploratória, descritiva, explicativa) ou os procedimentos (bibliográfica, experimental, documental, estudo de caso, pesquisa-ação, levantamento, expost- facto, participante), quais as classificações podem tipificar a pesquisa realizada? Quais instrumentos específicos (questionários, entrevistas, registros áudios- |
RESUMO / METODOLOGIA |
|
TIPO DE |
/ RESULTADOS / |
|
|
PESQUISA |
DISCUSSÃO DE RESULTADOS |
|
|
C6. |
RESUMO / METODOLOGIA |
|
|
COLETA DE DADOS |
RESULTADOS / DISCUSSÃO DE RESULTADOS / RESUMO / METODOLOGIA |
|
|
visuais, coleta de documentos, etc.) foram utilizados para realizar a ação? Quais modos específicos foram utilizados para realizar a ação (por exemplo, técnicas ou métodos para tratamento dos dados, que podem ser do tipo: modelagem estatística, análise estrutural, codificação, análise de conteúdo, indexação, análise semiótica, retórica ou de discurso)? |
||
|
C7. MÉTODOS C8. |
RESULTADOS / DISCUSSÃO DE RESULTADOS / |
FUNDAMENTO
TEÓRICO
Houve alguma corrente ou abordagem teórica específica (teorias, hipóteses, pressupostos, etc.) utilizada em função da natureza do objeto a ser pesquisado e dos objetivos pretendidos, que foram descritos na pesquisa?
RESUMO / REVISÃO DE LITERATURA / FUNDAMENTAÇÃO
C9.
FUNDAMENTO
HISTÓRICO/
CONTEXTUAL
Quais temas foram tratados e revisados, a partir de pesquisa bibliográfica, para contextualizar o tema pesquisado de forma profunda e consistente?
RESUMO / REVISÃO DE LITERATURA / FUNDAMENTAÇÃO
C10.
RESULTADOS
Quais pontos a pesquisa alcançou, levando em consideração os objetivos propostos? Houve formulação ou reformulação de teoria, criação de um método ou de um produto?
RESUMO / RESULTADOS / DISCUSSÃO DE RESULTADOS / CONCLUSÕES
Fonte: Adaptado do MLD de Fujita e Rubi (2006).
GT2
707
Com essa matriz (QUADRO 2) foi possível sistematizar a análise conceitual nas teses e dissertações, orientando e facilitando a extração de conceitos que representassem o conteúdo dos documentos, cujos termos ainda têm o papel de ser um recurso navegável.
3.4 Apreciação dos resultados alcançados
Para verificar a qualidade do algoritmo desenvolvido para a extração de conceitos foi realizado um teste que constituiu-se na análise conceitual dos resumos informativos dos documentos do corpus (41 documentos) (FIG. 1) e na implementação tecnológica (FIG. 2), com o objetivo de demonstrar a visualização da navegação pela “taxonomia facetada navegacional” (TAFNAVEGA), em meio digital. Na análise conceitual nos resumos informativos, cada resumo foi indexado pelo conjunto final CAFTE (FIG. 1).
FIGURA 1 – Processo de extração de conceitos dos resumos informativos do corpus
Fonte: Elaborado pela autora.
Com essa atividade foi possível estruturar o texto semi-estruturado das teses e dissertações. Esses textos são considerados “semi-estruturados” porque apresentam elementos estruturados, como autor, data, título da obra, títulos das seções, além de elementos não estruturados, como é o caso do resumo informativo e do conteúdo textual. Atribuir diferentes dimensões ao documento, a partir das categorias fundamentais, facilitou representar seu conteúdo de forma mais detalhada, pois permitiu segmentar as partes estruturais do texto, interligando seus teores. Ao final da análise, foram obtidos 168 diferentes termos de indexação, que alimentaram as CAFTE, categorias utilizadas na etapa da implementação tecnológica (FIG. 2). A fase tecnológica foi elaborada em conjunto com Pontes (2010), dentro do laboratório experimental do “Protótipo Mapa Hipertextual” – MHTX (LIMA, 2004). Pontes (2010) desenvolveu, em seu projeto de qualificação, um aplicativo tecnológico para implementar e avaliar mecanismos para a representação e organização
GT2
708
do acervo de uma biblioteca digital de teses e dissertações, com base na taxonomia facetada criada na pesquisa ora apresentada neste artigo.
FIGURA 2 – Mecanismo de busca utilizando a taxonomia facetada navegacional
Fonte: Extraído do protótipo desenvolvido por Pontes (2010).
Nota-se que o UNIVERSO está representado pelos 41 documentos tratados na pesquisa de Maculan (2011), juntamente com as dez categorias fundamentais temáticas (CAFTE) utilizadas para classificá-los, que aparecem no primeiro nível da estrutura facetada. Ao lado direito de cada CAFTE está indicado o número de documentos associados a elas. Esclarece-se que foi utilizada a Taxonomia da Ciência da Informação, desenvolvida por Oddone
e Gomes (2003) como instrumento de tradução para os termos indexadores. O uso dessa taxonomia se restringiu à função de controle do vocabulário, com o objetivo de permitir a compatibilização da linguagem natural empregada nos diferentes textos, principalmente solucionando problemas de sinonímias e ambiguidades. Um importante resultado alcançado foi observar quais tipos de informações e inferências são
passíveis de serem obtidas a partir da indexação das teses e dissertações utilizando a matriz. Percebeu- se que é possível coletar, por exemplo, dados sobre: 1) os temas mais recorrentes nas pesquisas dentro da área; 2) quais objetos empíricos vêm sendo empregados, demonstrando as particularidades
e interesses dos estudos, buscando entender suas motivações; 3) quais metodologias de investigação e
quais abordagens, combinações de métodos e técnicas estão sendo priorizados na área; 4) os tipos de pesquisas que prevalecem; 5) os instrumentos de coleta de dados mais utilizados, o que pode indicar o grau de envolvimento dos pesquisadores nas pesquisas. Ademais, permitiu identificar problemas tais como de resumos incompletos (95% do total), falta
GT2
709
de palavras-chave (25% do total) ou palavras-chave insuficientes e/ou inadequadas na representação do conteúdo das pesquisas. Além desses, foram verificados outros problemas nos resumos informativos, tais como de sinonímia na atribuição de palavras-chave, falta de objetividade e itens pré-textuais inseridos após o sumário. Essa constatação induziu a outra verificação que foi a do uso da matriz no auxílio à elaboração de resumos informativos, uma vez que pode orientar a sistematização das informações que devem ser apresentadas em um resumo completo e de qualidade.
4 CONSIDERAÇÕES FINAIS Todo pesquisador é também um membro da comunidade científica, que busca a aprovação de
seus pares e a visibilidade acadêmica. Em sua atividade profissional, para sua produção de pesquisa, segue procedimentos metodológicos ordenados e sistemáticos. Uma pesquisa deve, numa situação processual ideal, ser construída a partir de um conhecimento anterior. Para isso, a disponibilidade
e a facilidade de acesso aos detalhes de estudos já realizados anteriormente é crucial, tornando a
produção científica mais eficiente e menos redundante. Acredita-se, assim, que o avanço da ciência pode ser maximizado pela comunicação do conhecimento já edificado. Toda pesquisa científica é baseada em aportes teóricos sobre o tema investigado, aliado ao conhecimento sobre o “estado da arte” daquilo que deseja averiguar, tendo informação sobre os métodos e técnicas que são aplicáveis ao seu problema de pesquisa. Acaracterística semi-estruturada do conteúdo textual dos documentos do tipo teses e dissertações implica em uma dificuldade para a recuperação das informações neles contidas. As necessidades informacionais de um pesquisador, na vigência de sua investigação, incluem distintos elementos que perpassam dados sobre resultados de pesquisa, tais como teorias, métodos, instrumentos de coleta de dados ou tipos de pesquisa. Conscientes disso, ao implantar bibliotecas digitais especializadas, de teses e dissertações, as instituições de ensino devem agregar valor ao serviço oferecido disponibilizando, além de acesso digital aos documentos, recursos que possam facilitar buscar por informações específicas e detalhadas dos mesmos. Atualmente, as BDTD possuem grande quantidade de informações que podem dar subsídio ao pesquisador, mas nem sempre elas são fáceis de explorar, localizar e recuperar. A TAFNAVEGA foi criada a partir da ordenação lógica da estrutura textual de trabalhos acadêmicos, permitindo mapear e organizar o conteúdo considerado relevante para o pesquisador, em sua atividade profissional. Com a implementação desse recurso como mecanismo para a estruturação das informações contidas nas teses e dissertações é possível disponibilizar os documentos digitalmente
e também permitir a exploração de seus conteúdos. Isso pode ser conseguido através da navegação
pelas categorias e facetas da ferramenta, facilitando a busca e, consequentemente, aprimorando a recuperação da informação. A melhora é alcançada porque o usuário pode navegar pelos elementos da taxonomia facetada, escolher um aspecto sob o qual pretende efetuar sua busca e localizar a
GT2
710
informação desejada, sem que, em tempo algum, encontre um resultado vazio.
O mecanismo possui um conjunto de categorias fundamentais temáticas, que agrupam e
interrelacionam os diferentes conteúdos dos documentos. Cada categoria é composta por uma
hierarquia (taxonomia) de facetas e subfacetas, que descreve os documentos sob uma dimensão específica.
O algoritmo desenvolvido para a extração dos conceitos que alimentam as categorias
fundamentais temáticas (CAFTE) da TAFNAVEGA, é utilizado no processo de indexação do recurso informacional, tornando-o sistematizado, minimizando a subjetividade que sempre envolve a atividade de análise e indexação. Por conseguinte, a busca realizada a partir de uma taxonomia facetada navegacional permite aos usuários explorar uma grande quantidade de informações, de forma flexível, através da navegação, de modo que a sobrecarga informacional possa ser poupada. Sendo assim, o papel fundamental da TAFNAVEGA é guiar o usuário na busca, explicitando as informações referentes ao conteúdo que realmente está disponível no banco de dados.
Abstract: This paper presents the results of a research that investigated the use of navigational faceted taxonomy (TAFNAVEGA) as an instrument of organization of information in order to give consistency and standardization to informational contents of university papers. Its aim was to facilitate the access to information by the navigation through the terms of the faceted structure. The research environment was one digital library of thesis and dissertations of a specific information unit and it had as input the thesis and dissertations of the line of research Organization and Use of Information. The TAFNAVEGA is composed for ten thematic fundamental categories (CAFTE) and for an algorithm for concepts’ extraction called thematic categorical for academic works. The methodology included the use of theory of domain analysis to identify the domain, the BDTD user, and his information needs, as well as the Model of Documentary Reading, by Fujita and Rubi (2006) for the development of the category matrix for university works. The method of content analysis, with the technique of the thematic category analysis, was used for the fundamental thematic categories creation. The results demonstrated that the mechanism TAFNAVEGA can facilitated the task of exploration, search and retrieval of documents’ content, giving access to data such as theories, methods and instruments of data gathering. The conclusion indicates that this instrument helps the researcher in its professional activity and allows to greater visibility to the available content in the digital library of thesis and dissertations without information overloading.
Keywords: Navigational faceted taxonomy. Faceted navigation. Search and information retrieval. Digital library of thesis and dissertations. Category matrix for university papers.
REFERÊNCIAS
ALVARADO, Rubén U.; OLIVEIRA, Marlene. A Comunidade científica da Biblioteconomia e Ciência da Informação brasileira. Pesquisa Brasileira em Ciência da Informação e Biblioteconomia, v. 3, n. 2, 2008. Disponível em: <http://revista.ibict.br/pbcib/index.php/pbcib/article/view/1051>. Acesso em: 12 jan. 2011.
GT2
711
ASSOCIAÇÃO BRASILEIRA DE NORMAS TÉCNICAS. NBR 12676:1992; NBR 1052:2002; NBR 6023:2002; NBR 6024:2003; NBR 6027:2003; NBR 6028:2003; NBR 12225:2004; NBR 14724:2011; Métodos para análise de documentos: determinação de seus assuntos e seleção de termos de indexação. Rio de Janeiro: ABNT.
BAEZA-YATES, Ricardo; RIBEIRO-NETO, Berthier Addison-Wesley, 1999.
Modern Information retrieval. New York:
BONILLA, Maeia Helena Silveira. Escola aprendente: para além da sociedade da informação. Rio de Janeiro: Quartet, 2005.
BORKO, H.; CHATMAN, S. Criteria for acceptable abstracts: a survey of abstractor’s instructions. American Documentation, v.14, p.149-160, 1963.
BORKO, Harold. Information science: what is it? American Documentation, Washington, v. 19, n. 1,
p. 3-5, Jan. 1968.
BROUGHTON, Vanda. The need for a faceted classification as the basis of all methods of information retrieval. Aslib Proceedings: New Information Perspectives, v. 58, n. 1-2, p. 49-72, 2006.
BUCKLAND, Michel. Information as thing. Journal of American Society of Information Science, v. 42, n. 5, p. 351-360, 1991.
CONKLIN, Jeff. Hipertext: an introduction and survey. In: GREIF, Irene (Ed.). Computer-supported cooperative work: a book of reading. San Mateo, CA: Morgan Kaufmann, 1988. p. 423-476.
CONWAY, Susan; SLIGAR, Char. Building taxonomies. In:
Redmont: Microsoft Press, 2002. cap. 6.
Unlocking knowledge assets.
CUNHA, M. B. da; CAVALCANTI, Cordélia R. de O. Dicionário de Biblioteconomia e Arquivologia. Brasília, DF: Briquet de Lemos, 2008.
ELIEL, Regiane A. Institucionalização da ciência da informação no Brasil: estudo da convergência entre a produção científica e os marcos regulatórios da área. TransInformação, Campinas, v. 20,
n. 3, p. 207-224, set./dez. 2008. Disponível em: <http://biblioteca.ricesu.com.br/art_link.php?art_ cod=6347>. Acesso em: 12 abr. 2010.
FIGUEIREDO, N. M. Da necessidade de promover o uso da informação. Ci. Inf., v.6, n.1, p.75-79,
1987.
FUJITA Mariângela S. L.; RUBI, Milena P. Um modelo de leitura documentária para a indexação de artigos científicos: princípios de elaboração e uso para a formação de indexadores. DataGramaZero – Rev Ci. Inf., Rio de Janeiro, v. 7, n. 3, jun. 2006. Disponível em: <http://www.dgz.org.br/jun06/ Art_04.htm>. Acesso em: 22 abr. 2010.
FURTADO, José Afonso. Hipertexto revisited. Letras de Hoje, Porto Alegre, v. 45, n. 2, p. 31-55, abr./jun. 2010.
GIL LEIVA, Isidoro; FUJITA, Mariângela S. L.; RUBI, Milena P. Consistência na indexação em bibliotecas universitárias. TransInformação, Campinas, v. 20, n. 3, p. 233-253, set./dez. 2008.
GT2
712
HJORLAND, B. Domain analysis in information science: eleven approaches: traditional as well as innovative. Journal of Documentation, v. 58, n. 4, p. 422-462, 2002.
KUHN, Thomas S. A tensão essencial. 9. ed. Lisboa: Edições 70, 2006.
LIMA, G. A. B. O. Mapa hipertextual (MHTX) um modelo para a organização hipertextual de documentos. 2004. 199f. Tese (Doutorado em Ciência da Informação) – Escola de Ciência da Informação, Universidade Federal de Minas Gerais, Belo Horizonte, 2004.
MACULAN, Benildes C. M. dos S. Taxonomia facetada navegacional: construção a partir de uma matriz categorial para trabalhos acadêmicos. 2011. 185f. Dissertação (Mestrado em Ciência da Informação), Universidade Federal de Minas Gerais, Escola de Ciência da Informação, Belo
Horizonte, 2011.
MALHOTRA, N. K. Pesquisa de Marketing: uma orientação aplicada. 3. ed. Porto Alegre: Bookman,
2001.
MARCONI, M. A.; LAKATOS, Eva Maria. Fundamentos de metodologia científica. 7. ed. São Paulo:
Atlas, 2010.
MORAES, Roque. Análise de Conteúdo. Revista Educação, Porto Alegre, v. 22, n. 37, p. 7-32, 1999.
NELSON, Theodor Holm. Xanalogical structure, needed now more than ever: parallel documents,
deep links to content, deep versioning, and deep re-use. ACM Computing Surveys, v. 31, n. 4, Dec.
1999.
NOGUEIRA, Maria do Carmo de C. Artigos de periódicos: produção de pesquisadores de Ciência Espacial do INPE. 1997. 149f. Dissertação (Mestrado em Biblioteconomia – Planejamento e Administração de Sistemas) – Pontifícia Universidade Católica de Campinas, Campinas, 1997.
ODDONE, Nanci; GOMES, Maria Yêda F. S. de F. Uma nova taxonomia para a ciência da informação. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 5.,
Belo Horizonte, 2003. Anais
Belo Horizonte: ECI/UFMG, 2003.
PONTES, Flávio. Organização do conhecimento em bibliotecas digitais de teses e dissertações: uma abordagem baseada na classificação facetada. 2010. Qualificação de Tese (Doutorado em Ciência da Informação), Universidade Federal de Minas Gerais, Escola de Ciência da Informação, Belo Horizonte, 2010. (Pesquisa em fase de finalização).
RABELLO, Rodrigo. A face oculta do documento: tradição e inovação no limiar da Ciência da Informação. 2009. 331f. Tese (Doutorado em Ciência da Informação) – Faculdade de Filosofia e Ciências, Universidade Federal Paulista, São Paulo, 2009.
SACCO, Giovanni Maria; TZITZIKAS, Yannis (Ed.). Dynamic taxonomies and faceted search:
theory, practice and experience. Berlin: Springer, 2009.
SEVERINO, Antônio Joaquim. Metodologia do trabalho científico. 23. ed. rev. atual. São Paulo:
|
Cortez, 2007. |
|
|
GT2 |
713 |
SILVA, Antônio Carlos R. da. Metodologia da pesquisa aplicada à contabilidade: orientações de estudos, projetos, artigos, relatórios, monografias, dissertações, teses. 3. ed. São Paulo: Atlas, 2010.
SOUZA, Vanessa I. de. Indexação: teorias e práticas do corpo indexador da Universidade Federal do Rio Grande do Sul. 2009. 36f. Monografia (Especialização em Gestão de Bibliotecas Universitárias) – Faculdade de Biblioteconomia e Comunicação, Universidade Federal do Rio Grande do Sul, Porto Alegre, 2009.
TARGINO, M. G. Comunicação científica: uma revisão de seus elementos básicos. Revista Informação & Sociedade: Estudos, João Pessoa, v. 10, n. 2, 2000.
TUNKELANG, Daniel. Faceted search. Carolina do Norte: Morgan e Claypool, 2009.
TZITZIKAS, Y.; ANALYTI, A. Faceted taxonomy-based information management. In:
INTERNATIONAL CONFERENCE ON DATABASE AND EXPERT SYSTEMS APPLICATIONS, 18., 2007, Regensburg. Proceedings… Linz: DEXA Society, 2007.
VIEIRA, Simone B. Indexação automática e manual: revisão de literatura. Ci. Inf, Brasília, DF, v. 17, n. 1, 1988.
GT2
714
COMUNICAÇÃO
ORAL
TESAUROS CONCEITUAIS E ONTOLOGIAS DE FUNDAMENTAÇÃO: ANÁLISE COMPARATIVA ENTRE AS BASES TEÓRICO-METODOLÓGICAS UTILIZADAS EM SEUS MODELOS DE REPRESENTAÇÃO DE DOMÍNIOS
Jackson da Silva Medeiros, Maria Luiza de Almeida Campos
Resumo: O objetivo deste trabalho é estudar, através de análise comparativa, se as bases teóricas e metodológicas utilizadas na construção de tesauros conceituais podem contribuir para a elaboração de ontologias de fundamentação, evidenciando os elementos existentes em tesauros conceituais que
devem ser observados na construção de uma ontologia de fundamentação. O estudo se baseia na análise das bases teóricas e metodológicas utilizadas na construção de modelos conceituais de tesauros conceituais, a Teoria do Conceito, de Ingetraut Dahlberg, e a Teoria da Classificação Facetada, de Shiyali Ramamrita Ranganathan, na Ciência da Informação, e de ontologias de fundamentação, a partir da Unified Foundational Ontology (UFO-A), desenvolvida por Giancarlo Guizzardi, a qual está baseada em princípios da Filosofia e das Ciências Cognitivas para construção de seu modelo conceitual baseado em objetos (endurants). Conclui-se que a Ciência da Informação dispõe de bases teóricas e metodológicas próprias para a construção de instrumentos terminológicos, como tesauros conceituais,
o que constitui um arcabouço sólido de conhecimentos capaz de permitir que seja criada uma teoria
independente sobre um domínio. As ontologias de fundamentação detêm fortes subsídios da Filosofia
e das Ciências Cognitivas, permitindo que a estrutura real de um domínio seja representada de forma
consistente, sendo a representação detentora de uma semântica baseada no mundo real, restringindo interpretações sobre seus conceitos. As ontologias de fundamentação permitem a construção de uma teoria sobre o domínio, possibilitando testar e validar um modelo conceitual. Entende-se que este estudo contribui para deixar explícito o maior número de diferenças do que semelhanças entre estes modelos e, consequentemente, entre os instrumentos em si.
Palavras-chave: Tesauro conceitual. Ontologia de fundamentação. Organização do conhecimento.
1 INTRODUÇÃO Este trabalho, resultado de dissertação defendida junto ao Programa de Pós-Graduação em Ciência da Informação da Universidade Federal Fluminense, objetiva a análise comparativa dos elementos constituintes dos formalismos de representação de modelos conceituais de construção de tesauros conceituais e ontologias de fundamentação. Parte da noção de que a construção de modelos conceituais está diretamente ligada à representação do conhecimento e estes devem ser capazes de representar um contexto, sendo construídos a partir de processos que evitem qualquer tipo de ambiguidade, ressaltando objetos relevantes ao domínio, além de seus relacionamentos e atributos, e removendo da representação os objetos que não sejam importantes para sua consistência em relação à realidade.
GT2
715
Na Ciência da Informação, a representação de domínios do conhecimento é responsável pela organização e recuperação de conhecimento registrado. Com a necessidade cada vez maior de recuperação de informações de forma consistente, deve-se levar em conta os processos teóricos e metodológicos que permitem desenvolver modelos capazes de organizar e representar conhecimento. A partir da constatação de questões referentes à organização e representação do conhecimento,
a Ciência da Informação vem trabalhando questões teóricas e metodológicas capazes de fornecer bases para a construção de modelos conceituais e, consequentemente, sistemas de organização e representação do conhecimento – como os tesauros conceituais –, permitindo que modelos sejam
organizados a partir de conceitos e categorias, garantindo a durabilidade do sistema ao comportar sua atualização. Isto está pautado em questões que tratam o conceito, a partir dos estudos de Ingetraut Dahlberg (1978a, 1978b), além de trabalhar com a categorização dos mesmos, baseados na Teoria da Classificação Facetada, de Shiyali Ramamrita Ranganathan (1967). No que tange a Ciência da Computação, seu foco representacional é a possibilidade de realizar comunicação entre sistemas. Nos últimos anos, porém, houve investigações no sentido de permitir modelar parte de um domínio tendo como base teorias independentes, como as ontologias de fundamentação (GUIZZARDI, 2005), parecendo-nos importante para a elaboração de modelos conceituais, aplicando teorias filosóficas e cognitivas neste processo e fornecendo princípios ontológicos para classificação de conceitos. Desta forma, visando atender aos objetivos acima expostos, este trabalho apresenta uma discussão sobre tesauros conceituais e ontologias de fundamentação visando identificar semelhanças
e diferenças entre seus modelos conceituais.
2 TESAURO CONCEITUAL
O tesauro conceitual, como modelo de organização e representação do conhecimento, utiliza
critérios das linguagens documentárias verbais aliadas a um sistema de classificação facetada. Com isso podemos dizer que é fruto de um método próprio para sua construção, levando em conta a Teoria da Classificação Facetada e a Teoria do Conceito. Isto posto, entendemos um tesauro conceitual como um tipo de tesauro que está baseado no conceito, como unidade representacional, e na categorização, como organizadora do conceito em um sistema de conceitos (CAMPOS; GOMES, 2008). Sabe-se que as questões relacionadas aos problemas do termo seguiam sendo enfrentadas na construção de
tesauros até o final dos anos 1970, vindo a apresentar soluções, a partir dessa época, com a Teoria do Conceito (1978a), proposta por Ingetraut Dahlberg.
O tesauro conceitual é formado por uma parte alfabética, onde os termos são apresentados na
forma alfabética com as especificações das relações existentes entre eles, e uma parte sistemática onde os conceitos se apresentam no modelo conceitual do tesauro conceitual. Além disso, esses tesauros se preocupam com o conteúdo conceitual dos termos, o que destaca a importância das definições de cada conceito. Considera-se, assim, conceito como uma “unidade de conhecimento” (DAHLBERG, 1978a).
GT2
716
A Teoria do Conceito, apresentada por Ingetraut Dahlberg em 1978, permite maior compreensão do conceito, fornecendo “bases seguras tanto para o estabelecimento de relações, como para a sua realização no plano verbal, ou seja, a determinação do que se denomina termo” (CAMPOS, 2001b, p. 87). Em conjunto com a Teoria da Classificação Facetada, a Teoria do Conceito contribui “para a elaboração de tesauros conceituais porque estabelecem bases para identificação dos conceitos, dos termos e das relações entre eles, e, ainda, para sua ordenação sistemática” (CAMPOS; GOMES, 2006, p. 349). Em síntese, os elementos do tesauro conceitual, que tem como bases teórico-metodológicas a
Teoria do Conceito e a Teoria da Classificação Facetada, são: (a) categorias e classes, que estabelecem
a ordenação lógica e hierárquica dos conceitos; (b) os conceitos, representados pelos termos; (c)
relações entre os conceitos, ou seja, sua ligação; e (d) definições, que, bem constituídas, permitem posicionar um conceito em um sistema de conceitos. Visando maior clareza quanto à explicitação destes elementos, eles serão apresentados a partir de agora na perspectiva de que sua organização estabeleça uma rede entre estes elementos. Como já foi mencionado, o tesauro conceitual é formado por uma parte sistemática e uma parte alfabética. Para este trabalho, a parte sistemática desempenha função primordial, uma vez que
é onde está situado o modelo de representação. Este modelo de representação é formado pelas teorias
que vão suportar sua construção – Teoria da Classificação Facetada e Teoria do Conceito. No tesauro conceitual, a Teoria da Classificação Facetada foi utilizada para fornecer diretrizes para a organização dos conceitos em um domínio, permitindo que o tesauro apresente os conceitos de forma sistemática, como uma estrutura conceitual. Nesta medida, apesar de não apresentar princípios gráficos de representação, esta teoria proporcionou um modo de apresentação mais estruturado do que uma simples lista alfabética. A necessidade de organização de classes requer princípios para o seu estabelecimento, e Ranganathan, através de sua teoria, provê subsídios para que esta estruturação seja realizada. Deste modo, é importante observar alguns princípios para a classificação dos conceitos em um sistema hierárquico (CAMPOS; GOMES, 2008): (a) categorização: fornece regras para a apresentação sistemática a partir do pensar sobre um domínio, atuando de forma indutiva (bottom-up) para a criação das categorias gerais dos conceitos; (b) cânones: princípios para a organização de classes (por estar trabalhando com conceitos, atua no Plano Ideacional), atuando nas categorias; e (c) princípios:
ordena as classes e os objetos. Como método de organização é posta a formação de classes, e dentro destas, os renques
e cadeias. Renques, também chamados de arrays, são subclasses em que seus conceitos têm uma
característica em comum e que os subordinam a uma superclasse, criando uma série horizontal. Cadeias são séries verticais de conceitos onde cada conceito tem um atributo, uma característica a mais ou a menos, apresentando-se na forma vertical. Uma vez que Ranganathan estabelece renques e cadeias para uma estruturação classificatória, apresenta cânones que regem a criação dessas estruturas,
GT2
717
bem como as características e sua sucessão, além de regras para a sequência de filiação. No que se refere ao conceito, unidade de representação nos tesauros conceituais, Dahlberg desenvolve seus estudos apoiada na área da Teoria Geral da Terminologia, apesar de propor definição diferenciada de Eugene Wüster sobre o conceito. Para a Teoria Geral da Terminologia e a norma ISO 704, um conceito é uma “unidade de pensamento”, ou ainda um “constructo mental”. Unidades de pensamento ou constructos mentais, como ressalta Dahlberg (1978b), apontam para a construção individualizada do conceito, dando a entender que esse esteja presente apenas na mente de cada indivíduo e seu compartilhamento seja impreciso, propondo, assim, que pensemos o conceito como “unidade de conhecimento”, esta sim podendo ser compartilhado por uma comunidade que estabelece um acordo sobre sua significação. Conceitos podem ser individuais ou gerais. Para o entendimento destes, partimos dos objetos individuais e gerais. Objetos individuais são aqueles existentes, realmente, no tempo e no espaço, assim, são exclusivos e apresentam características que os distinguem dos demais. Os objetos gerais, por sua vez, estão situados fora do tempo e do espaço, podendo ser considerados como as generalizações dos objetos individuais. A capacidade humana de realizar asserções sobre objetos permite que se crie enunciados sobre eles. É com base nos enunciados sobre objetos que podem ser elaborados conceitos. Neste ponto abordamos a questão dos elementos dos conceitos que, em sua composição a partir de afirmações verdadeiras, fornecem as características. Características, segundo Dahlberg (1978b), são propriedades dos objetos, mas, importante ressaltar, ao nível dos conceitos. Podem ser descritos como atributos predicáveis de um objeto. Na formação do conceito são distintos dois tipos de características: (i) essenciais ou necessárias 17 e (ii) acidentais. Estas características dos conceitos serão utilizadas para a ordenação dos conceitos, sua definição e, em última instância, a determinação dos nomes dos conceitos. Assim, quando conceitos diversos possuírem características – de qualquer espécie – em comum, existe algum tipo de relação entre eles. As relações são responsáveis pela ligação entre conceitos, permitindo que, através de uma rede conceitual criada seja possível identificar conceitos que possuem características em comum e/ou as compartilham com outros conceitos. As relações entre conceitos, como distintas em Dahlberg (1978a, 1978b), podem ser divididas em relações quantitativas e qualitativas. A primeira busca comparar dois conceitos distintos de acordo com uma visão formal, ou seja, de acordo com a quantidade e similaridade de características dos conceitos. Assim, pode ser classificada da seguinte maneira: (i) identidade de características; (ii) inclusão de características; (iii) intersecção de características e; (iv) disjunção de características.
17 Características essenciais ou necessárias são aquelas que definem um conceito, ou seja, o diferem de qualquer outro conceito.
Características acidentais não são características definidoras do conceito, ocorrendo neste sem influenciar em sua definição.
GT2
718
A primeira observa se as características existentes em dois conceitos são idênticas. Na segunda,
as características de um conceito aparecem em sua totalidade nas características de outro conceito. Na
terceira existe a sobreposição de características. Na relação de disjunção de características, por fim, as características entre conceitos são completamente diferentes. Já as relações qualitativas permitem que sejam observados os aspectos formais e materiais dos conceitos, constituindo o sistema de conceitos (CAMPOS, 2001a). Esses tipos de relações podem ser divididas em: (i) formal/categorial; (ii) material/paradigmática e; (iii) funcional-sintagmática.
A relação formal/categorial depende do item de referência escolhido e é baseada no processo
de categorização do mesmo, isto é, constitui as categorias de um domínio (DAHLBERG, 1978b) ou,
nas palavras de Campos (2001a), “a partir da análise do conceito as características essenciais levam
à mesma categoria”.
A noção de categorias é abordada na Teoria do Conceito sob dois enfoques: primeiramente
como um recurso para o entendimento da natureza dos conceitos analisados; em segundo lugar,
categorias permitem a formação de estruturas conceituais. Ambos os enfoques não são mutuamente
categorias
exclusivos na visão de Dahlberg, sendo vistos como complementares. Desse modo “[
têm uma capacidade de estruturação: não apenas estruturar todos nossos elementos de conhecimento
e unidades de conhecimento, elas fornecem, ao mesmo tempo, através deste meio, o esqueleto, os
ossos e os tendões para a estruturação de todo nosso conhecimento”. (DAHLBERG, 1978a, p. 34).
A relação material-paradigmática depende da categoria fundamental do objeto do conceito,
ou seja, organiza os conceitos dentro de determinada categoria. Pode ser subdivida em (i) relação hierárquica, (ii) relação de partição e (iii) relação de oposição.
A relação hierárquica existe quando dois conceitos apresentam características iguais, sendo
que um dos conceitos possui uma ou mais características diferenciáveis, ou seja, está “baseada na relação lógica de implicação”. Esta pode ser subdividida em outros dois tipos de relações hierárquicas,
relação gênero/espécie ou abstração/especificação e relação lateral (relação renque ou horizontal) 18 . A relação partitiva é existente entre o todo e suas partes, onde o último também pode ter partes e as partes podem ser relatadas em cada outra parte. Assim sendo, o conceito de todo pode incluir suas próprias características e características de suas partes. A relação de oposição mostra contrariedade entre os conceitos, ou seja, se características de certos conceitos expressam uma relação de oposição,
a relação pode ser transferida para estes conceitos. A relação funcional-sintagmática – onde estão
colocadas as relações associativas – permite que algumas características possam ser identificadas, a partir de processos ou operações. São exemplos: instrumentalidade, condição, co-ocorrência, lugar, causalidade, modalidade, resultado, tempo, finalidade, potencialidade, etc. (DAHLBERG, 1978b).
Ressalta-se aqui a importância das questões sobre definição, pois os tesauros conceituais se
]
18 A relação gênero/espécie cria, como o próprio nome leva a considerar, conceitos genéricos e específicos, ou seja, conceitos
amplos e restritos, respectivamente. A relação lateral cria conceitos na forma de renque, ocorrendo quando dois ou mais conceitos possuem as mesmas características, mas diferem em uma característica que seu termo genérico não possui e compartilha (DAHLBERG,
1978b).
GT2
719
preocupam com o conteúdo conceitual dos elementos de um domínio. Assim, é válido ressaltar sua importância, uma vez que a construção de um tesauro conceitual depende do estabelecimento de
definições e explicações bem constituídas sobre os conceitos, possibilitando a classificação clara
e objetiva dos conceitos ali existentes. Isto, segundo Campos (2001a), possibilita uma ordenação
sistemática consistente de conceitos, permitindo, além de um entendimento objetivo do conceito, melhor relacioná-lo com outros conceitos. As definições proporcionam, segundo Dahlberg (1978a), o correto e preciso uso do conceito e seus termos nos discursos a partir do conhecimento sobre o que ele é e qual sua intensão, ou seja, é a soma das características do conceito, e é representada pelos termos.
3 ONTOLOGIA DE FUNDAMENTAÇÃO
As ontologias de fundamentação são desenvolvidas para fornecer subsídios para a criação de modelos conceituais independentes de domínio, estando baseadas em categorias ontológicas, como objetos, processos, eventos, entidades sociais, tempo, espaço, propriedades, relações, fases, papéis, situações, entre outras. A ideia é que, a partir do uso de categorias, essas ontologias forneçam uma estrutura axiomatizada e, por assim dizer, restritiva para o desenvolvimento de outras ontologias baseadas na modelagem conceitual. Guizzardi (2005), no entanto, relata que a literatura apresenta debate sobre o significado das categorias a serem utilizadas em modelagem conceitual, e propõe uma teoria, pautada na Filosofia e nas Ciências Cognitivas, em que os universais sejam definidos para modelagem conceitual. Essa teoria seria organizada em uma estrutura taxonômica elaborada de acordo com a tipologia dos universais, combinadas às restrições impostas por axiomas. A construção de uma ontologia de fundamentação é apresentada e discutida exaustivamente a
partir da proposta de uma teoria – que, por sua vez, engloba diferentes teorias –, em Guizzardi (2005). Em sua tese de doutorado, Guizzardi apresenta a construção de uma ontologia de fundamentação, denominada Unified Foundational Ontology (UFO), para o apoio a modelagem conceitual. Esta ontologia é dividida em três fragmentos: (i) UFO-A, responsável por modelar objetos (endurants)
e suas propriedades; (ii) UFO-B, que diz respeito aos eventos (perdurants); e (iii) UFO-C, que
identifica entidades sociais e intensionais. A partir destes elementos que, em essência, constituem- se na divisão geral de categorias nestes fragmentos do modelo, como consta na literatura, buscam agrupar conceitos e categorias gerais que, apoiados por uma ontologia de fundamentação, subsidiam
a modelagem conceitual. A distinção entre objetos e processos, para fins deste trabalho será evidenciada. Basicamente, endurant (também chamado de thing e continuant) são as coisas, os objetos, suas propriedades; perdurants são os eventos, processos, etc. Pelas propriedades inerentes aos objetos (no caso dos endurants) e dos eventos (no caso dos perdurants), pode-se notar que a questão da permanência de identidade ao longo do tempo é o foco de distinção desses conceitos. Guizzardi (2005) diz que no caso
GT2
720
dos endurants, eles “são no tempo”, enquanto no caso dos perdurants, eles “acontecem no tempo”. Neste estudo, trabalharemos especificamente com a UFO-A, detalhada em Guizzardi (2005), sendo esta pautada em objetos (endurants), a fim de evidenciar nossa comparação entre os elementos que constituem os formalismos dos modelos de representação tanto de tesauros conceituais como de ontologias de fundamentação. A partir de agora serão apresentados os elementos, as categorias presentes nesta ontologia de fundamentação, tomando por base o trabalho Ontological foundations for structural conceptual models de Guizzardi (2005). Visto a razoável complexidade que a abordagem de modelagem fornecida pela UFO-A apresenta, advinda, principalmente, de noções filosóficas, ressaltamos que estes pontos serão tratadas de forma resumida ao longo da seção, visando elucidar os elementos da ontologia de fundamentação. Uma vez que a UFO-A é uma ontologia que pretende fornecer maior nível semântico do mundo para a modelagem conceitual de dado domínio de conhecimento, aborda questões como (a) noções
de tipos e suas instâncias; (b) objetos, e suas propriedades intrínsecas; (c) a relação entre identidade e classificação; (d) distinções entre tipos e suas relações; (e) relações parte-todo (GUIZZARDI, 2005), além de possuir elementos como classes, propriedades, relacionamentos e regras. Devemos, inicialmente, esclarecer que a UFO-A faz um primeiro recorte entre os objetos distinguindo-os em universals e individuals. Universals são entidades que comportam um conjunto de características seguindo padrões gerais, agrupando diferentes individuals e, por consequência, apresentando instâncias. Individuals, por sua vez, dizem respeito a coisas, entidades que existem
e mantêm identidade única, ou seja, são as instâncias. Para melhor explicação dos elementos da
UFO-A, estes serão apresentados a partir de sua classificação proposta na estrutura taxonômica da ontologia de fundamentação, ou seja, em universals e individuals. Antes, porém, é importante apresentar algumas noções filosóficas básicas como identidade, rigidez e dependência, visando melhor compreensão dos elementos da UFO-A, uma vez que estas noções são de importância ímpar na identificação de entidades em um domínio. Identidade é a propriedade determinante do objeto, a especificação do que a coisa realmente
é, ou seja, ao analisar duas entidades, as quais exibem propriedades diferenciadas, diz se estas podem
ser consideradas como sendo as mesmas. A noção de rigidez diz que uma coisa é rígida quando ao
longo do tempo é aplicável a todas as instâncias que dela derivam. Em outras palavras, rigidez diz que uma coisa é realmente aquela coisa em qualquer mundo possível. Dependência vai existir, como
o próprio nome denota, a partir da existência de uma coisa estar condicionada à existência de outra (GUIZZARDI, 2005). A noção de dependência pode compreender a seguinte forma: universals e individuals que necessitam de outras entidades para existir são chamados moments. De modo inverso, universals
e individuals que não dependem de outras entidades são conhecidos como substantials. Exemplos
de moment individuals são: uma cor, uma carga elétrica e um sintoma e exemplos de substantial
GT2
721
individuals são: uma mesa, uma pessoa, uma cadeira. A relação de dependência pode ser utilizada, em conjunto com a relação de inerência – por
exemplo, a inerência “cola” a carga em um condutor específico – para diferenciar intrinsic moments
e relational moments (relators). O primeiro depende de um único individual, como uma cor, uma dor
de cabeça. O segundo tem sua existência condicionada à existência de duas ou mais entidades, como, por exemplo, um casamento, um aperto de mão, um beijo. Uma abordagem para modelagem da relação existente entre intrinsic moments e suas representações em estruturas cognitivas humanas é apresentada na teoria dos espaços conceituais, proposta por Gardenfors (2004), sendo esta teoria baseada na noção de quality structure. A ideia
é que, de modo geral, em vários moment universals perceptíveis ou imagináveis há uma estrutura
de qualidade associados na cognição humana. Por exemplo, altura está associada a uma estrutura unidimensional com ponto zero e contagem não negativa. Outras propriedades, como cor e sabor estão relacionadas a estruturas multidimensionais. Este ponto exato percebido pode ser representado em uma quality structure é nomeado quale. Essas estruturas são exemplos de abstract particulars (moments) (GUIZZARDI, 2005). Tendo mostrado como a UFO-A trata individuals, passamos agora a descrever universals nesta ontologia de fundamentação. Universals podem ser classificados em substancial universal ou moment universal. Um substantial, como já foi abordado acima, é uma entidade que mantém sua identidade no tempo, sendo existencialmente independente de qualquer outra entidade. Um moment, ao contrário, não é parte da essência do objeto, assim, pode apenas existir a partir da existência (dependência) de outra entidade. Os substantial universals podem ser classificados em sortal universals ou mixin universals. Sortal universal é uma entidade que carrega um princípio de identidade para suas instâncias, permitindo observar se duas entidades são as mesmas a partir de características fornecidas. Mixin universal, por sua vez, agrega conceitos de diferentes características e identidades. Com isso, entendemos que estes conceitos podem ser considerados classes que agregam entidades, ainda que de essência diferenciada (GUIZZARDI, 2005). Neste ponto é importante rever a noção de rigidez, para então compreender anti-rigidez e não-rigidez. Em relação a um substancial universal, dizemos que ele é rígido quando uma entidade classificada dentro dele é uma instância durante todo tempo em que o substantial universal existir, independente do mundo a que é aplicado. Um substantial universal é anti-rígido se a entidade instanciada a ele puder deixar de existir ao longo de sua existência, assim, não é aplicável a totalidade de instâncias do universal. Já o substantial universal não-rígido será aplicável a pelo menos uma de
suas instâncias. Rigid sortals são o kind e o subkind. Anti-rigid sortals são o phase e o role. Rigid mixin é o category. E non-rigid mixin são o rolemixin e o mixin. Kind representa um sortal substantial que fornece um princípio de identidade para suas instâncias, sendo responsáveis pela estruturação da taxonomia representante do domínio. Kinds
GT2
722
podem ser especializados em outros subtipos rígidos que herdam o princípio de identidade e são chamados subkinds 19 . Phase e role são sortals anti-rígidos. Phases são constituídos de partes temporais ou são representados em determinado mundo, caracterizando-se, como o próprio termo indica, uma fase passageira de um universal. Role é um processo, função executada por uma entidade em determinado contexto ou por um período de tempo. É exemplo de phase a adolescência e de role ser empregado. Category é um rigid mixin. Esta categoria engloba entidades de espécies diferentes, com características essenciais em comum. Rolemixins são constituídos por propriedades comuns abstraídas de papeis. Um mixin agrega propriedades que são essenciais para algumas instâncias e acidentais para outras. Por exemplo, ter a propriedade de ser “sentável” é um mixin, visto que esta pode ser uma característica tanto de uma cadeira quanto de uma caixa sólida. Para que possam existir ligações entre as categorias há relações a serem descritas. As relações entre entidades são também consideradas entidades, podendo ocorrer de duas formas: relações formais (formal relations) e relações materiais (material relations). Nas relações formais a relação entre entidades é direta, ou seja, não possui intermediário, sendo representada pelas relações como instanciação, parte-todo, membros, associação, etc. Como relações formais podem ser incluídas, também, as relações de comparação, como maior que, mais alto que, passando a se chamar relações formais comparativas. Já as relações materiais mantêm uma entidade (relator) como intermediária, sendo ele um individual que permite conectar entidades. Como buscamos mostrar, a complexidade que envolve o modelo da ontologia de fundamentação UFO-A nos permite compreender categorias gerais independentes de domínio para modelagem. Tal complexidade ocorre devido ao fato da ontologia de fundamentação buscar a representação de um modelo dinâmico de domínio e, para isto, possuir um arcabouço de conceitos que visam expressar uma realidade da forma mais fiel possível.
4 ANÁLISE COMPARATIVA ENTRE OS MODELOS CONCEITUAIS DE TESAUROS CONCEITUAIS E ONTOLOGIAS DE FUNDAMENTAÇÃO
O método comparativo visa permitir a utilização da comparação como um procedimento sistemático e organizado onde é possível estabelecer relações, semelhanças e diferenças entre objetos ou fenômenos, com a finalidade de concluir algo, sendo a análise dos objetos adaptáveis a cada caso de pesquisa, sem fuga do objeto em favor de qualquer rigidez estabelecida pelo método de trabalho escolhido. Estamos, nesse sentido, privilegiando o processo (comparativo) mais do que o modelo em si. Isso permite evidenciar aspectos que ocorrem mutuamente nos dois modelos, sem, no entanto, deixar de apresentar nosso entendimento sobre os atributos que aparecem em apenas um ou outro. Realizou-se, deste modo, a análise comparativa a partir da observação dos elementos dos
19 Em modelagem conceitual, subkind é, geralmente, suprimido, sendo utilizado kind.
GT2
723
modelos conceituais dos instrumentos, com base no que consideramos um modelo de observação de princípios construído por Campos (2004) – Modelização de domínios de conhecimento: uma investigação de princípios fundamentais –, com base em elementos que constituem: (a) o método de raciocínio; (b) o objeto de representação; (c) as relações entre os objetos e; (d) as formas de representação gráfica. A utilização deste modelo de observação de elementos advém da ideia da agregação de modos de pensar a representação de domínios, possibilitando tomar uma “postura teórico-metodológica que dê condições ao modelizador de ultrapassar modelos específicos de representação e pensar nos princípios subjacentes ao processo de modelização” (CAMPOS, 2004, p. 25). Constatamos, observando o modelo de agregação proposto por Campos (2004), que sua estrutura nos parece capaz de compreender os elementos passíveis de comparação neste estudo, abarcando elementos da Ciência da Informação e da Ciência da Computação na construção de tesauros conceituais e ontologias de fundamentação 20 , respectivamente. O método de raciocínio pretende compreender a sistematização utilizada de como olhar o domínio, compreendendo a construção de modelos a partir dos métodos dedutivo e/ou indutivo. O objeto de representação, por sua vez, é considerado, em geral, como a menor unidade de manipulação/ representação de um dado contexto. As relações entre os objetos permitem que seja observada a estrutura do contexto em que os objetos estão inseridos, sendo possível identificar tipos de relações e como elas ocorrem nas relações entre os objetos. As formas de representação gráfica, por fim, permitem que o modelo conceitual seja visto como um espaço comunicacional em que transpomos o mundo fenomenal para um espaço de representação.
4.1 Elementos comparáveis entre os modelos conceituais do tesauro conceitual e da ontologia de fundamentação: o método de raciocínio, o objeto de representação, as relações entre os objetos e as formas de representação gráfica
No que diz respeito ao método de raciocínio, a construção de tesauros conceituais conta, basicamente, com o aporte de duas teorias na Ciência da Informação: a Teoria da Classificação
Facetada e a Teoria do Conceito. Como visto anteriormente, a Teoria da Classificação Facetada visa
o estabelecimento de categorias gerais a partir do olhar sobre um domínio, deixando a compreensão dos objetos que as constituem para um momento posterior. A Teoria do Conceito, por outro lado, compreende um modo analítico-sintético de conhecer o domínio, sendo “uma metodologia híbrida
|
[ |
] |
agregando [o método dedutivo e indutivo] em um exercício de pensar o particular como um todo |
|
e |
o todo possuindo particulares” (CAMPOS, 2004). |
|
20 Cabe lembrar, apenas para fins de esclarecimento, que a ontologia de fundamentação está plenamente baseada na ontologia
formal, esta analisada por Campos (2004).
GT2
724
A ontologia de fundamentação se utiliza da indução como método de raciocínio, ou seja, parte da observação dos objetos no mundo (particulares/individuais) para chegar aos universais. Deste modo, apesar de possuir princípios para descrição de metaníveis de objetos em um domínio (universais), não utiliza esta classificação como um mecanismo inicial para a organização dos objetos em um contexto (CAMPOS, 2004, p. 26). Isto permite que a observação dos elementos evidencie uma estrutura conceitual que revele a real constituição dos mesmos bem como suas relações, já que a partir de uma perspectiva filosófica realista o modelo conceitual gerado é um modelo da realidade. No que se refere ao objeto de representação, ele é a menor unidade de representação de um contexto. A Ciência da Informação, a partir da Teoria do Conceito, admite a existência de conceitos propriamente ditos, sendo este composto pelo referente – o objeto –, suas características e um nome que o designa. Na Ciência da Computação, a partir da ontologia formal, os objetos, ou particulares, são classificados como endurants (contínuos) ou perdurants (ocorrentes). Os endurants são objetos/ entidades, enquanto o perdurants são eventos/ações. Apesar dos tesauros conceituais não possuírem tal classificação, os conceitos que os constituem são também objetos/entidades, eventos/ações, entre outras categorias de conceitos. Para a construção de tesauros conceituais, a Ciência da Informação trata o conceito como unidade de representação, sendo composto pelo referente, suas características predicadas e um nome ou termo. Este referente é um objeto no mundo, alguma coisa que realmente existe, sendo classificado como objeto geral ou individual. Note-se que no tesauro conceitual o objeto que se conceitua é o objeto geral, embora o conhecimento conceitual do objeto geral possa ser obtido através da análise de objetos individuais. É importante lembrar que a norma ANSI/NISO (2005) contempla a relação de instanciação. Ora, a referida norma designa um tipo de entidade que pode ser representada em tesauros conceituais, a instância (objeto individual, em Dahlberg). A ontologia de fundamentação está pautada no trabalhar com objetos de representação a partir de uma visão Aristotélica de mundo, estabelecendo a existência de categorias gerais que podem ser usadas de forma a estruturar modelos da realidade, sendo, assim, passíveis de representação. Deste modo, o modelo formal construído permite o “raciocínio” sobre estes elementos e a representação da ontologia de fundamentação deve começar a partir de sua distinção ontológica dos elementos que serão representados. No que tange às relações entre objetos, para a construção de modelos conceituais de tesauros conceituais, os conceitos estão relacionados entre si porque existem características comuns entre eles. As características são, assim, essenciais para a construção de relações e o posicionamento do conceito em um sistema de conceitos. Essas características permitem que seja observada a essência do conceito, uma vez que a descrição de características essenciais de um objeto permite sua identificação conceitual, formando, como ressalta Campos (2004), a estrutura conceitual do contexto. As relações existem tanto em tesauros conceituais quanto em ontologias de fundamentação. Aqui esboçaremos um comparativo de forma a caracterizar as relações existentes em tesauros
GT2
725
conceituais que também são previstas em ontologias de fundamentação, sem, no entanto, deixar de perceber que as relações existentes em ontologias de fundamentação são de uma variedade extremamente maior. As relações propostas por Campos (2004) para a modelagem de domínios de conhecimento utilizadas em tesauros conceituais que podem apresentar semelhança com relações na ontologia de fundamentação são: (a) relação categorial; (b) relação hierárquica; (c) relação partitiva e; (d) relação funcional-sintagmática 21 . Chegando, por fim, às formas de representação, pode-se verificar que a Ciência da Informação destina teorias e metodologias consistentes e utilizadas desde muito tempo para a modelagem de domínios, mas as possibilidades de manifestações gráficas são pouco desenvolvidas. A ontologia de fundamentação, em específico no caso deste trabalho a UFO-A, tem explorando o ferramental tecnológico para constituição taxonômica de elementos que compõem um domínio, desenvolvendo aparatos capazes de projetar visualmente a constituição do domínio 22 .
4.2 Elementos não comparáveis entre os modelos conceituais do tesauro conceitual e da ontologia de fundamentação
Nesta seção apresentaremos os elementos não comparáveis entre os modelos conceituais apresentados, os quais serão divididos pelos instrumentos, a saber: tesauro conceitual e ontologia de fundamentação.
4.2.1 Tesauro conceitual Como foi explicitado anteriormente, os elementos que constituem o tesauro conceitual são:
(a) categorias e classes; (b) conceitos; (c) relações e; (d) definições. As categorias e classes são responsáveis pela estruturação do domínio, os conceitos como objeto de representação e as relações indicam as ligações entre os elementos do domínio. Entende-se que o principal elemento do tesauro conceitual que deveria ser observado com maior cuidado na construção de ontologias é a definição. No entanto, como ressalta Campos (2010), as abordagens teórico-metodológicas para a construção de ontologias ainda ficam aquém do ideal de utilização, haja vista que não contemplam de forma satisfatória a identificação de conceitos e suas relações, tampouco o estabelecimento de definições sobre os conceitos. A importância da definição está na evidência de características dos conceitos, possibilitando seu posicionamento em um sistema de conceitos. Isto se consegue através da manifestação de características do objeto e sua função em um contexto, bem como na evidência do que o objeto
21 Devido à extensão do desenrolar sobre o tópico de relações existentes, e o espaço máximo destinado para este trabalho,
optamos apenas por citar os relacionamentos existentes. A versão completa pode ser consultada em Medeiros (2011).
22 Uma vez que nosso intuito é estabelecer os elementos existentes nos modelos conceituais dos instrumentos analisados, não
cabe analisar a forma de representação gráfica desenvolvida por uma ou outra área, mas compreender que a Ciência da Computação, a partir da utilização de seu arcabouço de tecnologia da informação, está largos passos à frente da Ciência da Informação neste processo de desenvolvimento.
GT2
726
realmente é, ou seja, sua natureza. É necessária a explicitação de características que indiquem o gênero mais próximo e a diferença específica do conceito, seus componentes ou etapas e sua aplicação em contexto. Deste modo, podemos conceder à definição bem elaborada de objetos presentes em tesauros conceituais um status de fundamental importância que deve ser trabalhada na construção de ontologias, estabelecendo, como menciona Dahlberg (1983), as unidades de conhecimento e explicitando características necessárias através de predicações de um referente. Deste modo, segundo Dahlberg (1983), a definição de conceitos envolve: (a) referentes dos
conceitos; (b) a(s) categorias a(s) qual(is) pertence(m) um conceito; e (c) a expressão verbal adequada
a certo número de usuários. Deve-se, então, para conhecer o conceito, relacionar enunciados sobre
os conceitos, identificando suas características. As informações sobre categoria(s) identificam os gêneros a que o conceito pertence, sendo, por último, importante conhecer a expressão verbal a ser utilizada.
4.2.2 Ontologia de fundamentação
Uma ontologia de fundamentação compreende o fornecimento de um nível semântico superior para a modelagem de um domínio. Assim sendo, trata da concepção filosófica empregada para a representação do domínio em questão e, como anteriormente observado, lida com questões como (a) a relação entre identidade e classificação; (b) noções de tipos e suas instâncias; (c) objetos, e suas
propriedades intrínsecas; (d) distinções entre tipos e suas relações; (e) relações parte-todo, bem como classes, propriedades, relacionamentos, valores e regras. A ontologia de fundamentação, por sua natureza filosófica, detém conceitos explícitos desta disciplina, como identidade, rigidez e dependência, por exemplo, enquanto, na construção de tesauros conceituais, conceitos semelhantes estão implícitos na construção das Teorias do Conceito e da Classificação, funcionando como uma organização hierárquica de estruturas conceituais em tesauros
e ontologias, respectivamente. A estruturação taxonômica dos conceitos utilizados para a construção de uma ontologia a partir
da abordagem adotada pela UFO-A indica a relação entre os tipos de elementos que ela descreve. Esta noção nos permite ter controle sobre a superordenação/subordinação das entidades após sua análise ontológica. Por exemplo: um phase será sempre um sortal anti-rígido, não podendo um kind, o qual
é um sortal rígido, estar subordinado a ele. Ao diferenciar os tipos de elementos que compõem um domínio e permitir sua representação, a ontologia de fundamentação explicita conceitos a partir de sua tipologia, estabelecendo sua
posição em uma cadeia de elementos. Isto permite, a partir da noção de cada tipo de elemento, que a estruturação do domínio seja construída de forma a evitar proposições errôneas, aferindo qualidade
à modelagem conceitual realizada. Assim, diferentemente do tesauro conceitual, o qual agrega os
GT2
727
conceitos independentemente de sua natureza, seja objeto ou processo, em um mesmo contexto, a ontologia de fundamentação parte a priori da identificação da natureza destes conceitos em contextos diferenciados. A ontologia de fundamentação dispõe de uma gama muito maior de tipos de relações entre os objetos. Como supracitado, basicamente existem dois tipos de relações na ontologia de fundamentação:
formal e material. As relações formais, estabelecendo ligação direta entre entidades, permitem que seja utilizada uma grande variedade de relações sem o uso de entidades intermediárias, abrindo um leque de relações como instanciação, parte-todo, membros, associação, comparação (como maior que, mais alto que, entre outras). Para a ocorrência de relações materiais há a necessidade de existir uma entidade intermediária, um conectivo, o qual possibilita atribuir propriedades à entidade, aferindo mais qualidade na modelagem conceitual realizada. Podemos notar que grande parte destas relações não estão inseridas no âmbito das relações formal-categorial, material-paradigmática, parte-todo, opositiva, instanciação ou de equivalência, mas na relação funcional-sintagmática, a qual diz respeito às relações associativas existentes em tesauros conceituais. A questão tecnológica, como já assinalada, é uma das grandes diferenciações entre tesauros (conceituais) e ontologias (de fundamentação). Ao representar o conhecimento e codificá-lo em uma linguagem que permita a leitura realizada por máquinas, as representações são feitas através de proposições lógicas, ou seja, os conteúdos das informações têm essência declarativa. Estas proposições são apresentadas na forma de axiomas, responsáveis pela possibilidade da realização de inferências com base nas proposições lógicas estabelecidas. Além da estrutura taxonômica, a qual é responsável pelo mapa estrutural do domínio coberto pela ontologia, os axiomas são essenciais à construção do instrumento. O detalhamento e a complexidade dos axiomas são necessários para que as respostas oferecidas pelo sistema sejam confiáveis e baseadas no compromisso ontológico estabelecido. Para que a comunicação entre máquinas ocorra de forma a permitir o entendimento entre elas, uma vez que não possuem o aparato de construção mental próprio dos seres humanos, é necessário que sejam construídos modelos parciais da realidade, operando com base em modelos formais (matemáticos) e permitindo o raciocínio a partir destes. A ontologia, nesse sentido, é um modelo formal de uma determinada porção da realidade, sendo um artefato de tecnologia que permite organizar e representar um domínio de conhecimento a partir dos conceitos, relações, definições, ou seja, modelar um domínio de conhecimento, criando uma teoria de raciocínio sobre um domínio.
4 CONCLUSÕES
Nota-se que a Ciência da Informação dispõe de bases teóricas e metodológicas próprias para a construção de instrumentos terminológicos, como tesauros conceituais, o que constitui um arcabouço sólido de conhecimentos, capaz de permitir que seja criada uma teoria independente sobre um domínio. Este arcabouço está posto na Teoria do Conceito, a qual permite perceber o domínio a partir
GT2
728
de uma análise analítico-sintética, e na Teoria da Classificação Facetada, a qual permite estabelecer categorias gerais de domínio, bem como regras para que isso seja feito de forma válida. As ontologias de fundamentação detêm forte fundamentação da Filosofia e das Ciências Cognitivas, permitindo que a estrutura real de um domínio, seu compromisso ontológico, seja representada de forma fiel, clara e consistente. Isto permite que a representação realizada detenha uma semântica baseada no mundo real, restringindo interpretações sobre seus conceitos. Deste modo, as ontologias de fundamentação, permitem que a construção de uma teoria sobre o domínio possibilite testar e validar um modelo conceitual. Assim, um tesauro, como uma representação conceitual da estrutura de um domínio de conhecimento, tem sua organização semântica dada através de relacionamentos e da restrição dos significados dos termos, fazendo com que estes sejam utilizados de forma unívoca. As ontologias, por outro lado, oriundas da engenharia informática e tendo por base a ontologia formal filosófica, apresentam relações de maior variedade, também permitindo a representação de determinado domínio. Esta representação é definida formalmente, sendo possível observar a estrutura conceitual (hierarquia) do domínio e receber respostas do sistema a partir de um esquema de inferências. Nossa visão é que este estudo contribui para deixar explícito o maior número de diferenças do que semelhanças entre estes modelos e, consequentemente, entre os instrumentos em si. Esta diferença nos parece perceptível já na concepção dos mesmos, uma vez que o tesauro visa o controle terminológico que permite a tradução da linguagem exposta em documentos em uma linguagem artificial, e vice-versa, enquanto a ontologia objetiva ser um artefato tecnológico que contém um conjunto de regras que delimitam o significado intensional de um vocabulário formal, permitindo que, a partir de um acordo ontológico, conhecimento existente em um domínio possa ser representado, compartilhado e inferido.
Abstract: The aim of this work is, through comparative analysis, to verify if the theoretical and methodological bases used in the construction of conceptual thesauri can contribute to the conceptual development of foundational ontologies, pointing out the existing conceptual thesauri elements that must be observed in the foundational ontology construction. The study is based on the analysis of theoretical and methodological bases used in the construction of conceptual models of conceptual thesaurus, the Concept Theory of Ingetraut Dahlberg, Faceted Classification Theory of Shiyali Ramamrita Ranganathan, in Library and Information Science, and foundational ontologies, from the Unified Foundational Ontology (UFO-A), developed by Giancarlo Guizzardi, which is based on principles of Philosophy and Cognitive Sciences to build its conceptual model based on objects (endurants). It is concluded that Library and Information Science has theoretical and methodological bases to build terminological instruments, like conceptual thesaurus, which constitutes a solid knowledge framework that can be created to allow an independent theory about a domain. The foundational ontologies have strong subsidies from Philosophy and Cognitive Sciences, allowing the real structure of a domain is represented in a consistent manner, being the holder of a semantic
GT2
729
representation based on the real world, restricting their interpretations of concepts. The foundational ontologies allow the construction of a theory about the field, allowing to test and validate a conceptual model. It is understood that this study helps to make explicit the largest number of differences than similarities between these models and, consequently, between the instruments themselves.
Keywords: Conceptual thesaurus. Foundational ontology. Knowledge organization. REFERÊNCIAS
CAMPOS, M. L. A. A organização de unidades do conhecimento em hiperdocumentos: o modelo conceitual como um espaço comunicacional para realização da autoria. 2001a. 186 f. Tese (Doutorado em Ciência da Informação) – IBICT/UFRJ, Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2001.
CAMPOS, M. L. A. Linguagem documentária: teorias que fundamentam sua elaboração. Niterói:
EdUFF, 2001b. 133 p.
CAMPOS, M. L. A. Modelização de domínios de conhecimento: uma investigação de princípios fundamentais. Ciência da Informação, v. 33, n. 1, p. 22-32, jan./abr. 2004.
CAMPOS, M. L.; GOMES, H. E. Metodologia de elaboração de tesauro conceitual: a categorização como princípio norteador. Perspectivas em Ciência da Informação, v. 11, n. 3, p. 348-359, set./ dez. 2006.
CAMPOS, M. L. A.; GOMES, H. E. Taxonomia e classificação: o princípio de categorização. DataGramaZero, v. 9, n. 4, ago. 2008. Disponível em: <http://www.dgz.org.br/ago08/Art_01. htm>. Acesso em: 3 jun. 2011.
DAHLBERG, I. A referent-oriented analytical concept theory of interconcept. International Classification, Frankfurt, v. 5, n. 3, p. 142-150, 1978a.
DAHLBERG, I. Ontical structures and universal classification. Bangalore: Sarada Ranganathan Endowment, 1978b. 64 p.
DAHLBERG, I. Terminological definitions: characteristics and demands. In: PROBLÈMES de la définition et de la synonymie en terminologie. Québec: Girsterm, 1983. p. 13-51.
GARDENFORS, P. How to make the semantic web more semantic. 3., INTERNATIONAL CONFERENCE ON FORMAL ONTOLOGY IN INFORMATION SYSTEMS (FOIS), 2004.
Proceedings
GUIZZARDI, G. Ontological foundations for structural conceptual models. 416 f. Tese (PhD em Computer Science) – Twente University of Technology, Twente, Holanda, 2005.
MEDEIROS, J. S. Tesauros conceituais e ontologias de fundamentação: análise comparativa entre as bases teórico-metodológicas utilizadas em seus modelos de representação de domínios. 2011. 145 f. Dissertação (Mestrado em Ciência da Informação) – UFF, Universidade Federal Fluminense, Niterói, 2011.
RANGANTHAN, S. R. Prolegomena to library classification. Bombay: Asia Publishing House, 1967. 640 p.
Torino, Italy, 2004.
GT2
730
PÔSTER
REPRESENTAÇÃO DA INFORMAÇÃO MUSICAL:
SUBSÍDIOS PARA RECUPERAÇÃO DA INFORMAÇÃO EM REGISTROS SONOROS E PARTITURAS NO CONTEXTO EDUCACIONAL E DE PESQUISA
Camila Monteiro de Barros, Lígia Maria Arruda Café
Resumo: A Recuperação da Informação Musical é uma área de estudos multidisciplinar que visa construir subsídios para representação, acesso e uso da informação musical. No entanto, para que a transferência da informação seja atingida com sucesso, é imprescindível incluir a perspectiva do usuário nesses estudos. O objetivo geral dessa pesquisa é verificar a relevância das características da informação musical para sua recuperação, na perspectiva dos usuários especialistas em Música. O objetivos específicos são: a) levantar na literatura características da música de forma a desenvolver um conjunto abrangente de metadados para representação da informação musical; b) verificar, junto aos alunos e professores do curso de Pós-Graduação de Música da UFRGS, quais são os metadados relevantes para recuperação da informação musical, de forma a constituir um conjunto mínimo de metadados de recuperação; c) verificar a presença dos metadados apontados como relevantes na representação e recuperação da informação musical praticada por bibliotecas de três universidades que possuem Programa de Pós-Graduação em Música. A primeira etapa da pesquisa foi desenvolvida com base na pesquisa bibliográfica e documental, de forma exploratória e qualitativa. A segunda etapa será exploratória com tratamento dos dados de forma quantitativa e descritiva. Como resultado inicial da primeira etapa, desenvolveu-se um conjunto abrangente de 46 metadados de representação da informação musical que foi convertido no instrumento de coleta de dados, a ser utilizado na segunda etapa.
Palavras-chave: Representação da informação. Recuperação da informação. Música.
1 INTRODUÇÃO Ainformaçãomusical,paraDownie(2003),carregaquatrograndesdesafios: multiexperimental, multicultural, multirepresentacional e multidisciplinar. As variações de pessoa para pessoa na forma de apropriação, apreciação e nos tipos de experiências emocionais que a música evoca (prazerosa, dolorosa, eufórica, pacífica) demonstram de maneira pragmática o desafio multiexperimental. O desafio multicultural vem ao encontro da condição da música ser uma objetivação da expressão humana, que sofre interferência de variados aspectos da cultura vigente no momento da produção
GT2
731
musical. O desafio multirepresentacional é o que Downie (2003) divide em sete facetas a serem consideradas na descrição da música e que representam a estrutura musical. São elas: tonal, temporal,
harmônica, de timbre, editorial, textual e faceta bibliográfica. A interação dessas facetas resulta em complexidade no tratamento do conteúdo musical, pois cada uma delas sofre um tipo de representação enquanto produto. O desafio multidisciplinar expõe a dificuldade de interação - tanto em âmbito comunicacional como pragmático - entre diferentes áreas que têm a música como seu objeto de pesquisa, por utilizarem diferentes linguagens, abordagens e perspectivas investigativas. Considerando os desafios propostos por Downie (2003), pode-se supor que a comunidade usuária da informação musical é heterogênea tanto nas características de cada indivíduo quanto nas possibilidades de abordagem da música. Segundo Barreto (2000), para o tratamento da informação,
a CI se apropria de “fatores de redução do código de comunicação, por meio da (re)formatação da
linguagem na informação primária, a fim de atender aos requisitos técnicos e de produtividade (espaço, tempo) de um sistema de recuperação da informação”. A representação da informação musical pode estar pautada em expressões textuais, notação musical, forma sonora ou ainda imagética (quando baseada em representações gráficas das ondas sonoras) (MCLANE, 1996). Cabe refletir, considerando- se as necessidades informacionais dos usuários, que linguagem (sonora, notação musical, textual) e que características do documento musical precisam ser consideradas na codificação (redução) do conteúdo original do documento para aplicação em um sistema de recuperação da informação. Kobashi (2007) afirma que, no que diz respeito às práticas de representação da informação “[ ] qualquer que seja a perspectiva adotada, o por quê, o para que e o para quem se organiza a informação determinam sua construção”. Dessa forma, para uma representação eficiente da informação musical - registros sonoros
e partituras – torna-se fonte relevante de estudo a investigação das práticas de representação da informação musical, em especial o conjunto de metadados. Alia-se a esse estudo a perspectiva do usuário especialista em Música na inferência do significado de relevância aos metadados de representação da informação musical para sua recuperação, contribuindo para o desenvolvimento de um aporte referencial para essas práticas.
2 OBJETIVOS
2.1 OBJETIVO GERAL
Verificar quais
metadados de representação da informação musical são relevantes para sua
recuperação, na perspectiva dos usuários especialistas em Música.
2.2 OBJETIVOS ESPECÍFICOS
a) Levantar na literatura características da música de forma a desenvolver um conjunto abrangente de metadados para representação da informação musical;
b) Verificar quais são os metadados relevantes para recuperação da informação musical, de
GT2
732
c)
forma a constituir um conjunto mínimo de metadados de recuperação; Verificar, na representação e recuperação da informação musical praticada por diferentes bibliotecas universitárias, a presença dos metadados apontados como relevantes.
3 PROCEDIMENTOS METODOLÓGICOS
A pesquisa será realizada em duas etapas. A primeira etapa, já realizada, é caracterizada pela
pesquisa bibliográfica e documental, de cunho exploratório, com tratamento dos dados de forma qualitativa. Nesta etapa, foi estruturado um conjunto abrangente de metadados de representação da informação musical. O levantamento bibliográfico compreendeu publicações
entre 2003 e 2010, em português e inglês e foi realizado nas seguintes fontes: a) Anais da International Society of Music Information Retrieval Conference (ISMIR); b) Annual Review of Information Science and Technology (ARIST); c) Anais do Encontro Nacional de Pesquisa em Ciência da Informação (ENANCIB); d) World Wide Web Consortium (W3C); e) Joint Information Systems Committee (JISC).
|
As |
informações sofreram análise de conteúdo segundo Bardin (1994), consistindo na extração |
|
de |
manifestações dos autores que pudessem ser convertidas em metadados de representação |
da informação musical e na verificação dos modelos de metadados recomendados pelo W3C e JISC.
|
A |
segunda etapa da pesquisa tem característica exploratória, a coleta de dados será por meio |
|
de |
um questionário e o tratamento dos dados será realizado de forma quantitativa e descritiva. |
|
O |
conjunto abrangente de metadados desenvolvido na primeira etapa foi convertido no |
instrumento de coleta de dados (questionário) a ser aplicado aos alunos e professores do Programa de Pós-Graduação em Música da UFRGS, que possui, dentre as universidades brasileiras, a melhor avaliação da CAPES do último triênio. O universo de pesquisa conta com, aproximadamente, 56 respondentes.
A estrutura do questionário compreende três partes: perfil dos respondentes, metadados de representação da informação musical e uma questão aberta. A cada metadado que compõe
a segunda parte do questionário, os respondentes deverão associar um valor dentre os
quatro apresentados: “muito relevante”, “relevante”, “pouco relevante” e “não relevante”.
A relevância está relacionada à necessidade de busca e recuperação da informação musical.
Os metadados apontados como “relevantes” comporão o conjunto mínimo de representação da informação musical e terão sua presença verificada nas planilhas de representação e na recuperação da informação musical da Biblioteca do Instituto de Artes da UFRGS, Biblioteca
Setorial do Centro de Letras e Artes UNIRIO e Biblioteca do Instituto de Artes da UNICAMP (as três melhores avaliações da Capes de Programas de Pós-Graduação em Música no último triênio).
GT2
733
4 RESULTADOS INICIAIS: CONJUNTO ABRANGENTE DE METADADOS A análise da literatura, realizada na primeira etapa da pesquisa, resultou em uma rica extração de manifestações dos autores no que concerne a diferentes aspectos da música, alguns ainda pouco discutidos e reconhecidos como informações relevantes, como é o caso da função social e dimensão emocional. A contribuição das recomendações do consórcio W3C e do JISC está especialmente nos metadados relacionados a formato e interoperabilidade de arquivos, link de acesso, descrição técnica e copyright. Como resultado, reuniu-se 46 metadados, agrupados em sete categorias: aspectos de título e autoria, aspectos de produção e edição, outros aspectos descritivos, aspectos sonoros, aspectos geográficos e de data, aspectos das dimensões emocional e social, e aspectos técnicos (quadro 1). Cada categoria sofreu subdivisões de forma que cada faceta da informação musical possa ser representada individualmente com a maior especificidade possível.
|
CATEGORIAS |
METADADOS |
DESCRIÇÃO |
|
1. Título do álbum ou conjunto de partituras |
Título do CD, disco, coletânea ou do conjunto de partituras. |
|
|
2. Título da música |
Título de cada música que compõe a gravação ou partitura. |
|
|
3. Nome(s) do(s) Compositor(es) |
Nome do responsável pela produção intelectual original da música. |
|
|
Aspectos de título e autoria |
4. Nome(s) do(s) Arranjador(es) |
Nome do arranjador responsável pela adaptação da música ao contexto de execução. |
|
5. Autor(es) da(s) letra(s) |
Nome do autor da letra da música. |
|
|
6. Nome(s) do(s) Intérprete(s) |
Nome do artista, banda, orquestra que interpreta a música. |
|
|
7. Dados originais |
No caso de obra não original, indicação do título da música e compositor originais. |
|
|
8. Nome do produtor |
Nome do produtor musical responsável (pessoa física e/ou jurídica) |
|
|
9. Versão |
Indicação se a obra é original, remixada, adaptada. |
|
|
10. Copyright 1 |
Tipo de direito autoral (ex: creative commons, direitos reservados) |
|
|
11. Copyright 2 |
Nome do proprietário do direito autoral |
|
|
12. Nome do editor |
Nome do editor físico ou organização responsável pela edição do CD, disco, partitura. |
|
|
Aspectos de produção e edição |
13. Edição |
Local, data e número de edição, em caso de reedição da mesma obra. |
|
14. Nome da Gravadora |
Nome da gravadora. |
|
|
15. Tipo de gravação |
Especifica o tipo de captação e registro sonoro (ao vivo, em estúdio, etc) |
|
|
16. Idioma da publicação |
Idioma do encarte do álbum ou edição. |
|
|
17. Coleção |
Nome da coleção à qual a obra pertence. |
|
|
18. Duração |
Tempo de duração do conjunto e das músicas individualmente. |
GT2
734
|
19. Discografia do intérprete |
Discografia já publicada pelo mesmo intérprete. |
|
|
20. Letra da música |
Letra completa da música |
|
|
21. Letra da música traduzida |
Letra da música traduzida para o português. |
|
|
22. Idioma em que a música é cantada |
Idioma da letra da música. |
|
|
Outros aspectos |
23. Descrição |
Anotações livres a respeito do conteúdo do documento. |
|
descritivos |
||
|
24. Avaliação crítica |
Anotações livres a respeito das condições da obra, aspectos de conservação. |
|
|
25. Formato do arquivo |
Indicação do formato de compactação do arquivo (partitura impressa ou digital (ex:pdf), CD, mp3, disco) |
|
|
26. Notação musical |
Disponibilização da partitura para recuperação por símbolos. |
|
|
27. Gênero musical |
Categorização da música baseada em sua composição rítmica e instrumental. (ex: jazz, blues) |
|
|
28. Possui vocal |
Indicação se a música possui vocais ou se é somente instrumental. |
|
|
29. Gênero do vocal |
Indicação se o vocal é masculino, feminino, infantil. |
|
|
A nota ou centro tonal em torno da qual a música é composta (ex: |
||
|
Aspectos sonoros |
30. Tonalidade da música |
A maior, B bemol). |
|
31. Compasso |
Indicação do compasso da obra (ex: 2/4, 6/8). Indicar individualmente no caso de um conjunto de músicas. |
|
|
32. Arranjo |
Estrutura adotada para a execução musical (ex: redução para piano, duas vozes) e descrição dos instrumentos que fazem parte da execução musical. |
|
|
33. Forma |
Sonata, concerto, etc. |
|
|
34. Nacionalidade original da música |
Nacionalidade original do compositor da música. |
|
|
35. Nacionalidade do intérprete |
Nacionalidade do artista/banda que interpreta a música. |
|
|
Aspectos geográficos e de data |
36. Local da gravação |
Nome e localização geográfica do estúdio, evento, programa onde ocorreu a gravação (em caso de registro sonoro). |
|
37. Período histórico |
Estilo temporal musical. (ex: classicismo, romantismo.) |
|
|
38. Data de criação |
Data de criação da música (data exata, século). |
|
|
39. Data de publicação |
Local e data da primeira publicação ou gravação. Ex: data da gravação do CD ou publicação da partitura. |
|
|
40. Uso recomendado (ex: repouso, atividade) |
Recomendação de uso da música (ex: repouso, atividade). |
|
|
Aspectos das dimensões emocional e social |
Relação com a sensação subjetiva causada pela música (ex: |
|
|
41. Dimensão emocional |
tristeza, alegria). |
|
|
42. Identidade social (ex: casamento, infantil, funeral) |
Identidade social da música (ex: casamento, infantil) |
|
|
43. Descrição técnica |
Informações de interoperabilidade, compactação de arquivo, protocolos de transferência. |
|
|
44. Humming |
Recuperação da música pela voz. |
|
|
Aspectos técnicos |
45. Localizador |
Indicação de uma URL ou link para acesso ao arquivo digital na base ou em outro local da rede. |
|
46. Meta-metadados |
Nome do responsável pelo preenchimento dos metadados |
Quadro 1: Conjunto abrangente de metadados para representação da informação musical Fonte: do autor, baseado em: Santini, Souza (2010); Angeles, McKay e Fujinaga (2010); Corthaut et al. (2008); Mandell, Ellis (2007); Lai et al. (2007); Hu, Downie (2007); Santini, Souza (2007); Hu, Downie, Ehmann (2006); Selfridge-Field (2006); Downie (2003); W3C.
GT2
735
A representação da informação musical envolve a descrição de aspectos sonoros, bibliográficos e técnicos, dessa forma, a extração das informações do documento exige algum tipo de conhecimento de estrutura e teoria musical, além daqueles da área de biblioteconomia. No entanto, a relevância de cada metadado pode ser avaliada conforme o perfil e a necessidade do público usuário, permitindo a especialização da atividade de representação.
5 CONCLUSÃO E RESULTADOS ESPERADOS A abrangência das características da informação musical torna sua análise e representação complexa, ficando evidente que a interdisciplinaridade apresenta-se indispensável na análise representacional do conteúdo musical. A partir do quadro de metadados desenvolvido espera-se compreender melhor quais são as informações relevantes para recuperação da informação musical na perspectiva do usuário especialista em música. Nesse sentido, julgamos de grande valia uma discussão do próprio conceito de relevância, que perpassa pelas diferentes variáveis que interferem na significação da informação do ponto de vista do bibliotecário e do usuário. Para uma eficiente transferência da informação é importante que estas perspectivas estejam em convergência. Espera-se, assim, contribuir para a especialização da representação da informação musical e também para a construção de embasamento teórico e exploratório sobre o tema.
Abstract: The music information retrieval is a multidisciplinary area of studies which addresses the construction of subsidies for representation, access and use of music information. However, for a successfully achievement of information transference, it’s indispensable to include the perspective of the user into this studies. The general purpose of this research is to verify the relevance of the characteristics of music information to address its retrieval, under the perspective of Music specialist users. The specific purposes are: a) to raise the characteristics of music, from the literature, in order to develop a wide set of metadata to represent the music information; b) to verify, along with students and professors of the course Pós-Graduação de Música da UFRGS, which are the relevant metadata for the retrieval of music information, in order to constitute a minimal set of retrieval metadata; c) to verify the presence of metadata indicated as relevant for the representation and retrieval of music information performed by the libraries of three universities which have the Postgraduate Program in Music. The first step of the research was developed based on the bibliographical and documentary research, in an exploratory and qualitative manner. The second step will be exploratory, handling the data in a qualitative and descriptive manner. As an initial result of the first step, a wide set of 46 metadata representing the music information was developed and converted into the data collection instrument to be used on the second step.
Key-words: Information representation. Information retrieval. Music.
GT2
736
REFERÊNCIAS
ANGELES, B.; MCKAY, C.; FUJINAGA, I. Discovering metadata inconsistencies . In: INTERNATIONAL SOCIETY FOR MUSIC INFORMATION RETRIEVAL CONFERENCE, 2010, Utrecht (Holanda). Anais
eletrônicos
Disponível em: <http://jmir.sourceforge.net/publications/ISMIR_2010_Discovering.pdf>.
Acesso em: 06 maio. 2011.
BARRETO, A. A. Os agregados de informação: memórias, esquecimento e estoques de informação. DataGramaZero, Rio de Janeiro, v.1, n. 3, jun. 2000. Disponível em: <http://www.dgz.org.br/>. Acesso em: 07 set. 2010.
CORTHAUT, N. et al. Connecting the dots: music metadata generation, schemas and applications. In:
INTERNATIONAL SOCIETY FOR MUSIC INFORMATION RETRIEVAL CONFERENCE, 2008,
Filadélfia (EUA). Anais eletrônicos pdf> Acesso em: 8 set. 2010.
Disponível em: <http://ismir2008.ismir.net/papers/ISMIR2008_213.
DOWNIE, J. S. Music Information Retrieval. In: CRONIN, B. Annual Review of Information Science and Technology. 37. ed. Medford: Information Today, 2003. p. 295-340. Disponível em: <http://music-ir.org/ downie_mir_arist37.pdf>. Acesso em: 21 abr. 2010.
HU, X; DOWNIE, J. S.; EHMANN, A. F. Exploiting recommended usage metadata: exploratory analyses. In: INTERNATIONAL SOCIETY FOR MUSIC INFORMATION RETRIEVAL CONFERENCE, 2006,
Victoria (Canadá). Anais eletrônicos Paper.pdf> Acesso em: 08 set. 2010.
Disponível em: <http://ismir2006.ismir.net/PAPERS/ISMIR06157_
HU, X.; DOWNIE, J. S. Exploring mood metadata: relationships with genre, artist and usage metadata. In:
INTERNATIONAL SOCIETY FOR MUSIC INFORMATION RETRIEVAL CONFERENCE, 2007, Viena.
Anais eletrônicos
Acesso em: 08 set. 2010.
Disponível em: <http://ismir2007.ismir.net/proceedings/ISMIR2007_p067_hu.pdf>
KOBASHI, N. Y. Fundamentos semânticos e pragmáticos da construção de instrumentos de representação da informação. DataGramaZero, Rio de Janeiro, v.8, n.6, dez. 2007. Disponível em: <http://dgz.org.br/jun09/ F_I_aut.htm> Acesso em: 09 de junho de 2009.
LAI, C. et al. Metadata infrastructure for sound recordings. In: INTERNATIONAL SOCIETY FOR MUSIC
INFORMATION RETRIEVAL CONFERENCE, 2007, Viena. Anais eletrônicos
ismir2007.ismir.net/proceedings/ISMIR2007_p157_lai.pdf> Acesso em: 08 set. 2010.
Disponível em: <http://
MANDEL, M. I.; ELLIS, D. P. W. A web-based game for collecting music metadata. In: INTERNATIONAL SOCIETY FOR MUSIC INFORMATION RETRIEVAL CONFERENCE, 2007, Viena. Anais eletrônicos Disponível em: <http://ismir2007.ismir.net/proceedings/ISMIR2007_p365_mandel.pdf> Acesso em: 08 set.
2010.
GT2
737
MCLANE, A. Music as information. In: CRONIN, B. Annual Review of Information Science and Technology. 37. ed. Medford: Information Today, 1996. p. 295-340.
SANTINI, R. M.; SOUZA, R.F. Classificação colaborativa de conteúdos não-textuais na internet: as novas formas de mediação e organização da informação da música através da folksonomia. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 11, 2010, Rio de Janeiro. Anais
Disponível em: <congresso.ibict.br/index.php/enancib/xienancib/paper/download/261/222>.
Acesso em: 06 maio 2011.
eletrônicos
SANTINI, R. M.; SOUZA, R. F. Recuperação da informação de música e a Ciência da Informação:
tendências e desafios de pesquisa. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA
INFORMAÇÃO, 8, 2007, Salvador. Anais eletrônicos br/artigos/GT2--143.pdf>. Acesso em: 30 mar. 2010.
Disponível em: <http://www.enancib.ppgci.ufba.
SELFRIDGE-FIELD, E. Social cognition and melodic persistence: where metadata and content diverge. In:
INTERNATIONAL SOCIETY FOR MUSIC INFORMATION RETRIEVAL CONFERENCE, 2006, Victoria
(Canadá). Anais eletrônicos Acesso em: 08 set. 2010.
Disponível em: <http://ismir2006.ismir.net/PAPERS/ISMIR0625_Paper.pdf>
WORLD Wide Web Consortium. Disponível em: <http://www.w3.org/>. Acesso em: 07 abr. 2011.
GT2
738
PÔSTER
PRESERVAÇÃO DIGITAL DE DOCUMENTOS DE ARQUIVO À LONGO PRAZO: ESTRATÉGIAS E INICIATIVAS
Leonardo Mendes Padilha, Maurício Barcellos Almeida
Resumo. Documentos digitais estão presentes na maioria das instituições, e encerram parcela significativa do patrimônio cultural da sociedade nos últimos 30 anos. Documentos de arquivo em formato digital têm trazido novos desafios para profissionais da informação. Destacam-se estudos sobre como manter documentos por longos períodos em um ambiente efêmero como o digital. Alternativas têm sido pesquisadas sobre a denominação de “preservação digital”. O presente artigo
aborda estratégias para preservação digital e descreve iniciativas internacionais para a manutenção
a longo prazo de documentos de arquivo digitais. O objetivo é explorar os recursos existentes sobre
preservação digital para uso em projetos nacionais, bem como fomentar o estudo e a disseminação do tema entre profissionais de informação e arquivistas. Palavra chave: preservação digital, arquivos, metadados
Abstract. Digital documents are pervasive in institutional environments, and retain valuable portion of the society cultural heritage produced during the last 30 years. Archival documents in a digital format have given raise to new challenges for information scientists and archivists. Studies about how to preserve documents for a long period of time in an ephemeral digital environment have been emphasized. Alternatives have been studied under the label “digital preservation”. The present paper advances strategies to digital preservation and describes international projects about maintaining archival documents in the long term. The goal is to explore resources and well-established projects with the aims of fostering the dissemination of that matter among archival professionals and information scientists. Key-words: digital preservation, archives, metadata
1. Introdução A preservação de documentos de arquivo é questão que recebe atenção de instituições públicas
e privadas em todo o mundo, em função da necessidade de manter o patrimônio cultural e a memória
da sociedade. A falta de registro do contexto de produção de documentos de arquivo tem sido um problema para a preservação ao longo da história. Nós últimos 30 anos, documentos de arquivo têm sido substituídos em larga escala por documentos digitais em formatos diversos, produzidos diretamente em ambiente digital (nati-digitais) ou provenientes de digitalização. A despeito do avanço tecnológico, o problema de manter o contexto se mantém. Além disso, o ambiente digital revela outras questões peculiares, as quais dificultam o trabalho de preservação. A dificuldade em preservar documentos digitais é consequência da volatilidade das mídias utilizadas para registro dos dados e da rápida obsolescência da tecnologia. Mídias como o papel podem durar até 500 anos, mas não se consegue precisar um período equivalente para as mídias ópticas e magnéticas. Além disso, os documentos de arquivos se tornam dependentes do formato
GT2
739
digital, o qual depende do software e do hardware. Assim, o acesso a documentos se torna dependente do conjunto tecnológico que os produziu, e nada garante que a mesma tecnologia estará presente no longo prazo. Estudos sobre o impacto do formato digital na produção e manutenção à longo prazo de documentos de arquivo em formato têm revelado questões multidisciplinares. Essas questões têm sido pesquisadas sob a denominação de preservação digital (DURANTI, 2007). Uma alternativa amplamente utilizada para a preservação de conjuntos de dados é considerar, além da manutenção de dados, a descrição dos metadados que explicam como acessar aqueles conjuntos. Documentos digitais e metadados correspondentes são fortemente conectados: um não tem valor sem o outro.
O presente artigo se insere nesse contexto, apresentando iniciativas sobre a preservação de
documentos de arquivo em formato digital. A partir daqui, objetivando simplicidade, utiliza-se o
termo “documento” para se referir a “documentos de arquivo” e o termo “preservação” para se referir a “preservação à longo prazo”. A seção 2 apresenta uma visão geral sobre a preservação digital, a seção 3 apresenta as principais iniciativas de pesquisa pioneiras no assunto e a seção 4 traz considerações finais. 2. Uma visão geral sobre preservação digital No processo de disseminação da informação escrita, a invenção da imprensa elevou significativamente a quantidade de registros escritos e promoveu uma verdadeira revolução social. O século XVIII foi a época em que os registros em papel ganharam força e independência (CLANCHY, 1979). No final do século XX, analogamente, a emergência da Internet promoveu a disseminação em larga escala de registros digitais (LANZINGER, 2001).
A maioria dos documentos digitais, entretanto, não tem recebido qualquer tipo de tratamento
visando preservação. Isso ocorre mesmo considerando que parte significativa corresponde a documentos científicos e de valor histórico. Problemas diversos dificultam tal tratamento, com destaque para a crescente dependência do hardware e do software ao longo do ciclo de vida do documento (THOMAZ, 2004). Outro fator impactante no processo de preservação é a mídia utilizada para armazenamento.
A migração entre diferentes tipos de mídias altera metadados, modifica a forma de gravar os dados e pode resultar em perdas. Além disso, o tempo de duração de uma mídia é maior do que o tempo de sua obsolescência tecnológica (UNITED KINGDON, 2003).
A adoção de um conjunto de requisitos básicos visando a preservação é o primeiro passo de
um longo processo, uma vez que a tecnologia é incapaz de proporcionar solução definitiva. De fato, tais requisitos são definidos no escopo de uma política de preservação digital e parte das diretrizes arquivísticas de uma instituição, contemplando: i) planejamento de estratégias; ii) definição de funções para seleção de registros; iii) definição de funções para adoção de formatos de armazenamento de dados e respectivos metadados (BULLOCK, 1999). Um padrão de metadados define o contexto para caracterização do documento, atributo essencial
GT2
740
para garantir o acesso à longo prazo (IKEMATU, 2001). Tal garantia, envolve ainda atributos que informam ao software ou hardware os requisitos para operações inerentes à preservação. As técnicas para preservação digital consistem de mecanismos que, em última instância, buscam combinar a
estrutura lógica do registro ao seu suporte físico. As técnicas mais conhecidas são migração, emulação
e encapsulamento (HEDSTROM, 1997).
A migração consiste na estratégia de substituir a mídia de armazenamento e o software
associado, antes que o registro se torne inacessível. Garante-se assim acesso à longo prazo ao
acompanhar a evolução tecnológica. Em geral, a transferência de documentos entre mídias ocorre em períodos determinados em políticas. Migrações sucessivas sem planejamento resultam em alterações na formatação do registro, tornando-o inacessível.
A segunda estratégia, denominada emulação, cria um software (o emulador) o qual recria as
condições do software original. A emulação dispensa a migração ao recriar o ambiente do sistema anterior, mas mantém a necessidade de migração do suporte. Requer metadados do documento para que o emulador possa ler um arquivo escrito anteriormente. Não é uma técnica de simples execução:
não é possível prever os metadados necessários e nem o curso das mudanças tecnológicas (LUSENET,
2002).
A terceira estratégia, conhecida como encapsulamento, consiste em agrupar o conjunto de
softwares e a descrição das condições necessárias para a reprodução do documento a ser preservado.
É criado ainda um sistema administrador de que assegura atualizações software e hardware. Trata-se
de uma alternativa adequada, por exemplo, para a preservação de documentos digitais complexos, com anexos ou hiperlinks, como ocorre na web. Identificam-se os elementos participantes da rede de conexões e encapsulam-se os recursos necessários para a visualização do conjunto. 3. Iniciativas internacionais para a preservação digital Ao definir uma estratégia para a preservação, as instituições se beneficiam da experiência de iniciativas e de casos de sucesso. A Norma Brasileira de Descrição Arquivística (NOBRADE), por exemplo, é uma importante iniciativa brasileira arquivística. Embora não trate diretamente de preservação, trabalha com metadados arquivísticos ligados a descrição. Tais metadados são fundamentais já que além de dos aspectos computacionais a que se enfatizar os arquivísticos. A NOBRADE baseia-se na International Standard Archival Description, um padrão internacional traduzido por Norma Geral Internacional de Descrição Arquivística (BRASIL, 2008).
3.1. Metadata Requirements Project O Metadata Requeriments Project 23 é uma iniciativa desenvolvida na University of Pittsburgh, que propõe um modelo de referência para intercâmbio de documentos visando a preservação digital no contexto de negócios. O projeto busca por um padrão de metadados para garantia de autenticidade de documentos em transações comerciais.
23 Disponível na Internet em: < http://www.archimuse.com/papers/nhprc/ >. Acesso em: 22/07/2010.
GT2
741
O conjunto de metadados definido possibilita acesso seguro a documentos de transações
comerciais, e, portanto valor de prova legal, por um longo período de tempo. Os metadados foram organizados em um modelo de referência composto por módulos funcionais – organização, sistemas, aquisição de registros, utilização e manutenção – cada qual com o seu conjunto próprio de metadados.
3.2. Dublin Core Metadata Initiative
Na tentativa de reduzir a ambiguidade de metadados criados automaticamente, a Dublin Core Metadata Initiative 24 (DMCI) propõe um conjunto mínimo de atributos para descrever metadados. O DCMI é mantido por um organismo sem fins lucrativos – a Online Computer Library Center
Research – a qual se fundamenta no padrão Dublin Core (DC) para estabelecer regras de gestão de documentos.
A descrição do DMCI (2004) define termos com fins diversos: i) termos básicos de
descrição (nome, identificação, identificador web, tipo de termo); ii) termos de descrição adicionais (comentário, referência, versão); e iii) termos para definição de contexto (esquemas de vocabulário, sintaxe de esquemas de classificação).
3.3. Open Archives Information System Reference
A Open Archives Information System Reference Model 25 (OAIS) é talvez a mais importante
iniciativa sobre preservação digital. Trata-se de padrão ISO desenvolvido pelo Consultative Committe for Space Data Systems da NASA (CCSDS).
O OAIS é aplicável a qualquer tipo de documento digital e determina as relações entre o
OAIS, os produtores de informação e os consumidores de informação. No âmbito do OAIS, dados em formato digital são armazenados em uma sequência codificada (bit stream), a qual é interpretada por esquemas de representação. O conjunto composto por dados, codificação e representação da informação constitui um objeto digital, o qual, uma vez acessível a uma pessoa, é então preservado (CCSDS, 2002). Os dados do objeto adicionados à metadados de preservação são reunidos na uma entidade pacote de informação. O pacote abriga dois tipos de dados: o informação de conteúdo, que contem os dados do conteúdo propriamente dito, e a informação descritiva de preservação, que contem metadados para o acesso futuro. Ainda existe outro nível de metadados, denominado informação descritiva. Os dados de preservação são definidos por princípios de proveniência, inviolabilidade contexto e referência.
3.4. CURL Exemplars in Digital Archives Project
O CURL Exemplars in Digital Archives Project (Cedars) 26 é uma iniciativa de consórcio
24 Disponível na Internet em : <http://dublincore.org/>. Acesso em: 30/04/ 2010.
25 Disponível na Internet em : <http://public.ccsds.org/publications/>. Acesso em: 21/05/ 2011.
26 Disponível na Internet em : <http://www.ukoln.ac.uk/services/elib/projects/>. Acesso em: 1/02/2010.
GT2
742
universitário inglês, que resultou em protótipo de um sistemas baseado no sistema OAIS. O conjunto de metadados proposto representa a memória descritiva, administrativa, técnica e legal, bem como a estrutura necessária para criar um pacote de informação para documento de arquivo digitais. O Cedars possui dois desdobramentos principais: o primeiro, sobre propriedade intelectual, que lida com o direito de propriedade intelectual no contexto de trabalho de bibliotecários e arquivistas; o segundo, sobre estratégias, que consideram que a preservação digital envolve preservar o acesso, a qual, por sua vez, envolve agregar metadados (de preservação, de migração, de contexto, dentre outros).
3.5. Preservation Metadata for Digital Collections Initiative
Ainiciativa conhecida como Preservation Metadata for Digital Collections Initiative 27 (PMCD)
é um projeto da National Library of Australia que objetiva manipular, para fins de preservação,
coleções de bibliotecas, arquivos de publicações digitais on-line, publicações digitais e coleções de
áudio, coleções de textos e imagens.
O PMDC também é baseado no OAIS: metadados descrevem pacotes de informação e
a história dos objetos no processo de preservação. A iniciativa distingue ainda parâmetros de
metadados para documentos nati-digitais e também para aqueles convertidos via digitalização. O principal item do sistema de preservação é o histórico de preservação (NLA, 1999).
3.6. Metadata Encoding and Transmission Standard
O Metadata Encoding and Transmission Standards 28 (METS ) é uma iniciativa desenvolvida
pelo Network Development and MARC Standards Office da U.S. Library of Congress. A METS se fundamenta no padrão OAIS e propõe um padrão de metadados em formato Extended Markup Language (XML) para gerenciar coleções de objetos digitais. Consiste em um padrão de codificação descritiva, administrativa e estrutural de metadados, criado para bibliotecas digitais.
Os componentes METs para caracterizar metadados são o cabeçalho METS, os metadados descritivos os metadados administrativos, os arquivos (files), o mapa estrutural, a ligação estrutural e
o comportamento.
3.6. Projeto Interpares
O projeto Interpares é um projeto internacional organizados em três fases. Tem como objetivo
desenvolver conhecimento teórico e metodológico para a preservação permanente de arquivos gerados eletronicamente (DURANTI, 2007). Com base nesse conhecimento, formularam-se modelos de
estratégias, políticas e padrões capazes de assegurar a preservação. O projeto está em sua terceira fase,
e já se desenvolveram modelos para elaboração de políticas para preservação digital que abrangem a
|
27 |
Disponível na Internet em : <http://www.nla.gov.au/preserve/pmeta.html>. Acesso em: 22/07/2010. |
|
28 |
Disponível na Internet em : <http://www.loc.gov/standards/mets/>. Acesso em: 22 /10/2010. |
GT2
743
captura do objeto digital, sua organização, trâmite, preservação e garantia de autenticidade. 4. Considerações finais O presente trabalho apresentou requisitos básicos necessários para uma política de preservação de documentos de arquivo em formato digital, bem como iniciativas pioneiras nesse sentido. Espera- se contribuir explorando um assunto ainda pouco difundido entre profissionais da informação e arquivistas. A importância de buscar soluções para a preservação digital está associada a manutenção de documentos de arquivo de caráter permanente, fundamentais para compreensão das instituições pelas gerações futuras, e mesmo para questões legais. O problema torna-se mais complexo quando o período de preservação exigido é o longo prazo. Muito embora o caráter interdisciplinar desse estudo a contribuição dos arquivistas, bibliotecários e demais profissionais da informação é fundamental na medida em que a omissão desses profissionais pode levar a confusão na construção de sistemas de gerenciamento que não observem requisitos necessários a contextualização dos documentos digitais. Esse trabalho é uma contribuição da Ciência da Informação em assunto que, muitas vezes, tem sido tratado como computação, mesmo que o domínio teórico seja próprio da arquivística (preservação). De fato, metadados são fundamentais para um processo eficiente de preservação digital. São parte intrínseca do processo e representam a única forma de contextualizar os documentos de arquivo, garantindo princípios fundamentais como a proveniência. Esses princípios se mantém fundamentais no ambiente digital. A falta de metadados adequados inviabiliza a preservação digital, fato que explica a grande enfase ao assunto.
5. Referências
BRASIL. (2008).CONARQ: Norma Brasileira de Descrição Arquivística. Disponível em: <http:// www.conarq.arquivonacional.gov.br/media/publicacacoes/nobrade.pdf>. Acesso em 21/07/2010.
CLANCHY, M. T. From memory to written record. England, 1066 – 1307. Cambridge: Harvard University Press, 1979.
CONSULTATIVE COMMITTEE FOR SPACE DATA SYSTEMS (CCSDS). (2002) Reference model for an Open Archival Information System (OAIS), recommendation. Disponível na Internet em: <http://www.ccsds.org/documents/ >. Acesso: 14/09/2008.
DURANTI, L. (2007). An Overview of InterPARES 3 (2007-2012). Disponível em: <http://www. interpares.org/>. Acesso em 10/01/2011.
HEDSTROM, M. Digital preservation: a time bomb for digital libraries. Language Resources and Evaluation, Springer (Netherlands), v. 31, n.3, p. 189 – 202, May. 1997.
IKEMATU, R. Si. 2001. Gestão de Metadados: sua evolução na tecnologia da informação. In:
Datagramazero – Revista de Ciência da Informação, v. 2, num. 6, Instituto Brasileiro de Adaptação e Inserção na Sociedade da Informação.
GT2
744
LAZINGER, S. S. Digital preservation and metadata: history, theory, practice. Englewood:
Libraries Unlimited, 2001. 359p.
LUSENET, Y. (2007). Towards Open Access in Europe. Disponível em: <http://www.knaw.nl/ecpa/ publications.html>. Acesso em: 01/02/2010.
NATIONAL LIBRARY OF AUSTRALIA (NLA) (1999). The NLA Preservation Metadata Working Group. Disponível em na Internet em: http://www.nla.gov.au/. Acesso em: 02/11/2008.
THOMAZ, K. P. A preservação de documentos eletrônicos de caráter arquivísitco. 2004. 388f. Doutorado em Ciência da Informação – Escola de Ciência da Informação. Belo Horizonte. 2004.
UNITED KINGDOM. (2003). National Archives. Uk Government. Digital Preservation Guidance. Preservation guide of National Archives of UK. Disponível em: <http://www.nationalarchives.gov. uk/documents/>. Acesso em: 05 mar. 2009.
GT2
745
PÔSTER
O DOCUMENTO AUDIOVISUAL INSERIDO EM AMBIENTE DE ARQUIVO
Luiz Antonio Santana da Silva, Telma Campanha Carvalho Madio
RESUMO
A presente pesquisa tem como objetivo principal fazer uma discussão a respeito de documentos audiovisuais em ambiente de arquivo, isto é, a forma como esse gênero documental é visto dentro dos arquivos e ambientes informacionais. No desenvolver da discussão se aproximou do objeto, levantando a bibliografia sobre arquivo e documentos audiovisuais, identificando as diferentes maneiras como se apresentam em cada unidade de informação, delineando o objetivo da documentação audiovisual dentro de um arquivo e biblioteca, assim como o arrolamento das especificidades no tratamento arquivístico dessa documentação. Foi abordado o caráter orgânico da documentação não textual como subsídio para o processo de tomada de decisão nas organizações, e futuramente assumindo outro caráter que tem por função manter e preservar a memória institucional registrada em documentos desprovidos de letras e números.
Palavras-Chave: 1.Documentação audiovisual 2. Documento de arquivo 3. Procedimentos arquivísticos.
ABSTRACT
The present research mainly aims at discussing about the audiovisual documents in archival environment, and that is the way as this documental genre is seen Ito the archival and information environments. By developing the discussion, the object could be closed through the bibliography about audiovisual archives and documents, identifying the different ways as they are stood for in each informational unity, delineating the audiovisual documentation’s objective in an archive or library, as well as specificities classification on the archival proceedings of this documentation. The non-textual documentation’s organic feature as subsidy for the decision-making process into the organizations and, hereafter, taking over another feature whose role is preserving the institutional memory registered on documents destituted from letters and numbers.
Keywords: 1.Audiovisual documentation2. Archive document 3. Archival proceedings.
11. SOBRE O DOCUMENTO AUDIOVISUAL EM AMBIENTE DE ARQUIVO
Em se tratando de gestão arquivística a documentos não-textuais, as necessidades metodológicas não são distintas dos ditos documentos tradicionais. Para Lopez (2000), o documento imagético não é distinto de um documento textual. Ele está sujeito às mesmas necessidades metodológicas de organização e classificação dos demais gêneros documentais. O autor deixa explícito que ambos devem respeitar os princípios arquivísticos que lhe são impostos com a finalidade de fornecer ao usuário toda
GT2
746
informação possível contida naquele documento. Mas é necessário acautelar-se em relação a isso, pois muitas instituições seja ela pública ou privada, não veem dessa maneira, justamente pela diferença do suporte ou pela técnica empregada na produção do documento quanto à organização dos mesmos. O olhar diferenciado voltado à documentação audiovisual, também é empregado pela arquivística pelo motivo de sua forte tradição documental textual ser bem marcante. Durante muito tempo preocupada somente com os documentos textuais, a arquivística tradicional preocupou-se pouco com o tratamento de documentos ditos não-textuais (CIRNE; FERREIRA, 2002). Dessa forma, os documentos audiovisuais foram considerados como documentos especiais e por muito tempo, até nos dias atuais, receberam cuidado diferenciado sendo desprovidos de qualquer princípio arquivístico no seu tratamento. Segundo Couture e Rousseau (1998), somente na segunda metade do século XX que houve uma preocupação por parte dos arquivistas. Foi apenas durante os anos 1960 e 1970 que os arquivistas se interessaram verdadeiramente pela questão da inclusão dos documentos não textuais nos seus respectivos fundos de arquivo. Como conseqüência por ter tomado a seu cargo todos os arquivos, qualquer que fosse a sua natureza ou suporte, a disciplina arquivística desenvolveu normas e práticas que, hoje em dia, têm em conta todos os suportes de informação (COUTURE; ROSSEAU, 1998, p. 227).
Neste mesmo caminho em relação a esse tipo de documento, Smit (1993) mostra que essa documentação imagética não é vista, geralmente, como documentação que possa ser utilizada posteriormente como fonte de pesquisa. Outra abordagem é feita por Bellotto (2004) quanto ao cuidado que se deve tomar quando se fala em tratamento que é aplicado aos documentos. É destacada a noção de respect des fonds (ordem de respeito aos fundos), a qual é primordial para realização do fazer arquivístico para não se misturar documentos de diferentes instituições, dificultando a formação de fundos. O que constitui um fundo no arquivo é a proveniência do documento independente do suporte. Na obra de Schellenberg, Arquivos modernos: princípios e técnicas, 2004, é possível visualizar o esforço pela compreensão de documentos não-textuais, ou seja, documentos audiovisuais e cartográficos em ambiente de arquivo, assim como o tratamento desses materiais inserindo-os nesse ambiente. Segundo Schellenberg documentos de arquivo são:
Todos os livros, papéis, mapas, fotografias, ou outras espécies documentárias, independentemente de sua apresentação física ou características, expedidos ou recebidos por qualquer entidade pública ou privada no exercício de seus encargos legais ou em função das suas atividades e preservados ou depositados para preservação por aquela entidade ou por seus legítimos sucessores como prova de suas funções, sua política, decisões, métodos, operações ou outras atividades, ou em virtude do valor informativo dos dados neles contidos (SCHELLENBERG, 2004, p.40).
Nessa definição é possível visualizar que o autor tem ciência de que o documento de arquivo, não é somente papel. A imagem é polissêmica, por isso deve-se observar seu contexto de produção e os motivos
GT2
747
que os levaram a serem produzidas. A partir dessa observação pode-se obter o significado real da imagem quanto a sua função. Para haver compreensão da imagem como um documento de arquivo, deve-se ter claro não somente o registro que está no suporte, mas também os motivos que a geraram e produziram, não a tomando diretamente como prova ou evidência de algum fato ocorrido sem a contextualizar. Como muito bem aponta Sontag (2004) o significado das imagens é muito distinto daquele encontrado no registro, o sentido e os significados não são os mesmos do momento da produção daquela imagem, por esse motivo voltar-se na geração e produção das imagens é primordial para compreender o seu contexto.
1.1 Aproximações e diferenças entre arquivo e biblioteca Esse paralelo entre arquivo e biblioteca é buscado como uma ferramenta de reflexão para enumerar e perceber a diferença do tratamento e a forma como a documentação não-textual, nesse caso, audiovisual é tratada por ambos. O intuito de tal comparação tem por objetivo apontar as características do documento audiovisual nessas unidades, bem como a forma como se configuram dentro delas. Segundo Schellenberg mencionado por Paes (2004), as principais características dos campos de atuação das bibliotecas e dos arquivos, podem ser assim resumidas:
QUADRO 1 – Representação do paralelo entre o arquivo e a biblioteca
|
BIBLIOTECA |
ARQUIVO |
|
Gênero de documentos. |
Gênero de documentos Reunião de espécies documentais que se assemelham por seus caracteres essenciais, particularmente o suporte e o formato, e que exigem processamento técnico específico e, por vezes, mediação técnica para acesso, como documentos audiovisuais, documentos bibliográficos, documentos cartográficos, documentos eletrônicos, documentos filmográficos, documentos iconográficos, documentos micrográficos, documentos textuais. |
|
Doc. Impressos, Audiovisual e cartográfico. |
Doc. Textuais, audiovisual e cartográfico. |
|
Origem |
Origem Termo em geral empregado para designar a origem mais imediata do arquivo, quando se trata de entrada de documentos efetuada por entidade diversa daquela que o gerou. |
|
Os documentos são produzidos e conservados com objetivos culturais. |
Os documentos são produzidos e conservados com objetivos funcionais. |
GT2
748
|
Aquisição e Custódia |
Aquisição e Custódia |
|
Responsabilidade jurídica de guarda e proteção de arquivos independentemente de vínculo de propriedade. (custódia); |
|
|
Ingresso de documentos em arquivo seja por comodato, compra custódia, dação, depósito, doação, empréstimo, legado, permuta, recolhimento, reintegração ou transferência. (aquisição). |
|
|
*os documentos são colecionados de fontes diversos, adquiridos por compra ou doação. *os documentos existem em numerosos exemplares. *a significação do acervo documental não depende da relação que os documentos tenham entre si. |
*os documentos não são objetos de coleção; provém tão só das atividades públicas ou privadas, servidas pelo arquivo. *os documentos são produzidos num único exemplar ou em limitado número de cópias. *há uma significação orgânica entre os documentos. |
|
Método de avaliação |
Método de avaliação Processo de análise de documentos de arquivo, que estabelece os prazos de guarda e a destinação, de acordo com os valores que lhes são atribuídos. |
|
*aplica-se a unidades sólidas. *o julgamento não tem caráter irrevogável. *o julgamento envolve questões de conveniência, e não de preservação ou perda. |
*preserva-se a documentação referente a uma atividade, como um conjunto e não como unidades isoladas. *os julgamentos são finais e irrevogáveis. *a documentação não raro existe em via única. |
GT2
749
|
Método de classificação |
Método de classificação |
|
1- Organização dos documentos de um arquivo ou coleção, de acordo com um plano de classificação, código de classificação ou quadro de arranjo; 2- Análise e identificação do conteúdo de documentos, seleção da categoria de assunto sob a qual sejam recuperados, podendo-se-lhes atribuir códigos; 3 - Atribuição a documentos, ou às informações neles contidas, de graus de sigilo, conforme legislação específica. Também chamada classificação de segurança. |
|
|
*utiliza métodos predeterminados. *exige conhecimento do sistema, do conteúdo e da significação dos documentos a classificar. |
*estabelece classificação específica para cada instituição, ditada pelas suas particularidades. *exige conhecimento da relação entre as unidades, a organização e o funcionamento dos órgãos. |
|
Método descritivo |
Método descritivo |
|
Conjunto de procedimentos que leva em conta os elementos formais e de conteúdo dos documentos para elaboração de instrumentos de pesquisa. |
|
|
*aplica-se a unidades discriminadas. *as séries (anuários, periódicos etc.) são unidades isoladas para catalogação. |
*aplica-se a conjuntos de documentos. *as séries (órgãos e suas subdivisões, atividades funcionais ou grupos documentais da mesma espécie) são consideradas unidades para fins de descrição. |
GT2
750
Fonte: quadro representativo produzido pelo autor com base nas informações retiradas do trabalho de PAES, Marilena Leite. Arquivos especiais. In: Arquivo: teoria e prática. Rio de Janeiro: FGV, 1986.
Concluindo, pode-se dizer que a biblioteconomia trata de documentos individuais e a arquivística de conjuntos documentais. Reforçando o tratamento documental dado a documentos audiovisuais, é aconselhável
que se tenha em mente o valor primário 29 dos documentos para realizar qualquer intervenção arquivística, assim como ocorre na gestão dos documentos arquivísticos textuais. A gestão documental 30 possibilita a qualquer instituição um melhor aproveitamento informacional, o que resulta na facilidade e agilidade no processo de tomada de decisões por meio das informações orgânicas 31 . Além de sistematicamente refletir em seus documentos as atividades desempenhadas pela instituição, contribuem com a constituição da memória institucional expondo a sociedade na qual se insere a importância que detém para o desenvolvimento de ambas.
12. PROCEDIMENTOS METODOLÓGICOS
Buscou-se através de um breve levantamento bibliográfico situar o documento audiovisual no cenário arquivístico, uma vez que tal cenário é seu local de origen quando dotado de valor probatório. Levantou-se algumas situações-problemas quanto ao tratamento dado a esse tipo de documento dentro dos arquivos, encontradas até mesmo na literatura arquivística. Procurou-se conceituar consistentemente documentos audiovisuais utilizando dicionários de terminologia arquivística e definições na literatura com o propósito de se conhecer bem o objeto de estudo. Fez-se uma abordagem teórica a respeito de documentos audiovisuais em ambiente de arquivo abordando suas características, assim como na biblioteca, traçando um paralelo com o intuito de mostrar aproximações e diferenças. A partir dessas questões levantadas a abordagem seguiu rumo a sistematização das ideias e pontos de vista embasados na discussão teórica a fim de traçar e delimitar o documento audiovisual dentro de ambientes arquivísticos.
3. RESULTADOS Discorrer sobre alguns pontos abordando a documentação audiovisual em ambiente de arquivo permitiu a constatação de que registros munidos de imagens também são documentos administrativos assim como qualquer documento de arquivo.Visualizou-se que tais documentos possuem características específicas dentro de cada unidade de informação na qual está inserido. As variedades de suportes de registros documentais permitem as instituições arquivísticas documentar suas ações de diferentes
29 Valor atribuído a documento em função do interesse que possa ter para a entidade produtora, levando-se em conta a sua
utilidade para fins administrativos, legais e fiscais. (DICIONÁRIO BRASILEIRO DE TERMINOLOGIA ARQUIVÍSTICA, 2005, p.
|
171) |
|
|
30 |
Conjunto de procedimentos e operações técnicas referentes à produção, tramitação, uso, avaliação e arquivamento de |
documentos em fase corrente e intermediária, visando sua eliminação ou recolhimento.
31 As informações registradas em documentos produzidos e acumulados por qualquer tipo de organização refletem suas funções,
atividades, ações, decisões e o desenvolvimento de suas relações para com a própria entidade e para com a sociedade. Denominamos esse tipo de informação de ‘informação orgânica’. (BUENO; VALENTIM, 2010, p.234).
GT2
751
formas. Tais resultados permitem um conhecimento mais aprofundado desse tipo de documentação a instituições que trazem em seus acervos, assim como na documentação corrente esses documentos, o que possibilita o aproveitamento informacional maior tanto quanto questões de gestão documental. O conhecimento adquirido por meio da junção de procedimentos arquivísticos com as necesidades organizacionais, possibilitam as instituições obterem aproveitamento informacional diferenciado e, portanto ágil para o processo de tomada de decisão.
4. CONSIDERAÇÕES O fato apresentado neste trabalho, o não reconhecimento de documentos audiovisuais em ambiente de arquivo, trás sob a ótica da arquivística apontar os pontos conflitantes e buscar soluções para esse problema imbricado nas instituições arquivísticas por meio da discussão teórica. A produção documental de uma instituição em suporte não convencional é mais comum, e atualmente é registrada cada vez mais em suportes diferenciados, como por exemplo, os digitais, filmográficos e fotográficos. Dessa forma pode-se afirmar que os documentos de arquivos não são produzidos exclusivamente em suporte papel, extrapolando questões de suporte, nesse caso, especificamente, fitas magnéticas. Realizar uma discussão a respeito do tratamento documental adequado a documentos de arquivo não- textuais, deve ser uma tarefa cada vez mais crescente na moderna arquivística, uma vez que o contexto atual utiliza informações como combustível para se manter dinâmico. Em uma sociedade denominada sociedade da informação, o que não se pode ignorar são as maneiras como são produzidos e geridos os documentos nos diferentes ambientes informacionais, assim as informações neles contido. A necessidade informacional é muito grande na sociedade atual, pois as informações são dotadas de valores que respondem aos anseios institucionais e também sociais. Destaca-se que embora obteve- se significantes respostas quanto ao problema em questão, ainda há uma grande necessidade de aprofundamento no tema, uma vez que abordar questões que modificam paradigmas necessita-se de embasamento teórico consistente e suficientemente coerentes.
REFERÊNCIAS
ARQUIVO NACIONAL (Brasil). Dicionário Brasileiro de Terminologia Arquivística. Rio de Janeiro: Arquivo Nacional, 2005.
BELLOTTO, Heloísa Liberalli. Arquivos permanentes: tratamento documental. Rio de Janeiro:
FGV, 2004.
BUENO, D. A.; VALENTIM, M. L. P. Fluxos documentais em ambientes empresariais:
características, tipologias e usos. In: VALENTIM, M. L. P. (Org.) Ambientes e fluxos de informação. São Paulo: Cultura Academica, 2010. p. 233-253.
CIRNE, Maria Teresa; FERREIRA, Sónia Maria. A ética para os profissionais da informação audiovisual: o devir tecnológico amoldar uma atitude. Cadernos de Biblioteconomia Arquivistica e Documentação Cadernos BAD: Revista da APBAD, Lisboa, n.1. p.115-129,2002.
COUTURE, Carol; ROUSSEAU, Jean-Yves. Os fundamentos da disciplina arquivística. Pref.
GT2
752
Frank B. Evans. Colaboradores: Florence Ares, Chantale Filion, Marlene Gagnon, Louise Gagnon- Arguin, Dominique Maurel. Trad. Magda Bigotte de Figueiredo. Revisão Científica Pedro Penteado. Lisboa: Dom Quixote, 1998. 356p.
LOPEZ, André Porto Ancona. As razões e os sentidos: finalidades da produção documental e interpretação de conteúdos na organização arquivística de documentos imagéticos. 2000,f. Tese (Doutorado em História Social)-Faculdade de Filosofia, Letras e Ciências Humanas, Universidade de São Paulo, São Paulo, 2000.
PAES, Marilena Leite. Arquivos especiais. In: Arquivo: teoria e prática. Rio de Janeiro: FGV, 1986.
SCHELLENBERG, Theodore Roosevelt. Arquivos modernos: princípios e técnicas. Pref. H. L. White, José Honório Rodrigues. Trad. Nilza Teixeira Soares. 4. ed. Rio de Janeiro: Fundação Getúlio Vargas, 2004.
SMIT, J. W. O documento audiovisual ou a proximidade entre as três marias. Revista Brasileira de Biblioteconomia e Documentação, p.81 – 85, 1993.
SONTAG, Susan. Sobre fotografia. São Paulo: Companhia das Letras, 2004.
GT2
753
PÔSTER
IDENTIFICAÇÃO DE CATEGORIAS INFORMACIONAIS PARA REPRESENTAÇÃO DE IMAGENS FOTOGRÁFICAS FIXAS EM BANCOS DE IMAGENS COMERCIAIS
Joice Cleide Cardoso Ennes de Souza, Rosali Fernandez de Souza
Resumo:Análise da imagem fotográfica fixa para uso em publicidade e sua representação documentária em bancos de imagem comerciais, disponíveis na Internet. Para a formação do quadro teórico foram estudados os princípios metodológicos adotados na indexação do conteúdo de imagens e os estudos semióticos como base para a interpretação das imagens. Estudo empírico realizado a partir da aplicação de critérios apurados na literatura nos sites Latinstock e Getty Images, com o objetivo de identificar as categorias informacionais adotadas na representação e recuperação das imagens fixas pelos usuários.
Palavras-chave: Imagem fotográfica fixa. Representação documentária. Banco de imagens. Categoria informacional.
1 INTRODUÇÃO
Atualmente é grande a produção de imagens, qualquer que seja o tipo (fotografias, ilustrações, desenhos, etc.), o que gera o questionamento de como representar esse acervo para futura recuperação. Aliado ao volume produzido, observamos a disseminação na Internet de bancos de imagens online, permitindo que o usuário possa pesquisar remotamente, o que outrora era realizado com a intermediação do profissional de informação. No processo de negociação entre a solicitação de busca feita pelo usuário e a obtenção de um resultado relevante por parte do sistema de informação se localizava o documentalista, que interpretava as perguntas e “entregava” as imagens consideradas representativas. No ambiente da Internet esse processo é de responsabilidade do usuário. Ele faz a busca, obtém o resultado e avalia sua relevância de acordo com suas necessidades informacionais. Contudo, há cada vez mais a demanda pelos aspectos temáticos das imagens, pontos de acesso que muitas vezes não são contemplados pelo sistema de informação, principalmente no ambiente da publicidade, onde o teor da mensagem transmitida é conceitual. No início dos anos 1920, inicia-se a publicação de anúncios em jornais impressos, onde a exibição da imagem do produto era o fator que motivava o leitor a consumi-lo. Com o passar do tempo, o aumento do número de produtos e serviços oferecidos ao consumidor faz com que os anúncios que apenas mostram o produto não garantam mais o seu consumo. Além de chamar a atenção do leitor é necessário cativá-lo, informando-o, influenciando-o na escolha. É preciso evocar sensações e sentimentos positivos associados aos produtos. Em virtude disso, questiona-se: quais aspectos temáticos devem ser identificados na análise
GT2
754
conceitual das imagens fotográficas fixas para que as mesmas sejam recuperadas em bancos de imagens comerciais, para uso na publicidade, permitindo sua reutilização em diferentes contextos? Como objetivo geral, pretendemos determinar as categorias informacionais a serem observadas durante a análise conceitual de imagens fotográficas fixas em um sistema de informação, mais precisamente em um banco de imagens comercial na Internet, para fins de recuperação eficiente. Especificamente, procuramos definir o potencial informativo estético da imagem fotográfica fixa com vistas a identificar as possíveis categorias informacionais a serem destacadas na análise conceitual da fotografia, e verificar a aplicação das diferentes categorias informacionais observadas na literatura na representação de imagens fotográficas.
2 REFERENCIAL TEÓRICO-METODOLÓGICO
A representação documentária de imagens fotográficas fixas para publicidade consiste em um
tema pouco observado na literatura da área. Adotamos, por analogia, os procedimentos metodológicos
já existentes para análise de fotografias para o embasamento teórico-metodológico, de modo a nos
permitir a análise e identificação de categorias informacionais necessárias à representação de imagens fotográficas. Para identificar as categorias nas imagens fotográficas fixas, propomos o estudo da interação do usuário com a imagem fotográfica em um sistema de informação, mais precisamente em banco de imagens comercial. A interpretação da fotografia seria feita a partir da lógica triádica da semiótica de Peirce (interpretante, signo, objeto), mais precisamente com base no processo de formação de significações (semiose). Com base nos estudos semióticos, estudaremos como o interpretante – que consiste no signo criado na mente do espectador ou usuário – se manifesta através das imagens fotográficas fixas. Acreditamos que a partir da formação do interpretante seja possível identificar as categorias informacionais a serem observadas no momento de análise conceitual de imagens fotográficas localizadas em bancos de imagens comerciais, e seu uso na publicidade. Devemos ressaltar que
o acesso a uma imagem fotográfica em um banco de imagens sofre a mediação de diferentes
profissionais: o editor de imagem, que possui critérios que o faz selecionar ou não determinada imagem; e o profissional de informação, responsável pela indexação da imagem fotográfica. Esse sucessivo processo de representação de uma fotografia faz com que o mesmo signo seja interpretado de forma diferente, dependendo da cultura do observador ou usuário.
A Teoria semiótica permite-nos captar não apenas a complexidade, mas também a força da comunicação pela imagem, apontando-nos essa circulação da imagem entre semelhança, traço e convenção, isto é, entre ícone, índice e símbolo (JOLY, 1996, p.
40).
Segundo Barthes (2009), o fato da fotografia propor três mensagens: linguística, denotada ou literal e conotada ou simbólica nos permite afirmar que mesmo a fotografia fixa produzida no
GT2
755
âmbito do fotojornalismo apresenta potencial informativo para sua reutilização na publicidade. Para esse reuso, é necessário identificar as categorias ou signos presentes na imagem fotográfica fixa, para que a mensagem simbólica atinja o usuário. Como o próprio autor esclarece (BARTHES, 2009, p. 38), os signos identificados são provenientes do código cultural do observador, quer seja ele o fotógrafo, o profissional da informação responsável pela representação da imagem fotográfica ou o publicitário que seleciona a melhor fotografia para compor seu anúncio publicitário. Não podemos ignorar os valores que permeiam os profissionais envolvidos na produção, tratamento documental e manipulação das imagens fotográficas. Tal fato influenciará na interpretação da imagem fotográfica. Teorizando sobre os sentidos da imagem, Barthes (2009, p. 47) distingue três níveis a serem observados: informativo, simbólico e sentido obtuso. No nível informativo é onde ocorre o processo comunicativo; onde o conhecimento, que nos permite reconhecer um dado objeto, suas características e relações, é acumulado. O nível simbólico consiste no nível da significação, considerando o símbolo um signo ao objeto denotado em virtude de uma associação de idéias produzidas por uma convenção. Para Barthes, o sentido obtuso “parece estender-se para lá da cultura, do saber, da informação” (Barthes, 2009, p. 50), não estando na linguagem dos símbolos ou da fala, apesar de apresentar certa emoção. A imagem fotográfica fixa apresenta informação estética em potencial, permitindo uma leitura mais subjetiva. Especificamente abordando o fenômeno informação e suas diferentes definições, Mikhailov, Chernyi e Gilyarevisky (1980), em artigo em que discorrem sobre a estrutura e principais propriedades da informação científica, citam A. Moles e seu conceito de informação estética, como sendo uma informação “intraduzível e se refere não ao sistema universal de símbolos mas ao repertório do conhecimento comum a um certo transmissor e a um certo receptor” (MIKHAILOV; CHERNYI; GILYAREVSKY, 1980, p. 77). Os autores consideravam a informação estética como um tipo de informação social, ou seja, originária da atividade da sociedade como um todo. No nosso entendimento, o caráter subjetivo da informação estética se reflete no fato de que, para que o processo comunicativo seja pleno, o emissor e o receptor devem compartilhar do mesmo código ou símbolos ou, mais precisamente, que o leitor indexador compartilhe dos códigos do usuário. Com base na filosofia da arte, no significado da linguagem e na percepção visual, Sara Shatford (1986) propõe uma base teórica para identificar e classificar os diferentes tipos de objetos representados em uma imagem. O objetivo da autora é possibilitar o acesso temático por parte do usuário ao acervo imagético, sem perder de vista o propósito desse acervo e seu uso. Além disso, Shartford esclarece que cabe aos profissionais de informação explorar o potencial do acervo imagético para os possíveis futuros usuários. Essa preocupação com o potencial informativo é observada por Hjorland (1992) em artigo que afirma que a chave para a definição do conceito de assunto se encontra na investigação epistemológica, no questionamento de como vamos saber o que precisamos saber sobre determinado documento, para a partir daí descrevê-lo de forma a facilitar sua recuperação em um sistema de informação.
GT2
756
Shatford (1986, p. 48) propõe o desenvolvimento de uma classificação facetada para imagem, adotando as facetas Quem, O que, Onde, Quando. A autora faz um paralelo das facetas com as categorias ranganathianas: Personalidade, Matéria, Energia, Espaço e Tempo.
3 ABORDAGEM METODOLÓGICA
Para a parte empírica, selecionamos dois bancos de imagem: Latinstock (http://www.latinstock. com.br/) e Getty Images (www.gettyimages.com) para aplicar os critérios para análise dos bancos de imagens. O primeiro possui uma página chamada “Dicas para pesquisa”, onde explicita como é realizada a indexação das imagens, apontando as categorias informacionais usadas na representação imagética. Já o Getty Images é um banco de imagens com organização complexa, onde o usuário pode acessar o manual com orientações sobre o uso das categorias e como pesquisar. Também oferece ao usuário pesquisa por sentimentos humanos e por “pesquisa de ideias”. Considerando os bancos de imagens como sistemas de informação, usamos como base para
a elaboração dos requisitos as orientações de Carneiro (1985) para a construção de uma política de indexação no âmbito de uma instituição, e os tópicos propostos por Aitchison e Gilchrist (1979) para elaboração de tesauros. Adotamos também o estudo de Kafure (2004) para identificar aspectos
a serem observados nos sites dos bancos de imagens por acreditarmos que a usabilidade, que vem a
ser “a capacidade que um sistema interativo oferece a seus usuários, num determinado contexto de
operação, para realização de tarefas, de maneira eficaz, eficiente e satisfatória” (KAFURE, 2004, p.152) é um aspecto importante para a recuperação da informação pelo usuário. A partir dos autores, foram compilados os seguintes requisitos a serem aplicados na análise dos bancos de imagens:
|
1. |
Organização à qual o banco de imagens pertence |
|
|
a. Descrever a organização: missão, escopo, finalidades e objetivos. |
||
|
b. Verificar a natureza da instituição: agência de notícias, jornal, etc. |
||
|
2. |
A unidade de informação |
|
|
a. |
Verificar se há menção explícita aos responsáveis pelo tratamento da informação. |
|
|
3. |
Acervo oferecido |
|
|
a. |
Volume, cobertura de assuntos, tipologia e período de tempo abrangido. |
|
|
4. |
Indexação |
|
|
a. Quais são as categorias/atributos usadas para representar as imagens fotográficas. |
||
|
b. Pontos de acesso são acessíveis ao usuário? |
||
|
c. Possui vocabulário controlado? Descrever tipo de linguagem, áreas de assunto, etc. |
||
|
5. |
Usuários (clientela) |
|
|
a. |
Nível de escolaridade, necessidade potencial de informação, assuntos pesquisados. |
|
|
6. |
Serviços oferecidos |
|
a. Definir serviços: busca retrospectiva, disseminação seletiva de informação, etc.
b. Estratégia de busca.
c. Tempo de resposta do sistema.
d. Forma de saída.
e. Oferece manual aos usuários.
GT2
757
7.
Site
|
a. |
Multilingue ou monolingue. |
|
b. |
Exige senha de acesso para pesquisar? |
|
c. |
Permite personalização do resultado (salvar e/ou imprimir os registros pesquisados, fazer coleções, classificação e ordenação os documentos recuperados por campos)? |
|
d. |
Envio de resultados por e-mail. |
|
e. |
Busca avançada, busca simples, busca por campo. |
|
f. |
Visualização de todos os itens recuperados. |
|
g. |
Oferece ajuda para o pesquisador realizar a pesquisa? A ajuda é visível? |
|
h. |
Os títulos de menus ou janelas estão localizados no topo? |
|
i. |
|
4 RESULTADOS ESPERADOS
Após a análise proposta acima, pretende-se identificar as categorias informacionais adotadas pelos bancos de imagens comerciais para representação documentária das imagens oferecidas. Uma vez que o uso da imagem fotográfica fixa na publicidade prevê a evocação de sentimentos do usuário (consumidor), acreditamos que para a recuperação eficiente deverá ser realizada uma análise conceitual, com destaque para os aspectos temáticos (aspectos significantes) das imagens.
5 CONCLUSÕES
O papel da imagem fotográfica fixa usada em publicidade faz com que seja necessário o uso
de recursos fotográficos que tornem a imagem fotográfica mais atraente ao consumidor. Não basta
vender somente o produto, mas também os conceitos subjetivos que estão atrelados a ele e que são transmitidos através da imagem fotográfica fixa.
A produção fotográfica exclusiva para publicidade apresenta dois aspectos: custo e tempo. O
custo é referente ao orçamento destinado para a produção: modelos, fotógrafo, locação, etc. Apesar de se obter um conjunto de fotografias produzidas para um produto específico, o fator tempo é decisivo em alguns projetos publicitários. Os bancos de imagens surgem como um recurso para os produtores que demandam de tempo para a concepção da peça publicitária. Com essa abordagem, acreditamos no potencial publicitário das imagens fotográficas produzidas dentro do contexto jornalístico. Mas para que as mesmas sejam recuperadas em seus bancos de dados, é necessário um novo olhar. Repensar a imagem fixa para publicidade é possível a partir da característica interdisciplinar da Ciência da Informação, que nos permite transitar em diferentes disciplinas, de modo a completar as lacunas provenientes dos questionamentos que apresentam como centro a informação e suas diferentes facetas.
Abstract: Analysis of the photografic image sets for use in advertising and its documentary representation in commercial image databank available on the Internet. In order to form the theoretical set, the methodological principals applied to indexation of images contents were studied. The interpretation of images is achieved through semiotics studies. Empirical studies based on the application of the criteria established in the literature in Latinstock and Getty Images sites, with the purpose of identifying the informational categories adopted in the image representation and retrieval.
GT2
758
Keywords: Photografic imagem. Documentary representation. Image databank. Informational category.
REFERÊNCIAS
AITCHISON, J.; A. GILCHRIST, A. Manual para construção de tesauros. (trad. Helena Medeiros Pereira Braga). Rio de Janeiro: BNG/Brasilart, 1979.
BARTHES, R. O óbvio e o obtuso. Lisboa: Edições 70, 2009.
CARNEIRO, M.V. Diretrizes para uma política de indexação, in Revista da Escola de Biblioteconomia da UFMG, Belo Horizonte, v. 14. n. 2, p. 221-241, set. 1985.
HJORLAND, B. The concept of ‘subject’ in information science, in Journal of Documentation, v. 48, n. 2. p. 172-200, June, 1992.
JOLY, M. Introdução à análise da imagem. Campinas: Papirus, 1996.
KAFURE, I. Usabilidade da imagem na recuperação da informação no catálogo público de acesso em linha. Tese (Doutorado) – Universidade de Brasília (UnB), Brasília, 2004.
MIKHAILOV, A. I.; CHERNYI, A. I. ; GILYAREVSKY, R. S. Estrutura e principais propriedades da informação científica. In: GOMES, H. E. (Org.). Ciência da informação ou informática? Rio de Janeiro: Calunga, 1980.
SHATFORD, S. Analyzing the subject of a picture: a theoretical approach, in Cataloging and Classification Quartely, v. 6, n. 3, p. 39-62, 1986.
GT2
759
PÔSTER
COMUNICAÇÃO CIENTÍFICA E REPRESENTAÇÃO DA INFORMAÇÃO: ESTUDO PRELIMINAR SOBRE A INDEXAÇÃO COM PALAVRAS-CHAVE NO ENANCIB
Marilucy da Silva Ferreira, Fábio Mascarenhas Silva
Resumo: As palavras-chave indexadas nos trabalhos das comunicações do Encontro Nacional de Pesquisa em Ciência da Informação (ENANCIB) podem ser utilizadas como objeto de análise para indicar tendências e nuances da pesquisa em Ciência da Informação (CI) no Brasil? Acreditamos que sim; elas podem apresentar comportamentos e dinâmicas das comunicações. Este trabalho traz parte de uma pesquisa de mestrado ainda em andamento, cujo objetivo é, a partir da análise das palavras- chave (PC) dos trabalhos publicados nos anais do ENANCIB, verificar, pelas temáticas abordadas, comportamentos no âmbito das pesquisas em CI, sob a perspectiva da memória científica. Contudo, em razão de a pesquisa estar em andamento, apresentaremos conceitos concernentes à comunicação científica, e resultados preliminares, no que tange à forma de apresentação das PC. Neste trabalho apresentar-se-á um breve histórico dos ENANCIB e a categorização as palavras-chave em um dos anos do evento. Propomos ainda uma categorização da configuração das palavras-chave, objetivando uniformizá-las para posteriores análise.
Palavras-chave: Comunicação científica; Palavras-chave; ENANCIB. ABSTRACT: Can be used papers keyword of National Communications Research in Information Science (ENANCIB) as object of analysis to indicate trends and nuances of Brazilian research in Information Science? We believe so, they may exhibit dynamic behaviors and communications. This paper presents part of a Master thesis in progress, whose aim is, through the analysis of keywords of the papers published in the ENANCIB Proceedings, verify the themes, behaviors in the research in IS, from the perspective of scientific memory. However, because of the research is continuing, present concepts concerning scientific communication, and preliminary results regarding the presentation of the Keywords. This paper will present a brief history of ENANCIB categorization and keywords in a year of the event. We also propose a categorization of the configuration keywords, aiming to standardize them for later analysis. KEYWORDS: Scientific Communication; Keywords; ENANCIB.
1 INTRODUÇÃO Este trabalho traz considerações preliminares da nossa pesquisa de mestrado, em andamento, cujo escopo insere-se nas palavras-chave dos trabalhos publicados nos diferentes Grupos de Trabalho (GTs) dos Anais do Encontro Nacional de Pesquisa em Ciência da Informação (ENANCIB). O objetivo da pesquisa é verificar a viabilidade de mapear, a partir das palavras-chave dos trabalhos, a memória científica das pesquisas da CI brasileira. Aqui serão expostas considerações parciais da pesquisa, cujas análises ainda não estão concluídas. A título de ilustração, apresentaremos alguns exemplos de usos de palavras-chave a fim de demonstrar a diversidade de como os trabalhos estão
GT2
760
indexados e ainda uma das etapas da pesquisa que almejou estabelecer categorias para o conjunto de palavras-chave, visando uma melhor visualização das mesmas para auxiliar nossos estudos. Discutimos também a informação científica e a comunicação científica, pois é a partir de palavras- chave em textos dessa natureza que debruçamos nossos estudos. Por ser um evento que apresenta comunicações de pesquisa em Ciência da Informação (CI), predominantemente em âmbito nacional, o ENANCIB tornou-se foco de trabalhos, os quais analisam, muitas vezes, as temáticas dos GTs e que refletem a configuração da pesquisa na CI brasileira.
2 A COMUNICAÇÃO DA PESQUISA BRASILEIRA EM CIÊNCIA DA INFORMAÇÃO NO ENANCIB A informação científica é validada pela sua visibilidade através de periódicos e eventos científicos. Nestes, os pesquisadores podem conhecer o universo estudado pelos seus pares. Segundo Kuramoto (2006), a informação científica é o insumo básico para o desenvolvimento científico e tecnológico de um país. Além da informação científica, julgamos importante apresentar também o conceito de comunicação científica. Primeiro, dizemos que esta se dá a partir de um esforço coletivo, a partir de uma comunidade de pesquisadores. Le Coadic coloca que a comunidade científica “é o grupo social formado por indivíduos cuja profissão é a pesquisa científica e tecnológica” (LE COADIC, 2004, p. 28). Além da pesquisa, os atores desta comunidade precisam trocar informações e interagir entre si, isso se dá pela comunicação científica. Assim, “as comunidades científicas são, sobretudo, redes de organizações e relações sociais formais e informais que desempenham várias funções. Uma das funções dominantes é a de comunicação” (LE COADIC, 2004, p. 31). Meadows (1999) coloca que há várias formas de comunicação científica e que a fala e a escrita são as mais importantes. Para Pinheiro (2003), a comunicação científica é caracterizada pela busca de maior velocidade no intercâmbio e disseminação de ideias, vantagem constatada desde a literatura clássica da área. A comunicação científica deve se apresentar mais interativa, sendo, portanto, ouvinte, leitora, interpretante e difusora dos acontecimentos da sociedade, refletindo seus produtos e demandas, ou seja, todas as faces da sua realidade. Destaca-se no Brasil, em termos de disseminação da pesquisa na área da CI, a Associação Nacional de Pesquisa e Pós-Graduação em Ciência da Informação (ANCIB), fundada em junho de 1989, que tem como frente de divulgação de suas pesquisas - desde 1994 - o ENANCIB (ANCIB, 2011). Segundo as informações do site da própria ANCIB, esta é uma sociedade civil, sem fins lucrativos. A associação se configura por sócios institucionais, representadas pelos Programas de Pós- Graduações em CI e individuais, representadas pelos pesquisadores e estudantes da área. Nos primeiros anos do ENANCIB os atuais Grupos de Trabalho eram denominados de Grupos Temáticos, e totalizavam 7. Atualmente são 11 GTs que compõem o evento; são eles: 1) Estudos Históricos e Epistemológicos da Ciência da Informação; 2) Organização e Representação do
GT2
761
Museu, Patrimônio e Informação; 10) Informação e Memória; 11) Informação e Saúde. Em todos os ENANCIB foram publicados anais com os trabalhos apresentados, esses nos servirão como fonte documental para a constituição de um mapa da memória científica do evento, a partir das palavras-chave estabelecidas pelos próprios autores. Em análise parcial dos dados coletados, já foi possível refletir a respeito de aspectos a serem contemplados na pesquisa, buscando respostas para indagações tais como: a mudança de temas dos GTs influenciará na configuração dos mapas temáticos? O acréscimo de temas em determinados GTs alterou os temas anteriores? As PC podem retratar a partir da formação do mapa? Desta forma, nossos interesses focam-se na visualização de uma memória científica, construída pelas palavras-chave que representam artigos da CI.
3 CONSTRUINDO A MEMÓRIA CIENTÍFICA DOS GTS DO ENANCIB A PARTIR
DAS PALAVRAS-CHAVE Kobashi (2007) afirma que a informação é indexada por palavras (justapostas, relacionadas graficamente em mapas estáticos ou dinâmicos) que são também utilizadas para busca, ou seja,
para indexar a pergunta do usuário. De acordo com a autora, “não por acaso, o signo que interessa
é a palavra denominativa (os nomes e os sintagmas nominais ou, mais precisamente, as unidades
polilexicais), que são as unidades típicas das Linguagens Documentárias.” (KOBASHI, 2007). Diferentemente dos descritores, que são controlados a partir de uma lista controlada de termos, as palavras-chave são estabelecidas livremente pelos próprios autores, ficando a cargo dos mesmos delimitarem as palavras que melhor representarão seu trabalho. A priori as palavras-chave têm a função primordial de servir como recurso de apoio aos processos de recuperação da informação, mas
a ausência do controle de termos, através de um vocabulário controlado e a diversidade nas formas de
representação da informação tendem a propiciar a ambiguidade no processo comunicativo. Para nossa pesquisa, quanto maior a incidência de palavras-chave diferentes, mais difícil será constituir mapas visuais da produção científica. Logo, consideremos necessário reduzir a diversidade de termos a fim de reduzir a dispersão dos mesmos, possibilitando agrupamentos semânticos. As PC dos trabalhos do ENANCIB, além de não serem controladas como descritores, apresentam-se sem padronização (separadas por vírgula, por ponto final, por ponto e vírgula, por travessão ou por dois pontos). Ainda, em análises preliminares, percebemos certas características das
PC adotadas pelos autores do ENANCIB de 2009, conforme exemplos apresentados no quadro 1:
|
NOMES |
SINTAGMAS |
NÚMEROS/ |
||||
|
NEOLOGISMOS |
GENERALIDADE |
SIGLAS |
PRÓPRIOS |
NOMINAIS |
DATAS |
VERBOS |
|
Netnografia |
Brasil |
ICOM |
Cañada |
Web 2.0 |
2.0 |
Informar-se |
GT2
762
|
Diversidade |
ICOFOM |
Paul Otlet |
Cultura Escrita |
|
ICOFOM |
|||
|
Cultura |
LAM |
David Hume |
Museu virtual |
|
Ética |
STAP |
Tom Wilson |
Saúde Pública |
|
Memória |
|||
|
Saúde |
BVS |
Wittgenstein |
Organizacional |
|
M |
Habermas |
Quadro 1 - Perfil das PC indexadas nos artigos
3.1 Desenvolvimento da Pesquisa
No percurso metodológico da pesquisa estão previstas três etapas: coleta dos dados; conversão das palavras-chave em descritores e elaboração dos mapas visuais.
a) Coleta dos dados Coleta dos trabalhos dos ENANCIBs e suas respectivas palavras-chave, somando e totalizando
as suas ocorrências. Será constituída, em planilha do Microsof Excel, uma base de dados com seguintes dados dos trabalhos: autor(es), título, palavras-chave, ano, GT. Posteriormente serão excluídas as palavras-chave com freqüência menor ou igual a 2, procedendo-se, na seqüência a re-indexação das demais palavras-chave, convertendo-as em termos descritores.
b) Conversão das palavras-chave em descritores (propondo categorias para a análise) Se por um lado a disparidade de palavras-chave cria um rico aspecto semântico útil aos
processos de recuperação da informação, por outro essa “pulverização” de termos dificulta o processo de agrupamento por similitude, tornando a construção de mapas um processo complexo e custoso. Assim, para viabilizar a elaboração de mapas visuais de produção científica é primeiro necessário uniformizar o conjunto de PC, aglutinando-as. Para tanto é preciso adotar o processo de composição de palavras pelo qual duas ou mais palavras se juntam, prevalecendo uma delas. Na primeira etapa do processo de uniformização instituiremos, a priori, quatro categorias (ainda não definitivas) com características arbitradas por nós:
a) termos subjetivos – Por se tratar de uma literatura especializada supõe-se que serão poucos os
termos subjetivos, no entanto, somente após a coleta total é que esta suposição será ou não confirmada, um exemplo registrado até o momento é a PC agir comunicativo. b) termos distintos com valor semântico equivalente – A título de exemplo, anotamos a PC Folksonomia, que em determinado trabalho foi indexado junto com a PC Indexação social, inserimos
que ambas podem ter o mesmo valor semântico no trabalho, uma vez que discutem uma determinada indexação, uma indexação social, a qual, na terminologia inglesa, diz-se Folksonomia. Então, dizemos que ambos os termos guardam relação semântica equivalente entre si.
c) termos compostos e/ou individuais com mesmo valor semântico - Alguns termos compostos,
GT2
763
dependendo do domínio semântico, expressam significados análogos, tal como percebido em trabalho que adotou as PC decisão e tomada de decisão; d) termos idênticos em GT´s distintos - As mudanças temáticas nos GTs ao longo dos anos despertou-nos o interesse de identificar a recorrência dos termos idênticos em diferentes GTs. Essa situação foi percebida não apenas em virtude das mudanças temáticas, mas também em razão de assuntos de distintos GTs estarem relacionados em discussões similares. Por exemplo, uma PC como política e sociedade transita em vários GTs devidamente contextualizada com o conteúdo discutido no texto. Isso pode ser natural, se considerarmos que os GTs inserem-se numa grande área, e esta possui um perfil interdisciplinar.
|
Termos |
Termos distintos com valor semântico equivalente |
Termos compostos e/ou individuais com mesmo valor semântico. |
Termos iguais recorrentes em GT´s distintos |
|
subjetivos |
|||
|
Agir |
Folksonomia |
Decisão |
Informação |
|
comunicativo |
|||
|
Indexação social |
Tomada de decisão |
Ciência da |
|
|
Informação |
Quadro 2- Dados eleitos a partir da estratégia de pesquisa
c) Construção dos mapas No que tange ao processo de mensuração, utilizaremos técnicas bibliométricas para relacionar os dados e obter resultados. Isso será a etapa posterior à uniformização dos dados. Com os resultados sistematizaremos por temáticas as PC, e tentaremos observar as particularidades da pesquisa e da memória científica da CI nacional. Prevemos que, após uniformizados, será gerada uma matriz quadrada a partir dos termos para o estudo de correlação entre descritores por meio de dendograma. Optamos por expor essas nuances na expectativa de conciliarmos tematicamente um mapa no qual seja possível construir um mapa da memória científica a partir dos assuntos representados por meio das palavras-chave em trabalhos publicados no ENANCIB, evento que traz em suas comunicações a face da pesquisa da CI nacional.
4 CONSIDERAÇÕES PRELIMINARES Os dados do quadro 2 referem-se ao ano de 2009, sendo, então, uma parte do que pretendemos trabalhar nesta pesquisa. A proposta aqui apresentada insere-se na questão que aborda tanto a representação, quanto a recuperação informacional. Nossos interesses buscam quesitos referentes à possível visualização de uma memória científica, construída pelas palavras-chave que representam conteúdos da comunicação científica nacional no campo da CI. Este trabalho apresentou parte de uma pesquisa ainda em andamento. Nossas primeiras inferências discorrem sobre uma parte do que já conseguimos coletar, organizar e visualizar. Contudo, só poderemos chegar a conclusões consistentes quando todos os dados forem organizados e analisados. Em tempo, já é possível observar a falta de padronização no que concerne a forma de apresentação
GT2
764
das palavras-chave. A necessidade de categorizar arbitrariamente sobre as PC nos leva a crer na possibilidade de refletir mais consistentemente sobre a forma de representação das comunicações do ENANCIB, uma vez que os trabalhos científicos representados também por descritores podem servir, além da função primordial da divulgação do conhecimento, para proporcionar uma memória da pesquisa em CI em âmbito nacional, revelando as suas diversas faces.
5
REFERÊNCIAS
ASSOCIAÇÃO NACIONAL DE PESQUISA E PÓS-GRADUAÇÃO EM CIÊNCIA DA INFORMAÇÃO - ANCIB. Disponível em: <http://www.ancib.org.br/pages/sobre.php>. Acesso em: 08 jun. 2011. KOBASHI, Nair Yumiko. Fundamentos semânticos e pragmáticos da construção de instrumentos de representação de informação. DataGramaZero - Revista de Ciência da Informação . v.8, n.6, dez. 2007. Disponível em: < http://www.dgz.org.br/dez07/Art_01.htm>. Acesso em 08 jun. 2011. KURAMOTO, Hélio. Informação científica: proposta de um novo modelo para o Brasil. Ci. Inf., Brasília, v. 35, n. 2, p. 91-102, maio/ago. 2006. Disponível em: <http://www.scielo.br/pdf/ci/v35n2/ a10v35n2.pdf>. Acesso em: 11 maio 2011. LE COADIC, Yves-François. A ciência da informação. 2. ed. Brasília: Briquet de Lemos, 2004. MEADOWS, Arthur J. A comunicação cientifica. Brasília D. F.: Briquet de Lemos, 1999. 268 p. ISBN 8585637153. PINHEIRO, Lena V. Comunidades científicas e infra-estrutura tecnológica no Brasil para uso de recursos eletrônicos de comunicação e informação na pesquisa. Ci. Inf., Brasília, v. 32, n. 3, p. 62-73, set./dez. 2003.
GT2
765
Molto più che documenti.
Scopri tutto ciò che Scribd ha da offrire, inclusi libri e audiolibri dei maggiori editori.
Annulla in qualsiasi momento.