Sei sulla pagina 1di 119

VERA LUCIA DOYLE DODEBEI

TESAURO
linguagem de representação da memória documentária

RIO DE JANEIRO
2001
Ao Mestre
MANOEL ADOLPHO WANDERLEY

Aos meus alunos da


Universidade do Rio de Janeiro -UNIRIO
3

SUMÁRIO

1 Em defesa das linguagens documentárias, P.

2 Representação e meta-representação, p.

3 Língua e linguagem, p.

4 Tesauro – parte 1 : análise do domínio. p.

5 Tesauro – parte 2 : relações conceituais, p.

6 A propósito, p.

Referências bibliográficas, p.
1 Em defesa das linguagens documentárias

Até a primeira metade do século XX, a prática biblioteconômica demonstrava que a


organização de documentos podia ser conduzida por instrumentos previamente construídos,
de âmbito geral e com total independência do uso efetivo que se pudesse fazer dos acervos.

Nesse sentido, o papel do bibliotecário era, fundamentalmente, o de guardião dos bens do-
cumentais, embora já existisse a consciência da sua função de intermediação entre a neces-
sidade de informação do usuário e a efetiva disponibilização desta pela biblioteca.
A formação profissional do bibliotecário era, assim, centrada em dois eixos princi-
pais. O primeiro, indicava a forte presença dos conteúdos de cultura geral, tais como o do-
mínio de idiomas, a Filosofia e a História, na tentativa de assegurar que a intermediação se
procedesse com bom índice de sucesso. O conhecimento profundo do acervo fazia do bi-
bliotecário o próprio instrumento de interação entre documento e usuário. O segundo eixo,
das técnicas de organização do acervo, era representado por um conjunto de normas, tais
como os códigos de catalogação e as tabelas de classificação. Nesse caso, o papel do bi-

bliotecário se restringia ao de adaptar o conteúdo dos documentos ao instrumento codifica-


dor1.
Por volta de 1940, a explosão documental gerada pelo processo de especialização
do saber obriga os bibliotecários a questionar não só o seu objeto de estudo, como os pro-
cedimentos utilizados na organização dos acervos documentais2. O livro, até então conside-
rado o objeto de estudo inquestionável da Biblioteconomia, passa a disputar espaço com
outros gêneros e suportes documentais, principalmente artigos de periódicos e relatórios de
pesquisa, sendo esses últimos os que mais enfaticamente representaram a era da especiali-
zação do conhecimento.
Essa primeira mudança de paradigma no âmbito da organização e disponibilização
do conhecimento produz discussões sobre as técnicas de análise documentária3 vigentes. Se
no passado, a leitura que se podia fazer dos documentos (representação genérica) não aten-
dia mais às necessidades de especificidade dos temas produzidos pela comunidade científi-
ca, era necessário o desenvolvimento de instrumentos que, ainda no plano da representação
de conteúdo, dessem conta do saber ultra-especializado. Como conseqüência, os especialis-
tas em análise documentária não encontram nas linguagens documentárias tradicionais (or-
5

ganização do conhecimento geral) as condições necessárias para representar os conteúdos


informativos dos textos técnico-científicos produzidos e que deveriam constituir uma no-
va memória documentária.
É nesta ocasião que são estimulados estudos e experiências sobre a construção de
linguagens artificiais que pudessem representar o universo conceitual de campos específi-
cos do conhecimento. Essas linguagens, genericamente denominadas /linguagens documen-
tárias/, passam a ser objeto de estudo, não só dos bibliotecários, como de lingüistas e ou-
tros profissionais preocupados com a representação de conteúdos informativos para fins de
recuperação e disseminação da informação, tradução automática, análise de conteúdo4,
análises literárias, semióticas e lingüísticas, realizadas manualmente ou de forma automáti-
ca. No entanto, rapidamente verifica-se que, a despeito de sua eficaz função de recupera-
ção da informação, a construção de linguagens documentárias para campos específicos do
conhecimento vem a representar tarefa interdisciplinar extremamente onerosa.
Aliados ao problema da interdisciplinaridade na produção de conhecimentos, da
dificuldade de indexar documentos utilizando linguagens universais e do elevado custo de
construção de linguagens especializadas, dois fatores - o aumento de documentos em su-
porte eletrônico e a informatização do armazenamento dos registros desse mesmo conhe-
cimento - conduziram as atenções dos especialistas para a antítese da representação sintéti-
ca, ou seja, o acesso direto ao documento primário, em linguagem natural. No entanto, a
recuperação da informação em linguagem natural deve considerar a digitalização de textos
completos e o uso de operadores lingüísticos, sendo que esses últimos são ainda objeto de
estudos experimentais5.
Ao considerarmos que o acesso à informação armazenada em bases de dados digi-
talizados possa ser feito mediante a busca do texto completo, temos que forçosamente re-
fletir sobre algumas questões. Em primeiro lugar, o problema diz respeito ao tempo des-
pendido na localização da informação desejada. Tomando como exemplo uma biblioteca

tradicional contendo cerca de cem mil volumes, dispostos fisicamente por data de registro
no acervo, e sem qualquer instrumento de busca representativo do conteúdo, como índices
ou catálogos, quanto tempo um usuário levaria para localizar as informações necessárias?
Seria necessário percorrer milhões de páginas para selecionar aquelas que satisfizessem a
sua necessidade de informação. Transportando o exemplo para uma biblioteca virtual, onde
esses mesmos textos sofreram um processo de infografia 6, a questão do acesso ainda per-
6

manece no âmbito da velocidade. Mesmo tendo como atenuantes do tempo despendido na


busca, a possibilidade de utilizar todo o léxico disponibilizado, ou seja, selecionar pala-
vras-chaves em língua natural, e, ainda, considerar que o tempo de comparação da máquina
é muito superior ao visual humano, o resultado da busca fica comprometido pelas caracte-
rísticas próprias das línguas naturais. Essas características das línguas naturais, principal-
mente a polissemia, a homonímia, a sinonímia, além da função sintática, interferem no
resultado significativo da busca, quer dizer, não garantem que a informação recuperada
possa ser a mais próxima possível da informação desejada, dentro do mesmo campo se-
mântico.
Um outro aspecto a ser considerado em defesa das linguagens documentá-
rias é a sua função referencial. Como disse Samuel Johnson7, o conhecimento é de
dois tipos: conhecemos um assunto por nós mesmos ou sabemos onde podemos encontrar a
informação sobre ele. No último caso, o conhecimento torna-se público, formando estoques
de informação que precisam estar organizados para a socialização do seu uso 8. Essa orga-
nização do conhecimento público, principalmente no que diz respeito à disponibilização
deste pelas grandes redes de comunicação, implica em processos de normalização na
apresentação da informação. A normalização temática seria, portanto, mais uma função das
linguagens documentárias, definida por Wanderley9 como: a capacidade de obter, por
ocasião das respostas aos pedidos de informação, um máximo de indicações relevantes ou
pertinentes e, para tal, de coincidência entre as descrições de autoria do indexador e as do
usuário, numa palavra, a normalização.
Quanto à normalização descritiva, a grande contribuição para o compartilhamento
da informação foi dada por Paul Otlet. Rayward10, em artigo publicado no Journal of Ame-
rican Society of Information Science (JASIS), afirma que Paul Otlet é uma importante e
negligenciada parte da história da Ciência da Informação, uma vez que, junto com os cole-
gas belgas, criou um complexo de organizações em tudo semelhantes aos atuais sistemas

de hipertexto/hipermídia. No seu Traité de Documentation (1934), um dos primeiros trata-


dos sistemáticos do que hoje pode-se chamar de Ciência da Informação, Otlet especula
sobre telecomunicações, conversão texto-voz e sobre o que era necessário para as esta-
ções de trabalho computadorizadas, embora, é claro, ele não tivesse usado essa teminolo-
gia.
7

Uma das grandes contribuições de Otlet, além de ampliar o conceito tradicional de


documento, foi a de estender essa ampliação ao conceito de bibliografia, hoje nomeada de
base de dados, quando em meio digital ou até mesmo webgrafia, se disponibilizada virtu-
almente nas grandes redes (web). O desenvolvimento de um sistema que permitisse uma
racional organização do conhecimento foi a meta de Otlet, que iniciava o convívio com a
explosão documental, ou, como chamou posteriormente Bradford, o Caos Documentário11.
O sistema idealizado partia de um princípio que Otlet chamou de “princípio monográfico”.
A idéia era a de registrar partes do conteúdo de uma obra isoladamente em fichas, o que
permitiria uma organização temática hierarquizada. Essa técnica pode ser comparada hoje
à construção dos hipertextos, onde o usuário não percorre o “texto” de forma linear, mas
“navega”, a partir da construção de estratégias de busca singulares das cadeias de informa-
ção, pelas partes, ou nós de classes de informação. Assim, o usuário pode se movimentar
da referência bibliográfica ao texto completo, à imagem, ao som, a outras referências, a
outras imagens; parafraseando Umberto Eco12, numa navegação in progress.
Além disso, no que diz respeito à representação da informação para a recuperação
posterior por múltiplos usuários, ou à forma de descrever a informação de modo a manter
uma síntese do pensamento do autor, Otlet sugeria que o “princípio monográfico” deveria
ser aplicado aos resumos (abstracts) que acompanhavam as referências bibliográficas, e
que serviam como um refinamento à pesquisa de fontes. A idéia era destacar o que o livro
amalgamava, para reduzir tudo que fosse complexo a unidades passíveis de serem descri-
tas em folhas ou fichas separadas. O sentido, portanto, era o de recuperar apenas o que fos-
se de novo no conhecimento já disseminado. Assim, Otlet sugeria a desconstrução do
texto para sua reconstrução, a partir das seguintes constatações:
a) os livros apresentam apenas parte do conhecimento científico (completude)
b) apresentam conhecimentos falsos e verdadeiros (erro)
c) apresentam a mesma coisa mais de uma vez (repetição)

d) dividem a mesma informação por vários setores ou capítulos (dispersão)


e) não apresentam a informação por graus de importância (valor)

Sem dúvida, mesmo quando se busca a imparcialidade, só se pode desconstruir e


refazer um texto em função de determinações arbitrárias, uma vez que toda e qualquer clas-
sificação só opera no sentido da arbitrariedade. O sonho de Otlet em relação à construção
8

do “Livro Universal”, organizado por áreas particulares do conhecimento, nunca foi con-
cretizado e embora o objetivo de Otlet não tenha sido alcançado nesse sentido, as suas idéi-
as foram extremamente úteis no que se refere à análise e síntese dos conteúdos informati-
vos. O princípio da indexação da informação e da construção de resumos para facilitar a
recuperação da informação contou com as regras de análise documentária criadas para a
organização do “Biblion” ou Livro Universal, ou seja, a literatura deve ser analisada, iso-
lando-se quatro categorias gerais: fatos - interpretação dos fatos - estatísticas - fontes.
Além disso, outra contribuição importante ao acesso às fontes bibliográfi-
cas foi o desenvolvimento das normas técnicas para a descrição da forma e do conteúdo
bibliográfico. Inegavelmente, Otlet e sua equipe nos legaram as bases do que chamamos
hoje de redes de informação, que funcionam interligando as representações do conhecimen-
to em todos os campos do saber, para todos os tipos de objetos e relatos, ainda necessitando
urgentemente de normalização. Essa normalização diz respeito aos formatos de apresenta-
ção da informação, aos protocolos de acesso às bases de dados, enfim, a uma nova lingua-
gem que de documentária passa a cibernética e que, em alguns casos, se aproxima da lin-
guagem pictórica, dos hieróglifos.
Se considerarmos as possibilidades de localização da informação desejada na Web,
tal como sintetiza SAÀDANI13, vemos que as melhores chances de obtê-la são aquelas que
utilizam operadores matemáticos na combinação e a restrição de conceitos representativos
da pergunta para a qual se deseja uma resposta. Não uma resposta objetiva, mas a indicação
de fontes de informação moduladas isto é, de uma cadeia de complexidade que parte dos
sites até se chegar ao texto primário. Vale lembrar que, neste momento, temos a possibili-
dade de encontrar ou não o texto primário digitalizado.
Caso já pudéssemos utilizar os operadores lingüísticos ainda em estudo, tais como
os sintagmas nominais discutidos por Brito14, a pergunta feita em lingua natural não preci-
saria ser decomposta em conceitos organizados por operadores matemáticos. Na prática, no

entanto, ao pesquisarmos um assunto na Web, chegamos a duas conclusões: a primeira é a


de que os engines (programas de busca de informações) são especialmente eficientes na
localização de sites genéricos sobre o domínio do campo semântico de interesse; a segun-
da conclusão é a de que um bom resultado refinado para um assunto específico só é ofere-
cido pelas bases de dados que operam com operadores matemáticos, isto é, que utilizam a
interface da linguagem documentárias entre documentos e usuários. Seria prematuro, con-
9

tudo, afirmar que ambos os sistemas se complementam e continuarão a coexistir por longo
tempo.
Enquanto aguardamos os resultados dos estudos nos campos da Lingüística e das
Ciências Cognitivas, a utilização das linguagens documentárias nos parece, ainda, indis-
pensável para a organização e o acesso ao conhecimento público.

NOTAS E CITAÇÕES
1
O primeiro Curso de Biblioteconomia no Brasil foi criado pelo Decreto n. 8.835, de 11/07/1911. Iniciou em
abril de 1915 na Biblioteca Nacional do Rio de Janeiro, tendo como diretor Manuel Cícero Peregrino Silva.
O programa deste curso pioneiro se inspirava no modelo francês (École de Chartes), dando ênfase ao aspec-
to cultural e informativo. Em 1929, o "Mackenzie College", hoje Universidade Mackenzie, de São Paulo,
criou um Curso de Biblioteconomia, inspirado no modelo norte-americano, que enfatizava os aspectos téc-
nicos da profissão. Cf. http://www.ced.ufsc.br/bibliote/encontro/bibli7/eb7art2.html
2
Sobre a impacto desta questão na Biblioteconomia Cf. DODEBEI, V.L., MENDONÇA DE SOUZA, Alfre-
do. Ciência da Informação: formação e interdisciplinaridade. Rio de Janeiro: IBICT/CNPQ/ ECO/USP,
1992.
3
Coyaud define (tradução livre) Análise Documentária como toda operação efetuada sobre o documento
bruto, a fim de torná-lo utilizável (i.e. “recuperável”) para a pesquisa documentária. Cf. COYAUD, Mauri-
ce. Analyse et recherche documentaire. In: __________. Linguistic et documentation: les articulations lo-
giques du discours. Paris: Larousse, 1972. p130
4
O conceito de análise de conteúdo apresentado pela autora diz respeito ao conjunto de técnicas destinadas
a ressaltar do conteúdo de diversas categorias de documentos escritos, certos elementos singulares de onde
se inferem características psico-sociológicas do objeto analisado. Cf. CUNHA, Isabel M. R. Ferin. Análise
documentária : parâmetros teóricos. In: ANÁLISE documentária: a análise da síntese. São Paulo: USP,
1986. p. 42.
5
Estudos fundamentados na Inteligência Artificial, na Sintaxe e em menor escala na Semântica. Cf. COU-
LON, Daniel. Informática e linguagem natural: uma visão geral dos métodos de interpretação de textos
escritos. Brasília, IBICT; Rio de Janeiro, SENAI, 1992.
6
O conceito de infografia para o autor é o de digitalização computadorizada. VIRILIO, Paul. A máquina de
visão. Rio de Janeiro: José Olympio, 1994. p. 9
7
VICKERY, B. C. Knowledge representation: a brief review. Journal of Documentation, 42, n. 3, p. 145-
159, Sept. 1982.
8
A esse respeito consultar um novo campo de especialização denominado Arquitetura da Informação. Em
Matthew Cutler: O que é exatamente arquitetura de informação? Para os webmasters, é a organização cons-
ciente de grandes volumes de informação, de forma que os usuários possam navegar de forma fácil e efici-
ente em seus site - função semelhante ao design... A criação de uma estrutura de informação sólida deveria
fazer parte da estratégia de Internet desde o início. O fio condutor deveria ser a criação da noção de hierar-
quia, um conceito de localização de cada item em termos de importância e sua relação com o todo. O objeti-
10

vo é oferecer informação suficiente para os visitantes decidirem facilmente onde ir, mas não a ponto de fica-
rem sobrecarregados de dados e confusos, ou de serem levados para onde não querem ir. Cf.
http://www.uol.com.br/webworld/tecnologia/arquitet2.htm
9
WANDERLEY, Manoel Adolfo. Linguagem documentária: acesso à informação. Rio de Janeiro, Ci. Inf.,
v. 2, n. 2 , p. 175-217, 1973. p. 180
10
RAYWARD, W. Boyd. Visions of Xanadu: Paul Otlet (1868-1944) and hypertext. Journal of the Ameri-
can Society for Information Science, v. 45, n. 4, p. 235-250, 1994.
11 BRADFORD, S. C. The documentary chaos. In: ____. Documentation. London: Crosby Lockwood & Son,
1953. cap. IX.
12
ECO, Umberto. A estrutura ausente: introducão à pesquisa semiológica. São Paulo: Perspectiva, 1991. p.
90, 91.
13
SAÀDANI, Lalthoum; BERTRAND-GASTALDY, Suzanne. La représentation dans Internet des comnais-
sances dún domaine. Documentation et bibliothèques, jan./mars, p. 27 – 42, 2000.
14
BRITO, Marcílio de. Sistemas de informação em linguagem natural: em busca de uma indexação automáti-
ca. Ci. Inf., Brasília, v. 21, n. 3, p. 223-232, set./dez., 1992.
2 Representação e meta-representação

Neste capítulo pretendemos discutir os modelos de organização do conhecimento, a


partir das interfaces dos conceitos de conhecimento, representação, informação e memória.
Essa discussão tem por objetivo delinear o funcionamento das memórias documentárias no
universo das representações sociais e, particularmente, fundamentar o papel das lingua-
gens documentárias como metalínguagens na produção de conhecimentos.
No âmbito da Ciência da Informação, o conhecimento é discutido no seu aspecto
representacional, tal como em Vickery1, que o distingue em dois tipos: conhecimento pes-
soal e conhecimento público. Neste enfoque, o significado mais apropriado de público leva
em consideração a idéia de conhecimento pessoal publicado, disponível para uso e, portan-
to, intencionalmente acumulado. O conjunto das representações do conhecimento vai, as-
sim, se transformar em estoques de informação que de algum modo precisam estar ordena-
dos para melhor serem utilizados. É nesse momento que se formam as memórias documen-
tárias, consideradas construções simbólicas do conhecimento.
As memórias documentárias, como constructos do conhecimento gerado pela soci-
edade, reúnem cadeias de representações presentes na dinâmica social, desde a produção do
conhecimento até a sua assimilação e reprodução. Essas representações são objeto de estu-
dos de vários campos do saber que as analisam a partir de fundamentos teóricos diversifi-
cados, as quais podem ser estruturadas em modelos, por exemplo, matemáticos, psico-
cognitivos, sistêmicos2. Os modelos derivam da necessidade humana de entender a realida-
de, aparentemente complexa e são, portanto, representações simplificadas e inteligíveis do
mundo, permitindo vislumbrar as características essenciais de um domínio ou campo de
estudo. Esta simplificação exige criatividade, tanto sensorial quanto intelectual, o que im-
plica em admitir-se que, na construção de modelos, algumas características da realidade,

que não se referem diretamente aos objetos buscados, são desprezadas ou abandonadas, em
função da maior inteligibilidade ou facilidade de compreensão. De fato, não teria sentido
substituir a realidade (aparentemente complexa) por modelos ainda mais complexos.
Como observam Haggett e Chorley3, os modelos são “aproximações altamente sub-
jetivas, no sentido de não incluírem todas as observações e mensurações associadas, mas,
como tais, são valiosos por ocultarem detalhes secundários e permitir o aparecimento dos
12

aspectos fundamentais da realidade”. Desta forma, os modelos são, sempre, aproximações


seletivas que, eliminando aspectos acidentais, permitem o aparecimento dos aspectos fun-
damentais, relevantes ou interessantes, do mundo real, sob alguma forma generalizada.
Além da simplificação/simplicidade, os modelos têm como característica, o fato de
serem estruturados, isto é, os aspectos selecionados da realidade são explorados em ter-
mos de suas relações com outros modelos e aspectos dessa realidade. Uma outra caracterís-
tica, também muito importante, dos modelos, é a sua natureza sugestiva (a visão global de
um modelo) que permite ao conhecimento um avanço mais significativo do que aquele que
se poderia obter pela análise de apenas uma das suas partes. Na medida, no entanto, em que
um modelo é apenas uma aproximação à realidade, ele é uma analogia, que permite re-
formular o conhecimento sobre alguns aspectos do mundo real.
Os modelos têm por essência, o fato de serem simples, acurados, estruturados, su-
gestivos, representando analogias ao mundo real, que podem ser reaplicados a novos con-
juntos de observações e nesse sentido, são necessários por constituírem uma ponte entre os
níveis da observação e do teórico. Os modelos são, portanto, construcões da mente huma-
na, que têm função psicológica, aquisitiva, organizacional, normativa, sistemática, constru-
tiva e de parentesco, o que permite a comunicação das idéias científicas, na medida em que
muitos modelos se aplicam a mais de um conjunto de observações, de mais de uma área do
conhecimento. Como observa Clarke4, a existência de um modelo pressupõe a existência
de uma teoria subjacente, uma vez que um modelo é apenas uma expressão simplificada,
formal e esquemática de uma teoria, implícita ou explícita, desenvolvida para uma situação
particular. Um estudo cuidadoso de grupos de modelos, aparentemente expressando um
delineamento comum de teorias para diferentes situações pode, assim, ajudar a expor e a
articular teorias latentes, de um modo poderoso e concreto. É ainda Clarke quem afirma
que as hipóteses são geradas a partir da expressão modelada de uma teoria, surgindo a ex-
planação das hipóteses testadas, as quais são testadas usando-se análises relevantes em ca-

tegorias significativas de dados.


Os modelos são tipificados de várias formas, em função das próprias ideologias
inerentes de cada autor ou área de conhecimento. Assim, para Haggett e Chorley, os mo-
delos podem ser descritivos e normativos - o primeiro trata de certa descrição estilística da
realidade, e o segundo, do que se pode esperar que acorra sob certas condições estabeleci-
das. Já para Clarke, podem ser operacionais e de controle, o que, em essência, não altera a
13

proposição de Haggett e Chorley. Também em Ciência da Informação tais classificações


são variadas. Burt e Kinnucan5 agrupam os modelos em cognitivos (ou mentais), conceitu-
ais e semâticos, mas, de um modo geral, este padrão classificatório não modifica os anteri-
ores.
Em termos pragmáticos, no entanto, considerando-se forma e expressão, os mode-
los podem ser agrupados ou classificados em uma série interminável de tipos. Sem se pre-
tender a exaustividade, pode-se reconhecer, ainda de acordo com Clarke, os seguintes tipos
de modelos: físicos/concretos, ou mentais/lógicos. Dentre os primeiros destacam-se os mo-
delos em escala real ou reduzida, dinâmicos ou estáticos. Dentre os segundos deve-se men-
cionar os modelos lógico-conceituais, os matemáticos e estatísticos, os gráficos, os sistêmi-
cos, os semânticos e as simulações por computador, para mencionar apenas os mais impor-
tantes.
Um modelo que se revela correto ou útil numa infinidade de aplicações, em circuns-
tâncias distintas e sobre dados diferentes, que apresenta, ao mesmo tempo, um amplo poder
explanatório, pode ser definido como um paradigma. Como observam Haggett e Chorley,
os paradigmas podem ser considerados como modelos estáveis da atividade científica, sen-
do, em certo sentido, modelos em escala ampla, mas diferindo dos modelos no sentido de
que raramente são formulados tão especialmente, tratando-se de modelos de busca do
mundo real, e não de modelos limitados a alguma área específica do conhecimento huma-
no. Neste sentido, os paradigmas podem ser entendidos como super-modelos, dentro dos
quais os modelos são colocados em escala mais reduzida.
Um paradigma deve ser analisado, e entendido, em função da sua escala, domínio e
poder explanatório. Nas ciências sociais, costumam ser agrupados de acordo com seus ne-
xos essenciais. Desta forma, os vários autores reconhecem paradigmas ecológicos, locacio-
nais/geográficos, morfológicos, antropológicos/etnológicos, evolucionistas e sistêmicos,
dentre outros.

Em Ciência da Informação, aparentemente, é o paradigma sistêmico, que deriva da


teoria geral de sistemas de Von Bertalanffy, aquele que é mais empregado. Opondo-se à
visão extremamente mecanicista do mundo, que predominava na ciência, Von Bertalanffy
apud6 desenvolveu uma teoria a que designou Teoria Geral dos Sistemas, propondo-se a
visualizar o mundo, e o universo, em termos de um grande conjunto interconectado, dentro
do qual poder-se-ia separar subconjuntos (ou subsistemas) para análise. De acordo com
14

Marcondes e Sayão7, inicialmente Bertalanffy abordou o problema de sistemas dentro de


uma perspectiva quase utilitária, dando a impressão de que a visão sistêmica se provou
necessária a partir do instante em que se tornou essencial lidar com complexidade.
A tecnologia nos conduziu a pensar não em termos de máquinas simples, mas em
termos de sistemas... Uma máquina a vapor, um automóvel, um aparelho de rádio, esta-
vam dentro da área de competência de um engenheiro, mas quando começamos a lidar
com mísseis, veículos espacias, isto é, problemas que envolvem tecnologias heterogêneas,
como por exemplo,
financeiros, relacionamento
econômicos, homem-máquina,
sociais e políticos, mecânica,
torna-se necessária umaeletrônica,
outra formaproblemas
de abor-
dagem.
Para Bertalanffy isto significa uma mudança nas categorias básicas de pensamento,
da qual a complexidade da tecnologia moderna é unicamente uma manifestação, possivel-
mente não a mais importante. De um jeito ou de outro, nós somos forçados a lidar com
complexidade, com o “todo” ou “sistemas”. A implicação disso é uma reorientação básica
do pensamento científico. O conceito de sistema não é novo, remontando à filosofia da
Grécia clássica. No entanto, foi com a 2ª Guerra Mundial que tal termo passou a ser usado
como sinônimo de metodologia, ou seja, o arranjo lógico de processos ou meios para atin-
gir fins. Na atualidade, um sistema é visto como um conjunto de elementos, propriedades e

relações, podendo ser definido como um conjunto de elementos em interação, que realizam
determinadas funções para determinados propósitos.
Sistemas suportam processos, e mesmo que se faça distinção entre sistemas naturais
e aqueles feitos pelo homem, na verdade, estes últimos sempre apresentam algo dos primei-
ros. Um processo, por sua vez, é uma seqüência de eventos, sob controle, para a obtenção
de resultados específicos, sendo um fenômeno dependente do tempo. Fundamentalmente,
envolve troca, transformação, transmissão de energia, matéria, informação. A distinção
fundamental entre sistema e processo é que este último é o aspecto dinâmico do primeiro.
Todo sistema inclui um processo, e, como sistemas não existem no vácuo, interagem com
seu meio ambiente, podendo ser difícil estabelecer-se os limites entre ambos. São os pro-
pósitos ou objetivos que, além de estabelecerem as razões de existência do sistema, descre-
vem-lhe os limites com o meio ambiente, sendo óbvio que este também está sujeito a mu-
danças. A adaptação de um sistema ao meio ambiente, em geral, é crucial, e depende inte-
gralmente da retro-alimentação.
Ainda de acordo com Marcondes e Sayão, o fato de a ciência moderna ser caracteri-
zada por um alto grau de especialização, um alto grau de compartimentação, de fragmenta-
15

ção dos papéis e responsabilidades dos cientistas, engendra, entre outras coisas, uma neces-
sidade vital de estruturas técnicas e de técnicas complexas para cada disciplina. Dessa for-
ma, “os físicos, os biólogos, os psicólogos e os cientistas sociais estão encapsulados em
seus universos particulares. É difícil estabelecer um diálogo entre um casulo e outro”. Essa
fragmentação se contrapõe a um outro aspecto interessante, que possivelmente foi o fato
determinante no processo de concepção da teoria geral dos sistemas por Bertalanffy. “Fa-
zendo um levantamento na evolução da ciência moderna, nos deparamos com um fenôme-
no surpreendente. De forma independente, problemas e concepções similares foram traba-
lhados e desenvolvidos em áreas completamente diferentes”. Dessa forma, existem mode-
los, princípios e leis que se aplicam a sistemas generalizados ou suas subclasses, não im-
portando sua área, a natureza de seus elementos componentes, nem a relação ouforças
entre eles. Parece então legítimo aspirar a uma teoria de princípios universais passível de
ser aplicada aos sistemas em geral. É nesse sentido que Bertalanffy postula uma nova dis-
ciplina nomeada Teoria Geral dos Sistemas, cujo objetivo e formulação derivarão de prin-
cípios válidos para sistemas em geral.
“A conseqüência de se aceitar a existência de propriedades gerais dos sistemas é o
aparecimento de similaridades estruturais, ou seja, isomorfismo entre diferentes áreas. E-
xiste uma correspondência nos princípios que governam o comportamento de entidades
intrinsecamente distintas”. Um exemplo simples é a lei do crescimento exponencial, que se
aplica ao crescimento de bactérias, animais ou humanos, ao mesmo tempo que ao cresci-
mento da pesquisa científica, medido pelo número de publicações”. A partir destas propo-
sições, Bertalanffy conclui que esta correspondência é proporcionada pelo fato de que as
entidades envolvidas podem ser consideradas como sistemas, isto é, um complexo de ele-
mentos em interação. Isto faz com que estes fenômenos, embora tendo srcens distintas,
estejam subjugados a um princípio geral comum. De fato, “são muitos os exemplos de
princípios idênticos que são descobertos várias vezes, pois os pesquisadores de um campo

desconhecem que a estrutura teórica do seu trabalho ou pesquisa já está desenvolvida em


outro campo”. Bertalanffy é bastante enfático quando afirma que a teoria geral de sistemas
é uma ferramenta útil na transferência de modelos de uma área para outra.
Indo mais adiante, Bertalanffy afirma que existe um outro aspecto ainda mais im-
portante na teoria de sistemas, o qual está relacionado com o conceito de complexidade
organizada (organized complexity). A física clássica, diz Bertalanffy, resolve com sucesso
16

os problemas concernentes à complexidade desorganizada (unorganized complexity), atra-


vés da segunda lei da termodinâmica e das leis da probabilidade. Um exemplo disso é o
comportamento de um gás. “Em oposição, o problema fundamental atual é o relacionamen-
to à complexidade organizada. Conceitos tais como organização, holística, diretividade
(directivness), teleologia e diferenciação, fogem ao escopo da física convencional. Entre-
tanto, eles surgem a todo instante, na biologia, nas ciências comportamentais e sociais; e
são indispensáveis quando se trata de organismos vivos e grupos sociais. Dessa forma, um
problema básico proposto pela ciência moderna é a teoria geral da organização. A teoria
geral de sistemas está, em princípio, capacitada a delinear tais conceitos e, em alguns casos
específicos, estabelecer para eles análises quantitativas”.
Como Bertalanffy observou, com muita propriedade, a física convencional, modelo
para todas as ciências, apresenta limitações graves, geralmente ignoradas pelos cientistas.
De fato, a física convencional lida somente com sistemas fechados, isto é, sistemas isola-
dos de seu meio ambiente. A segunda lei da termodinâmica, por exemplo, só se aplica a
sistemas fechados. Os sistemas vivos, entretanto, são sistemas abertos. O mesmo se pode
afirmar quando se trata da teoria geral da comunicação, ou da informação, que incorporam
a noção de feedback e de ruído, portanto, sistemas abertos ao seu meio ambiente.
Neste sentido, como observaram Haggett e Chorley8, discutindo a Nova Geografia,
a informação é suscetível de tratamento em termos da teoria geral da informação. “Nesse
contexto, as informações concretas, factuais, só têm relevância dentro de um corpo de refe-
rência mais geral, e esta operação básica de como definir um fato relevante só pode ser
realizada com base num arcabouço teórico. Há também níveis diferentes de organização
das informações relevantes.
Burt e Kinnucan9, analisando os modelos utilizados em Ciência da Informação para
o Annual Review of Information Science and Technology, dizem que a modelagem da in-
formação refere-se à identificação de componentes de modelos e seus elos, aos modos de

expressão, ao processo de construção do modelo, e ainda ao delineamento dos paradigmas


que afetam aos modelos que estão sendo construídos. Paradigmas refletem ao mesmo tem-
po os propósitos e as fronteiras de um modelo. Lyytinen10 considera dois paradigmas para a
modelagem. O primeiro refere-se ou é um mapeamento da realidade, e é essencialmente
uma técnica descritiva para representar alguma coisa que é claramente compreendida mas
17

que apresenta um comportamento ambíguo. A necessidade de certeza nesse enfoque traz


uma limitação severa à sua aplicabilidade.
O segundo paradigma de Lyytinen diz respeito ao desenvolvimento da linguagem
formal, e é concentrado na representação da estrutura, conteúdo e uso da mensagem lin-
güística, já que ele pode tratar mais acuradamente com a natureza ambígua das configura-
ções da realidade.
Considerando-se a totalidade dos modelos de informação, tem-se idéia de um conti-
nuum, no qual em um extremo está o ser humano, com suas idiossincrasias, que podem ser
entendidas como o seu conhecimento, e no outro extremo está o sistema de informação.
Entre essses extremos, encontram-se representações que oscilam entre um ou outro pólo, as
quais procuram explicar as diferenças entre eles. Modelos do primeiro pólo são os modelos
cognitivos. Do segundo, são modelos de dados. Na faixa intermediária, aparecem os mode-
los conceituais (mentais, estruturais, semânticos, etc).
Em Ciência da Informação, o modelo mais amplamente utilizado foi, ao longo dos
anos, o de Shannon e Weaver11, que propuseram um modelo matemático para explicar a
comunicação entre dois pólos - o emissor e o receptor. Tal modelo, criticado, adaptado,
modificado, continua, ainda hoje, sendo amplamente utilizado, na medida em que, de modo
acurado, simples e preditivo, propicia uma boa idéia de como se dá a comunicação huma-
na. É, em essência, um modelo matemático, da mesma forma que as leis de Zipf, Bradford
e outras, amplamente utilizadas na Bibliometria, mas é, também, um modelo sistêmico, na
sua concepção geral, interligando o emissor ao receptor. Outros modelos valem-se de com-
parações com o funcionamento de computadores, ou voltam-se para a representação do
conhecimento; há modelos envolvidos com inteligência artificial, outros com tomada de
decisão. Em resumo, a Ciência da Informação absorveou “importa” numerosos gêneros de
modelos, que, de ângulos distintos, descrevem a sua realidade.
Para estudar as representações documentárias destacamos o modelo de caráter sis-

têmico denominado Ciclo da informação, ou modelo de transferência da informação, que


reduz a realidade da representação do conhecimento a seis etapas: produção, registro, aqui-
sição, organização, disseminação e assimilação. Essas etapas, amplamente apresentadas
como paradigmáticas na Ciência da Informação, procuram simplificar os processos criados
pela produção, acumulação e uso de conhecimentos e os produtos gerados em suas várias
formas representacionais, quer sejam fontes primárias, secundárias ou terciárias. Este é o
18

modelo, até o momento, mais adequado para representar o processo de transferência da


informação, o papel exercido por cada segmento social envolvido nesta transferência e a
estrutura das instituições de preservação da memória social. Com alguns acréscimos à pro-
posta srcinal de Lancaster 12, a figura abaixo incorpora ao modelo o conceito de memória
documentária, dividindo o universo do conhecimento em dois subconjuntos: informação e
documento.

O primeiro universo, inscrito na parte superior do círculo, descreve a dimensão na


qual se dão as trocas de informação, sendo essa realidade representada pelas etapas de pro-

dução, registro e assimilação. Esse subconjunto, que existe independentemente das etapas
inferiores, permite a análise das ações decorrentes da geração de novos conhecimentos dis-
seminados de modo informal ou formalizados em registros materias (incluídos os eletrôni-
cos), em redes eventuais ou organizadas sistematicamente. Seu campo de estudo, interdis-
ciplinar, reúne principalmente os fundamentos da psico-cognição, da comunicação, da so-
ciologia de redes de informação, da economia e mercadologia.
19

 Produção de conhecimentos
Com a mudança do paradigma da ciência, que deixa de se pautar pela verticalidade (es-
pecialização), se conduzindo mais no sentido da horizontalidade das abordagens transdis-
ciplinares, as informações produzidas pela sociedade dificilmente podem ser
antecipadamente organizadas por campos de interesse, em categorias fixas e imutáveis.
Essas informações são disponibilizadas por vários segmentos da sociedade e é no momento
da procura ou busca que as interseções de significado vão ocorrer. Isto é, priori,
a não se
pode afirmar que um texto de medicina possa somente interessar aos médicos, assim como
uma foto da clonagem de ovelhas ser útil apenas aos geneticistas. Aliados ao fator de
gênero, os atributos de qualidade (valor intrínseco), quantidade e conveniência da
informação produzida na atualidade devem ser considerados nesse universo dependente
dos produtos (informação), o qual se configura no que chamamos de sociedade da
informação.
 Registro

Quanto à diversificação dos suportes (registro), as informações produzidas poderiam,


grosso modo, ser classificadas em textuais, visuais, sonoras ou tridimensionais e, ainda, por
uma combinação dessas categorias. Com efeito, os suportes vão se desenvolvendo em fun-
ção dos avanços tecnológicos, configurando-se aí não só a sua diversidade como também a
duplicidade. Hoje temos condições de acessar uma revista científica em papel, em CD-
ROM e até em microformas (técnica muito utilizada preservação e reprodução de docu-
mentos) ou em arquivo eletrônico, que parece ser o meio mais rápido e de baixo custo para
a disseminação da informação. Temos a possibilidade de analisar uma escultura, com todos
os detalhes técnicos, em um museu virtual, como em um museu tradicional. Pode-se ter
acesso a um acontecimento em torno de um produto como por exemplo a mostra Monet, no
Museu de Belas Artes do Rio de Janeiro, que intercalou a pintura srcinal, fotos da tela e
vídeos temáticos das seqüências inspiradoras do pintor na confecção de um grupo de obras
sob um mesmo tema. Os suportes são os mais variados e, às vezes, passam a se constituir

em acessórios à localização da informação, ou seja, fazem parte do universo de restrição à


uma estratégia de busca temática, à exceção das pesquisas que visam ao suporte como ob-
jeto de interesse, passando o tema a ser secundário.
 Assimilação
A assimilação das informações geradas pelo conhecimento e que proporcionarão a
produção de conhecimentos novos pode ser estudada, entre outros, sob o ângulo da veloci-
20

dade de sua obsolescência. Como cita Virilio13, ao lado das dimensões espaço e tempo,
existe hoje uma outra dimensão, que é a luz. Não a luz no sentido puro da claridade, da
visão, do entendimento, mas a luz em sua versão de trajeto. Para Virilio, o que nos move
hoje no sentido das representações sociais não é mais o espaço e o tempo, mas o movimen-
to, o trajeto, invertendo assim o conceito de velocidade da luz para a luz da velocidade. É o
tempo real que importa. Não é mais uma questão de localização absoluta, mas de percep-
ção relativa, a qual Virilio nomeia de energia cinemática da relatividade. Quanto mais ve-
loz a apresentação dos produtos à sociedade, mais rápido estes ficam obsoletos. O senti-
mento predominante da sociedade atual pode ser caracterizado pela ansiedade de informa-
ção. Ansiedade no sentido de saber que existe uma informação relevante e não conseguir
acessá-la em tempo hábil, ou de produzir uma informação importante e não conseguir dis-
ponibilizá-la. Qual informação e quanto dela é assimilada, é uma questão complexa, men-
surável apenas indiretamente pela quantidade e qualidade dos novos conhecimentos produ-
zidos.
O segundo subconjunto, representado pela parte inferior do círculo, ao contrário do
primeiro, não tem existência independente. As seis etapas completas são necessárias ao
ciclo de vida da informação, embora só o subconjunto representado pela seleção, represen-
tação e disseminação se configurará emmemória documentária. O campo de estudo da
memória documentária e seus fundamentos mais específicos são a teoria da classificação, a
teoria do conceito e as teorias da comunicação, que são denominadas, no seu conjunto,
teorias da organização do conhecimento e, especificamente, teoria da memória documentá-
ria.
Segundo Wanderley14, toda coleção documentária pode ser representada por um
quadro de entrada dupla chamado usualmentematriz documentária, em que se atribui cada
linha a um documento e cada coluna a uma das múltiplas características a partir das quais
serão ulteriormente procurados os documentos. Com base nessa representação simbólica,

seria possível edificar a teoria geral da organização das memórias documentárias ou o


conjunto de elementos que permite o acesso aos documentos de uma coleção a partir de
suas características, e a sistemática dos processos de seleção.
21

A representação da informação é composta, assim, dos seguintes elementos:

• Objetos (coisas que queremos representar)

• Propriedades (caraterísticas de tais coisas)

Para uma eficaz memória seletiva é possível levar-se a segmentação da matriz até
aos elementos, linhas ou colunas tomadas isoladamente, a cada uma das quais se atribuirá

um elemento seletivo, isto é, uma célula de memória.


22

Usam-se os objetos e as propriedades por pertinência recíproca, isto é: o objeto


constitui um conjunto ou uma classe de propriedades e, portanto, um conjunto ou uma clas-
se de objetos constitui uma propriedade. Cada termo divide o conjunto de termos perpendi-
cularmente em duas partes - os que lhe pertencem e os que não lhe pertencem.
Os processos informacionais de representação do objeto tratam, portanto, das rela-
ções entre as coisas e as suas características, e da maneira de manipular as representações
em seus vários suportes, em vez de manipular as próprias coisas. A memória documentá-
ria pode ser explorada tradicionalmente, como é o caso das fichas unitermo, ou eletronica-
mente, nos arquivos seriais e invertidos que estão presentes nos modelos de busca em bases
de dados bibliográficos e nos motores de busca ( search engines) da Internet.
O primeiro aspecto sob o qual a memória documentária pode ser percebida, o con-
creto, torna tal representação uma imagem geométrica da estrutura material da memória; o
outro, o abstrato, prende-se ao conteúdo ideológico da coleção, isto é, à organização de
dados e das noções características dos documentos contidos nela. Salvo raríssimas exce-

ções, as coleções documentárias ultrapassam, quer horizontal, quer verticalmente, a possi-


bilidade de utilização de semelhante matriz materializada de modo direto no papel, num
espaço e em duas dimensões.
Cada célula de memória é igualada ao elemento seletivo obtido pela escolha do cru-
zamento de atributos ideológicos com a seqüência material da disposição dos documentos.
Tal cruzamento é, no entanto, limitado à escolha de atributos feita pelo analista da infor-
23

mação e, ainda, à dificuldade imposta pela própria natureza da língua natural, na qual se
apresentam tanto os documentos como os pedidos de busca de um documento na coleção.
Tanto pelo aspecto quantitativo, isto é, o número de atributos escolhidos, como pelo quali-
tativo - possibilidades de interpretações semânticas - , a memória documentária ainda se
caracteriza como memória virtual de acesso ao documento primário. Ela não oferece a
garantia do acesso, apenas a possibilidade.
Montgomery15 descreve a estrutura da memória documentária em um modelo de
concepção sistêmica, denominado Sistema de Recuperação da Informação (SRI), no qual
os dados de entrada são, ao mesmo tempo, as representações das demandas de informação
pelo público e as representações do acervo ou coleção. O sistema processa essas represen-
tações, comparando-as e devolvendo-as sob a forma de novas representações direcionadas
a cada demanda. A retroalimentação é garantida pelas novas produções de conhecimento
que serão selecionadas para o ingresso no sistema de informação. Esse processo, denomi-
nado de Recuperação da Informação, pode ser considerado como um filtro, pelo qual só
transitam as informações demandadas, embora nem sempre essas se configurem como as
mais necessárias.
O modelo abaixo toma por base as simplificações apresentadas por Montgomery,
que já demonstrava a intenção de salientar a importância das representações documentárias
no sucesso do “casamento” entre público e acervo.
24

A análise do modelo SRI nos conduz às etapas inscritas na parte inferior do círculo, já
configurada como memória documentária.
 Seleção
A primeira etapa do subconjunto da memória documentária e terceira etapa do ciclo da
informação é identificada pelos processos de seleção e aquisição que não são processos ao
acaso, ao contrário, devem ser planejados em função das características da instituição que
mantém acervos documentais. Ambos valem-se do princípio da economia. Quer dizer, fun-
cionam como filtros da sociedade da informação, a fim de favorecer o equilíbrio entre as
necessidades de informação do público usuário e a oferta da sociedade. Segundo Mc Gar-
ry16, “necessidade” é um conceito básico nos estudos de informação mas difícil de definir

satisfatoriamente. Essencialmente, ele implica a “falta” de algo que se estivesse presente


contribuiria para nosso bem-estar e para facilitar o alcance de quaisquer objetivos que te-
nhamos em mente. O conceito de necessidade passa pelos termos “vontade”, “desejo”, “an-
seio” e “exigência” e está intimamente ligado à idéia de motivação.
Assim, a seleção, principalmente, é um processo redutor, e como tal faz uso da
comparação como indicador de tomada de decisão para a aquisição. A função das unidades
25

que gerenciam a seleção ea aquisição de documentos é, pois, voltada à comparação entre a


oferta de informações com as demandas da comunidade usuária. No plano quantitativo, o
processo de aquisição é ainda mais redutor, uma vez que deve ajustar as escolhas qualitati-
vas aos recursos postos à disposição pela instituição. Sem dúvida, este primeiro componen-
te do que chamamos universo documental, dentro do ciclo de vida da produção de conhe-
cimentos, é o que vai influenciar com maior peso a representatividade das memórias do-
cumentárias em relação às trocas de informação na sociedade.
Se a seleção já implica em redução de informação, a próxima etapa, representação
do conhecimento, é ainda mais redutora. A complexidade do tema aliada a interdisciplina-
ridade das abordagens nos leva a uma discussão mais detalhada do que possa ser o conceito
de representação para a Ciência da Informação, seus fundamentos teóricos e seu uso na
organização da memória documentária.
 Representação do conhecimento
Fala-se em representação hoje como um conceito redentor que poderia dar conta de to-
do gênero de discussão. Discutir o conceito isoladamente, sem impor limitações de domí-
nios e de espaço-tempo seria o mesmo que tentar conceituar cultura, liberdade, memória,
expressões metafóricas e complexas que, sem o cuidado da reflexão, passam a ocupar o
lugar de todos os significados. Do ponto de vista desse espaco-tempo-acontecimento, a
literatura nos mostra que vem existindo uma fértil discussão sobre o conceito de represen-
tação em cada domínio, na tentativa de explicitar a operação interna de um campo do co-
nhecimento e sua interação com as bordas ou os limites de campos vizinhos. Na Ciência da
Informação, particularmente, podemos observar o nascimento e a evolução das expressões
/representação do conhecimento/ e /representação da informação/ bastando para isso efetu-
ar um estudo da literatura17. Quanto à última expressão, /representação da informação/,
uma busca direta na Internet resultou em 34.000 referências, na forma de artigos acadêmi-
cos, programas de disciplina, consultorias comerciais, encontros e eventos em vários domí-

nios com ênfase porém, na esfera da organização do conhecimento.


As abordagens que traçam uma genealogia do conceito representação, especialmen-
te sobre o binômio conhecer-representar, se inscrevem no campo da filosofia tal como em
Foucault18 que leva ao extremo essa discussão ao resgatar pela linguagem a idéia do mundo
com representação. Mas é exatamente na filosofia da linguagem que as interpretações ou
leituras feitas de filósofos sobre esta questão ora privilegiam a noção de representação, ora
26

a excluem como condição necessária do conhecer. No campo da Lingüística, por exemplo,


Magro19 considera a noção de representação comoum desses recursos explicativos que tem
integrado as reflexões dos fenômenos humanos, especialmente os fraseáveis em termos
cognitivos – e esses vão desde os fenômenos evolutivos, genéticos, imunológicos e neuro-
lógicos, até os psicológicos, cognitivos e lingüísticos. Nesse mesmo texto, a autora conclui
que a atribuição de significado a nossas experiências é uma conseqüência , e não um pré-
requisito, de nosso estar nas interações no meio, nas coordenações de atividades que consti-
tuem o linguajar e que, portanto a noção de representação pode e deve ser dispensada.
As acepções de representação e representação do conhecimento são inúmeras, tais
como a noção de representação sob a ótica daconstrução como em Gomez20, ou com o
significado de intermediação, considerando que a as representações se colocam entre o
meio e o homem. Kobashi21 destaca que a Ciência da Informação adota essa última acep-
ção, ao considerar representação como um conceito mediador entre emissor e receptor,
objetivado pelos processos e produtos da condensação de conteúdos informativos e, neste
caso opta pela expressãorepresentação da informação.
No âmbito das produções sociais de sentido, Becker22 discute a idéia de representa-
ção social (absorvendo algumas acepções do conceito mencionadas anteriormente) no sen-
tido durkheimiano de representações coletivas, as quais são referenciadas nos campos da
história da cultura, antropologia, sociologia e psicologia, e indica que as possibilidades
teóricas e metodológicas de operarmos as representações sociais implicam nos seguintes
aspectos:
• qualquer representação da realidade social é necessariamente parcial, menor do
que aquilo que se poderia vivenciar e achar disponível no real;
• a mesma realidade pode ser descrita de um enorme número de maneiras, visto
que descrições podem ser respostas para qualquer uma dentre uma multidão de
questões;

• representações só têm existência completa quando alguém as está usando, lendo


ou assistindo, ou escutando e, assim, completando a comunicação através da in-
terpretação dos resultados e da construção para si próprio da realidade que o pro-
dutor pretendeu mostrar.
Esses aspectos, por estarem referenciados ao estágio mais complexo da cadeia de
representações, isto é, o social, são atributos inerentes a todos os demais estágios ou níveis
27

de representação e podem ser sintetizados por três conceitos: redução semântica, pluralida-
de de significados e produção de sentido.

 Redução semântica
A mediação exercida pela Ciência da Informação entre indivíduos e representa-
ções sociais faz com que a redução semântica se imponha à pluralidade de significados
como forma de garantir a produção de sentido. Toda intermediação é em si é um fe-
nômeno redutor de significados. O menor nível de redução semântica se daria, por e-
xemplo, em uma comunicação telepática entre dois indivíduos. Qualquer meio que se
interpusesse entre emissor e receptor já representaria uma alteração na fonte, como é o
caso da linguagem. A escrita acrescenta mais um nível de redução em relação à mesma
fonte e, portanto, toda proposta de representação de linguagens de representação reduz
a informação na fonte. Se a linguagem, em si, já é redutora do pensamento, todas as
formas de síntese da linguagem com o propósito de acesso à informação são, também,
formas ainda mais acentuadas de redução de significado. Inegavelmente, a cadeia de
reduções semânticas faz parte da base teórica da memória documentária para que a or-
ganização do conhecimento em unidades mínimas seja passível de decodificação. O
princípio da economia de símbolos é o que nos permite usufruir do conhecimento con-
figurado nessas memórias. É nesse momento que faz sentido incorporar um novo con-
ceito, o da meta-representação. A representação do conhecimento com esta acepção
pode ser entendida como uma cadeia necessária de reduções que se inicia com a con-
cepção indo até a representação da representação, meta-representação ou representação
documentária.

Representação sensível
⇐ Representação conceitual
⇐ Representação verbal
⇐ Representação social
⇐ Representação documentaria (meta-representação)

 Pluralidade de significados
O pensamento humano, que opera com conteúdos dependentes da palavra, implica
sempre uma influência recíproca entre o sujeito pensante e o conteúdo que a palavra encer-
28

ra. A linguagem é vista como o instrumento do pensar, sua realidade imediata, tanto para o
ouvinte quanto para o falante. Merleau Ponty23 amplia esse conceito e afirma que a palavra
não é a tradução de um sentido mudo, mas criação de sentido. A linguagem não “veste”
idéias: ela encarna significações, estabelece a mediação entre o eu e o outro e sedimenta
os significados que constituem a cultura. O pensamento, segundo Spirkin24, nasce junto
com a linguagem e constitui a atividade cognoscitiva do sujeito feita imediatamente por
meio da palavra. A linguagem cumpre, então, dois papéis: um como fator de comunicação
(objeto - relação do sujeito com o objeto - relação existente entre sujeitos), outro como
organizador do pensamento. Gorsky25 confirma o discurso de Spirkin, dizendo que a lin-
guagem está vinculada ao pensamento direta e indissoluvelmente e é essa conexão essenci-
al que determina o papel que a linguagem desempenha na esfera do conhecimento. Richau-
deau26 adiciona ênfase à tese, considerando que a riqueza do aparelho lingüístico permitiu a
transcendência da sua função inicial e a linguagem se transformou em suporte do conheci-
mento, da imaginação, do sonho, dos prazeres. A linguagem não exprime somente o pen-
samento humano pré-existente, mas se constitui no próprio pensamento.27
Sobre o segundo aspecto, observa Spirkin28 que a escrita constitui a forma visual de
fixar a linguagem, surgindo quando a sociedade já havia alcançado um nível elevado de
desenvolvimento. Portanto, um produto normal da ampliação dos meios de intercomunica-
ção das pessoas, estimuladas pelas necessidades práticas da vida social. A escrita é, assim,
resultado da atividade criadora e consciente dos seres humanos. Como linguagem articula-
da, adquire um caráter até certo ponto independente e constitui uma forma de atividade
extremamente abstrata. A escritura pictográfica evoluiu gradativamente no sentido da sig-
nificação. Da representação completa do objeto, o homem passou à representação esque-
mática. Por sua vez, a escrita ideográfica ou hieroglífica constituiu um sistema de signos e
regras acerca de seu emprego que serviu para comunicar um pensamento qualquer.
Do ponto de vista do desenvolvimento do pensamento, o aparecimento do alfabeto

significou que o homem chegou a ter a idéia de que a palavra consta de elementos particu-
lares. O sistema alfabético, portanto, surgiu no estágio em que a linguagem fonética e o
pensamento abstrato haviam alcançado seu pleno desenvolvimento. A escrita fonética, a-
través da linguagem, se converteu em realidade material do pensamento. Então, ao propor-
cionar ao pensamento um caráter de certo modo independente (da realidade física dos obje-
29

tos), a linguagem foi uma das forças que contribuíram para criar não somente uma cultura
espiritual, como para desenvolver a cultura material.
Ainda em Gorsky, a linguagem não só constitui uma condição necessária para a
formação de nossos pensamentos, como também permite consolidar os êxitos da atividade
cognoscitiva do indivíduo, fixar a experiência adquirida por uma geração e transmitida às
gerações futuras. Portanto, o papel da linguagem para o conhecimento se revela a partir da
transmissão dos conhecimentos adquiridos, na passagem do nível sensorial para o racional
e no processo de formação de conceitos, tanto do discurso da ontogênese, como da filogê-
nese. O pensamento pode então ser igualado à concepção, dentro da escala associativa sen-
sação →percepção →concepção, no sentido de criação e, portanto, com independência do
real objetivo. O pensamento não se dissocia do real, mesmo considerando os conceitos de
juízos e raciocínios. A reflexão sobre a realidade natural existe, dado que tanto o conteúdo
como a forma de cada conceito, de cada juízo e de cada raciocínio particulares são um re-
flexo do mundo material.
Gorsky trata, ainda, do problema correspondente ao sentido da palavra, da correla-
ção que existe entre o sentido e o significado e ainda entre sentido e conhecimento. Usa,
para tal, o raciocínio aristotélico de propriedades ou características e diferença na identifi-
cação de grupos ou classes de conceitos e seus possíveis relacionamentos. A aproximação
de um objeto sob o aspecto da sensação, percepção ou representação nos conduz ao objeto
único e não à sua classe. As sensações e percepções não precisam ser fixadas materialmen-
te, mas as concepções sim. A suposição de que existam estrelas e o sol é da ordem da per-
cepção. A relação, ou seja, as estrelas são sóis, é da ordem da concepção. Para tanto, há a
necessidade de atribuição do signo, no caso a palavra, para expressar ou fixar o pensamen-
to (ou concepção). Logo, o processo de pensar se caracteriza pela capacidade de formar
conceitos, de generalizar. E, nesse sentido, o processo de pensamento é, por sua vez, um
processo no qual se opera com palavras.

Ainda assim, embora possamos afirmar que o signo representa o pensamento, o fato
mesmo da representação conduz à idéia de redução semiótica, tal que as representações
variam não só pela forma de apresentação como pelo modo de interpretação. Do mesmo
modo que posso representar uma relação por meio de uma abstração pictórica, como por
exemplo: a rosa é maior que o livro - e desenhar uma rosa grande e um livro pequeno, a
30

interpretação vai variar conforme o universo retórico presente à comparação. O desenho


poderia ser interpretado como: gosto de rosas grandes e de livros pequenos, etc.

 Produção de sentido
Sem dúvida que, se nas etapas anteriores já há uma configuração de redução semió-
tica, o acesso ao conhecimento mediado por representações documentárias intensifica essa
perda, considerada por Lara29 uma questão crucial do tipo: “Como representar adequada-
mente as informações sem comprometer o seu significado?” ou “Como resolver o proble-
ma da quase ausência de articulação entre os descritores para a recuperação de informações
veiculadas pelos textos?”. As palavras são neutras. Elas assumem significados conforme
sua inserção contextual. As palavras isoladas não significam nada, ou significam, virtual-
mente, tudo. É a condição de referência a determinados contextos que lhes confere signifi-
cado.
Se considerarmos, como em Gomez30, que a busca de uma informação que seja
uma resposta pertinente e relevante às nossas perguntas requer, na modernidade, a recons-
trução de um complexo cenário onde sejam agregadas as populações de fontes e canais de
informação de modo a permitir processos seletivos, organizados e econômicos de busca e
recuperação, tal reconstrução vai forçosamente fazer uso de atalhos semânticos no sentido
clássico do processo operacional presente na idealização das representações documentárias.
Quer dizer, desconstruir o “texto” para reconstruí-lo de forma reduzida. Sem dúvida que ao
lado da redução simbólica fica configurada a redução de significado. O paradoxo da produ-
ção de sentido no campo das memórias documentárias deve ser entendido como uma ten-
são necessária: reduzir informação para obter conhecimento.
Os produtos obtidos pelos processos de representação documentária, em seus vários
graus de redução semântica, quer sejam: o texto ou objeto na íntegra, resumos, referências
bibliográficas, índices temáticos ou notações de classes sob as formas de codificações tex-

tuais, imagéticas, sonoras e digitais, organizadas em inventários, catálogos, repertórios,


índices, bibliografias vão ser disseminados à sociedade em função da sua demanda por
informações.

 Disseminação da Informação
31

O processo de transmissão do conhecimento não é exclusivo ao modelo de organização


da memória documentária. Ao contrário, faz parte da natureza humana a transferência de
informações adquiridas para a geração de novos conhecimentos. No passado, a tradição
oral era o único meio de transmissão ou difusão da informação. Segundo Mc Garry31, para
facilitar a memorização e a evolução, a tradição coletiva era conservada na poesia ou na
prosa rítmica e os mitos e lendas eram usados como uma espécie de enciclopédia tribal.
Sem quaisquer outros registros paralelos para comparar, o mito, a história e a realidade
social fundem-se num só, configurando a era da oralidade mítica. Após as escritas cunei-
formes e hieroglíficas, o alfabeto permitiu à humanidade registrar e comunicar idéias
por meio de símbolos visuais, caracterizando a era da escrita. Por fim, o desenvolvimen-
to tecnológico dos meios de comunicação visual, sonoro e eletrônico, encurtou as distân-
cias espaço-temporais, criando uma realidade em espaço virtual e em tempo real, corres-
pondendo à era da informática-mediática, ou simulação32.
O conceito de disseminação da informação se subordina aos conceitos de transmis-
são, divulgação ou veiculação de informações. Contudo, apresenta um diferenciador, ou
seja, o atributo de domínio específico e geral ao mesmo tempo, ou campo de interação en-
tre o que as memórias documentárias adquirem e representam e o que necessita o ator que
delas faz uso. A rede de relações que se estabelece entre as representações da memória
documentária permite que a disseminação de um item extrapole a sua unidade material
(forma e conteúdo), levando o usuário à possibilidade de obtenção de vários itens pertinen-
tes à sua necessidade de informação. Latour33 exemplifica essa característica das redes de
informação utilizando a expressão centros de cálculo, nos quais cada informação nova,
cada sistema de projeção favorece todos os outros.
Paradoxalmente a essa capacidade de extensão referencial de um item, a dissemina-
ção de informações faz uso de estratégias redutoras para impedir a oferta de informações
não desejadas. Essas estratégias, consideradas atalhos ou filtros, não diferem daquelas

utilizadas no nosso cotidiano quando recebemos e enviamos informações por correio tradi-
cional, correio eletrônico, telefone, fax ou por transferência eletrônica de arquivos. Nesse
sentido, fazemos uso de guias e catálogos, geralmente organizados por temas de interesse
ou domínios, assim como os catálogos de produtos e serviços, editores de livros e revistas
técnicas.
32

Não poderia ser diferente nos acervos de bibliotecas, arquivos, museus, como tam-
bém no universo virtual das grandes redes de informação. Para este último, hoje nos vale-
mos de páginas de índices temáticos, organizadas em sistema hipertexto, que nada mais são
do que uma sucessão de filtros ou de atalhos pelos quais o usuário vai selecionando o ca-
minho mais propício à localização de uma dada informação. Tais atalhos visam, portanto, a
diminuir a ansiedade de informação, facilitando o acesso mais rápido aos conteúdos que
venham a satisfazer uma determinada necessidade de informação. Do ponto de vista das
instituições de memória, a disseminação é não só o estágio final do ciclo de vida do docu-
mento, como a tarefa social de garantir o direito à informação. Sem a disseminação o ciclo
total se rompe, impedindo as novas construções e a geração de novos conhecimentos.
A meta-representação ou representação documentária, explicitada pelos modelos do
ciclo de vida da informação e do sistema de recuperação da informação (SRI), deve ainda
sofrer uma análise, no sentido de ser isolado o conceito de linguagem de comunicação, em
especial o conceito de linguagem documentária, discussão que organizará o próximo capí-
tulo.

NOTAS E CITAÇÕES
1
VICKERY, B. C. Knowledge representation: a brief review. Op. cit., p. 145
2
MENDONÇA DE SOUZA, Alfredo, DODEBEI, Vera Lucia. Modelos e sistemas em Ciência da Informa-
ção. Rio de Janeiro, UFRJ/ECO, 1992. (Terceiro Seminário apresentado à diciplina “Linguagem e Ciência
da Informação III”).
3
HAGGETT, P., Chorley, R. J. Modelos, paradigmas e a nova Geografia. In: ________. Modelos sócio-
econômicos en Geografia. Rio de Janeiro: Livros Técnicos e Científicos / USP, 1975.
4
CLARKE, D. Models in archaeology. London : Methuen, 1972.
5
BURT, P. V. , KINNUCAN, M. T. Information models and modeling techniques for information systems.
Annual Review of Information Sciences and Technology. Holanda: Elsevier, v. 25
6
MARCONDES, C. H. , SAYÃO, L. F. Teoria Geral dos Sistemas: Sistemas de Informação Rio de Janeiro:
UFRJ/ECO,em
Doutorado 1992. (Seminário
Ciência apresentado à disciplina “Linguagem e Ciência da Informação V”, Curso de
da Informação)
7
MARCONDES, C.H. , SAYÃO, L.F. Op. cit., p. 15
8
HAGGET, P., Chorley, R.J. op. cit.
9
BURT, P.V., KINNUCAN, M.T op. cit.
10
LYYTINEN, K. Two views of information modelling. Information & Management, v. 12, n. 1, jan. 1987.
33

11
SHANONN, C. E., WEAVER, W. The mathematical theory of communication. Urbana: Univesity of
Illinois Press, 1949.
12
LANCASTER, F. W. Information retrieval systems: characteristics, testing and evaluation. 2. ed. New
York: Wiley, 1979.
13
VIRILIO, Paul. A máquina de visão. Rio de Janeiro: José Olympio, 1994. p. 9
14
WANDERLEY, Manoel Adolfo. Organização da memória documentária: a matriz documentária. Rio de
Janeiro: UNIRIO/CCH, 1980. (Notas de Aula)
15
MONTGOMERY, Christine A. Automated language processing. Annual Review of Information Science
and Technology. v. 4, p.145-174, 1969.
16
Mc GARRY, K. J. Da documentação à informação: um contexto em evolução. Lisboa: Editorial Reserva,
1984.
17
Cf. MARCONDES, Carlos Henrique. Representação e economia da informação. Ci. Inf., Brasilia, v. 30, n.
1, p. 61-70, jan./abr. 2001.
18
FOUCAULT, Michel. A palavra e as coisas : uma arqueologia das Ciências Humanas. São Paulo: Martins
Fontes, 1994.
19
MAGRO, Cristina. Representação, Virtus Dormitiva e linguagem. In: OLIVEIRA. P. ; BENN-IBLER, V.
e MENDES, E. (orgs) Revisitações: Edição Comemorativa dos 30 anos da Faculdade de Letras . Belo Hori-
zonte: Editora FALE/UFMG. 1999. p. 29 – 44.
20
GOMEZ, Maria Nelida Gonçalez. A representação do conhecimento e o conhecimento da representação:
algumas questões epistemológicas. Ci. Inf., Brasilia, v. 22, n. 3 p. 217-222, set./dez. 1993.
21
KOBASHI, Nayr Yumiko. Análise documentária e representação da informação . INFORMARE – Cad.
Prog.Pós-Grad. Ci.Inf., Rio de Janeiro, v.2, n.2 p. 5-27, jul./dez. 1996.
22
BECKER, Howard S. Apud. JARDIM, José Maria. Cartografia de uma ordem imaginária: uma análise do
sistema nacional de arquivos. Dissertação de Mestrado em Ciência da Informação. Escola de Comunicação,
Universidade Federal do Rio de Janeiro, 1994. p.98
23
MERLEAU PONTY, Maurice. O visível e o invisível. São Paulo: Perspectiva, 1992. p22
24
SPIRKIN, A.G. Origen del lenguaje y su papel en la formacio del pensamiento. In: Les theories de
l’action. Paris, Hachette, 1972
25
GORSKY, D. P. Lenguaje y conocimiento. In: Pensamiento y lenguaje. Mexico: Grijalbo, 1966. p. 68-105.
26
RICHAUDEAU, F. Langage et action. In: LES THÉORIES de l’action . Paris : Hachette, 1972.
27
Alguns lingüistas e psicólogos contestam essa tese, principalmente os discípulos de Piaget, que deduziram
de seus trabalhos
p. 208. experimentais
No entanto, vale a pena ainvestigar
pré-existência
se os do pensamentopiagetianos
experimentos sobre a linguagem. Cf. Richaudeau,
são da ordem op.ape-
da ontogênese cit.
nas, ou se estedem-se também à filogênese.
28
SPIRKIN, A. G. op. cit., p. 114.
29
LARA, Marilda Lopes Ginez de. Algumas contribuições da semiolologia e da semiótica para a análise das
linguagens documentárias. Ci. Inf. , Brasilia, v. 22, n. 3, p. 223-226, set./dez. 1993.
30
GOMEZ, Maria Nélida Gonzalez de. Op. cit.
34

31
Na opinião de Claude Levi-Strauss, a diferença essencial entre sociedades com escrita e sociedades sem
escrita é que as primeiras são pluralistas e contém sempre mais de um ponto de vista, mais de uma possibili-
dade de ação. As sociedades primitivas, ou sem escrita, tendem a ser monolíticas; os modos de fazer vigen-
tes não são postos em questão e a tradição fornece definitivamente o plano de como as coisas devem fazer-
se. O pluralismo cria tensão e debate e desencadeia o futuro. Cf. Mc GARRY, K. J. op. cit., p. 43, 44.
32
DODEBEI, Vera Lucia Doyle. Espaços mítico e imagético da memória social. In: Memória e espaço. Rio
de Janeiro: 7 Letras, 2000. p. 63-71.
33
LATOUR, Bruno. Redes que a razão desconhece: laboratórios, bibliotecas, coleções. In: O poder das
bibliotecas: a memória dos livros no Ocidente. Rio de Janeiro: Editora UFRJ, 2000. p. 29
3 Língua e Linguagem

De acordo com a escala de complexidade das representações sociais, as linguagens


documentárias são consideradas meta-representações ou representações documentárias, ao
lado de outras formas de representação da informação, como resumos, catálogos, biblio-

grafias, índices, inventários, repertórios. Embora todos esses produtos pertençam ao gêne-
ro das representações documentárias, uma vez que são construídos para referenciar um
objeto, a fim de permitir a sua distribuição e localização na memória documentária, eles
não devem ser classificados como linguagem documentária. Os conceitos de linguagem
documentária encontrados na literatura reduzem, por vezes, todas as formas de representa-
ção documentária à linguagem documentária, igualando assim, os dois conceitos.
A primeira explicação possível para esse fato reside no emprego indiscriminado da
terminologia utilizada pelos campos teórico-conceituais da representação documentária
importados do modelo europeu, cujo foco está centrado na analyse documementaire e do
modelo americano, que utiliza a information indexing como expressão genérica para as

operações documentárias. A dicotomia conceitual documentação/ informação também fica


clara na preferência dos dois modelos. Coyaud1, na introdução de seu trabalho, interroga o
uso da expressão Ciência da Informação para as atividades documentárias, de vez que con-
sidera o problema da documentação complexo demais para ser reduzido aos métodos ma-
temáticos ou simplesmente científicos e, ainda instáveis para constituir uma possível ciên-
cia documentária. Organiza seu discurso, definindo as expressões analyse documentaire,
indexation e langages documentaires , reservando à análise documentária o conceito ge-
nérico de processo documental que pode ser descrito em três níveis de complexidade cres-
cente:
1º extração de palavras-chaves (i.e. de palavras naturais, não transformadas) do títu-
lo ou do corpo do documento;
2º indexação (i.e. análise feita com a ajuda de descritores que, diferentemente das
palavras-chaves naturais são palavras que simbolizam os conceitos organizados
em um léxico documentário tais como as linguagens documentárias hierárquicas
e/ou facetadas)
36

3º constituição de resumo (construção de texto novo, podendo ser indicativo dos


temas essenciais ou detalhado).
Essa complexidade crescente, mencionada por Coyaud, lança uma luz em parte dos
descaminhos da terminologia utilizada sem reflexão no campo das representações docu-
mentárias. Pode-se admitir, por exemplo, que não devemos falar em indexação, quando a
análise for feita por extração de palavras naturais do texto analisado. No entanto, a expres-
são indexação há muito tempo vem sendo utilizada para indicar os dois processos, tanto o
de extração de palavras naturais como o de extração somado à tradução em descritores. O
que fica esclarecido, neste caso, é que os índices (naturais ou transformados) e os resumos
resultantes destas análises não são linguagens documentárias. São, apenas, produtos da
representação documentária. Essa é a idéia de Coyaud, que coloca a linguagem documentá-
ria na ordem dos produtos necessários à operação de transformação da língua natural em
uma linguagem artificialmente construída para favorecer a comunicação documentária,
preservando nestas as funções semânticas e sintáticas da primeira. Reserva-se, assim, a
caraterística natural para a língua2 e a característica documentária para a linguagem, justi-
ficando a imprecisão da expressão “linguagem de indexação em língua natural”.
Segundo Wanderley3, as linguagens documentárias recebem denominações diver-
sas, tais como linguagens de indexação (Melton, J.); linguagens descritoras (Vickery, B.);
codificações documentárias (Grolier, E.); linguagens de informação (Soergel); vocabulários
controlados (Lancaster, F.W); lista de assuntos autorizados (Montgomery, C.); e, ainda,
linguagens de recuperação da informação, linguagens de descrição da informação. Anali-
sando os substantivos utilizados, temos: linguagem, codificação, vocabulário e lista. Para
os qualificadores: descritoras, documentárias, informação, (termos) controlados, assuntos
autorizados. De um modo geral, poder-se-ía afirmar que nas expressões, tanto os substanti-
vos como os adjetivos são sinônimos. As escolhas deixam transparecer as orientações teó-
rico-metodológicas adotadas pelos autores, refletidas no binômio observado anteriormente,

isto é: informação/documentação, além da demonstração da igualdade do peso conceitual


entre os objetos da análise: assunto, informação, descritor e, também entre as estruturas
das representações: código, linguagem, vocabulário e lista.
As imprecisões terminológicas situam-se em três níveis da abordagem ao problema
da representação documentária: no objeto da análise, nos processos e nos produtos da re-
presentação. Lancaster4, menciona o problema da instabilidade terminológica ao afirmar
37

que na bibliografia de Biblioteconomia e Ciência da Informação faz-se uma distinção entre


as expressões, indexação de assuntos, catalogação de assuntos e classificação e que essas
diferenças são inexpressivas, servindo apenas para causar confusão. Sem dúvida, o proces-
so maior que permeia e fundamenta todas essas operações é o da classificação, vista como
a condição do pensamento de operar comparações, identificando semelhanças e diferenças
entre os objetos e seus conceitos, tal como em Grolier 5: todos os sistemas de organização
intelectual da informação têm uma base comum e esta é a classificação, e em Rangana-
than6: classificação é o processo de tradução do nome de um determinado objeto da
linguagem natural para uma linguagem classificatória . Já para Wanderley7, a indexa-
ção é a representação dos elementos dos documentos e a classificação é a representação
do documento como um todo”, definição mais próxima das observações de Lancaster, nas
quais afirma que todas essas expressões dizem respeito ao processo de classificação de um
objeto em um campo conceitual, mediante a atribuição de um rótulo que pode ser um as-
sunto, um termo/descritor ou uma notação, mas que, objetivamente, a confusão terminoló-
gica se deve à incapacidade de distinção entre as etapas deanálise conceitual e de tradução
na indexação.
Essa conclusão de Lancaster, da qual compartilhamos, nos leva à segunda explica-
ção que aponta o escasso interesse por parte dos bibliotecários nas discussões sobre o cam-
po teórico da representação documentária, resultando em poucas contribuições na produção
literária. O maior número de textos existentes volta-se para as aplicações das representa-
ções e das linguagens a domínios especializados, sem manifestar o interesse em abordagens
conceituais.
No Brasil, um dos primeiros trabalhos que se vale das contribuições teóricas de ou-
tros campos do conhecimento, em especial da Lingüística, é também uma das primeiras
dissertações do Mestrado em Ciência da Informação do Instituto Brasileiro de informação
em Ciência e Tecnologia (IBICT). Em 1973, seu autor, Manoel Adolpho Wanderley, busca

na escola francesa autores preocupados com a relação entre a Lingüística e a Documenta-


ção, em especial Grolier, Coyaud e Gardin, para discutir o processo específico da comuni-
cação documentária do ponto de vista das relações entre a linguagem e o universo da repre-
sentação documentária. A partir de 1980, Kobashi, Smit, Lara, Cintra, Tálamo e Cunha
retomam a discussão das relações entre a Lingüística e a Documentação, significando, para
a atualidade, os autores brasileiros mais produtivos no campo da representação documentá-
38

ria8. Com base na análise dessa literatura, arriscamo-nos a discutir o campo teórico-
conceitual e metodológico das representações documentárias, não de forma exaustiva mas,
ao contrário, pontuando as reflexões nas relações entre seus conceitos principais a fim de
destacar aqueles imprescindíveis à construção de seus produtos, em particular, das lingua-
gens documentárias.
As operações efetuadas nos documentos a fim de torná-los úteis a uma pesquisa
documentária podem ser observadas sob dois aspectos: o primeiro é relativo aos processos
que ocorrem na transformação do objeto em item documentário, passível de ser recuperado
da memória documentária; o segundo aspecto diz respeito aos produtos, quer sejam gera-
dos por esses processos, quer sejam construídos para melhorar a comunicação entre usuário
e documento.
Considera-se como processos a análise, a síntese e a tradução em códigos docu-
mentários. Destes, a análise e a síntese vão constituir o que se denomina Análise Docu-
mentária e a tradução ou processo de codificação documentária vai variar em função do
objetivo específico da criação de códigos documentários, isto é: catalogação, classificação,
indexação ou condensação informativa. Os produtos gerados por esses processos são, por-
tanto: catálogos, índices e resumos. E os produtos construídos para melhorar a comunica-
ção constituem as Linguagens Documentárias. O gráficoabaixo representa uma das inú-
meras possibilidades de leitura deste campo de estudos. Sua construção teve por objetivo
principal organizar os conceitos já consagrados na literatura, apresentando as relações exis-
tentes entre eles, quer sejam de subordinação ou paradigmáticas, quer sejam de coordena-
ção ou sintagmáticas.
39

O gráfico conceitual da Representação Documentária, organizado em facetas mutu-


amente exclusivas, não está completo, isto é, não reúne todas as possibilidades conceituais
deste domínio. A rede de relações conceituais pode ser ampliada tanto no eixo paradigmá-
tico, quanto no sintagmático. No entanto, esta estrutura mínima já nos é favorável ao en-
tendimento do lugar ocupado pelas linguagens documentárias no espaço da representação,
o que nos vai permitir organizar a discussão com maior cuidado no que se refere, princi-
palmente, ao emprego da terminologia.
A análise da primeira faceta, ou os processos que concorrem para a realização das
representações documentárias, indica um campo de estudos importantíssimo na compreen-
são da complexidade e da interdisciplinaridade das abordagens conceituais. O primeiro

deles, denominado de Análise Documentária (AD), é definido por Cunha 9 como o estudo
do conjunto de procedimentos efetuados com o fim de expressar o conteúdo de documentos
sob formas destinadas a facilitar a recuperação da informação. A AD, embora não seja
um campo novo de interesse da Biblioteconomia e da Ciência da Informação, experimen-
tou um desenvolvimento maior no Brasil, a partir de um grupo de pesquisa formado pela
Escola de Comunicação e Artes de Universidade de São Paulo, tendo como propósito dar
40

subsídios teórico-metodológicos à prática da codificação bibliográfica, em especial à inde-


xação de documentos textuais. Nas palavras de Cunha10, esse procedimento de tradução
(tradicionalmente) realiza-se... com base no ‘ bom senso’ bibliotecário, e envolve grande
número de pré-conceitos comuns à área de Biblioteconomia/Documentação. São eles: a
idéia de que os textos/documentos a analisar/indexar são ‘absolutos”; que é possível che-
gar-se a palavras ‘neutras’; que o analista/indexador é passivo; que o trabalho de análise
documentária pode ser realizado sem o conhecimento da área.
Essas observações de Isabel Cunha, de fato, refletem uma importante questão da
intermediação nas representações documentárias, isto é, a familiaridade com o campo con-
ceitual dos objetos sujeitos à análise. Nesse sentido, explicam-se as tentativas de fórmulas
para a codificação dos textos e o peso que o título dos documentos apresenta como seg-
mento de maior valor semântico, principalmente quando o tempo despendido para efetuar a
codificação está na razão inversa da velocidade de alimentação da memória documentária.
A neutralidade, tanto do texto quanto do analista, muitas vezes é imaginada como uma des-
culpa à intervenção no processo seletivo, o que, de resto, não contribui, em absoluto, para
melhorar a qualidade da oferta de informações. Com maior ou menor ênfase à neutralidade
da análise, fato é que as etapas consideradas pela AD são realizadas, no plano lógico, por
toda a intermediação entre objeto e sua representação, seja qual for o código escolhido.
Essas etapas são representadas pela leitura e posterior segmentação do texto em unidades
que sintetizam o conteúdo dos documentos. A expressão usada por Wanderley11 descons-
truir o texto para referenciar o conteúdo reflete as etapas discutidas em profundidade por
Cunha12, que apresenta um quadro teórico-conceitual da Análise Documentária e outro de
seus modelos, onde se lê a seguinte “frase”: leitura ⇐ segmentação ⇐ representação.
A leitura é, assim, o início dos processos de catalogação, classificação, indexação
ou condensação informativa de objetos. Cintra 13 argumenta que na leitura para fins docu-
mentários o princípio da cooperação autor/leitor é rompido uma vez que o autor não previu

o documentalista como leitor. Portanto, a intermediação presente no ato de ler cria mais um
universo retórico a ser considerado – o do analista, além daquele existente para o autor, e
aquele existente para o leitor objeto da criação do texto. Esses universos retóricos ou “tá-
buas”14 de conhecimentos formam um quadro de referências necessário não só à segmenta-
ção do texto como à sua reconstrução, como diz Cunha 15, à remontagem do discurso. Ou-
tros aspectos que devem ser considerados são a capacidade preditiva do leitor que extrai do
41

texto mais do que está expresso lingüísticamente, graças às açoes mentais estruturadas e as
estratégias de leitura adotadas e, contrariamente, a tendência natural de reduzir o cenário
para reter as informações principais. A inclusão das estratégias de leitura, tanto textuais
como imagéticas16, no mundo das representações documentárias parece ser de vital impor-
tância à qualidade da memória documentária e à eficácia do sistema de recuperação das
informações.
A segmentação do texto objeto da AD pode ser considerada a síntese da leitura, fase
que antecede à da codificação. Nesta etapa, o analista pode valer-se dos fundamentos da
sintaxe ou da semântica. No que se refere à análise automática de textos, Coulon 17 indica
que as pesquisas que visam a associar a informática ao processamento de textos podem ser
classificadas em quatro fases: fase estatístico-morfológica (1945-1955); fase sintática
(1955-1070); fase lógica (1963- ); e fase cognitiva (1974- ). Vê-se nesta classificação
uma evolução de abordagens que indicam os graus de complexidade da tecnologia de seg-
mentação de textos, ou seja: análise morfológica (léxico) ⇐ análise sintática (estrutura)
⇐ interpretação lógica das estruturas sintáticas (semântica) ⇐ análise conceitual (simu-
lação). Essa última fase representa os esforços conjuntos da psicologia cognitiva e da in-
formática (inteligência artificial) na solução da representação automática do conhecimento.
Os processos de atribuição de códigos ou “rótulos” aos segmentos da leitura docu-
mental, como denominou Lancaster, podem ser discutidos sob o aspecto normativo. Quer
dizer que eles se dividem em dois universos: os processos que se abstêm de orientações
normativas e os que se valem das estruturas dos códigos para controlar as funções sintáti-
cas e semânticas da língua natural. Os primeiros são nomeados de indexação livre, indexa-
ção natural, indexação por palavras-chaves (no sentido de extrato empregado por Coyaud),
pois utilizam as palavras naturais, encontradas no texto, como pontos de acesso ao conteú-
do. Essa modalidade de indexação é a utilizada como parte integrante de compêndios e
manuais técnicos e objetiva a localização de conceitos, assuntos, nomes de pessoas ao lon-

go da exposição. A indexação natural é usada também com o objetivo de localização de um


objeto na memória documentária, porém sofre todos os tipos de restrição dos sistemas a-
bertos de comunicação dos quais a língua natural é a principal representante. O segundo
universo é representado pelos processos de catalogação, classificação e indexação que
utilizam instrumentos normalizadores das representações, a partir de regras sintáticas e
semânticas. Não nos cabe neste trabalho analisar tais processos em profundidade, mas tão
42

somente refletir sobre a influência dos controles sintáticos e semânticos, não apenas no
momento da atribuição do código, como também na segmentação do texto.
Pode-se dizer que a indexação natural faz uso da escolha de palavras simples, com-
postas ou articuladas em frases que, extraídas do texto vão se transformar em uma repre-
sentação reduzida do objeto. Independentemente dastecnologias da AD empregadas nessa
segmentação, não há, nesta fase, o processo de tradução do texto srcinal em um outro re-
duzido, representado e traduzido. O processo de tradução, no nosso entender, implica a
interação de língua e linguagem, dois sistemas de comunicação que mutuamente se refe-
renciam. Portanto, só há o processo de tradução quando a língua natural e a linguagem
documentária são confrontadas. De outro lado, pode-se considerar que a indexação natural
é uma indexação “incompleta” (melhor seria utilizar outra expressão) pois, nesse processo,
apenas a análise/síntese mental é considerada na segmentação do texto, ignorando-se o
plano conceitual da representação. Neste caso, todas as vantagens tanto da língua natural
quanto das linguagens documentárias são desprezadas, uma vez que as palavras são retira-
das de um contexto significativo para constituírem uma lista ou um índice de pouco valor
para a identificação dos conceitos que representavam no texto.
Vale observar, ainda, que os processos de representação documentária sofrem uma
variação significativa na leitura e segmentação dos objetos em análise dependendo da utili-
zação ou não de uma linguagem documentária. A linguagem documentária proporciona não
só um controle das dispersões semânticas e sintáticas da língua natural como delimita o
domínio conceitual do campo de estudo em questão. Essa delimitação do domínio guia a
leitura e influencia a segmentação do texto, no sentido de que esta última deva se ajustar à
linguagem documentária para a qual será traduzida. O compromisso que a indexação assu-
me com o campo de estudo é muito mais forte quando ela é “completa”, isto é, quando ela
cumpre integralmente as etapas da leitura, da segmentação e da codificação documentária.
Dos produtos da representação documentária, componentes da segunda faceta do

esquema conceitual apresentado, vamos nos ocupar das Linguagens Documentárias (LD).
Antes de serem analisadas sob o ponto de vista de linguagens artificialmente construídas
para facilitar o acesso às coleções de uma memória documentária, devemos observar que as
LD pertencem à categoria das linguagens comunicação, aolado da língua natural oral e
escrita, das linguagens gestuais, sonoras e visuais. As LD guardam traços característicos
43

comuns às linguagens de comunicação e traços diferenciados, o que as tornam singulares,


justificando sua existência.
Das inúmeras abordagens existentes sobre os fundamentos teóricos das LD, as con-
tribuições da Lingüística e das teorias da Comunicação não podem ser omitidas. Por ser
complexa a separação conceitual entre Lingüística e Comunicação adota-se freqüentemen-
te, e também neste trabalho, a expressão linguagem de comunicação como um conceito
que percorre as linguagens orais, escritas, visuais, sonoras e gestuais, analisando-as sob o
fenômeno da comunicação. Uma limitação, ou melhor uma diferença, poder-se-ia impor à
Lingüística, se não de modo absoluto mas de forma relativa, que é a preferência pela língua
(em seus códigos convencionais, principalmente a escrita), sendo esta o seu principal mate-
rial de estudo. Para Nocetti e Figueiredo 18, há entre os lingüistas um consenso no sentido
de considerar a linguagem como a capacidade humana de criar mensagens para a comuni-
cação e língua como sistema de signos vocais utilizados pelas comunidades lingüísticas.
De todas as considerações sobre as características da língua natural pode-se identificar uma
estrutura comum a todas elas, denominada de universais da linguagem:

• a natureza oral das línguas;


• o caráter linear (transmissão direcional);
• o caráter significativo (trabalham com símbolos e signos que remetem a um de-
terminado conteúdo);
• o caráter arbitrário (não há uma relação intrínseca entre as coisas e os nomes da-
dos a elas;
• a criatividade (fundamentalmente humana, o que faz com que a linguagem ad-
quira um caráter dinâmico, de evolução ou involução); e,
• a dupla articulação19.

Hughes citado por Nocetti e Figueiredo20 define a língua natural como um sistema
de símbolos vocais arbitrários pelos quais o pensamento é transmitido de um ser para o
outro, podendo ser entendida dos pontos de vista:

• sistêmico ⇒ código ou conjunto de regras em que cada item é o que é em virtu-


de de seu lugar no sistema. Poderíamos ter como exemplo as duas frases seguin-
44

tes, que, embora sejam constituídas pelos mesmos símbolos, podem ter signifi-
cado diferente.
O menino lê alto (lê em voz alta)
O menino alto lê (o menino alto)

• arbitrário ⇒ Não há necessidade intrínseca de que cada palavra signifique o


que significa, ou para que cada língua tenha a estrutura que tem.

ex: Coração, ou Coeur, ou Heart

• vocal ⇒ é formada pelos sons produzidos pelos órgãos da fala dos seres huma-
nos.

• simbólico ⇒ o poder de simbolizar e de distinguir símbolos é um pré-requisito.

• mediático (representação do pensamento) ⇒ a forma de representar as idéias.

De acordo com Cintra21, a prática da linguagem é marcada por uma tendência natu-
ral do homem de compreender, governar e modificar o mundo. Essa necessidade de domi-
nar os fenômenos sociais implica em dois processos, o de apreensão e o de compreensão.
O primeiro pode ser representado por uma “catalogação” do mundo e o segundo pela sua
“hierarquização”. Esses dois processos indicam a arbitrariedade da língua, uma vez que
desde a fase de nomeação, característica do desenvolvimento da espécie humana, a função
classificatória se fez presente. O fato de atribuir um símbolo a um referente já o isola con-
ceitualmente de outros referentes. Como a memória documentária é formada, preponderan-
temente, por documentos textuais, as principais questões apontadas para a eficácia dos pro-
cessos de representação documentária repousam na criatividade, arbitrariedade e simbolis-
mo da língua natural, o que vai gerar alternativas de escolha no processo de tradução e de
codificação. Essas alternativas de escolha podem ser representadas pela característica de
dispersão da LN que vai dificultar a eficácia do processo comunicativo restrito à recupera-
ção da informação documentária. A dispersão na LN pode ser classificada por: dispersão
45

léxica ou terminológica (sinonímia e polissemia), dispersão sintática (estrutura das frases)


e dispersão simbólica (vários símbolos para o mesmo referente), tal como os exemplos:

• professor e docente ⇒ sinonímia


• manga (fruta) e manga (parte de vestuário) ⇒ polissemia
• /o aluno rabiscou a prova/ e /a prova foi rabiscada pelo aluno/ ⇒ dispersão sintá-
tica

• ou gato, ou cat, ou chat ⇒ dispersão simbólica

As LD, a par de guardar uma relação estreita com a língua natural, de vez que pos-
suem um vocabulário ou léxico documentário e uma estrutura ou sintaxe, representam o
conteúdo informativo de um documento, operando por análise e síntese. Quer dizer, a lin-
gua natural é traduzida para uma linguagem sintética - descritores - a qual, retida na memó-
ria do catálogo tradicional ou da máquina, significa economia verbal, economia de símbo-
los, economia de espaço. Mas, certamente, significa também economia de significado.
Do ponto de vista dos fundamentos teóricos da Comunicação ao nosso propósito de
estabelecer as relações entre LN e LD, identificamos no discurso de Umberto Eco em Se-
miótica e Filosofia da Linguagem22 alguns conceitos que, de certo modo, dominam as dis-
cussões semióticas, principalmente sob a perspectiva da filosofia. São eles: signo e signifi-
cado, símbolo e código.
Eco vê o mundo como fato de cultura, uma mensagem a desvendar e considera que
todos os fenômenos de cultura podem ser vistos como fatos de comunicação, para os
quais as mensagens isoladas se organizam e se tornam compreensíveis em referência a có-
digos. Partindo da suposição do mundo como um fenômeno semiótico, Eco procura identi-
ficar na história da filosofia a discussão sobre a língua e outros sistemas de signos e medi-

ante essa releitura, afirma que cada grande filósofo do passado elaborou, de alguma for-
ma, uma semiótica. Dos estóicos a Cassirer, dos medievais a Vico, de Santo Agostinho a
Wittgenstein, todos abordaram os sistemas de signos. Mas é com Aristóteles que a idéia de
ser é percebida como expressão de vários modos, ou que o ser é o que a linguagem expres-
sa de muitas maneiras. Usando a figura que viria a ser mais tarde conhecida como o triân-
46

gulo semântico de Ogden e Richard, Eco relê semioticamente alguns filósofos: onde Y é
uma expressão, Z é uma coisa ou estados de coisas e X o significado.

Para Platão o Z era uma experiência do mundo, mas efêmera e enganosa, dotada de
"realidade" apenas enquanto imitação de uma realidade situada no mundo das idéias; para
Aristóteles era uma susbtância primeira, em toda a sua concretude; para os estóicos era
um corpo. Para Platão o X era um conceito; para Aristóteles, uma disposição da mente;
para os estóicos uma criação do espírito humano. Embora a definição dessas entidades
mudasse segundo o contexto filosófico, a diferença entre significado e referência foi de
algum modo enunciada.
Para Ogden e Richard o Y é o símbolo, o Z o referente, o X a referência. No que con-
cerne à semiologia só interessa o lado esquerdo do triângulo pois, o problema do referen-
te não tem pertinência, uma vez que existem símbolos que possuem uma referência e
não têm referente (como o unicórnio, que se refere a um animal fantástico, mas inexis-
tente). Há ainda símbolos diferentes, com significado diferente, que dizem respeito ao
mesmo referente (Vênus, como estrela-da-manhã e estrela-da-tarde, ou ainda as expres-
sões "meu padrasto" e "o pai de meu meio-irmão").
Já Peirce, ao entender o signo como alguma coisa que está para alguém em lugar de

outra, sob algum aspecto ou capacidade, trata essas relações numa estrutura triádica, que
lembra o triângulo richardsiano onde, alterando as conceituações saussurianas de signifi-
cante e significado, introduz a idéia do Interpretante. Onde o Y é o símbolo ou "repre-
sentâmen", o Z o objeto que representa e o X interpretante (tese essa mais próxima de Aris-
tóteles e dos estóicos). A idéia do interpretante, como diz Eco, pode ser identificada com o
significado, mas a hipótese mais fecunda é a que vê o Interpretante como uma outra repre-
47

sentação relativa ao mesmo objeto, numa cadeia de semiose ilimitada, uma vez que para
estabelecermos o que seja o interpretante de um signo é necessário designá-lo mediante
outro signo, o qual tem por sua vez outro interpretante, designável por outro signo, e assim
por diante.

Esse círculo vicioso se dá em relação aos diversos contextos ou culturas a que o sig-
nificante se direciona, como por exemplo o significado do significante vaca para o hindu
ou os significantes beleza, unicórnio e Deus. Esta relação cultural provoca na mente do
indivíduo o interpretante, existindo, portanto, diferentes interpretantes a partir do contato
com um código ou cultura. Assim, com base num dado código, um significante denota um
significado num certo grau de extensão e, ainda, conota um significado em relação ao pró-
prio código. A relação de conotação se estabelece quando um par formado pelo signifi-
cante e pelo significado denotado, conjuntamente, se torna o significante de um significado
adjunto. O termo cão, por exemplo, denota certo tipo de animal, mas para o italiano tam-
bém conota "mau tenor". A relação entre símbolo e referência é estudada em profundida-
de, uma vez que é dessa relação que ocorrem os fenômenos de significação. A relação
entre símbolo e significado pode mudar, crescer, deformar-se; o símbolo permanece cons-
tante e o significado torna-se mais rico ou mais pobre. A esse processo dinâmico e contí-
nuo Eco denomina sentido.
A língua natural (LN) faz parte desse modelo comunicacional "aberto", onde a men-
sagem varia conforme os códigos. Estes são postos em pauta conforme as ideologias e cir-
cunstâncias, e todo sistema de signos se reestrutura continuamente com base na experiên-
cia de decodificação que o processo institui como semiosi in progress. O processo de co-
municação se dá, portanto, quando o indivíduo reduz o que pensa e quer a um sistema de
convenções comunicativas, ou seja, quando o que pensa e quer é socializado. O sistema de
saber, por sua vez, tem que se transformar em um sistema de signos, onde a ideologia soci-
48

alizada se torna código. Nasce assim uma estreita relação entre o mundo dos códigos e o
mundo do saber preexistente, onde esse saber torna-se visível, controlável, quando se faz
código, convenção comunicativa.
À LN é atribuído um sistema de signos compreendido pelo que se designa de gra-
mática. Para Eco a gramática é composta da sintática, da semântica e da pragmática. A sin-
tática diz respeito ao sentido estrutural da língua e envolve a morfologia e a sintaxe. A
semântica se ocupa do sentido lexical e a pragmática do sentido situacional. Esta última, a
pragmática, segundo Bar-Hidel citado por Eco23
é o estudo da dependência essencial da comunicação, em linguagem natural, do
falante e do ouvinte, do contexto lingüístico e do contexto extralingüístico e da disponibili-
dade dos conhecimentos fundamentais, da prontidão em obter esse conhecimento funda-
mental e da boa vontade dos participantes do ato de comunicação.

Essa classificação da gramática, impõe apenasuma diferença àquela feita por Saus-
24
sure , ao afirmar que tudo o que compõe um estado de língua pode apenas ser reduzido a
uma teoria dos sintagmas e a uma teoria das associações. Tal diferença diz respeito ao nível
de extensão das relações entre os conceitos, isto é, as relações sintagmáticas e as relações
associativas (ou paradigmáticas) implicam a sintaxe (incluindo a morfologia) , a semântica
e a pragmática. Sem dúvida que no modelo de semiose, a pragmática exerce um importan-
te papel no sucesso da comunicação pois, somada à semântica, vai possibilitar o apareci-
mento do significado contextual, em detrimento apenas do significado lexical.
Nesse sentido, Eco utiliza uma metáfora muito interessante para analisar a gramáti-
ca da LN e que corresponde a dois modelos: o dodicionário e o da enciclopédia. Do ponto
de vista da representação da LN como um dicionário, o conceito de estrutura classificatória
é utilizado, na qual os significados de cada palavra são impostos por sua posição num es-
quema arborescente composto de gêneros e espécies. Assim é que /casa/ é um tipo de mo-

radia; /macieira/ é um tipo de árvore frutífera que, por sua vez é uma espécie de árvore.
Esse tipo de representação pressupõe o uso de estruturas hierárquicas rígidas que conside-
ram as propriedades conceituais, atributivas e necessárias dos objetos. Do ponto de vista da
representação enciclopédica, a LN pode se analisada como uma rede de relações infinitas
que faz maior uso de propriedades factuais, descritivas ou acidentais dos objetos. Se para o
modelo de dicionário há um consenso e uma finitude conceitual, para a enciclopédia há um
49

conjunto não ordenado, situacional e pragmático. A enciclopédia supõe uma moldura ou


um roteiro local, que parte de um recorte temático e vai articulando os significados em uma
rede rizomática25. Assim, /casa/ implica não somente a moradia, mas de que material é
feita, quem a habita, em que espaços geográficos, numa rede de associações infinita.
Desta forma, o modelo do dicionário tem maior identificação com a semântica e o
da enciclopédia com a pragmática. No entanto, os modelos não são mutuamente exclusi-
vos. Eles podem coexistir, sem o compromisso da descrição da totalidade do universo con-
ceitual, uma vez que, com base na teoria do interpretante, o destinatário constrói a porção
da enciclopédia com a qual decodifica a mensagem. Poder-se-ia, neste momento, relacionar
dicionário à ordem (hierarquia) e enciclopédia à desordem (rede), cuja coexistência é pos-
sível pela introdução da noção de código (convenção e regras).
As várias acepções de código existentes, segundo o roteiro ou a moldura construída
26
do universo das representações sociais, aparecem, de acordo com Eco , na reformulação
da oposição saussuriana língua-fala para código-mensagem e na terminologia de vários
domínios do conhecimento tais como: código fonológico, código lingüístico, código se-
mântico, código genético, código estético, código ético, códigos gestuais, códigos musicais,
códigos culinários ... A explosão do termo, tal como ocorreu com outros: informação, cul-
tura, por exemplo, podem demonstrar instabilidade conceitual, mas podem também indicar
uma certa fecundidade nas abordagens interdisciplinares. Parece ter sido esta última a con-
seqüência do surgimento da expressão código documentário, a qual nos interessa discutir
na configuração das linguagens documentárias. De todo modo, a noção de código implica
sempre a de convenção, de acordo social, de um lado, e de mecanismo regido por regras,
de outro.
As LD são, portanto, metacódigos ou metalinguagens, pois são construções artifici-
ais ou convenções criadas para facilitar o conhecimento de um domínio, regidas por regras
de utilização a exemplo daquelas existentes para a língua natural da qual representam uma

imagem reduzida. Voltemos às metáforas de Eco, criadas no intuito de encontrar os funda-


mentos teóricos para justificar o modelo do interpretante/ semiose. O que nos chama a a-
tenção nessa perspectiva de análise da língua natural como meio de comunicação é exata-
mente a semelhança apresentada pelas estruturas adotadas pelas linguagens documentárias.
Não poderia ser diferente, uma vez que as LD são construídas a partir da LN, quer dizer,
tomam como modelo as relações paradigmáticas e as relações sintagmáticas existentes en-
50

tre as palavras. Para as primeiras, o conceito de hierarquia está sempre presente pois, o sig-
nificado de cada palavra traz consigo a sua inserção em uma classe de objetos, inferindo-se
daí a posição da palavra na ordem de gêneros e espécies: /árvore/ supõe /vegetais/ e tam-
bém /macieira/. Para as relações sintagmáticas, a reunião de palavras representa a busca de
um sentido, isto é, classes distintas de palavras que intencionalmente reunidas vão compor
uma mensagem: /árvore/ e /madeira/ e /casa/ e /incêndio/ e ... Essa reunião é da natureza de
redes, representada pela possibilidade infinita de combinações entre as palavras, enquanto
as inferências nas relações paradigmáticas são finitas, contidas numa escala entre o maior
gênero e a menor espécie. Esses são os sentidos deordem/hierarquia e de desordem/rede.
Vale ressaltar que a idéia de enciclopédia ligada à desordem e portanto à rede, simboliza a
forma como os temas são reunidos circunstancialmente ou pragmaticamente, a partir de um
roteiro, como uma das inúmeras possibilidades de análise do conhecimento.
Todas as LD incluem, em maior ou menor grau, as imagens de hierarquia e rede, o
que torna complexa uma classificação segundo esses critérios. No entanto, isolando-se al-
guns atributos compartilhados pelas principais LD, pode-se tentar compreendê-las sob essa
nova perspectiva, ao menos no que se refere às suas propostas de utilização no espaço-
tempo. Os três momentos que se seguem devem ser compreendidos como segmentações
arbitrárias e, portanto, circunstanciais, na análise das LD, não significando que os atributos
utilizados para a classificação sejam mutuamente exclusivos.

1º momento: domínio
A classificação tradicional das LD isolava dois atributos, até então, considerados
antagônicos: universal, correspondendo a reduções da totalidade do conhecimento eespe-
cializada, representando a totalidade de alguns domínios do conhecimento. No primeiro,
encontram-se as classificações bibliográficas universais, os macrotesauros, as listas de ca-
beçalhos de assunto construídas com base nas classificações universais; no segundo atribu-

to, os tesauros, as classificações e listas de assuntos de domínios específicos. Do ponto de


vista da condição hierárquica dessas linguagens, a dicotomia universo/espécie é verdadeira.
Quanto às suas redes de relações associativas ou sintagmáticas, a totalidade/especialidade
fica comprometida, uma vez que não se consegue analisar um aspecto do conhecimento
sem envolvê-lo com as circunstâncias nas quais ele ocorre. Nesse caso, o modelo da enci-
clopédia como roteirização de um domínio é mais adequado pois implica, ao mesmo tem-
51

po, a idéia de todo e também a de parte. É como se do todo escolhêssemos uma porção
nuclear e, a partir dela, estabelecêssemos as relações necessárias com esse todo. Por exem-
plo: se o meu interesse é sobre /energia nuclear/ qual a rede de relações necessárias para
efetuar uma moldura, um roteiro de análise dessa porção do todo? Certamente, vários as-
pectos presentes no todo, tais como: física, química, biologia, economia, religião, educa-
ção ... Em vez de efetuar-se simplesmente um recorte do universo, construi-se uma rede de
referências que deve estar representada na língua natural (escrita e oral) e na metalíngua-
gem documentária.

2º momento: objeto
Tem-se por certo que as LD podem estruturar-se por conceitos, isto é, por abstra-
ções de objetos representados por um símbolo da língua natural, de caráter unívoco e restri-
to, ou por assuntos, que definiríamos como a representação da soma de vários conceitos.
Tradicionalmente, as LD foram concebidas a partir da análise dos assuntos presentes na
literatura, portanto a unidade referencial das classes e subclasses era formada por pré-
coordenações conceituais. Do mesmo modo, as Listas de Cabeçalhos de Assunto adotaram
este mesmo princípio, já que seu objetivo é o de codificar, por palavras, o que a Classifica-
ção havia codificado com a notação. A noção de conceito como unidade estrutural das LD
surge com a proposta de Ranghanathan seguida por Sayers, Bliss, Mills e os trabalhos do
Classification Research Group, culminando, na atualidade, com um campo de estudos de-
nominado “Organização do Conhecimento” cuja base teórica repousa na Teoria Analítica
do Conceito” de Ingetrat Dhalberg27. As LD mais representativas das estruturas pós-
coordenadas, isto é, estruturas que se formam por relações conceituais e não por relações
28
de assuntos, são as classificações facetadas e os tesauros. Wanderley , discute a correla-
ção dessas estruturas, com base no modelo de Gardin para os léxicos documentários, dis-
tinguindo-os em classificações unidimensionais e pluridimensionais, conforme se estrutu-

ram numa só, ou em mais de uma dimensão. Por dimensão de uma organização, explica o
autor, entende-se a natureza das relações analíticas, paradigmáticas, que a constituem, ou,
em outras palavras, da relação dos termos à classe a que pertencem. As unidimensionais
podem ser representadas pelos sistemas taxonômicos no estilo das Ciências Naturais, onde,
de fato uma só relação informa todos os níveis: reino ⇐ classe ⇐ subclasse ⇐ ordem ⇐
subordem ⇐ família ⇐ gênero ⇐ espécie ⇐ nome comum, quando se diz que são unidi-
52

mensionais reais. Para aquelas em que a multiplicidade se esconde em uma unidade, como
é o caso das classificações decimais (ex: Dewey Decimal Classification – CDD), diz-se que
são unidimensionais aparentes. As pluridimensionais reúnem as organizações semânticas
(essência, definições) e as sintáticas (acidentes, funções) e são denominadas de classifica-
ções facetadas (Colon Classification). Wanderley inclui, ainda, o conceito de mistas, no
qual se inserem as classificações que alternam os pontos de vista essenciais e funcionais, e,
entre elas os esquemas ditos analítico-sintéticos (Decimal Universal Classification – CDU),
tais como o concebe Gardin. Desta proposta de análise das estruturas de classificações
bibliográficas nota-se a que a preferência da organização pluridimensional denota uma
tendência de considerar o conceito, perspectivado pelos vários domínios do conhecimento,
como a unidade principal e necessária à representação documentária.

3º momento: ordem
Se a ordem única representada pelas taxonomias, como no caso das ciências natu-
rais, ou as aparentes estabelecidas pelas LD que hierarquizam assuntos, não nos servem
para estabelecer as representações, ao mesmo tempo, essenciais e funcionais dos objetos
que nos são indicados pela pragmática, no sentido de efetuar a plenitude da semiose, de-
vemos nos valer então da multiplicidade de ordens, conforme os nós da rede de conheci-
mentos que queremos representar. Partindo do suposto de que é a Rede de Conhecimentos
que vai indicar a melhor organização de sua representação, a constituição das LD vai pres-
supor a identificação e a segmentação do domínio do conhecimento, a fim de poder efetuar
a análise de seus conceitos chaves. Se a literatura monográfica foi a única responsável pelo
desenho das classificações unidimensionais, cujo objetivo principal era o do arranjo físico
dos documentos e da recuperação do todo temático, e a literatura periódica proporcionou o
surgimento de LD especializadas, de cunho semântico, como foi o caso dos tesauros me-
ramente alfabéticos, a produção do conhecimento armazenada na memória documentária

da atualidade vai necessitar de instrumentos que não só delimitem campos conceituais, mas
que os organize em segmentos hierárquicos. As listas de cabeçalhos de assunto, como espe-
lho da estrutura classificatória utilizada na organização de acervos da memória documen-
tária, só têm sua sobrevivência assegurada pelo domínio que os grandes acervos bibliográ-
ficos impõem como paradigmas, por exemplo, a biblioteca do congresso americano (Li-
brary of Congress). Nesse caso, o domínio está dado pela ideologia de acumulação da insti-
53

tuição, o que significa que as pré-coordenações conceituais existentes na linguagem, embo-


ra de fácil acesso por estarem prontas ao uso, não são adequadas a outras perspectivas de
análise. A escolha ou construção de um roteiro situacional vem a ser a tarefa mais comple-
xa da constituição de linguagens documentárias e os tesauros, assim como as classificações
bibliográficas (facetados) construídos com base nesses pressupostos, são as linguagens que
podem orientar com maior eficiência os processos de representação da informação.
Resta, ainda, discorrer como as LD operam no quadro das representações documen-
tárias, vistas como linguagens de comunicação entre a informação documentária e o usuá-
rio que dela necessita. Para Maria Cristina Pinto 29, as LD atuam nos sistemas de recupera-
ção de informações em dois níveis: orientando o analista sobre quais os melhores termos
para representar o assunto de um documento, e orientando o pesquisador sobre a escolha
dos termos que corresponderiam à representação do assunto por ele procurado. Essas orien-
tações vão desde o simples controle semântico de termos sinônimos até a construção de
complexas redes pragmáticas de referências cruzadas, dando ao usuário outras opções de
busca em relação ao assunto procurado. Correspondem, portanto, às linguagens documen-
tárias as seguintes funções:
a) organizar o campo conceitual da representação documentária, pois, segundo La-
ra30, ...pode-se afirmar que as linguagens documentárias devem possibilitar a condição de
referência, para que se estabeleçam as articulações necessárias ao engendramento de sig-
nificados. Vários fatores são apresentados por Lara para que essas condições aconteçam.
Em uma leitura sintética, pode-se afirmar que dois aspectos permeiam tais fatores. O pri-
meiro é a correspondência entre o sistema de significação do domínio em questão e a lin-
guagem documentária, o que configura, no plano conceitual, a chamadagarantia literária.
Quer dizer, o sistema conceitual aparente na literatura observada deve ser o mesmo da lin-
guagem documentária. O segundo é a adequação da linguagem documentária ao perfil do
grupo de usuários em questão, o que representa a garantia conceitual do uso, ou garantia

do usuário. Essas duas garantias (Literária e do Usuário) refletem um contexto onde tanto o
31
universo documental quanto as necessidades de informação do usuário são consideradas.
b) servir de instrumento para a distribuição útil dos livros ou documentos. Essa
função é cumprida pelas classificações bibliográficas, sendo que as mais utilizadas até
hoje são a CDD (Dewey Decimal Classification) e a CDU (Classificação Decimal Univer-
sal), as quais foram construídas pelo método dedutivo, unidimensional e misto respectiva-
54

mente, onde se agrupam os assuntos de acordo com as disciplinas do conhecimento. Estas


classificações, basicamente construídas com a finalidade de organizar os documentos em
bibliotecas, tem ainda hoje uma utilidade indiscutível, quando se trata de localizar fisica-
mente o documento em sua classe de assunto. As classificações de assuntos atendem ple-
namente às exigências do arranjo dos documentos em bibliotecas mas, exatamente por or-
ganizarem assuntos e não conceitos, elas não possuem a complexidade necessária para or-
ganizar, por exemplo, um acervo documentário representado por uma só classe, subclasse,
ou até mesmo um tema especial, já que o nível requerido para a análise dos conceitos ocor-
re a um grau de especificidade muito superior ao da sua formação estrutural. Durante mui-
tos anos, as bibliotecas especializadas preferiram usar a Classificação Decimal Universal
que, embora não possa ser considerada uma classificação facetada em sua plenitude, ofere-
ce uma maior flexibilidade na composição dos assuntos, apresentando sínteses notacionais
mais subjetivas.

c) controlar as dispersões léxicas, sintáticas e simbólicas no processo de análise


documentária. Ao contrário da função de dispor e localizar o documento na sua forma física
integral, as linguagens documentárias - listas de cabeçalhos de assunto e tesauros, orientam
a organização intelectual para a desconstrução do texto em língua natural e sua representa-
ção codificada e sintética, constituindo-se em instrumento de análise semântica e sintática.
Visam, portanto, a obter por ocasião das respostas aos pedidos de informação, um máxi-
mo de indicações relevantes ou pertinentes e, para tal, de coincidência entre as descrições de
autoria do classificador ou do indexador e as do usuário, em síntese, a normalização. Além
de economizar símbolos, eliminar redundâncias e condensar informações, as linguagens
documentárias facilitam a modulação das questões (hierarquização da informação), genera-
lizando-lhes ou especificando-lhes a compreensão, mediante a organização semântica. Por
exemplo, posso iniciar a busca por um conceito específico /manga espada/ e verificar, pela

estrutura hierárquica do conceito, que o conceito de /manga/ é mais interessante para a mi-
nha pesquisa. Quando as linguagens desse tipo são consideradas linguagens-produtos do
processo de catalogação, temos as listas de cabeçalhos de assunto. As listas de cabeçalhos de
assunto são linguagens documentárias que organizam uma rede de relações temáticas (mode-
lo da enciclopédia), de caráter conceitual pré-coordenado, uma vez que refletem não os
conceitos principais de um domínio do conhecimento, mas os assuntos estruturados no
55

sistema de classificação bibliográfica utilizado como representação do item documentário.


Como códigos documentários, reúnem regras de união de cabeçalhos e sub-cabeçalhos e de
controle semântico (sinonímia, homonímia). Os assuntos atribuídos a cada documento são de
cunho geral, representando a síntese temática efetuada no momento de atribuir a notação
classificatória. Segundo Shera32, o fator central de êxito ou insucesso de um catálogo é a
eficácia do sistema de classificação no qual se baseia. Isto vem a comprovar que a atribuição
de cabeçalhos de assunto a um documento está irremediavelmente presa ao código de assun-
to atribuído a ele.
Na verdade, poder-se-ia questionar que não há um limite teórico para atribuição de
cabeçalhos de assunto a um determinado documento. Mas, o que ocorre é que o sistema de
catalogação é fundamentalmente um sistema desenhado para recuperação manual na sua
essência, não permitindo, assim, estender em demasia o número de fichas catalográficas
para cada documento. A praticabilidade no manuseio do catálogo é fator relevante no tem-
po despendido para recuperar um assunto, sendo, portanto, utilizado para recuperar docu-
mentos somente em seus assuntos dominantes. Por outro lado, as listas de cabeçalhos de
assunto desenvolveram-se a partir dos catálogos de bibliotecas, sendo constituídas para
sistemas em funcionamento e só utilizadas em função das necessidades dos mesmos. Em
sua maioria, traduzem a experiência particular de cada sistema para o qual foram construí-
das, tornando-se instrumentos limitados, dada a característica de funcionamento e utiliza-
ção dos catálogos bibliográficos33 e ineficientes quando transpostas a outros sistemas ou
quando utilizadas a um grau de profundidade de indexação superior à capacidade de con-
trole, sem ferir a relevância na recuperação.
Por outro lado, quando as linguagens são consideradas linguagens-produtos do pro-
cesso de indexação, temos os tesauros. Os tesauros possuem uma característica singular no
34
âmbito das LD que é a organização do seu campo terminológico. Segundo Leska , o de-
senvolvimento de terminologias é direcionado à melhor designação para o significado dos

conceitos individuais e, consequentemente, para a mais precisa limitação deste significado.


O sentido de normalização vem, sem dúvida, desta redução de significado. Assim, os te-
sauros reúnem conceitos, que, embora sejam representados por símbolos lingüísticos, têm
restrito o significado. Este é, precisamente, o campo onde os tesauros se identificam com
os sistemas conceituais, ou seja, para cada conceito só pode existir uma representação sim-
bólica, designada de termo ou descritor.
56

Aos tesauros, sua história, desenvolvimento no âmbito da Ciência da Informação e,


particularmente, sobre os fundamentos teóricos para a sua construção, manutenção e utili-
zação, dedicaremos o próximo capítulo.

Notas e citações
1
COYAUD, M. Linguistique et documentation: les articulations logiques du discours. Paris: Larousse, 1972.
173 p.p. 130
2
Neste trabalho, usaremos a expressão /língua/ com o sentido de língua natural e /linguagem/ para linguagens
de comunicação. Sobre as diferenças semânticas entre língua e linguagem Martinet afirma que, há meio sécu-
lo, as definições de linguagem vêm apresentando uma certa coerência, pois partem todas do princípio de que
a linguagem é um sistema de signos utilizados para estabelecer a comunicação. Mas, o autor estabelece uma
oposição entre língua e linguagem. A língua é definida pelo caráter vocal, a linearidade e a dupla articulação,
e a linguagem é um conceito mais vasto identificado com o sistema de signos que permite efetivar a comuni-
cação. Saussure, por sua vez, além de distinguir língua e linguagem, observa que língua ( langue) e fala (paro-
le) são partes de um todo que é a linguagem. A primeira se situa no campo social e a segunda na esfera do
indivíduo. Cf. NOCETTI, Milton A., FIGUEIREDO, R. C. Línguas naturais e linguagens documentárias:
traços inerentes e ocorrências de interação. R. Bibliotecon. Brasília, v. 6, n. 1. p. 23-37.
3
WANDERLEY.M. A. Linguagem documentária. op. cit. p. 176.
4
LANCASTER, F. W. Indexção e resumos: teoria e prática. Brasília: Briqut de Lemos, 1993. p. 15-17.
5

de. :Étude
GROLIER, EricParis
documentaires. sur les1962.
UNESCO, catégories
p. 262.générales applicables aux classifications et codifications
6
RANGANATHAN, S. R. Philosophy of library classification. Copenhagen: Ejnar Munksgaard, 1951. p. 33
7
WANDERLEY, M. A. op. cit. p. 188.
8
As referências a esses autores se encontram ao logo do texto, em citações, ou na bibliografia.
9
CUNHA, Maria Isabel R. Ferin. Do mito à análise documentária. São Paulo: EDUSP, 1990. (Tese de
doutorado) p. 59
10
CUNHA, Maria Isabel R. Ferin. Do mito ....Op. cit. p. 19
11
WANDERLEY, Manoel Adolpho. op. cit. p. 187
12
CUNHA, Maria Isabel R. Ferin. (Coord.) Análise documentária: considerações teóricas e experimentações.
São Paulo: FEBAP, 1989. p. 28 e 29

13 CINTRA, Ana Maria Marques. Estratégias de leitura em documentação. In: SMIT, Joahanna W. (coord.)
Análise documentária: a análise da síntese. Brasília: SCT-PR/CNPq/IBICT, 1898. p. 30-38.
14
Cf, ECO, Umberto. A estrutura ausente: introducão à pesquisa semiológica. São Paulo: Perspectiva, 1991.
15
CUNHA, Maria Isabel R. Ferin. Do mito .....Op. cit.p. 111
16
SMIT, Johanna, W. A análise da imagem: um primeiro plano. In: Análise documentária: considerações
teóricas e experimentações. São Paulo: FEBAP, 1989. p. 102-113
57

17
COULON, Daniel, KAYSER, Daniel. Informática e linguagem natural: uma visão geral dos métodos de
interpretação de textos escritos. Brasília: SCT-PR/CNPq/IBICT, 1992. p.11
18
NOCETTI, Milton A., FIGUEIREDO, R. C. Línguas naturais e linguagens documentárias: traços inerentes
e ocorrências de interação. R. Bibliotecon. Brasília, v. 6, n. 1. p. 23-37.
19
Várias correntes da lingüística contemporânea reconhecem uma dupla articulação da língua. Na língua,
articulam-se entre si unidades de primeira articulação, dotadas de significado (a língüística européia
chama-as monemas e a lingüística norte-americana, morfemas) e identificáveis, embora nem sempre, com a
palavra. Tais unidades combinam-se entre si e formam unidades mais vastas chamadas sintagmas. Mas as
unidades de primeira articulação, que podem ser numerosíssimas no interior de uma língua, como o
demonstram os dicionários, constroem-se combinando entre si unidades de segunda articulação, os
fonemas, dotados de valor diferencial uns em relação aos outros, mas desprovidos de significado. Cf.
MARTINET, apud ECO, Umberto. A estrutura ausente: introducão à pesquisa semiológica. São Paulo:
Perspectiva, 1991. p. 32.
20
NOCETTI, Milton A., FIGUEIREDO, R. C. Op. cit.
21
CINTRA, Ana Maria Marques et al. Para entender as linguagens documentárias. São Paulo : Polis : APB,
1994. p. 18
22
ECO, Umberto. Semiótica e filosofia da linguagem. São Paulo: Ática , 1991.
23
ECO, Umberto. op. cit. p. 75
24
SAUSSURE, Ferdinand de. Curso de Lingüística geral. São Paulo: Cultrix, 1974. p. 136-139.
25
Cf. DELEUZE, G., GUATTARI, F. Rhizome. Paris: Minuit, 1976.
26
ECO, Umberto. Semiótica e filosofia da linguagem. op. cit. p. 245-290.
27
A discussão maior sobre organização conceitual se dará no próximo capítulo.
28
WANDERLEY, M.A . Linguagem documentária: acesso à informação. Ci. Inf., Rio de Janeiro, v. 2, n. 2. p.
175-217, 1973. p. 204
29
PINTO, Maria Cristina Mello Ferreira. Análise e representação de assuntos em sistemas de recuperação da
informação; linguagens de indexação. R.. Esc. Bibliotecon., UFMG, Belo Horizonte, v. 14, n. 2 p. 169-186,
set. 1985.
30
LARA, Marilda Lopes Ginez de. Algumas contribuições da semiolologia e da semiótica para a análise das
linguagens documentárias. Ci. Inf. , Brasilia, v. 22, n. 3, p. 223-226, set./dez. 1993
31
Voltaremos a esta questão posteriormente, quando da análise das fontes para a construção de tesauros.
32
SHERA, J. H., EGAN, M. E. op. cit., p. 37
33
Shera ressalta dois objetivos principais do catálogo de biblioteca: inventário e recuperação da informação,
sendo que o último é a sua função mais importante.
34
LESKA, B. M. Theoretical and methodological problems of therminology In: PROCEEDINGS of
international symposium, Nov. 27-30, 1979, Warsaw.

4 Tesauro - parte 1: análise do domínio


58

Um pouco da história
59

Segundo Vickery1, a palavra tesauro (latim = thesauru, grego = thesaurós) teve ori-
gem na Grécia significando Treasury or Storehouse (tesouro ou armazenagem / repositó-
rio), sendo que em 1936 o Oxford English Dictionary definiu a expressão inglesa como um
dicionário, enciclopédia e similares. Em 1852, Peter Mark Roget publicou o Thesaurus of
English Words and Phrases, uma coleção de termos organizada não em ordem alfabética,
como em um dicionário, mas de acordo com as idéias que expressavam. O objetivo de tal
estrutura era o de encontrar as palavras pelas quais as idéias pudessem ser mais bem ex-
pressas em textos. De acordo com Gomes2, Roget era secretário da Royal Society e
pretendia, com aquela obra, facilitar sua atividade literária. Levou nesse trabalho cerca de
50 anos. Argumentava Roget que o propósito de um dicionário comum é simplesmente
explicar o significado das palavras, mas o problema para o qual ele pretendia oferecer a
solução poderia ser apresentado assim: sendo dada uma palavra, pode-se encontrar seu
significado ou a idéia que ela pretende trazer consigo, em um dicionário. Mas, ao contrário:
tendo-se uma idéia, qual/quais palavras podem melhor expressar seu significado? Com esse
objetivo, as palavras e frases da língua foram arranjadas no Roget’s Thesaurus não de a-
cordo com seu som ou ortografia, mas estritamente de acordo com seu significado.
Peter Mark Roget organizou as palavras da língua inglesa em seis categorias concei-
tuais: relações abstratas – espaço – matéria – intelecto – volição – afeições. Essas categori-
as foram subdivididas em classes, que por sua vez foram divididas em seções, subseções e
conceitos isolados, tal como no recorte abaixo:

Classe 1 - Palavras que expressam Relações Abstra-


tas
Seção 1 - Existência
1.1. Ser, no abstrato
1.1.1. Existência
1.1.2. Sem existência
1.2. Ser, no concreto
1.3. Existência Formal
1.4.
1.5. Existência
etc. modal
60

A figura abaixo é um recorte do hipertexto 3 para a expressão Existência, que inicia


o Roget’ Thesaurus, tal como a página manuscrita.

NOUN: EXISTENCE, being, entity, ens [L.], esse [L.], subsistence; quid, hypaxis [rare], auto-
maton.
REALITY, actuality; positiveness &c. adj.; fact, matter of fact, sober reality; truth [See
Truth]; actual existence.
PRESENCE (existence in space) [See Presence]; coexistence [See Synchronism].
STUBBORN FACT; not a dream [See Imagination]; no joke.
ESSENCE, inmost nature, center of life, inner reality, vital principle.
[SCIENCE OF EXISTENCE] ontology.

VERB: EXIST, be; have being &c. n.; subsist, live, breathe, stand, obtain, be the case; occur
(event) [See Eventuality]; have place, rank, prevail; find oneself, pass the time, vegetate.
come into existence &c. n.; arise (begin) [See Beginning]; come forth (appear) [See
Visibility].
BECOME ( be converted) [See Conversion]; bring into existence [See Production];
coexist, postexist [rare], preëxist [rare].
CONSIST IN, lie in; be comprised in, be contained in, be constituted by.
ABIDE, continue, endure, last, remain.
ADJECTIVE: EXISTING &c. v.; existent, subsistent, under the sun; in existence &c. n.; extant; afloat,
on foot, current, prevalent; undestroyed.
REAL, actual, positive, absolute; factual, veritable, true [See Truth]; substantial, subs-
tantive; self-existing, self-existent; essential, beënt.
WELL-FOUNDED, well-grounded; unideal, unimagined; not potential [See
Nonexistence]; authentic.
ADVERB: ACTUALLY &c. adj.; in fact, in point of fact, in reality; indeed; de facto [L.], ipso
facto [L.].
QUOTATIONS: 1. Ens rationi.
2. cogito ergo sum.
3. Think’st thou existence doth depend on time?—Byron

4. All is concenter’d in a life intense.—Byron


5. To live is not merely to breathe, it is to act.—Rousseau
6. The mainspring of life is in the heart.—Amiel
7. I came like Water, and like Wind I go.—Omar Khayyám—Fitzgerald

Vale ressaltar que ao Roget’Thesaurus são dedicados vários endereços na Internet,


não só com conteúdos históricos, mas com as edições recentes do tesauro para consulta em
61

tela. O campo ou domínio desse tesauro é a língua inglesa e seu propósito continua a ser
aquele imaginado por Roget ou seja, o de auxiliar na escolha de uma expressão que melhor
reflita o conceito existente na mente do escritor. Por outro lado, como concepção, o mo-
delo do Roget’Thesaurus é utilizado no ensino da língua inglesa, em pesquisas de natureza
lingüística e filológica, jogos e lazer, propaganda e marketing de empresas comerciais.
No Brasil, além das iniciativas comentadas por Gomes, descobrimos uma obra inti-
tulada Dicionário inverso4, cujo objetivo era o de “proporcionar maior facilidade de con-
sulta aqueles que se dedicam à arte-ciência educativa e recreativa das ‘palavras cruzadas’ e
das charadas e enigmas em geral. A sua ordenação deve ser vista sob o prisma inverso dos
léxicos usuais - do significado para a palavra que o expressa”. Embora este léxico (elabo-
rado somente até a letra B) seja distinto do tesauro de Roget quanto ao uso, os dois têm em
comum o fato de organizarem os significados em detrimento dos símbolos utilizados na
linguagem natural para representá-los.
A partir de 1940, o termo tesauro começou a ser utilizado na esfera da Ciência da
Informação e, em especial, no processo de recuperação da informação, como sendo um
instrumento capaz de transportar conceitos e suas relações mútuas, tal como expressos na
linguagem dos documentos, em uma língua regular, com controle de sinônimos e estruturas
sintáticas simplificadas. Ainda segundo Gomes, o tesauro documentário surgiu da necessi-
dade de manipular grande quantidade de documentos especializados. Era preciso trabalhar
com vocabulário mais específico e com uma estrutura mais depurada do que aquela presen-
te nos cabeçalhos de assunto (remissivas e referências cruzadas tipo ver e ver também).
Assim, além da especificidade, cuidou-se de melhorar a estrutura, e as referências cruzadas
(ver também) deram lugar às relações hieráquicas (paradigmáticas) e associativas (sintag-
máticas). Pelo fato desse novo instrumento da documentação possibilitar, através do agru-
pamento dos termos, o acesso a uma idéia, mesmo sem saber nomeá-la de saída, as novas
listas estruturadas de termos passaram a ser chamadas de tesauros, por analogia com a obra

de Roget, embora com a função de indexar/recuperar informação. E aí estão presentes as


duas grandes características do tesauro de documentação: os conceitos, representados por
termos (descritores ou preferidos) e as relações entre eles.
O desenvolvimento acelerado dos tesauros documentários se deu mediante vários
aspectos. Luhn5 ressaltou a possibilidade de automatizar a indexação, onde tal instrumento
se fazia necessário dado que a passagem de palavras de texto para palavras-chaves só pode-
62

ria ser obtida por processos automáticos se as associações de palavras fossem previamente
armazenadas em uma memória. Bernier e Heumann 6 propuseram o uso do tesauro com o
sentido de coincidir os vocabulários de uma solicitação de pesquisa com o do sistema de
recuperação de informações, formando três tipos de ajuda: restrição do número de pala-
vras-chaves, lista classificada de termos e definições de palavras-chaves. Wall 7 listou alfa-
beticamente as palavras-chaves, provendo-as de referências cruzadas dos seguintes tipos:
sinônimos, termo genérico, termo específico e termo relacionado. A característica de a-
brangência no uso de relações entre os termos foi enfocada por M. Taube8, que propôs um
esquema de associações entre o termo a indexar com outras palavras-chaves que pudessem
ser relevantes e utilizadas tanto para a indexação como para a recuperação de informações.
Heald9 descreveu o tesauro como um instrumento dividido em duas partes: a primeira é
uma lista alfabética de palavras-chaves e referências cruzadas para indicar a hierarquia de
conceitos, e a segunda é a próprio estrutura hierárquica, apresentando as categorias ou face-
tas do vocabulário. Por fim, a UNESCO10 define o tesauro com sendo “vocabulário contro-
lado e dinâmico de termos relacionados semântica e genericamente, que cobre de forma
extensiva um campo específico do conhecimento” e a COSATI11 como “uma recompilação
de termos selecionados com as apropriadas relações mútuas e expostos de maneira a obter
máxima coerência na descrição de conceitos para a confecção de índices ou recuperação de
informações”.
O emprego de tesauros nas tarefas de indexação e recuperação de informações tenta
resolver o problema da alocação de documentos em classes de assuntos, não só por sua
capacidade de controlar o vocabulário, mas porque é um instrumento que relaciona os des-
critores/termos de forma mais consistente, apresentando uma estrutura sintética simplifica-
da e uma complexa rede de referências cruzadas. Isto permite ao especialista localizar com
mais facilidade a palavra-chave requerida para uma busca. Apresenta, ainda, um relacio-
namento lógico e hierárquico dos descritores, o que contribui para a indexação dos docu-
12
mentos ao nível específico e/ou genérico (modulação). Segundo Foskett , o principal obje-
tivo do tesauro é o de controle terminológico e, em concordância com Lancaster 13, lista
suas principais funções: controlar sinônimos e quase sinônimos; distinguir homógrafos;
facilitar a condução da busca por meio dos termos relacionados e das referências cruzadas
(estrutura sintética), melhorando a consistência da indexação e transportando a linguagem
63

de busca para a linguagem de indexação; e, reduzir o tempo e aumentar a eficiência nas


tarefas de indexação e recuperação de informações.
Partindo do princípio de que não existe uma linguagem documentária adequada ao
campo conceitual para o qual se deseja representar os documentos de uma coleção, a tarefa
mais produtiva é a construção de uma nova linguagem que seja útil à representação dos
dois universos integrantes do sistema de recuperação da informação: universo das deman-
das de informação e universo dos documentos disponíveis. Essa necessidade de interação
do documento com o usuário faz com que o fluxo do trabalho na construção de uma lin-
guagem documentária, especificamente de uma estrutura conceitual como o tesauro, obe-
deça a uma seqüência lógica de passos que, embora comum à maioria dos métodos utiliza-
dos para a construção de linguagens documentárias, deve ter por base alguns princípios
gerais que regem a construção deste tipo de vocabulário controlado.

Determinação do universo conceitual


De acordo com Gomes14, existem várias possibilidades para o estabelecimento do
universo conceitual, dependendo das circunstâncias na utilização da linguagem e das carac-
terísticas do sistema de informações para o qual esta será concebida. Por exemplo, existirá
uma diferença substancial na concepção de uma linguagem para um novo serviço de in-
formação, que não apresentou formalmente o universo de demandas de informação, e de
um sistema em operação, onde já existe um universo terminológico em uso. No primeiro
caso, é necessário desenvolver um estudo preliminar sobre o campo conceitual de interesse
dos usuários atuais e potenciais do sistema de informação para o qual o tesauro será
desenvolvido. Tais estudos, como dissemos no capítulo anterior, constituem-se na tarefa
mais complexa da elaboração de uma linguagem documentária e, na maioria das vezes não
é conduzida com a propriedade de uma análise abrangente, tanto dos documentos
produzidos quanto do interesse informacional dos seus utilizadores. Se por um lado, existe

um consenso de que a melhor fonte de informação é a literatura produzida, por outro, os


estudos de usuários dificilmente fazem parte do planejamento para a construção de
linguagens documentárias. E, além desses, a preocupação com a classe de problemas
existentes no campo conceitual de interesse da comunidade para a qual o sistema e a
linguagem estariam sendo desenhados só vem a ocorrer a partir de 1990.
64

As contribuições para a determinação de fontes se iniciam com Soergel15, para


quem a seleção dos termos pode ser obtida através de uma série de fontes de informação,
compreendidas em dois tipos distintos:
1. Fontes primárias
 lista de pesquisas retrospectivas e perfis de interesse;
 discussões com usuários em potencial, a fim de identificar seus interesses e determi-
nar possíveis pesquisas, resultando numa lista de termos;
 reunião de documentos representativos da área específica do tesauro para discussão
e eleição dos termos por comitê de especialistas;
 indexação de vários documentos feita por especialistas ou indexadores de centros de
informação.
2. Fontes secundárias
 listas de descritores, esquemas de classificação, outros tesauros;
 tratados de terminologia acerca de um campo de assunto específico;
 enciclopédias, dicionários, glossários e similares;
 sumários e índices de manuais e livros técnicos;
 índices e abstracts de publicações periódicas;
 índices de outros tipos de publicações na área.
Esses dois conjuntos indicados por Soergel, na verdade, podem ser explicitados
pelo significado que as expressões primário e secundário assumem na Ciência da Informa-
ção. As fontes primárias são representadas pela comunicação do conhecimento que está
expressa em linguagem natural. As fontes secundárias são representações sintetizadas do
conhecimento, apresentando uma interpretação estruturada em uma linguagem documentá-
ria. No que diz respeito à determinação do universo terminológico que se vai dispor para
construir uma linguagem, a preferência deve ser dada ao uso das fontes primárias, uma vez
que essas apresentam, de acordo com a escala de redução de significado, uma fidelidade

maior ao sentido da comunicação expressa nos documentos ou na formulação de uma ne-


cessidade de informação.
Gomes16 afirma que a escolha dos termos feita a partir da literatura, por exemplo,
permite obter o termo com o significado que lhe atribuem os especialistas da área. Esse
significado, apreendido a partir do contexto em que o termo aparece, é o que vai ser levado
em conta no momento de estruturar os conceitos em suas diversas relações. Por outro lado,
65

quando a terminologia é levantada a partir de fontes secundárias, isto é, de outras lingua-


gens documentárias, deve-se ter em mente as diferenças conceituais entre termos já estrutu-
rados e os significados destes presentes na comunicação em linguagem natural. Normal-
mente, uma classificação bibliográfica construída pelo método hieráquico apresenta termos
estruturados em assuntos pré-coordenados, merecendo, portanto, a análise conceitual que
transformará um assunto numa soma de conceitos principais.
Embora existam classificação facetadas que estruturam os conceitos e não os assun-
tos, ainda assim os conceitos e idéias muitas vezes não estão explicitados numa forma ver-
bal correta. Como exemplifica Gomes, a síntese conceitual se dá apenas na notação:
Nq Instalação de esgoto
Nq2 Esgoto sanitário
A expressão esgoto sanitário representa a idéia de instalação de esgoto sanitário e
não o próprio esgoto. Nesse caso, se aquela forma verbal for mantida, deve-se acrescentar
uma nota explicativa informando que sob aquele termo devem ser indexados documentos
sobre instalação de esgotos sanitários, ou adicionar um qualificador para tornar o termo
mais expressivo, como, por exemplo: “esgoto sanitário (instalação)”.
17

Dodebei , ultrapassando a discussão isolada da natureza das fontes, considera que


a determinação do universo conceitual pode ser obtido tanto por conhecimento prévio do
domínio, como por observação do campo conceitual, reconhecendo, no campo da metodo-
logia, a indução e a dedução como os métodos de escolha para a composição desse univer-
so.
Método empírico
A obtenção da terminologia se faz mediante a identificação de termos prováveis,
a partir do exame da literatura corrente, tendo como princípio básico de eleição a freqüên-
cia de ocorrência terminológica e a conseqüente incidência desses termos nas perguntas
que serão feitas ao sistema de informação. O método chamado Empírico por Lancaster18,
Estalagmite por Wooster e Analítico pelo American National Standard Institute (ANSI)
apud44, expressa o processo de construção a ser levado em consideração no desenvolvimen-
to do tesauro, onde as árvores hierárquicas são construídas a partir dos termos coletados na
literatura, até se obter máximos gêneros e mínimas espécies, que darão srcem às classes
gerais ou facetas principais.
66

Método consensual
A obtenção da terminologia se faz por consenso de peritos no assunto, mediante a
formação de comitês para discussão acerca dos termos que irão compor a estrutura do léxi-
co documentário e tendo como justificativa a garantia dos produtores e utilizadores do sis-
tema de informação; daí decorre um processo de dedução das espécies a serem incluídas, a
partir da definição, baseada no conhecimento, das classes gerais ou facetas principais. O
método é chamado também deGestalt, em contraposição a Analítico; Estalactite , em con-
traposição a Estalagmite; ou ainda Commitee Aproach, em contraposição a Empírico.
Os métodos Empírico e Consensual derivam, por sua vez, de dois princípios que
regem o levantamento dos termos e que são, respectivamente, a Garantia Literária e o En-
dosso do Usuário.

Garantia literária
A expressão Garantia Literária (Literary Warrant ou Bibliographic Warrant) foi
usada por Wyndhan Hulme19 em 1911, que defendia que a determinação de classes na
construção de linguagens documentárias não deveria ser baseada na classificação do co-
nhecimento e sim nas classes em que existe literatura; isto é, as características da literatura
em si é que determinam as classes definidas no sistema. Foskett20 assume o princípio da
Garantia Literária ao afirmar que os sistemas de recuperação de informação devem basear-
se no material que nele introduzimos e não em considerações puramente lógicas. Good-
man21, por sua vez, ao discutir o Thesaurus of Eric Descriptors, enfatizou o princípio da
67

Garantia Literária, ao ponto de afirmar que “ninguém pode, nunca, incluir um descritor no
tesauro, a não ser que um documento tenha sido nele classificado. Como exemplo, ainda,
de aplicação deste princípio, temos o sistema de classificação da Biblioteca do Congresso
Americano, que foi desenvolvido, pragmáticamente, a partir do estudo de seu acervo bibli-
ográfico.

Endosso do usuário
A expressão Endosso do Usuário (User Warrant ou Personal Warrant), usada por
Lancaster22, é uma confirmação direta dos produtores e utilizadores das informações de um
campo de atividades de que os termos escolhidos são, efetivamente, aqueles utilizados na
comunidade e, portanto, serão eles utilizados nas solicitações de pesquisa no acervo biblio-
gráfico. Chai Kim23, em artigo que discute os dois métodos de levantamento dos termos,
Empírico e Consensual, observou, através de experimento, que a relevância na recuperação
das informações se dá no mesmo grau quando utilizado uma linguagem construída a partir
de termos selecionados da literatura corrente (Empírico) ou um vocabulário cujos termos
foram obtidos através do consenso de um grupo de peritos no assunto (Consensual). Kim
conclui seu trabalho com a argumentação de que o conhecimento e a comunicação deste
não podem ser conceituados separadamente, não sendo verdadeiro que o conhecimento
baseado no consenso de peritos seja fundamentalmente diferente do conhecimento expres-
so na literatura, já que a literatura é a formalização do conhecimento produzido. Kim, no
entanto, deixou de considerar que o conhecimento pode ainda não estar retratado na litera-
tura, dado o hiato existente entre conhecimento e comunicação formal.
Na verdade, quando se trata de construção de linguagens documentárias, o ideal
seria que se pudesse absorver os dois princípios concomitantemente, isto é, certificar-se de
que a terminologia levantada possui as duas garantias: literária e do usuário. A esse respei-
to pode-se citar a experiência de Pickford24, que desenvolveu uma linguagem documentária

para a Biomedicina no National Institute for Medical Research, Inglaterra. O léxico do-
cumentário foi construído, tomando-se por fonte uma coleção literária abrangendo periódi-
cos especializados. Após a indicação feita pelos usuários do centro de pesquisa acerca dos
periódicos que deveriam pertencer a uma coleção de engenharia biomédica (1/3 do material
coletado), foram feitas cópias dos artigos que circularam entre os usuários em potencial. A
esses colaboradores foi solicitado que indexassem as cópias de acordo com uma série de
68

normas, sendo que cada cópia circulou por dois especialistas de modo que dois pontos de
vista fossem obtidos. As respostas coletadas foram tratadas eletronicamente, sendo a esco-
lha dos termos definida pela freqüência de uso na indexação. Esta metodologia obrigou à
formulação de instruções rigorosas acerca da indexação de documentos, utilizando, portan-
to, o conhecimento do usuário acerca da matéria, somado à técnica da indexação.
Nos Estados Unidos da América, Dym25 desenvolveu o Thesaurus for Paint Tech-
nology para a Federation of Paint Technology, coletando os termos a partir do envio de
cópias de artigos de revistas técnicas para os membros da Federação e solicitando que cada
colaborador sublinhasse os termos que considerasse representativos do conteúdo de cada
artigo. O processamento da terminologia se deu do mesmo modo que o adotado por Pick-
ford.
Tanto Pickford quanto Dym utilizaram a um só tempo os princípios da Garantia
Literária e do Endosso do Usuário, obtendo, como resultado do método, a terminologia
preferida por usuários em potencial do sistema de informação, o nível de especificidade e o
grau de exaustividade requeridos para a indexação dos documentos, além de envolverem os
usuários no processo, despertando o interesse e a participação mais efetiva nos programas
de documentação e informação.

Com base nessas duas experiências Dodebei26 desenvolveu uma pesquisa que visa-
va a estabelecer uma metodologia de levantamento de termos para a construção de tesauros
contemplada com as duas garantias: literária e do endosso do usuário. O domínio escolhido
69

para testar a metodologia foi a Formação Profissional nas suas ações desenvolvidas no Bra-
sil. A escolha de tal campo de assunto de deveu ao fato de que os estudos sobre a termino-
logia dessa especialização da Educação eram não só escassos, como disciplinares. Os ins-
trumentos terminológicos existentes ora se apresentavam no contexto geral da Educação,
ora no contexto da Economia. A inadequação dos instrumentos desenvolvidos para a área
de Formação Profissional fez com que os diversos organismos interessados duplicassem
esforços para sistematizar vocabulários técnicos, de modo a minimizar suas próprias difi-
culdades internas de comunicação em uma mesma linguagem.
As instituições ligadas à Formação Profissional procediam ao desenvolvimento de
seus próprios vocabulários, criando-se um impasse no momento de trocar informações en-
tre si, dada a característica de diversificação da linguagem quando do emprego de concei-
tos, tendo-se em vista, de uma lado, a extensão territorial do Brasil e seus regionalismos
lingüísticos, e, de outro, as diversas posições teóricas tradicionalmente adotadas. Após o
estudo da comunidade atuante no campo da Formação Profissional, e da identificação da
classe de problema existente no seu campo de interesse, decidiu-se envolver as três maiores
instituições para-governamentais que cobriam os setores primário, secundário e terciário de
atividades econômicas, ou seja, o Serviço Nacional de Aprendizagem Rural (SENAR), o
Serviço Nacional de Aprendizagem Industrial (SENAI) e o Serviço Nacional de Aprendi-
zagem Comercial (SENAC).
A decisão baseou-se no fato de que essas instituições congregavam um número re-
levante de técnicos em Formação Profissional, assim como possuíam um acervo básico de
obras e documentos sobre o assunto, sendo na sua maioria as produtoras dessa literatura.
Foram selecionados 250 artigos de periódicos nacionais e 250 técnicos em Formação Pro-
fissional. Cada técnico recebeu um artigo acompanhado de instruções. A seleção dos ter-
mos deveria ser feita após a leitura (análise de conteúdo), devendo-se sublinhar os concei-
tos (representados por palavras simples ou compostas) que fossem representativos do texto

em seu conteúdo global.


Após a escolha dos termos, o colaborador deveria ordená-los segundo a importância
no texto, ou seja: em primeiro lugar os conceitos que se referissem ao conteúdo global do
artigo e, em seguida, aqueles que representassem aspectos particulares da matéria tratada,
perfazendo um mínimo de dez conceitos ordenados dentro desse esquema. A seguir o cola-
borador deveria dar uma definição do primeiro conceito (desde que não fosse o assunto
70

geral Formação Profissional) na ordem de importância, ou seja, o termo n. 1, redigindo de


maneira informal o que, para ele, seria o seu significado. Desta forma, obteve-se um con-
junto de conceitos retirados da literatura corrente, escolhidos pelos técnicos do domínio em
questão, sendo delimitado o campo conceitual principal, visto, exclusivamente, na ótica da
Formação Profissional.
A união dos princípios da Garantia Literária e do Endosso do Usuário é um forte
indicador de que a linguagem documentária a ser construída para a indexação e recupera-
ção da informação será eficiente na tradução da linguagem natural, tanto do universo de
documentos que entram no sistema de informação, quanto do universo de possíveis per-
guntas que serão formuladas acerca da existência de documentos registrados no acervo.
A experiência metodológica levada a efeito para a Formação Profissional no Brasil,
antecipou de certo modo e, ao menos no campo das linguagens documentárias, um conceito
de análise situacional, o qual, a partir de 1990, é reconhecido como análise de domínio.
Beghtol27 e Hjorjand28 discorrem sobre a natureza do conceito, sobre as discussões que
antecederam o seu surgimento, tais como às que se referiam ao assunto/ aboutness (Sara-
cevic, 1975), ao binômio relevância e pertinência (Lancaster, 1979), ao ambiente do uso
da informação (Taylor, 1991), e aquelas sobre as implicações do conceito para a Ciência da
Informação, deslocando seu polo de atenção do documento/indivíduo, para o acervo/grupo
social. Se a análise de domínio é o processo de identificar e organizar o conhecimento so-
bre alguma classe de problema, em que medida ela ultrapassaria, no campo da construção
de linguagens documentárias, a soma das garantia literária e do usuário? Na verdade, a per-
gunta que se pode fazer na atualidade é a seguinte: como o profissional da informação pode
substituir, face às novas tecnologias, o modelo tradicional da análise de interesses de cada
usuário para a análise de interesse de um determinado grupo social? Certamente, devem ser
incluídos no modelo de estudo de usuário, não apenas a terminologia especializada, mas os
gostos, as tendências, as preferências por suportes, as demandas e as oportunidades dos

mercados. Não importa se o objetivo é a avaliação do campo conceitual para a construção


de uma linguagem documentária para um novo sistema de informação ou para um já exis-
tente.
Independentemente do método escolhido para a determinação do universo conceitu-
al, vale ainda uma observação sobre a dinâmica de cada um deles, do ponto de vista teóri-
co. Os processos de indução e dedução não devem ser tomados com absolutos e indepen-
71

dentes entre si, isto é, se a escolha recair pela utilização de um grupo de peritos que vai
estabelecer, dedutivamente, as hierarquias representativas de um dado campo conceitual,
isto não deve eliminar a comprovação de que tais hierarquias estão refletidas nas fontes,
tanto documentais como pessoais. O processo, nesse caso, deve partir de uma suposta hipó-
tese, ou suposição hipotética, passível de verificação particular, para então ser confirmada.
Sob o ponto de vista da indução, é improvável que não se faça suposições, ao longo do
processo, já que algum conhecimento antecipado o construtor da linguagem documentária
deve possuir. O modelo de Pierce citado por Eco 29, para o entendimento das regras de sig-
nificação, pode ilustrar esta tensão entre indução e dedução:

Peirce considera a abdução como a hipótese que, comparada com a dedução e a in-
dução, dá srcem aos três diferentes esquemas inferenciais em que as casas de linha contí-
nua expressam os estágios argumentativos pelos quais temos proposições verificadas, e as
casas de linha tracejada, os estágios argumentativos produzidos pelo raciocínio. Assim é
que a Abdução, naturalmente deve ser verificada.
O que se distingue nesta etapa de definição do universo conceitual é que os concei-
tos podem ser criados dedutivamente, ou identificados indutivamente, nas fontes primárias

e secundárias. O modelo de Peirce nos ajuda a compreender que os conceitos criados de-
vem ter uma correspondência com as fontes, na etapa da delimitação do universo conceitu-
al, e que o processo das inferências vai fundamentar toda a organização conceitual descrita
nas etapas seguintes.
Se a decisão tiver sido a do método dedutivo, o grupo de especialistas não estará
simplesmente determinando quais conceitos farão parte da linguagem documentária, mas já
72

estará determinando a estrutura conceitual em suas hierarquias principais. A dedução im-


plica em um conhecimento global do campo de assunto, no qual é possível efetuar deriva-
ções conceituais, do geral para o particular. Nesse caso, é necessário possuir um conheci-
mento profundo do domínio para o qual se está elaborando uma linguagem artificial, a fim
de evitar todos os riscos naturais, não só da subjetividade na seleção, definição e relacio-
namento entre conceitos, como também na identidade entre conhecimento e comunicação,
tal como mencionado anteriormente.
Por outro lado, na organização conceitual para a construção de linguagens docu-
mentárias fica evidente a tensão existente entre indução e dedução nas etapas de classifica-
ção, ou seja, nas ações de aproximação e afastamento de conceitos, por suas semelhanças e
diferenças dos atributos de apreensão conceitual. Mas, quando se diz que o método esco-
lhido é o dedutivo, quer-se dizer também que a análise de um domínio se deu por divisão
lógica, repartindo o universo em subconjuntos específicos, e que as classes principais, ou
primeiras categorias, não surgem por aproximações específicas do conjunto de conceitos
daquele domínio, características da indução, mas por decisão antecipada do especialista. A
discussão sobre o emprego dos métodos no relacionamento conceitual se dará no próximo
capítulo.
NOTAS E CITAÇÕES
1
VICKERY, B. C. Thesaurus : a new world in documentation. Journal of Documentation, v. 16, n. 4, p.
181-189, dec. 1960.
2
GOMES, Hagar Espanha (Org.) Manual de elaboração de tesauros monolíngües. Brasília : PNBU, 1990.
3
Roget’s International Thesaurus. Mawson, C.O.S., ed. (1870–1938) 1922.
http://www.bartleby.com/110/1.html. Capturada em 24 de setembro de 2001.
4
DOYLE SILVA, Ernani, FERREIRA, Lélio. Dicionário inverso. Rio de Janeiro : Abril, 1956. fasc. 1.
5
LUHN, H. P. apud VICKERY, B. C. op. cit., p. 183
6
BERNIER, C. L. , HEUMANN, K. F. apud VICKERY, B. C. op. cit., p. 185
7 WALL, E. A. ibid.
8
TAUBE, M. ibid.
9
HEALD, J. H. ibid.
10
UNESCO. Guia para la creación y desenvolvimiento de thesaurus multilingues, técnicos y científicos,
destinados a la recuperación de dados. CINTERFOR Documentation, Montevideo, v. 32, p. 13-17, 1973.
73

11
COMMITTEE ON SCIENTIFIC AND TECHNICAL INFORMATION. Guidelines for the development
of information retrieval thesauri. Washington : Government Printing Office, 1967.
12
FOSKETT, D. .J. A study of the role of categories in a thesaurus for education documentation. Strasbourg
: Council of Europe, 1972.
13
LANCASTER, F. W. Vocabulary control for information retrieval. Washington : Information Resources
Press, 1972.
14
GOMES, H. E. op. cit. p. 20
15
SOERGEL, D. Indexing languages and thesauri : construction and maintenance. Los Angeles : Wiley -
Becker & Hayes, 1974.
16
GOMES, op. cit., p.30
17
DODEBEI, Vera Lucia D. L. de M. Construção de thesauri: experimento empírico para a coleta de termos
em formação profissional. Rio de Janeiro, 1979. Dissertação apresentada ao Instituto Brasileiro de
Informação em Ciência e Tecnologia / Universidade Federal do Rio de Janeiro para a obtenção do grau de
mestre em Ciência da Informação.
18
LANCASTER, F.W. Vocabulary control for information retrieval. Washington : Information Resources
Press, 1972.
19
HULME, E. W. Principals of book classification. Association of Assistant Librarians, 1950.
20
FOSKETT, A. C. A abordagem temática da informação. São Paulo : Polígono, 1973. p. 10, 20, 40.

21GOODMAN, F. The role and function of thesaurus in education. In: THESAURUS of ERIC descriptors.
New York : CCM Information Corporation, 1972. p. IX-X.
22
LANCASTER, F. W. op. cit.
23
CHAI KIM, SOON KIM. Consensus vs frequency: an empirical investigation of theories for identifying
descriptors in designing retrieval thesauri. Information Processing Management, London, v. 13, n. 4, p. 253-
258, 1977.
24
PICKFORD, A. G. A. FAIR (Fast Access Information Retieval) Project. Aslib Procedings, London. v. 19,
n. 3, p. 79-95, 1976.
25
DYM, E. D. A new approach to the development of a technical thesaurus. Proceedings of the American
Documentation Institute, Washington, D.C. n. 4, p. 126 -131, 1967.
26
DODEBEI, V. L. D. L. de M. Construção de thesauri. op. cit.
27
BEGHTOL, Claire. Domain analysis, literary warrant andconsensus: the case of fiction studies. Journal of
the American Society for Information Science. v. 46, n. 1, p. 30-44, 1995.
28
HJORLAND, Birger, ALBRECHTSEN, Hanne. Toward a new-horizon inInformation Science: Domain-
Analysis. Journal of the American Society for Information Science. v. 46, n. 6, p. 400-425, 1995.
29
ECO, Umberto. Semiótica e filosofia da linguagem. op.cit. p. 50
5 Tesauro - Parte 2:organização de conceitos

As linguagens documentárias construídas para indexação e recuperação da informa-


ção devem ser baseadas na estrutura conceitual de um determinado campo temático ou á-
reas de domínio e não em assuntos representados por palavras, já que cada significado deve
ser representado por uma única forma verbal. Cada conceito é um item do conhecimento e
reflete este conhecimento do mundo real dos objetos e dos fenômenos, com seus atributos e
relacionamentos essenciais e acidentais. Mas, afinal o que vem a ser um conceito?
Se consultarmos um dicionário geral 1, vamos encontrar as seguintes acepções para
o verbete conceito: representação de um objeto pelo pensamento, por meio de suas carate-
rísticas gerais; ação de formular uma idéia por meio de palavras; pensamento, idéia, opini-
ão; noção, idéia, concepção; apreciação, julgamento, avaliação, opinião; avaliação da con-
duta e/ou aproveitamento escolar; ponto de vista, opinião, concepção; reputação, fama.
Na filosofia, pode-se distinguir duas naturezas para o conceito. A primeira, de acor-
do com a filosofia grega, indica que o conceito é a essência, a substância das coisas e,ain-
da, todo o processo que torne possível a descrição, a classificação e a previsão dos objetos

cognoscíveis. A segunda considera que o conceito é um sinal, ou procedimento semântico.

• 1ª → CONCEITO = ESSÊNCIA

Abbagnamo2 traça um quadro de relações em que, tanto para Hegel como para Aris-
tóteles, o conceito é a essência necessária da realidade, o que faz que ela não possa ser dife-
rente do que é. Aristóteles reforça a idéia de conceito de Platão quando diz que o conceito
(logos) é o que circunscreve ou define a substância ou a essência necessária de uma coisa,
classificando-o em: conceitos comuns, próprios e materiais. Kant, em sua obra Crítica da
razão pura, afirma que, se os conceitos se referem às coisas só mediante a sensação, os

conceitos puros ou categorias constituem as próprias coisas enquanto percebidas, isto é,


aparentes na experiência. Para os fenomenologistas, o conceito é uma formação psíquica,
cuja representação varia de momento a momento, de indivíduo a indivíduo, porém conser-
vando a mesma essência. Logo, reduz-se a essência à razão.

• 2ª→ CONCEITO = SIGNO


75

Na segunda acepção, Abbagnamo considera que o conceito é um signo do objeto e


se acha em relação (significação) com ele. Por essa interpretação, apresentada pela primeira
vez pelos estóicos, a doutrina do conceito torna-se uma teoria dos signos, a qual constitui o
modelo da lógica terminística medieval e o antecedente da moderna semiótica. Por signo
entende-se, de resto, uma proposição que, sendo antecedente em uma conexão verdadeira, é
descobridora da conseqüente. Pela lógica terminística a função do termo, tanto o universal
como o particular, é definida mediante a noção de suposição, pela qual os termos estão no
lugar da coisa suposta. Assim, por exemplo, na proposição “o homem corre”, o termo Ho-
mem está para Sócrates, Platão etc. Dewey, por sua vez, chama aos conceitos termos ou
significados, e Quine indicou exatamente o ponto crítico da transformação da noção de
conceito quando disse: o significado é o que a essência se torna quando se divorciou do
objeto de referência e se casou com a palavra. Para Carnap o conceito implica em proprie-
dade, atributo e função, e indica mais conotação do que denotação. Abbagnamo lista, as-
sim, as funções do conceito:
a) final → de exprimir ou revelar a substância das coisas.
b) instrumental, que se classifica ainda em:
b1 ) referencial → descrever os objetos da experiência para
permitir seu reconhecimento.
2
b ) econômica → classificar os fatos nos conceitos.
3
b ) organização → estabelecer relações lógicas para os dados
da experiência.
4
b ) previsão → antecipar ou projetar a solução de um
problema formulado.

No campo das teorias da linguagem, Wanderley3, ao discutir o desenvolvimento da


semântica, indica que estas já não se concentram mais em modelos gramaticais conduzindo
apenas às estruturas superficiais, mas incluem outras estruturas relativas à situações concei-
58
tuais adjacentes. O autor exemplifica com o modelo de Langacker apud que esquematiza
tal organização lingüística como na figura:
76

Do ponto de vista da relação entre língua natural e linguagem artificial, comenta


ainda Wanderley que “tudo se passa, na verdade, como se houvesse entre os domínios da
linguagem comum, da linguagem artificial e do pensamento, respectivamente da alçada da
linguística, da lógica e epistemologia e da psicologia - a correspondência que Clouzot a-
pud59 resume no quadro abaixo:

Assim, no que se refere à construção de linguagens documentárias, a unidade in-


formacional é o conceito, embora, é claro, ela deva estar expressa por termos, simbolica-
mente representados por palavras. Desta forma, os conceitos podem estar representados por
apenas uma palavra, ou por uma composição de palavras, desde que esta composição de-
signe um único conceito. Por exemplo: Ciência da Informação = termo que representa ape-
nas um conceito de um objeto, formado por duas palavras = um termo; Estudo de línguas =
dois conceitos, dois objetos (estudo e línguas) = dois termos.
77

A identificação dessas estruturas conceituais obedece a dois princípios:


a) princípio da monorreferencialidade, no qual a denominação do conceito é um
termo que guarda com ele uma relação unívoca, isto é, para cada conceito existe apenas
uma denominação e cada denominação vale apenas para um conceito. O conceito é o sig-
nificado do termo.4
b) princípio da contextualização diz respeito ao contexto (isto é, ao ambiente no
qual se encontra em língua natural) que vai especificar o significado da palavra, diminuin-
do desta forma a ambigüidade inerente às palavras representativas desta mesma linguagem
natural. Por exemplo, num texto sobre culinária, a palavra manga tem o significado de fru-
ta e, num texto sobre moda, o significado de manga muda para componente do vestuário.
Uma vez que fazemos uso da redução de significado para escolher uma dentre as várias
acepções que uma palavra possa ter, a fim de isolar os conceitos representativos de um
domínio temático, é o contexto no qual ela está inserida que vai determinar seu significado.
De acordo com Eco5, a pressão exercida pelo contexto para a obtenção do significado deri-
va tanto da identificação de um tema ou tópico e consequentemente pela escolha de um
percurso de interpretação ou isotopia, quanto pela referência a roteiros intertextuais que
permitem estabelecer não só do que estamos falando, como sob que aspecto, com que obje-
tivo e em que direção. A contextualização devolve, assim, o sentido que a monoreferência
reduziu.

Relações conceituais
Mudando o foco de nossa atenção das esferas ontológica e metodológica na identi-
ficação dos conceitos que constituirão uma linguagem documentária para o espaço lógico
das suas relações, duas abordagens teóricas devem ser consideradas: a dadivisão lógica
própria do processo dedutivo, representado pela diferença e a da predicação conceitual,
que compreende tanto a indução quanto a dedução, num processo relacional de semelhan-

ças, tal como a proposta de Peirce para a abdução/hipótese.

A divisão lógica
A hierarquização conceitual é um processo analítico, que considera a divisão do
tema geral em suas espécies. As espécies são, portanto, obtidas pela diferença específica,
ou seja, as qualidades ou atributos que, somados aos próprios do gênero, as distinguem.
78

Diremos, então, que a cada derivação conceitual as espécies daí decorrentes adquirem pelo
menos um atributo a mais que seu gênero próximo, tornando-se mais intensas ou compre-
ensíveis na medida em que aumenta o número das diferenças.
A questão da diferença é estudada na teoria da classificação a partir das categorias
aristotélicas que, reformuladas por Porfírio, representam: gênero, espécie, diferença, pro-
priedade e acidente. Porfírio (séc. IV), na sua obra Isagoge ou Introdução às categorias,
aplicando o princípio da oposição de Platão e Aristóteles, apresentou uma classificação
dicotômica constando de cinco predicáveis ou categoremas representados na famosa classi-
ficação Árvore de Porfírio ou Arvore de Remée (divulgada no século XVI pelo filósofo
francês Pierre de la Remée):

A diferença específica é, portanto, o atributo a mais que distingue as espécies. No


caso do gênero maior /subtância/, a diferençaCorpo gerou duas espécies: corpórea e in-
corpórea. A cada derivação conceitual, as espécies tornam-se gêneros das derivações sub-
seqüentes, até que uma espécie seja tão pouco extensa e tão intensa que não possa ser mais
subdividida, como é o caso de Platão, Sócrates e Aristóteles, no exemplo de Porfírio.
Na literatura de Teoria da Classificação 6, a diferença é nomeada de qualidade, atri-
buto, ou característica escolhida para servir de base à classificação ou à divisão lógica. Po-
de também ser considerado como princípio da classificação ou princípio da divisão. A
79

expressão /característica/ é, no entanto, a mais freqüentemente utilizada. Se tomarmos o


exemplo abaixo:

Objeto (matéria)
Objeto material (+ essência : forma e conteúdo)
Suporte da informação (+ memória)
Documento (+ tempo de publicação)
Periódico

Reconhecidas as características que serviram de base para a divisão conceitual: ma-


téria, essência, memória e tempo, elas podem ser identificadas com os “pontos de vista”,
ou diferenças escolhidas pelas quais pode-se analisar um objeto. A observação da cadeia
conceitual resultante, demonstra a intencionalidade na escolha das diferenças, quer dizer, a
partir de objeto poderíamos também chegar amesa, casa, filme etc. O que vai determinar o
sucesso na obtenção de todas as derivações necessárias à organização do universo concei-
tual é a aplicação de regras lógicas de divisão, as quais, muitas vezes, se configuram como
obstáculos na utilização prática de tal processo de análise conceitual. Existem, portanto,
qualidades e limitações na aplicação da divisão lógica conceitual. Para o primeiro caso,
contamos com três princípios que regem a organização de conceitos no aspecto da estrutura
classificatória. Podem, assim, ser considerados como:

a) Completude
A divisão do conceito deve ser completa, adequada e ordenada por complexidade
crescente, isto é, enumerar todos as espécies de que o gênero se compõe, do simples ao
complexo ou do abstrato ao concreto. Por exemplo, aplicando-se a característica nível de
ensino, a divisão abaixo está completa, com todas as espécies enumeradas.
80

b) Irredutibilidade
A divisão deve garantir que a cada dedução conceitual os conteúdos sejam irredutí-
veis entre si, isto é, não se deve enumerar mais do que os elementos verdadeiramente dis-
tintos entre si, de maneira que nenhum esteja compreendido no outro. Se, tal como no e-
xemplo, o conceito de inteligência está contido no conceito de alma, ele não pode integrar
o primeiro nível de derivação conceitual, coordenado à alma e ao corpo. O conceito de
inteligência é um conceito subordinado à alma.

c) Mútua exclusividade
A divisão deve ser fundada no mesmo princípio, isto é, servir-se de membros ver-
dadeiramente opostos entre si. Para cada derivação conceitual deve-se usar apenas uma
característica do conceito. No exemplo abaixo, a divisão do conceito biblioteca considerou
duas características de derivação ao mesmo tempo: disciplina e tamanho. Embora a espécie
esteja de acordo com o gênero, uso de duas diferenças concomitantes configura um erro
lógico.
81

A organização conceitual deve garantir que a classificação obtida tenha por quali-
dades: ser completa; ser irredutível; e, ser mutuamente exclusiva.
Com a divisão lógica, os conceitos vão se relacionar pela hierarquia do processo de
derivação conceitual, sendo fundamental o domínio de seu conteúdo. Para tanto, devemos
considerar uma idéia ou conceito do ponto de vista de sua intensão (ou compreensão) e de
sua extensão. Se tomarmos como exemplo a divisão:

Verificamos que os conceitos se relacionam por:


• Coordenação de classes, ou relacionamento sintagmático ( Eixo C )
Observa-se o uso de uma característica de cada vez para a derivação de um conceito
(regras da divisão lógica), resultando em classes associadas ou coordenadas. Nos diversos
domínios do saber esta relação é denominada de sintagmática (lingüística); divisão em fi-
leira array (Ranganathan); assuntos correlatos (classificações bibliográficas, em geral).
82

• Subordinação de classes, ou relacionamento paradigmático ( Eixo S )


Para Jolivet7, a “idéia” ou conceito é a simples representação intelectual de um ob-
jeto, diferindo essencialmente da “imagem”, que é a representação determinada do objeto
sensível. A compreensão é, portanto, o conteúdo de uma idéia, o conjunto de elementos de
que uma idéia se compõe. A idéia de Homem implica os elementos: ser, vivente, sensível,
racional.

A extensão é o conjunto de sujeitos a que a idéia convém. A idéia de Homem con-


vém aos: canadenses, aos franceses, aos negros, a Pedro. Portanto, a relação entre compre-
ensão e extensão se dá numa tensão da razão inversa.

Existe, pois, uma relação entre gênero/espécie - hierarquia - intensão e extensão. É


possível, portanto, ordenar as idéias segundo uma hierarquia baseada em sua extensão. A
83

idéia superior em extensão se chama gênero em relação à idéia inferior, e esta, espécie em
relação à primeira. Assim, quanto maior é a intensão (número de caraterísticas do concei-
to), menor é a extensão (número de membros ou espécies) de uma classe, e vive-versa.
Embora as relações hierárquicas sejam as mais freqüentes na organização de con-
ceitos para a construção de linguagens documentárias, elas não devem ser as únicas a se-
rem consideradas no processo de construção de linguagens documentárias.
Wanderley8, citando Mills, considera as seguintes limitações impostas pelo uso da
divisão lógica na concepção de classificações bibliográficas:
a) a relação de gênero para espécie, de uma coisa para suas variedades, é apenas
uma das relações de fato utilizadas nas classificações bibliográficas;
b) é inadequado limitar-se a divisão às características que constituem qualidades
genéricas essenciais.
c) é comum o uso de características acidentais, quando mais apropriadas para o en-
tendimento do contexto, sem que isto fira a lógica da derivação conceitual;
d) não é sempre exeqüível, ao dividir-se um gênero por características sucessivas,
ater-se a uma regra de todo coerente;
e) a divisão lógica não pode impor uma ordem privilegiada de aplicação de caracte-
rísticas.
f) o mesmo ocorre quanto ao arranjo das classes, o qual teoricamente não obrigaria
à anteposição do geral para o particular, do abstrato ao concreto, nem privilegiaria qualquer
ordem dentro de uma série de subclasses coordenadas;
g) por fim, não existe uma correspondência biunívoca entre documentos e termos
de classes, o que se soma à natural complexidade das relações entre as próprias ciências e
ao caráter interdisciplinar da pesquisa moderna.
Tais limitações, no entanto, só fazem demonstrar o caráter subjetivo, arbitrário das
classificações, quer dizer: a decisão quanto ao ponto de vista a se adotar na divisão lógica;

o nível de modulação conceitual para cada domínio do conhecimento; a extensão do domí-


nio e suas interfaces com outros fronteiriços. Não há como afirmar que uma classificação é
melhor do que outra, a avaliação se dá pelo uso e pelos resultados obtidos, sempre tendo-se
em mente a representatividade do campo conceitual a se representado. As regras e os prin-
cípios delineados pela literatura indicam que a concepção de linguagens documentárias
84

deve ser lógica na formação e relacionamento conceituais, mas flexível nas aplicações ob-
jetivas.

Predicação conceitual
De acordo com Dahlberg9, a linguagem permitiu ao homem relacionar-se com os
vários objetos que o circundavam e permitiu também que ele elaborasse enunciados sobre
eles. Toda vez que o objeto é pensado como único, distinto dos demais, constituindo uma
unidade inconfundível (coisas, fenômenos, processos, acontecimentos, atributos) pode-se
falar em objetos individuais, isto é: objetos únicos, definidos, distintos de outros, com pre-
sença de tempo e espaço , por exemplo: O menino (este menino específico). Mas, além dos
objetos individuais, podemos referir-nos a objetos gerais, quando não se trata de nada úni-
co, mas de algo que ocorre em várias situações, de um tipo geral, que, de certo modo, pres-
cindem das dimensões tempo e espaço- Um menino (qualquer menino).
Com a ajuda das línguas naturais é possível formular enunciados a respeito tanto
dos objetos individuais como dos objetos gerais. Cada enunciado verdadeiro representa um
elemento, atributo ou característica do conceito. Efetuando-se a predicação de um objeto
individual, identificam-se os elementos, como abaixo:

O conceito de UNIRIO é a soma de seus enunciados. Portanto, a soma total dos


enunciados verdadeiros de um objeto individual resulta no conceito individual deste objeto.
85

Se tomarmos o objeto geral /Instituição/, sobre ele poderemos formular os seguintes enun-
ciados verdadeiros:

Do mesmo modo, a soma total dos enunciados verdadeiros de um objeto geral re-
sulta no conceito geral deste objeto. No entanto, ao comparar o elenco de atributos dos dois
tipos de conceitos, podemos perceber que nos conceitos individuais há sempre elementos
dos conceitos gerais, o que significa que é possível, portanto, inferir conceitos gerais a par-
tir de conceitos individuais. Isto é o que permite que no processo indutivo, por inferência,
possa-se chegar à uma classe geral, partindo-se de um objeto particular. Pode-se, assim,
considerar a formação dos conceitos como a reunião e a compilação de enunciados verda-
deiros a respeito de determinado objeto. Para fixar o resultado dessa compilação, usamos a
palavra ou qualquer signo que possa traduzir ou fixar essa compilação. É possível, então,
definir conceito como a compilação de enunciados verdadeiros sobre determinado objeto,
fixada por um símbolo lingüístico.
Se o conceito pode ser compreendido como um portador de elemen-
tos/características, obtidos pela predicação de seu referente, para fins de comunicação é
necessário sintetizar os elementos do conceito em uma expressão, ou combinação de pala-
vras, a fim de que se possa manipulá-lo ou, até mesmo, designá-lo por um código ou sinal.
Dahlberg10 apresenta, assim, um modelo conceitual para a organização do conhecimento e
estudos terminológicos, denominado Teoria Analítica do Conceito (orientada para referen-
te), visando à comunicação entre indivíduos, tendo como intermediário a informação regis-
trada. Utilizando o significado de conceito como sinal e conteúdo, Dahlberg defende que
as características do conceito são entendidas como elementos de conhecimento, e a soma
86

total das predicações pode ser sintetizada na unidade de conhecimento correspondente. Os


conceitos são, desta forma, entendidos como unidades de conhecimento.

Considerando que todo enunciado sobre objetos contém um elemento do respectivo


conceito, pode-se afirmar que esses elementos identificam-se com as chamadas caracterís-
ticas dos conceitos. Assim, as características dos conceitos são obtidas pela formulação dos
enunciados sobre os atributos necessários ou possíveis dos objetos. Esse processo de iden-
tificação das características de um conceito é denominado de predicação conceitual.
87

Segundo Dahlberg, muitas vezes não se trata de um atributo a que corresponde uma
característica, mas de uma hierarquia de características, já que o predicado de um enuncia-
do pode tornar-se sujeito de novo enunciado, e assim sucessivamente, até que se atinja uma
característica tão geral que possa ser igualada a uma categoria, como abaixo:

Periódico é um documento que se publica periodicamente


Documento que se publica periodicamente é um documento
Documento é um suporte da informação
Suporte da informação é um objeto material
Objeto material é um objeto

O exemplo considera os mesmos conceitos utilizados para demonstrar a derivação


conceitual na divisão lógica. Embora o resultado seja o mesmo, em relação ao número de
objetos, a predicação deperiódico o classifica na categoria geral deobjetos, naturalmente e
a partir das cadeias de definição a ele atribuída. Nesse sentido, tendo o contexto a função

de delimitar o significado do conceito, as cadeias construídas vão melhor representar o


campo conceitual no qual serão utilizadas como linguagem documentária.
Gomes11, exemplifica a característica como o elemento de um conceito que serve
para descrever ou identificar uma determinada qualidade de um objeto. As características
são elementos fundamentais na sistematização dos conceitos, pois é através delas que se
faz a comparação dos conceitos em classes, subclasses, ou ainda em conjuntos não hierár-
quicos. Exemplifica Gomes: os conceitos /Abadia/, /Basílica/, /Catedral/, /Mesquita/ e
/Mosteiro/, pertencem à classe /Edifício religioso/, pois esta é a característica comum a
estes conceitos. A literatura aponta, ainda, uma variada tipologia de características concei-
tuais. De um modo geral, pode-se reduzir tais classificações a duas categorias: Característi-

cas intrínsecas ou naturais - são as características inerentes ou inseparáveis do conceito de


um objeto e podem ser constitutivas ou consecutivas da essência; e, Características extrín-
secas ou acidentais - são características que dependem de fatores externos e de condições
acidentais e podem ser gerais ou individualizantes. Dahlberg apresenta o exemplo a seguir:
88

Objetos materiais em geral MINERAIS


Características essenciais constitutivas
- ser natural composição química
- ter uma estrutura estrutura cristalina
Características essenciais consecutivas
- propriedades físicas desvio dos raios luminosos; dureza
- propriedades elétricas condutividade
Características acidentais gerais
- determinada forma formas externas dos minerais
- falhas deformações
- cor cor
Características acidentais individualizantes
- relação com determinado lugar tempo
- relação com determinado tempo espaço

De acordo ainda com Dahlberg, outras espécies de objetos, como as plantas, podem
ter características diferentes. O mesmo ocorre com os produtos, como máquinas, equipa-
mentos. Nesse caso, as características essenciais são determinadas pelas finalidades e pela
aplicação, e as características acidentais dependem da respectiva eficiência ou valores, em
geral práticos. Essa também é a opinião de Gomes 12, que acrescenta às duas categorias
gerais (naturais e acidentais) outras em função do tipo de objeto, tais como características
equivalentes e não-equivalentes; características independentes e dependentes.
O conhecimento das carcterísticas conceituais vai permitir realizar, com maior pro-
priedade as ações de: definição dos conceitos; formação dos nomes dos conceitos; e, orde-
nação classificatória. Para o estabelecimento de comparações por semelhanças e diferenças
entre os conceitos, quer seja para defini-los, nomeá-los ou ordená-los, há que se falar em
relações conceituais. Do ponto de vista epistemológico, o conceito pode ser analisado se-
gundo as ações mentais, ou seja, a habilidade da mente em comparar algo novo com co-
nhecimento adquirido. Esse tipo de conhecimento subjetivo necessita tornar-se acessível e
verificável, explícito, objetivo. As possíveis comparações, segundo Dahlberg, podem ser
classificadas em lógicas ou formais; categorias formais; e materiais ou de conteúdo, sendo
esta última baseada na primeira. Com a finalidade de demonstrar o caráter deduti-
89

vo/indutivo da proposta de Dahlberg para a predicação conceitual, reorganizamos as rela-


ções conceituais, levando-se em consideração tanto o modo de ser dos objetos, quanto as
suas identidades e diferenças.
Em função de seu conteúdo ou significado, as relações entre os conceitos se dão
mediante comparações: lógicas, formais, abstratas ou semânticas
• Relações de equivalência (identidade)

Quando um conceito pode ser representado por vários símbolos distintos ou quando
se quer reduzir, por questões pragmáticas, os níveis de implicação conceitual, estabelecem-
se as relações de equivalência semântica. Tais relações vão permitir controlar os três con-
juntos de dispersões semânticas, característicos da língua natural; léxicas, simbólicas e
sintáticas.
Dispersão léxica
 sinônimos (professor e docente)
 quase sinônimos ( linguagem documentária e tesauro)
Dispersão simbólica
 grafias diferentes (conceptual e conceitual)
 abreviaturas (Unirio e Universidade do Rio de Janeiro)
 razão social e nome fantasia (Telefonica celular e TELERJ Celular SA)
 tradução (software e programa)
Dispersão sintática
 coordenação (instituições de ensino e ensino, instituição; aprendizagem e ensi-
no/aprendizagem)
 gênero e número (casa e casas; aluno e aluna)
A equivalência entre dois símbolos é representada pela identidade de suas caracte-
rísticas, de modo que a soma dos atributos verdadeiros, resultado da análise de cada um,
possa gerar um único e mesmo conceito. Ao contrário, quando um mesmo símbolo é iden-

tificado com dois ou mais conjuntos de características distintas, o que se configura é a po-
lissemia, isto é, dois ou mais significados nomeados por um mesmo símbolo. Neste caso,
os símbolos devem ser distinguidos por meio de qualificadores, o que os transformará em
novos símbolos, cada um no lugar de um único significado conceitual. Por exemplo:
 venda (processo) e venda (produto)
 cedo(verbo ceder) e cedo (advérbio de tempo)
90

 manga (fruta) e manga (parte de vestuário)

• Relações hierárquicas (implicação)


Se dois conceitos diferentes possuem características idênticas e um deles possui
uma característica a mais do que o outro, então entre eles se estabelece a relação hierárqui-
ca ou relação de gênero-espécie. Pode-se falar de conceitos mais amplos ou extensos e
mais restritos ou intensos. Este tipo de relação pode também ser chamada de relação de
abstração, uma vez que a cada degrau hierárquico abstrai-se uma característica a mais, co-
mo no exemplo: uma macieira é uma árvore frutífera que, por sua vez, é uma árvore.
Árvore
Árvore frutífera (todos as características do anterior + 1= frutas)
Macieira (todos as características do anterior + 1= maçã)

Outra forma de visualizarmos o relacionamento hierárquico, que significa implica-


ção conceitual:
91

Vale ressaltar, que devemos sempre preferir relacionar os conceitos por suas carac-
terísticas essenciais, de modo que sejam evitados os relacionamentos acidentais do tipo:
animais de estimação (gênero) gatos (espécie), já que todos os gatos são animais, mas nem
todos os gatos são animais de estimação.

• Relações partitivas
A relação partitiva existe entre um todo e suas partes. Em relação aos conceitos e
suas características, isto significa que o conceito de um todo, por exemplo, um corpo, um
organismo, um sistema, inclui como suas características os conceitos de suas partes. Por
92

exemplo: A árvore é composta de raízes, tronco, galhos, folhas, flor e frutos. As caracterís-
ticas de /raiz/ integram as características de /árvore/.

As relações partitivas podem ser reconhecidas pela especificação das partes de um


objeto natural (uma planta, um animal, um mineral); ou pela identificação dos elementos
de construção de um produto (uma bicicleta, uma casa, um telefone); ou ainda pela consti-
tuição de uma unidade organizacional (um país e seus estados, um campo de estudo e seus
subcampos). Por exemplo, a relação entre Brasil e Rio de Janeiro é uma relação de par-
te/todo. Não se configura, neste caso, a relação de gênero/espécie, uma vez que não se pode
afirmar que Rio de Janeiro é uma espécie de Brasil.

• Relações de oposição (negação)


A oposição entre conceitos pode acontecer por contradição: numérico/não numéri-
co, presença/ausência; contrariedade: branco/preto, amizade/inimizade; ou por gradação:
favorável - neutro – desfavorável, (valor) alto - igual – baixo. Não se lhes atribuem desta-
que na apresentação do tesauro, podendo tais relações aparecer tanto em categorias distin-
tas, quanto fazendo parte de uma mesma estrutura hieráquica, tal como as hierarquias cha-
madas dicotômicas.
93

• Relações funcionais (interseção)


Se as relações abstratas e as relações partitivas se aplicam a conceitos que expres-
sam objetos e as relações de oposição se aplicam, principalmente a conceitos que expres-
sam propriedades, as relações funcionais aplicam-se sobretudo a conceitos que expressam
processos. Pode-se conhecer o caráter semântico de tais relações tendo por base as chama-
das valências semânticas dos verbos, dando atenção aos verbos e seus respectivos comple-
mentos. Por exemplo: produção → produto - produtor – comprador; medição → objeto
medido - fins da medição - instrumento de medição - graus de medição. A valência semân-

tica do verbo é a soma dos lugares a serem preenchidos de acordo com a ligação deste con-
ceito com outros. O Roget’Thesaurus aplica não só a valência semântica para relacionar as
palavras da língua inglesa, como as categorias gramaticais (nome, verbo, adjetivo, advér-
bio) nas quais são classificados os conceitos.
Caso se trate da valência semântica do verbo medir, teremos que responder às se-
guintes questões:
94

- o que é medido? ex: a temperatura;


- com que instrumento é feita a medição? ex: o termômetro;
- de acordo com que sistema? ex: Celsius;
- de que coisa é medida a temperatura? ex: de uma célula viva.

Pode-se então considerar que entre o conceito do processo medição e os conceitos


dos complementos mencionados existem relações funcionais. Vale ressaltar que, se por um
lado existe toda uma base teórica para o estabelecimento das relações abstratas e partitivas
independentemente ao contexto, as relações funcionais ou associativas são estabelecidas

pelo empirismo, quer dizer pelo conhecimento do campo conceitual. No limite, pode-se
afirmar que todos os conceitos se relacionam entre si. Qual a relação existente entre ca-
chorro e árvore? Não é uma relação de gênero/espécie - cachorro não é uma espécie de
árvore e vice-versa. Não é uma relação de parte/todo - cachorro não é uma parte da árvore e
vice-versa. Mas o cachorro tende a urinar nas árvores. Esta é uma relação do tipo associati-
vo. Pinto13 enumera algumas possibilidades de associação entre os conceitos:
a) causa e efeito → medicamento/cura de doenças
b) concorrência → ensino/aprendizagem
c) constituição → janelas/alumínio
d) agente → iluminador/iluminação

Motta14 identifica os seguintes tipos de relações associativas, a partir da análise


conceitual de 61 termos no domínio da Economia: associação implícita; interfaceta; ins-
trumental; coordenação lógica; causalidade; influência; oposição; atribuição; coordenação
partitiva. Tal identificação é resultado pragmático da análise conceitual dos termos levan-
tados, específicos para o campo da Economia. Isto não quer dizer que esta tipologia possa
95

ser aplicada a todas as áreas do conhecimento. As relações conceituais de natureza funcio-


nal ou associativa podem ser estabelecidas antecedente ou posteriormente à construção do
tesauro, conforme o método adotado para dar início ao processo de relacionamento concei-
tual, mas, sem dúvida, devem se pautar pelas categorias, classes superiores ou facetas que
organizam a rede conceitual.
Em complemento às relações conceituais de natureza lógico-semântica, outra possi-
bilidade de efetuar-se comparações entre os conceitos é a que estabelece as categorias nas
quais os conceitos se identificam e se organizam, nomeada por Dahlberg de relações de
categorias formais. Assim é que a contribuição ontológica ao seu modelo conceitual é re-
presentada pelas dez categorias aristotélicas ou as classes gerais pelas quais pode-se olhar o
ser. Piedade15 resume o pensamento aristotélico ao afirmar que a idéia que temos das coi-
sas não é simples, mas um composto de vários aspectos, que temos que conhecer para tor-
nar posssível uma descrição. Aristóteles deu o nome de categorias ou predicáveis às clas-
ses gerais em que, segundo ele, podemos situar, ordenadamente, as idéias que temos das
coisas e que constituem os dez gêneros supremos, as dez essências mais gerais. Assim, se
considerarmos as perguntas que podem ser feitas às coisas: o que é isso? que tamanho tem?
que tipo de coisa é?, as respostas especificarão:
• Substância (homem, cachorro, pedra, casa etc.)
• Qualidade (azul, virtuoso etc.)
• Quantidade (grande, comprido, dois quilos etc.)
• Relação (mais pesado, escravo, duplo, mais barulhento etc.)
• Duração (ontem, 1970, de manhã etc.)
• Lugar (aqui, Brasil, no pátio etc.)
• Ação (correndo, cortando, falando etc.)
• Paixão ou sofrimento (derrotado, cortado etc.)
• Maneira de ser (saudável, febril etc.)

• Posição (horizontal, sentado etc.)


Tais categorias representam o modo de ser das coisas, de forma que, fixadas pela
linguagem, formam proposições através da combinação de substantivos e verbos. A subs-
tância é a categoria básica identificada com o sujeito, o substantivo. As demais são consi-
deradas predicados do sujeito tal como a organização das categorias gramaticais (adjetivos,
verbos e advérbios). Para Aristóteles a substância é a categoria básica, as outras são decor-
96

rentes desta, pois se não houvesse o objeto não haveria a relação, paixão etc. Aristóteles
reduz, posteriormente, as dez categorias a três:
• Substância - o ser que existe
• Modo - ou acidente, é o que existe na substância, seus modos de ser
• Relação - é o que liga um ser a outro
Piedade apresenta a relação das categorias aristotélicas com as categorias gramati-
cais, o que, de fato, é muito importante para a análise conceitual do texto que se quer inde-
xar e, consequentemente, para o estabelecimento das relações conceituais em um tesauro.

Substantivo, sujeito √ substância


Adjetivo qualitativo √ qualidade
Adjetivo quantitativo √ quantidade
Pronome relativo, adjun- √ relação
to adnominal
Verbo na voz ativa √ ação
Verbo na voz passiva √ paixão
Advérbio de lugar √ lugar, posição
Advérbio de tempo √ duração
Advérbio de modo √ maneira de ser

Para o Padre Leme Lopes apud70 , poder-se-ia formular o seguinte exemplo de in-
terseção entre as categorias gramaticais e aristotélicas:
O grande quantidade adjetivo quantitativo
cavalo substância substantivo
castanho qualidade adjetivo qualitativo
do cavaleiro relação adjunto adnominal
está ação verbo ativo
arreado maneira de ser advérbio de modo
de manhã tempo advérbio de tempo
no pátio lugar advérbio de lugar
Dahlberg também faz uma releitura dessas categorias, reagrupando-as no que de-
97

nomina “super categorias”, que correspondem às categorias necessárias ao estabelecimento


da estrutura sintática para a formação de frases:
 Entidades: princípios, objetos imateriais, objetos materiais
 Propriedades: quantidades, qualidades, relações
 Atividades: operações, processos, estados
 Dimensões: tempo, espaço, posição
A relação do objeto com a categoria deve ser entendida como circunstancial,
denotando o sentido de contextualização do modelo semiótico de Eco. Um mesmo concei-
to pode pertencer a uma categoria num contexto e a outra em contexto diverso. Astério de
Campos citado por Piedade16 apresenta como exemplo deste fato o conceito /algodão/, que
pertence à categoria /Substância ou Personalidade/ no contexto da Agricultura ou em Botâ-
nica, mas pertence à categoria /Matéria/, quando o campo conceitual for a Indústria Têxtil.
Existirão, portanto, tantas espécies de categorias quanto os contextos escolhidos para rela-
cionar conceitos. Tal são os exemplos em Roget, que identificou seis categorias principais
para seu tesauro (relações abstratas, espaço, matéria, intelecto, afeições e volições); Ranga-
nathan, que estabeleceu cinco facetas para a sua classificação (personalidade, matéria, e-
nergia, espaço e tempo); Grolier (tempo, espaço e ação); Classification Research Group
(tipos de produto final, partes, materiais, propriedades, processos, operações, agentes,
espaço, tempo, forma de apresentação) Dodebei, para a Formação Profissional (processos,
recursos, grupos, características humanas, ambiente). Vickery mostra como proceder à
análise da terminologia de um assunto, partindo dos conceitos individuais para se chegar às
categorias ou facetas principais. Tomando como exemplo a Ciência do Solo, o processo
analítico se faria considerando:
TERMOS DEFINIÇÕES CATEGORIAS
Coesão Propriedade das partículas de se Propriedade
ligarem para formar compostos
Areia Grãos de 2 a 20 mm de diâmetro Partes do solo
Ponto de viscosidade Grau máximo de umidade que Medida de propriedade do solo
atinge o solo antes de deixar de
aderir ao corte
Lama Matéria orgânica parcialmente Constituinte srcinal do solo
decomposta
Mineração Separação de matéria mineral de Processo intervindo no solo
uma combinação orgânica
98

Adubação Trabalho sobre o solo para aumen- Operação sobre o solo.


tar sua produtividade

Ainda em Dahlberg, uma categorização formal dos conceitos que têm importância
na formação dos sistemas e na combinação dos mesmos conceitos pode ser a seguinte:
• objetos ex: plantas, produtos, papel

• fenômenos ex: crescimento, chuva, tráfego


• processos ex: imprimir, sintetizar
• propriedades ex: cego/cegueira, suave/suavidade
• relações ex: causalidade, necessidade
• dimensão ex: espaço, tempo, posição
Em relação a esse tipo de categorização é importante notar que existem possiilida-
des inúmeras de combinação destas categorias de conceitos. Por exemplo: objetos + fenô-
menos = crescimento de plantas; objetos + processos = impressão em papel.
Do ponto de vista de categorias universais é a linguagem que exercerá maior influ-
ência na concepção e desenvolvimento de sistemas de organização do conhecimento. A

lingüística, segundo o modelo deDahlberg, oferece as bases necessárias à “designação” de


conceitos, sendo os seguintes critérios aqueles considerados de mais significação: confor-
midade com o referente; representação das características; mínima extensão; capacidade de
derivação verbal; internacionalidade.
Finalmente, na organização de sistemas de conceitos podem ser considerados dois
processos. O primeiro, denominado hierarquização ou enumeração, tem por base a Teoria
da Divisão Lógica. O segundo, nomeado de facetação, se fundamenta na Teoria Analítica
de Conceitos. O conceito de Faceta foi definido por Ranganathan para indicar as manifes-
tações das categorias fundamentais em cada campo do conhecimento, reunindo conceitos
que têm determinada característica em comum. O seu significado, representando o produto,

pode ser igualado à Categoria, tal como as categorias aristotélicas, por exemplo. Conside-
rando-se, no entanto, o processo de derivação conceitual, o significado de Faceta pode ser
igualado ao de Característica.
99

Ranganathan, ao aplicar os princípios aristotélicos à documentação, identificou qua-


tro maneiras de desdobrar o conhecimento:

Embora as duas primeiras possam ser relacionadas ao processo de derivação concei-


tual, seja considerando-se os eixos de subordinação e coordenação, ou o relacionamento
conceitual hierárquivo e partitivo, as duas últimas - Laminação e Justaposição ou Monta-
gem flexível - se referem ao produto obtido. Isto significa uma estrutura conceitual cuja
coordenação de conceitos possa ser efetuada no momento do uso e não, antecipadamente,
quando da construção e organização dos conceitos. Assim, diz-se que as estruturas que
apresentam forte pré-coordenação conceitual são hierárquicas e enumerativas. E as estrutu-
ras que permitem coordenar conceitos no momento do uso são pós-cordenadas, facetadas
ou analítico sintéticas.
Se tomarmos o exemplo de uma estrutura hierárquica para a organização dos con-
ceitos no campo da Educação, poderemos identificar as facetas principais pelas quais o
tema foi analisado e visualizar, no gráfico, as limitações das estruturas hierárquicas, princi-
100

palmente quanto à enumeração ou repetição de conceitos, propriedade esta necessária à


adequação da análise quanto à completude da enumeração conceitual.

No gráfico, verificamos que no primeiro nível hierárquico, a característica que ser-


viu de base para a divisão lógica do conceito /Educação/ foi nível de ensino. Na segunda
derivação foi usada a característica método de ensino e, no terceiro nível hierárquico, disci-
plina. Tais características são, portanto, os pontos de vista pelos quais o assunto /Educação/
pode ser analisado, transformando-se nas facetas principais de tal análise, como abaixo:

Faceta 1
NÍVEL DE ENSINO
Pré-escolar
1º Grau
2º Grau
3º Grau
Faceta 2
MÉTODO DE ENSINO

Instrução Programada
Audiovisual
Faceta 3
DISCIPLINAS
Português
Inglês
101

A combinação dos conceitos em uma estrutura facetada é feita no momento da clas-


sificação ou indexação, não sendo necessário, como no caso da estrutura hierárquica, que
haja um local pré-determinado para todas as combinações conceituais. Obtêm-se, assim,
não só, uma economia de símbolos, como a liberdade de coordenar conceitos se, e quando
necessário. Podemos confirmar que Faceta pode ser igualada à Categoria como também à
Característica. O processo de organização de conceitos usando a facetação nos indica que
o produto final é mais sintético, uma vez que os conceitos não precisam ser repetidos para
a correta estruturação do esquema classificatório. Porquanto se diz que, a partir de um con-
ceito geral só se pode enumerar as espécies, enquanto que a partir de um conceito individu-
al pode-se inferir conceitos gerais, descobrindo-se as categorias ou facetas gerais que me-
lhor se adeqüem à análise do tema.

Organização formal do tesauro


Independente do uso do software17 que vai gerenciar os processos de alfabetação,
correspondências hierárquicas e inversões ou remissivas, o construtor de linguagens docu-
mentárias não pode fugir à tarefa de fichar a terminologia, pois é com base na análise indi-
vidual de cada termo escolhido para representar um conceito que a mente humana vai con-
seguir traçar as sua relações. A capacidade de estabelecer aproximações e analogias entre
os conceitos é própria do raciocínio humano, cabendo à máquina, única e exclusivamente
(até que os modelos conceituais artificias estejam plenamente desenvolvidos), receber as
ordens sobre tais relacionamentos, os quais devem estar concluídos antes do início do uso
do software.
A primeira operação desta etapa é, portanto, a alfabetação dos termos levantados.
Neste momento, são identificados aspectos tais como:
a) termos iguais em conteúdo, com grafias diferentes;
b) freqüência de ocorrência de termos;

c) termos no singular e no plural;


d) termos em línguas diferentes;
e) termos especializados;
f) termos genéricos ou com multi-valências.
102

Esse primeiro contato com o universo terminológico permite ao especialista, neste

momento, tomar algumas decisões antes de prosseguir para a etapa seguinte, que é a da
definição conceitual. No que diz respeito a grafias distintas ou aos termos em duas ou mais
línguas, um indicador de decisão pode ser o da freqüência de aparecimento, já ficando con-
signada uma relação de identidade entre eles. Quanto à forma gramatical de desinência
numérica, pode-se considerar o seguinte:
a) deve haver consistência quanto a plural e singular;
b) nem sempre pode-se afirmar que o plural está para o gênero e o singular
para a espécie.
Na verdade, estamos construindo uma rede conceitual e não uma rede de palavras.
Assim, se a representação do conceito, na sua forma simbólica, for mais geral quando a

palavra estiver no singular, tal forma deve ser a escolhida. Por exemplo: Administração (+
geral) do que Administrações. Pode-se atribuir a esta figura o correspondente à gramática,
denominada concordância mental ou silepse. Uma outra possibilidade é a de considerar
para os substantivos, tal como na língua inglesa, a propriedade de serem numericamente
contáveis ou não (much e many), ex: dinheiro; casas. Os demais aspectos ou problemas
encontrados nesta etapa serão resolvidos com o estabelecimento das definições conceituais.
103

A única possibilidade de relacionar conceitos é quando conhecemos seu significado.


Para Gomes18, a definição do termo é importante na medida em ela fornece as característi-
cas do conceito, o que vai permitir seu agrupamento e a indicação das possíveis relações
com outros conceitos. Para Dahlberg19, as definições são pressupostos indispensáveis na
argumentação e nas comunicações verbais, pois é pelo domínio perfeito das estruturas dos
conceitos que será possível obter também perfeita equivalência verbal. Embora tenhamos
claro que a mesma palavra pode ter vários sentidos, nosso objetivo é encontrar uma defini-
ção adequada não à palavra, mas ao conceito que queremos relacionar. Desse modo, o pro-
cesso de definição conceitual passa por duas etapas. A primeira diz respeito ao entendi-
mento do termo, no sentido de isolar as características essenciais para poder efetuar a com-
paração com outras características de outros termos. Podemos chamar esta operação de
compreensão conceitual. A segunda, após organizarmos o termo dentro de uma rede de
relacionamento com outros termos, se refere à definição propriamente dita, ou seja, efetuar
uma equação de sentido, indicar os limites semânticos do termo para a abordagem deseja-
da. Por isso Gomes diz que “na prática, a definição não se dará no início da estruturação,
mas no final, quando então se domina o conceito e se sabe exatamente qual é o significado
do termo com o qual se está trabalhando e qual a abrangência do conceito útil no tesauro.”
Mas, se não é possível relacionar conceitos sem que se domine seu significado, ficaríamos
num círculo vicioso. A solução pode ser o uso prioritário da definição real na primeira fase
e da definição nominal na segunda. Dahlberg explica a diferença: definição nominal tem
por fim a fixação do sentido da palavra, enquanto que definição real procura delimitar a
intensão de determinado conceito, distinguindo-o de outro com idênticas características.
Por exemplo:
Discografia = df. (nominal) catalogação de discos
df. (real) descrição metódica dos discos numa coleção

Ainda em Dahlberg, vale ressaltar que com a ajuda da distinção aristotélica entre
gênero próximo e diferença específica é possível estruturar as formas simples e complexas
das definições reais. Em todos os casos encontramos no definiens um conceito mais amplo
do que está contido no definiendum, seguido de uma característica chamada diferença es-
pecífica ou característica especificadora. Por exemplo: homem = df. mamífero bípede.
104

As definições acompanham também os tipos de relacionamento entre conceitos


apresentados por Dahlberg. Assim, temos por exemplo:
a) definição genérica
Bolo df = É um produto de confeitaria
b) definição partitiva
Bolo df = É um produto composto de farinha, manteiga, ovos,
leite, açúcar e fermento.
c) definição de oposição
Bolo df = É um alimento que não é pão.
d) definição funcional ou operacional
Bolo df = É um alimento que se confecciona batendo o açúcar com a
manteiga, adicionando as gemas, o leite e a farinha e etc.
À exceção da definição de oposição, que não é muito usual, a melhor definição de
um conceito ou a mais completa contemplará os tipos a), b) e d), ou seja:
Definição genérica + partitiva + funcional
Bolo df = É um produto de confeitaria, composto de farinha, manteiga, o-
vos, leite, açúcar e fermento, que se confecciona batendo o açúcar
com a manteiga, adicionando as gemas, o leite e a farinha e etc.

Deve-se ressaltar que não há necessidade de definir todos os termos levantados. Só


os conceitos gerais propriamente necessitam de definições. Só eles necessitam ser bem
distinguidos dos demais conceitos, a fim de que apareça, com clareza, a quais objetos se
referem. Gomes20 nomeia os conceitos gerais de um determinado domínio de conceitos
105

básicos e indica que, estatisticamente, esses não ultrapassam dez por cento do referido do-
mínio. Para o campo da Engenharia, por exemplo, encontramos os seguintes conceitos bá-
sicos: Edificação, Estrutura, Viga. Como conceitos derivados: Edificação militar, Edifica-
ção industrial, Supraestrutura, Viga hiperestática. Assim, só os primeiros precisam ser de-
finidos, uma vez que, do ponto de vista pragmático, as deduções subseqüentes são de fácil
apreensão, até porque Militar, Industrial, Supra etc. possuem multivalências, sendo mais
fácil apreender a combinação. Não resta dúvida que, se não soubermos o sentido de Mili-
tar, por exemplo, teremos que, forçosamente, considerar este termo combinatório como um
conceito a ser compreendido. As definições devem ser anotadas na ficha terminológica, a
fim de que, a qualquer momento, possamos recuperá-las para decidir qual o mais adequado
relacionamento entre os conceitos.
A organização dos conceitos é conduzida por processo de indução/dedução ou rela-
ção. À medida que as associações vão se constituindo, novos conceitos podem surgir como
complemento à organização de cada faceta. Assim, somente ao final do processo, as facetas
serão conhecidas, embora se tenha, previamente, uma idéia genérica das características
essenciais dos conceitos básicos, uma vez que estes já sofreram o processo de definição
conceitual.
106

Efetuado o relacionamento entre os conceitos, de forma indutiva/dedutiva ou rela-


cional, como preferem Dahlberg21 e Motta22, elas vão aparecer no tesauro com a seguinte
simbologia:
Para as relações de equivalência:
Archive

USE ARQUIVO (tradução)


Lambreta
USE MOTONETAS (sinonímia)
Universidade do Rio de Janeiro
USE UNI-RIO (abreviaturas)
107

Aprendizagem
USE ENSINO APRENDIZAGEM (coordenação)

Para as relações hierárquicas, de gênero/espécie ou abstratas


ARQUIVO
TG Organização da informação
TE Arquivos correntes
Arquivos intermediários
Arquivos permanentes
Onde: TG = Termo genérico; TE = Termo específico

Para as relações partitivas


ARQUIVO
TEP Gavetas
Pastas
Guias
Onde: TEP = termo específico partitivo.

Para as relações funcionais, associativas ou relacionadas


ARQUIVO
TR Manuscritos
Tabela de temporalidade
Onde TR = Termo relacionado.

Para o uso de qualificadores


TÊNIS (calçado)

TÊNIS (esporte)

AIDS ( Medicina experimental)


AIDS (Saúde pública)

Para nota explicativa, de escopo ou de aplicação


108

Como observação, é importante ressaltar que as notas explicativas referem-se à con-


textualização do conceito. Elas indicam os pontos de vista pelos quais o conceito foi hie-
rarquizado. Podem significar ampliação ou redução do campo conceitual e são necessárias
para orientar o indexador na melhor correspondência entre conceito e descritor.

ABSORÇÃO
NE Fenômeno. Inclui a absorção de radiação eletromagnética.
ENSINO
NE Processo de ensino aprendizagem.

Os softwares para construção de tesauros executam a tarefa de desdobramento das


fichas, sendo necessário apenas que se tenha, em gráfico, a estruturação e o relacionamento
dos conceitos. Os modelos mais comuns de apresentação planigráfica são do tipo diagrama
em árvore e diagrama em chave, ou a combinação destes.

De acordo com Gomes, é recomendável que os termos dos tesauros sejam apresen-
tados em ordem sistemática para:
109

a) permitir que o usuário encontre o termo que melhor represente o conceito que ele
deseja exprimir, sem que saiba, no início da busca, qual o mais adequado;
b) facilitar a compreensão da lógica do relacionamento e permitir modular as ques-
tões no nível da compreensão conceitual.
c) facilitar a manutenção do tesauro, uma vez que as características que levaram ao
relacionamento conceitual estão explicitadas.
Por fim, do ponto de vista do acompanhamento terminológico, é necessário que se
tenha um registro de cada termo representativo do conceito, com suas relações, faceta, data
de ingresso e responsável23. O exemplo abaixo é uma das opções:
• notação
termo = Documentação

• informação semântica
definição = conjunto de conhecimentos e técnicas que têm por fim a pesquisa, a re-
união, a descrição e a utilização de documentos de qualquer natureza.

• informação estrutural
tipo de natureza dos termos relacionados = difusão, processamento de dados
interpretação dessas relações =parte do processo de ... método mais usado para
...
faceta = Processos informacionais

• informação operativa
frequência de uso = 10
data de inclusão = 5/10/84
data de exclusão = 3/5/96

A construção de tesauro não é tarefa fácil. Cada linguagem construída é única, es-
pecial para um domínio do conhecimento e, portanto, passível de ser modificada na mesma
medida em que as línguas naturais evoluem. Novos conceitos aparecerão, representados
por novos símbolos. Velhos conceitos em desuso podem ser retomados. Os usuários do
sistema de informação para o qual a linguagem foi construída podem ter novas necessida-
110

des de informação mais ou menos disciplinares ou interdisciplinares. Não importa se o te-


sauro vai ser gerado tradicional ou automaticamente, pois com certeza, todas estas hipóte-
ses vão estar refletidas na literatura, que é o ponto de partida para a construção de novas
linguagens. A análise do domínio para o qual será desenhado o tesauro, a identificação
dos conceitos necessários à sua compreensão e o processo de relacionamento conceitual,
etapas necessárias à construção de qualquer linguagem artificial, são processos que, tanto
dedutiva quanto indutivamente, vão criar categorias que possibilitarão a desconstrução do
documento e sua reconstrução simbólica, sintética e representacional, em uma linguagem
documentária capaz de fazer coincidir as necessidades de informação do usuário com os
registros disponíveis na memória documentária.

1
HOLANDA, Aurélio Buarque de. Novo dicionário da língua portuguesa . Rio de Janeiro: Nova Fronteira,
1975. p. 358
2
ABBAGNAMO, Nicola. Dicionário de filosofia. São Paulo : Mestre Jou, 1970. p. 153-154
3 WANDERLEY, M. A. op. cit., p. 193.
4
GOMES, H. E. op. cit., p. 19
5
ECO, Umberto. Semiótica e filosofia da linguagem. op. cit. p. 180.
6
Cf. PIEDADE, Maria Antonieta Requião. Introdução à teoria da classificação . Rio de Janeiro :
Interciência, 1983. p. 17

7
JOLIVET, Regis. op. cit.
8
WANDERLEY, M. A. Limitações dos sistemas tradicionais e inovações neles introduzidos. Rio de Janeiro
: Uni-Rio, 19. Notas de aula

9
DAHLBERG, Ingetraut. Teoria do conceito. Ci. Inf. Rio de Janeiro, v. 7, n. 2, p.101-107, 1978.
10
DAHLBERG, Ingetraut. Knowledge organization and terminology : philosophical and linguistic bases.
International classification, v. 19, n. 2 , p. 65-71, 1992.
11
GOMES, op. cit., p. 20
12
GOMES, op. cit., p. 20-23
13
PINTO, Maria Cristina. op. cit.
14
Motta, Dilza Fonseca da. op. cit.
111

15
Piedade, M. A. R. op. cit. p. 20
16
PIEDADE, M. A . R. op. cit p. 21-22
17
TECER: programa de elaboração de tesauros em microcomputador. Brasília : CNPq/IBICT, 1989.
18
Gomes, H. E. op. cit., p. 25.
19
DAHLBERG, I. Teoria do conceito. Ci. Inf., Rio de Janeiro, v. 7, n. 2, p. 101-107, 1978.
20
GOMES, H, E. op. cit., p.
21
DAHLBERG, I. Structure and construction of classification systems. Rio de Janeiro, 1975. Notas de aula.
22
MOTTA, Dilza Fonseca da. Método relacional como nova abordagem para a construção de tesauros . Rio
de Janeiro : SENAI, 1987.
23
Existem estudos para o desenvolvimento dos chamados tesauros dinâmicos, que são construídos e
atualizados automaticamente à medida em que as coleções para as quais servem como instrumento de ajuda
na recuperação, incorporam e retiram documentos. Cf. http://dewey.yonsel.ac.kr/memexlee/doc/thes_ads.htm
Capturado em 09/10/2001.
6 A Propósito

Este livro começou a ser escrito em 1983, ano em que ingressei na Universidade do
Rio de Janeiro (Unirio). O tema Tesauro já havia sido objeto de minha dissertação de mes-
trado, defendida em 1979 no Instituto Brasileiro de Informação em Ciência e Tecnologia

(IBICT), antigo Instituto Brasileiro de Bibliografia e Documentação (IBBD), sob a orienta-


ção de Frederic Wilfrid Lancaster. Ao aceitar o desafio de assumir a disciplina Classifica-
ções especialidades, ministrada por Manoel Adolpho Wanderley, que se aposentava no
ensino universitário, iniciei um percurso de estudos e reflexões sobre os fundamentos teó-
ricos do campo documental. Os resultados, entre outros, se concretizaram na criação das
disciplinas Organização de Conceitos em Linguagens Documentárias e Análise da Infor-
mação, oferecidas aos Cursos de Arquivologia, Biblioteconomia e Museologia da Unirio, e
na minha tese de doutoramento, defendida em 1997, na Escola de Comunicação da Univer-
sidade Federal do Rio de Janeiro (UFRJ), intitulada O sentido e o significado de documen-
to para a memória social.

Os roteiros de aulas, aliados à doação da biblioteca particular do Professor Wander-


ley para a Unirio, representam as fontes principais das discussões apresentadas neste traba-
lho. Com efeito, é importante esclarecer que não houve a intenção de construir o texto com
a característica de um manual de orientação para a construção de tesauros, pois já dispomos
de excelentes trabalhos, tais como os de Hagar Espanha Gomes, além de normas nacionais
e internacionais. A proposta deste livro foi a de organizar os conceitos do campo docu-
mental, isto é, traçar um roteiro, construir uma moldura para a rede de relações interdisci-
plinares, partindo do pressuposto que o tesauro é o instrumento que melhor espelha a co-
municação da informação, e que o especialista, principalmente o bibliotecário, é o principal
ator na intermediação entre a produção e a circulação da informação.
A defesa das linguagens documentárias, sua construção e crítica, no exemplo dos
tesauros, foi desencadeada pela discussão teórica, considerando-se a importância de ressal-
tar mais a sua essência e seus modos de ser, do que os exemplos de sua utilização, pois aos
últimos, a dinâmica da memória eletrônica aponta para o caráter volátil, repetitivo e apócri-
fo dos registros. Contudo, a exemplo da experiência didática, os conteúdos foram desen-
volvidos em um encadeamento que permitiu identificar as contribuições da Ciência da In-
113

formação, principalmente no entendimento do modelo sistêmico de transferência da infor-


mação e o papel das linguagens documentárias nesse contexto. As teorias da Comunicação
foram fundamentais para a compreensão dos estágios de representação do conhecimento,
assim como para o desenvolvimento de um quadro teórico-metodológico de representação
simbólica do conhecimento, a qual deve ser baseada nos sistemas de signos da linguagem.
Nas relações entre língua natural e linguagem documentária verificou-se a correspondência
entre os domínios da linguagem comum, da linguagem artificial e do pensamento, respecti-
vamente da alçada da Lingüística, da Lógica, da Epistemologia e da Psicologia. A Filosofia
permeou toda a discussão sobre a organização de conceitos, sendo a visão aristotélica do
Ser o ponto referencial de todas as abordagens, tornando-se até mesmo difícil a classifica-
ção dos discursos em lógicos e empíricos.
Sem dúvida, não é possível o exercício de comportamento crítico isento do domínio
cognitivo. Ranganathan confirmaria essa afirmação, pois foi o primeiro bibliotecário a a-
presentar soluções para às discussões emergentes sobre a relatividade na análise dos fenô-
menos físicos e sociais, desencadeando a produção teórica no campo da representação do
conhecimento, e tendo em Dahlberg sua melhor discípula, visto que ela se colocou na van-
guarda da pesquisa em teoria da classificação, com uma produção científica disseminada
internacionalmente. Estes exemplos recuperam para a Biblioteconomia um campo filosófi-
co de discussão esquecido durante anos de abordagens tecnicistas. No seu bojo, aparecem
não só as questões fundamentais ligadas à organização de conceitos em linguagens docu-
mentárias, mas aos demais aspectos da representação do conhecimento.
A certeza de que o tema é complexo, não se esgotando com a discussão aqui apre-
sentada, oferece tantas outras possibilidades de abordar o problema da organização do co-
nhecimento, quanto de considerar que o tesauro é, neste momento, o modelo necessário de
linguagem de representação da memória documentária.
REFERÊNCIAS BIBLIOGRÁFICAS

ABBAGNAMO, Nicola. Dicionário de filosofia. São Paulo: Mestre Jou, 1970.

BEGHTOL, Claire. Domain analysis, literary warrant and consensus: the case of fiction
studies. Journal of the American Society for Information Science. v. 46, n. 1, p. 30-44,
1995.

BRADFORD, S. C. The documentary chaos. In: ____. Documentation. London: Crosby


Lockwood & Son, 1953. cap. IX.

BRITO, Marcílio de. Sistemas de informação em linguagem natural: em busca de uma in-
dexação automática. Ci. Inf., Brasília, v. 21, n. 3, p. 223-232, set./dez., 1992.

BURT, P. V. , KINNUCAN, M. T. Information models and modeling techniques for in-


formation systems. Annual Review of Information Sciences and Technology. Holanda: El-
sevier, v. 25

CHAI KIM, SOON KIM. Consensus vs frequency: an empirical investigation of theories


for identifying descriptors in designing retrieval thesauri. Information Processing Mana-
gement, London, v. 13, n. 4, p. 253-258, 1977.

CINTRA, Ana Maria Marques et al. Para entender as linguagens documentárias. São
Paulo : Polis : APB, 1994.
CINTRA, Ana Maria Marques. Estratégias de leitura em documentação. In: SMIT, Joa-
hanna W. (coord.) Análise documentária: a análise da síntese. Brasília: SCT-
PR/CNPq/IBICT, 1898. p. 30-38.

CLARKE, D. Models in archaeology. London : Methuen, 1972.

COMMITTEE ON SCIENTIFIC AND TECHNICAL INFORMATION. Guidelines for


the development of information retrieval thesauri. Washington : Government Printing Of-
fice, 1967.

COULON, Daniel, KAYSER, Daniel. Informática e linguagem natural: uma visão geral
dos métodos de interpretação de textos escritos. Brasília: SCT-PR/CNPq/IBICT, 1992.

COYAUD, Maurice. Analyse et recherche documentaire. In: __________. Linguistic et


documentation: les articulations logiques du discours. Paris: Larousse, 1972. p130

CUNHA, Isabel M. R. Ferin. Análise documentária : parâmetros teóricos. In: SMIT, Joa-
hanna W. (coord.) Análise documentária: a análise da síntese. São Paulo: USP, 1986.

CUNHA, Maria Isabel R. Ferin. Do mito à análise documentária. São Paulo: EDUSP,
1990. (Tese de doutorado)
115

CUNHA, Maria Isabel R. Ferin. (Coord.) Análise documentária: considerações teóricas e


experimentações. São Paulo: FEBAP, 1989.

DAHLBERG, Ingetraut. Knowledge organization and terminology: philosophical and lin-


guistic bases. International classification, v. 19, n. 2 , p. 65-71, 1992.

DAHLBERG, Ingetraut. Structure and construction of classification systems. Rio de Ja-


neiro, 1975. (Notas de aula).

DAHLBERG, Ingetraut. Teoria do conceito. Ci. Inf. Rio de Janeiro, v. 7, n. 2, p.101-107,


1978.

DEBONS, A. Information science: search for identity. Dekker, 1974.

DELEUZE, G., GUATTARI, F. Rhizome. Paris: Minuit, 1976.

DODEBEI, V. L. D. L. M., MENDONÇA DE SOUZA, Alfredo.Ciência da Informação:


formação e interdisciplinaridade. Rio de Janeiro: IBICT/CNPQ/ ECO/USP, 1992.

DODEBEI, V. L. D. L. M. Construção de thesauri: experimento empírico para a coleta


de termos em formação profissional. Rio de Janeiro, 1979. (Dissertação apresentada ao
Instituto Brasileiro de Informação em Ciência e Tecnologia / Universidade Federal do Rio
de Janeiro para a obtenção do grau de mestre em Ciência da Informação).

DODEBEI, V. L. D. L. M. Espaços mítico e imagético da memória social. In: Memória e


espaço. Rio de Janeiro: 7 Letras, 2000. p. 63-71.

DOYLE SILVA, Ernani, FERREIRA, Lélio. Dicionário inverso. Rio de Janeiro: Abril,
1956. fasc. 1.

DYM, E. D. A new approach to the development of a technical thesaurus. Proceedings


of the American Documentation Institute, Washington, D.C. n. 4, p. 126 -131, 1967.

ECO, Umberto. A estrutura ausente: introducão à pesquisa semiológica. São Paulo: Pers-
pectiva, 1991.

ECO, Umberto. Semiótica e filosofia da linguagem. São Paulo: Ática, 1991.

10, 20, 40. A. C. A abordagem temática da informação. São Paulo : Polígono, 1973. p.
FOSKETT,

FOSKETT, D. .J. A study of the role of categories in a thesaurus for education documen-
tation. Strasbourg : Council of Europe, 1972.

FOUCAULT, Michel. A palavra e as coisas: uma arqueologia das Ciências Humanas.


São Paulo: Martins Fontes, 1994.
116

GOMES, Hagar Espanha (org.) Manual de elaboração de tesauros monolíngües. Brasí-


lia: PNBU, 1990.

GOMEZ, Maria Nelida Gonçalez. A representação do conhecimento e o conhecimento da


representação: algumas questões epistemológicas. Ci. Inf., Brasilia, v. 22, n. 3 p. 217-222,
set./dez. 1993.

GOODMAN, F. The role and function of the thesaurus in education. In: THESAURUS
of ERIC descriptors. New York : CCM Information Corporation, 1972.

GORSKY, D. P. Lengaje y conocimiento. In:Pensamiento y lenguaje. Mexico : Grijalbo,


1966.

GROLIER, Eric de. Étude sur les catégories générales applicables aux classifications et
codifications documentaires. Paris: UNESCO, 1962. p. 262.

HAGGET, P., Chorley, R.J. Modelos, paradigmas e a nova Geografia. In: ________.
Modelos sócio-econômicos en Geografia. Rio de Janeiro: Livros Técnicos e Científicos /
USP, 1975.

HJORLAND, Birger, ALBRECHTSEN, Hanne. Toward a new-horizon inInformation


Science: Domain-Analysis. Journal of the American Society for Information Science. v.
46, n. 6, p. 400-425, 1995.

HOLANDA, Aurélio B. Novo dicionário da língua portuguesa. Rio de Janeiro: Nova


Fronteira, 1975.

HULME, E.W. Principals of book classification. Association of Assistant Librarians,


1950.

JARDIM, José Maria. Cartografia de uma ordem imaginária: uma análise do sistema
nacional de arquivos. (Dissertação de Mestrado em Ciência da Informação. Escola de
Comunicação, Universidade Federal do Rio de Janeiro, 1994)

JOLIVET, Régis. Curso de filosofia. Rio de Janeiro : Agir, 1965.

KOBASHI, Nayr Yumiko. Análise documentária e representação da informação . IN-


FORMARE – Cad. Prog.Pós-Grad. Ci.Inf., Rio de Janeiro, v.2, n.2 p.
5-27, jul./dez. 1996.

1993. p. 15-17. F. W. Indexção e resumos: teoria e prática. Brasília: Briquet de Lemos,


LANCASTER,

LANCASTER, F. W. Information retrieval systems: characteristics, testing and evaluati-


on. 2. ed. New York: Wiley, 1979.

LANCASTER, F. W. Vocabulary control for information retrieval. Washington : Infor-


mation Resources Press, 1972.
117

LARA, Marilda Lopes Ginez de. Algumas contribuições da semiolologia e da semiótica


para a análise das linguagens documentárias.Ci. Inf. , Brasilia, v. 22, n. 3, p. 223-226,
set./dez. 1993.
LATOUR, Bruno. Redes que a razão desconhece: laboratórios, bibliotecas, coleções. In:
O poder das bibliotecas: a memória dos livros no Ocidente. Rio de Janeiro: Editora U-
FRJ, 2000. p. 29

LESKA, B. M. Theoretical and methodological problems of therminology In: PROCEE-


DINGS of inter international symposium, Nov. 27-30, 1979, Warsaw

LYYTINEN, K. Two views of information modelling. Information & Management, v.


12, n. 1, jan. 1987.

MAGRO, Cristina. Representação, Virtus Dormitiva e linguagem. In: OLIVEIRA. P. ;


BENN-IBLER, V. e MENDES, E. (orgs)Revisitações: Edição Comemorativa dos 30 anos
da Faculdade de Letras. Belo Horizonte: Editora FALE/UFMG. 1999. p. 29 – 44.

MARCONDES, C. H. , SAYÃO, L. F. Teoria Geral dos Sistemas: Sistemas de Informa-


ção Rio de Janeiro: UFRJ/ECO, 1992. (Seminário apresentado à disciplina “Linguagem e
Ciência da Informação V”, Curso de Doutorado em Ciência da Informação)

MARCONDES, Carlos Henrique. Representação e economia da informação. Ci. Inf., Bra-


silia, v. 30, n. 1, p. 61-70, jan./abr. 2001.

Mc GARRY, K. J. Da documentação à informação : um contexto em evolução. Lisboa :


Editorial Reserva, 1984.

MENDONÇA DE SOUZA, Alfredo, DODEBEI, Vera Lucia. Modelos e sistemas em Ci-


ência da Informação. Rio de Janeiro, UFRJ/ECO, 1992. (Terceiro Seminário apresentado
à diciplina “Linguagem e Ciência da Informação III”).

MERLEAU PONTY, Maurice. O visível e o invisível. São Paulo: Perspectiva, 1992. p22

MONTGOMERY, Christine A. Automated language processing. Annual Review of In-


formation Science and Technology. v. 4, p.145-174, 1969.

MOTTA, Dilza Fonseca da. Método relacional como nova abordagem para a construção
de tesauros. Rio de Janeiro : SENAI, 1987.

NOCETTI, Milton A.,


rias: traços inerentes FIGUEIREDO,
e ocorrências R. C. Línguas
de interação. naturais Brasília,
R. Bibliotecon. e linguagens
v. 6, documentá-
n. 1. p. 23-
37.

PICKFORD, A. G. A. FAIR (Fast Access Information Retieval) Project. Aslib Proce-


dings, London. v. 19, n. 3, p. 79-95, 1976.

PIEDADE, Maria Antonieta Requião. Introdução à teoria da classificação. Rio de Janei-


ro : Interciência, 1983. p. 17
118

PINTO, Maria Cristina Mello Ferreira. Análise e representação de assuntos em sistemas


de recuperação da informação; linguagens de indexação. R.. Esc. Bibliotecon., UFMG,
Belo Horizonte, v. 14, n. 2 p. 169-186, set. 1985.

RANGANATHAN, S. R. Philosophy of library classification. Copenhagen : Ejnar


Munksgaard, 1951.

RANGANATHAN, S. R. Prolegomena to library classification. Bombaim : Asia Publi-


shin House, 1967.
RAYWARD, W. Boyd. Visions of Xanadu : Paul Otlet (1868-1944) and hypertext.
Journal of the American Society for Information Science, v. 45, n. 4, p. 235-250, 1994.

RICHAUDEAU, F. Langage et action. In: LES THÉORIES de l’action


. Paris : Hachette,
1972.

SAÀDANI, Lalthoum; BERTRAND-GASTALDY, Suzanne. La représentation dans In-


ternet des comnaissances dún domaine. Documentation et bibliothèques, jan./mars, p. 27
– 42, 2000.

SAUSSURE, Ferdinand de. Curso de Lingüística geral. São Paulo: Cultrix, 1974. p.
136-139.

SHANONN, C. E., WEAVER, W. The mathematical theory of communication. Urbana:


Univesity of Illinois Press, 1949.

SHERA, J. H., EGAN, M. E. Catálogo sistemático: princípios básicos e utilização. Bra-


sília : Editora Universidade de Brasília , 1969.

SMIT, Johanna, W. A análise da imagem: um primeiro plano. In: Análise documentária:


considerações teóricas e experimentações. São Paulo: FEBAP, 1989. p. 102-113

SOERGEL, D. Indexing languages and thesauri : construction and maintenance. Los An-
geles : Wiley - Becker & Hayes, 1974.

SPIRKIN, A. G. Origen del lenguaje y su papel en la formación del pensamiento. In: Les
théories de l’action. Paris, Hachette, 1972.

TECER: programa
CNPq/IBICT, 1989. de elaboração de tesauros em microcomputador. Brasília :

UNESCO. Guia para la creación y desenvolvimiento de thesaurus multilingues, técnicos y


científicos, destinados a la recuperación de dados. CINTERFOR Documentation, Monte-
video, v. 32, p. 13-17, 1973.

VICKERY, B. C. Knowledge representation : a brief review. Journal of Documentation,


42, n. 3, p. 145-159, Sept. 1982.
119

VICKERY, B. C. Thesaurus - a new world in documentation. Journal of Documentation,


v. 16, n. 4, p. 181-189, Dec. 1960.

VIRILIO, Paul. A máquina de visão. Rio de Janeiro : José Olympio, 1994.

WANDERLEY, M. A. Limitações dos sistemas tradicionais e inovações neles introduzi-


dos. Rio de Janeiro: UNIRIO, 1980. (Notas de aula)

WANDERLEY, M.A . Linguagem documentária: acesso à informação.Ci. Inf., Rio de


Janeiro, v. 2, n. 2. p. 175-217, 1973.

WANDERLEY, Manoel Adolfo. Organização da memória documentária: a matriz do-


cumentária. Rio de Janeiro: UNIRIO/CCH, 1980. (Notas de Aula)

Potrebbero piacerti anche