Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Keywords
O surgimento da Internet a partir dos anos 90 vem mu- – a informação é disponibilizada em diferentes idiomas,
dando de maneira radical o papel das bibliotecas no ciclo o que agrava o problema do controle do vocabulário a ser
intermediação e acesso ao documento. As possibilidades usado na recuperação;
abertas pela Internet com seus mecanismos de publica-
ção direta na rede tornam o acesso a um documento digi- – os mecanismos de busca gerais indexam a Internet
tal uma mera questão de conhecer sua URL. No entanto, periodicamente, de forma automática, cegamente, sem
esta facilidade de acesso tem como contrapartida a gran- compreender o tema de uma página, simplesmente
de dificuldade de encontrar informação relevante, as ati- extraindo palavras do texto HTML da página e armaze-
vidades de information discovery. Encontrar a informação nando estas palavras isoladas junto ao endereço da pági-
relevante é fundamental para que a mesma possa ser uti- na, em uma base de dados para consulta. Além disso, a
lizada. O uso dos mecanismos de busca gerais é uma solu- indexação é feita por páginas HTML isoladas, não consi-
ção parcial para o problema. Sneiderman (1997), discu- derando que diversas páginas estão inter-relacionadas,
tindo a eficácia dos mecanismos de busca de uso geral formando um site;
disponíveis na Internet, diz que:
– os programas-robôs dos mecanismos de busca só “en-
“Embora mecanismos de busca como as Infoseek, AltaVista, xergam” páginas HTML estáticas quando fazem sua roti-
Lycos, WebCrawler e Open Text sejam largamente usados, na de indexação, deixando de considerar grande quanti-
existe um consenso público e geral e entre profissionais acerca dade de informações sob a forma de registros contidos
das grandes dificuldades em se buscar informações”* em bases de dados disponíveis na Internet – a chamada
deep web – (Bergman, 2001), que fica assim “invisível”.
Um relatório do NEC Research Institute publicado pelo Estes registros são acessados somente por meio das
boletim Edupage, em português, datado de 3 de abril de interfaces destas bases de dados, que pressupõem uma
1998, relata que, na ocasião, os melhores mecanismos de interação entre um usuário humano e a base de dados
busca cobriam não mais de 30% de todas as páginas Web. e, portanto, ficam inacessíveis aos programas-robôs.
Esta afirmação reforça a dimensão do problema localiza- Segundo Bergman, a surface web é estimada em cerca de
ção/identificação colocado pela Internet, devido princi- 2,5 bilhões de páginas, enquanto a deep web seria cerca de
palmente ao seguinte fator: O estudo mais recente de 500 vezes maior;
Bergman (2001) sobre a “Deep Web”X “Surface Web”
enfatiza a gravidade da questão. – tem sido extremamente difícil estabelecer filtros de
qualidade para as informações encontradas na Internet.
– grande quantidade de informações e seu número cres-
ce de forma acelerada; acentua-se a chamada “explosão O surgimento da Internet vem tendo um impacto signi-
informacional”, existem bilhões de páginas; publica-se ficativo também nas formas de comunicação científica
de tudo, sobre tudo, de forma caótica, na Internet; e, conseqüentemente, nos sistemas de informação em
C&T. Diferentes processos sociais, econômicos e
– a Internet não é como uma biblioteca: não existe or- tecnológicos convergem para configurar a situação atual
dem, a informação é disponibilizada de maneira caótica; das formas de comunicação científica. Desde o
surgimento do primeiro arquivo eletrônico de preprints,
– a informação disponibilizada é sobre uma infinidade ou eprints, o ArXiv, no Los Alamos National Laboratory,
de temas, sob os mais diferentes enfoques; isto é, um criado em 1991 pelo físico Paul Ginsparg (Ginsparg,
problema adicional para sua recuperação; não é à toa que 1996), que a própria comunidade científica internacio-
os profissionais de informação, principalmente aqueles nal oferece uma alternativa prática para a publicação de
que trabalham com informação especializada para ciên- seus trabalhos e sua disponibilização gratuita como al-
cia e tecnologia, desenvolveram técnicas como vocabu- ternativa aos periódicos científicos controlados pelos
lários controlados e linguagens artificiais, técnicas de grandes editores internacionais. Este debate envolven-
indexação pós-coordenada, conectivos booleanos para do pesquisadores e grande editores vem sendo coberto
coordenar conceitos temáticos simples, formando con- pela revista Nature, no seu site http://www.nature.com/
ceitos temáticos complexos etc.; nature/debates/e-access/.
chamados open archives. Este movimento vem crescen- tífica que integrem em um ciclo a produção de conhe-
do desde então e como resultado deste debate surgem cimento, o registro dos resultados, a coleta e estocagem
iniciativas como a NCSTRL – Networked Computer destes registros, a disseminação dos resultados e o
Science Technical Report Library (http://www.ncstrl.org) reuso, tanto em atividades produtivas quanto como
–, a NDLTD – Networked Digital Library of Theses and fonte para gerar novos conhecimentos. Até muito
Dissertations (http://www.ndltd.org) – e mais recen- recentemente, o periódico científico tradicional era o
temente o PUBMED Central (http://www. veículo por excelência para a comunicação científica,
pubmedcentral.nih.gov/) – Public Library of Science mas estamos no meio de uma profunda mudança desta
(http://www.publiclibraryofscience.org/) – e situação (Day, 1999).
OpenArchives Initiative (http://www.openarchives.org).
Os mecanismos de comunicação científica combinavam
Os padrões de tecnologia da informação utilizados ou canais desde os informais, como conversas pessoais, car-
derivados da Open Archives Initiative têm um impacto po- tas, telefonemas, preprints distribuídos aos pares, bastan-
tencial muito grande sobre os sistemas de informação te ágeis e atualizados em termos de velocidade, mas sem
em C&T, afetando substancialmente a maneira como qualquer filtro de qualidade, com canais cada vez mais
bibliotecas e centros de documentação desempenham formais, como as comunicações e trabalhos em congres-
funções tradicionais, como seleção, aquisição, registro/ sos e os artigos de periódico, em que os trabalhos para
tratamento técnico/indexação/classificação e dissemina- serem aceitos são submetidos à avaliação por pares. No
ção. Colocam também a questão da cooperação entre percurso dos canais informais para os formais, a maior
sistemas de informação com vistas ao acesso à informa- rapidez na comunicação é trocada pela maior lentidão da
ção em C&T em um novo patamar. Este trabalho se pro- publicação dos resultados de pesquisas e pela maior qua-
põe a discutir este novo quadro que surge com a emer- lidade graças à revisão por pares (Ziman, 1979; Le Coadic,
gência de documentos digitais em C&T, publicados di- 1996).
retamente na rede e armazenados em bibliotecas digitais
e repositórios como os Open Archives, e como estes pa- Desde a publicação do Journal des Savans e das Philosophical
drões e tecnologias podem ser usados pelos países em Transactions da Royal Society, em 1665 (Day, 1999), que o
desenvolvimento para ampliar o alcance e o nível de periódico acadêmico vem tendo um papel destacado
cooperação de seus sistemas de informação. como veículo por excelência de comunicação científica.
A partir do fim do século XIX, com a instituição do siste-
DOCUMENTOS E ARQUIVOS DIGITAIS EM ma de revisão por pares, este papel se institucionalizou,
CIÊNCIA E TECNOLOGIA juntamente com todo aparato acadêmico e científico,
atingindo a configuração institucional atual. No mundo
A ciência hoje é uma atividade altamente dos documentos impressos, os periódicos científicos ti-
institucionalizada. O conhecimento passa a ter um pa- nham papel destacado como coroamento de um sistema
pel fundamental como insumo produtivo, em um pro- de comunicação científica institucionalizado e reconhe-
cesso que tem suas origens no Renascimento e se acen- cido pela comunidade acadêmica, que fazia um compro-
tua fortemente na Revolução Industrial (Gómez, 1987). misso entre velocidade e filtros de qualidade. Dentre os
Sua gestão, a utilização e principalmente o acesso se tor- papéis por eles cumpridos, destacam-se os seguintes:
nam cada vez mais atividades econômicas críticas disseminação ampla dos resultados de pesquisa; contro-
(Marcondes, 2001a). le de qualidade, através do mecanismo de revisão por
pares; homologação de prioridade nas descobertas cien-
Nesta ciência tão institucionalizada, não existe pratica- tíficas; reconhecimento dos autores; criação de um ar-
mente lugar para o gênio isolado, capaz de dar conta de quivo público de conhecimentos com cópias armazena-
uma descoberta científica do início ao fim. A ciência das em bibliotecas de centros de documentação (Day,
atual é fundamentalmente um trabalho coletivo, em que 1999).
pesquisadores e grupos de pesquisa trabalham sobre re-
sultados já obtidos por seus pares, e tem como objetivo Paralelamente à criação e à institucionalização destes
acrescentar um tijolo a mais em um vasto edifício. mecanismos de comunicação científica e de filtros de
qualidade, vive-se um processo de parcelamento e frag-
Daí o papel fundamental que desempenha neste contex- mentação da ciência em áreas cada vez mais especializadas.
to a comunicação científica. A ciência não pode avan- A isto se soma um processo de identificação e
çar sem mecanismos eficientes de comunicação cien- questionamento de novos problemas de pesquisa que de-
mandam o aporte de diferentes áreas do conhecimento editores científicos internacionais impediriam o livre
como as ciências cognitivas, a ecologia, a moderna visão fluxo dos resultados da pesquisa e o próprio avanço des-
integrada das ciências da vida etc., levando à identificação ta, em prol de interesses comerciais restritos. As con-
de pontos de contato entre diferentes ramos da ciência. seqüências deste processo para o desenvolvimento da
ciência começam a ser percebidas por um número cres-
A conseqüência deste processo para a comunicação cente de cientistas e pesquisadores que se lançaram na
científica é a fragmentação e o surgimento de novos busca de alternativas. Stevan Harnard, um dos ideólogos
periódicos e eventos científicos, dedicados a novas áreas deste movimento, assim formula esta questão:
ou a novos problemas de caráter interdisciplinar. Devi-
do à fragmentação descrita, estes veículos de comunica- “Unlike the authors of books and magazine articles, who write
ção científica têm audiências cada vez mais restritas e for royalty or fees, the authors of refereed journal articles write
especializadas, levando à diminuição das edições e ao only for ‘research impact’. To be cited and built on in the research
conseqüente encarecimento do custo final dos periódi- of others, their findings have to be accessible to their potential
cos científicos e edição de anais de eventos para seus users. From the authors’ viewpoint, toll-gating access to their
usuários. findings is as counterproductive as toll-gating access to
commercial advertisements”.
Entretanto, a produção destes veículos de comunicação
científica tornou-se um negócio que movimenta vulto- E ainda:
sas somas e é dominado por grandes empresas, os grandes
editores científicos. Os custos das assinaturas de perió- “Researchers never benefited from the fact that people had to
dicos cada vez mais proibitivos para bibliotecas e cen- pay access tolls to read their papers (as subscriptions, and for
tros de documentação, como intermediárias no ciclo de the online version, site-licences or pay-per-view). On the
comunicação científica, ameaçam quebrar este ciclo. Este contrary, those access barriers represent impact barriers for
processo vem tendo conseqüências sérias para o desen- researchers, whose careers and standing depend largely on the
volvimento da ciência e especialmente sérias para países visibility and uptake of their research”.
em desenvolvimento, com recursos escassos a serem in-
vestidos na ciência e em apoio bibliográfico para a mes- Este debate envolvendo pesquisadores e grande editores
ma, como o Brasil. está sendo coberto pela revista Nature no seu site http:/
/www.nature.com/nature/debates/e-access/.
O surgimento da Internet e dos mecanismos de publica-
ção direta na rede tem sido visto pela comunidade aca- A comunidade científica vê as publicações eletrônicas
dêmica como uma possível alternativa. O maior retorno na rede como um meio de aumentar sua visibilidade, ace-
que a comunidade acadêmica almeja, publicando os re- lerar o avanço da ciência e disseminar amplamente os
sultados de suas pesquisas, é que estes possam servir de resultados das pesquisas, vistas como patrimônio da hu-
bases a outras pesquisas, sendo citados por outros traba- manidade (Harnard). Ela soube, com muita propriedade,
lhos. A citação é a medida clássica do prestígio e do valor acercar-se das novas possibilidades abertas pelas
de uma contribuição para a ciência em geral. Com base tecnologias de informação para criar mecanismos alter-
nos mecanismos de citação, são criados indicadores con- nativos de publicação de resultados das atividades de
sagrados para cientometria e bibliometria como o Science pesquisa.
Citation Index, produzido pelo ISI - Institute of Scientific
Information (http://www.isinet.com). Estudos recentes Observa-se, nos últimos anos, uma forte tendência,
confirmam que as publicações eletrônicas são muito mais surgida no seio da comunidade científica mundial, para a
citadas que as publicações em papel: “The mean number of criação de arquivos eletrônicos informais e autogeridos,
citations to offline articles is 2,74, and the mean number of voltados para este fim. Estes arquivos são conhecidos
citations of online articles is 7.03, an increase of 157%” como eprints archives e configuram claramente uma tran-
(Lawrence, 2001). sição do modelo de comunicação tradicional, baseado
em publicações periódicas formalmente estabelecidas,
À medida que os periódicos científicos se tornam para um novo e surpreendente paradigma. Eles
crescentemente mais caros, vem diminuindo sua audi- exemplificam o mais democrático e eficiente modelo para
ência, resultando disso menor impacto das comunica- disseminação de resultados de pesquisa. Uma referência
ções nele veiculadas. Segundo este ponto de vista, a co- importante em português sobre o histórico, os desenvol-
brança e as restrições ao acesso por parte dos grandes vimentos recentes e a dimensão da OpenArchives
Initiative, inclusive com uma entrevista a Paul Ginsparg, Um repositório eletrônico aberto apresenta caracterís-
pode ser encontrada em Sena (2000). ticas específicas. Seu site apresenta facilidades que per-
mitem a um autor submeter diretamente seus trabalhos,
Além das condicionantes tecnológicas oferecidas pela armazená-los em forma digital permanentemente, editá-
Internet, que facilitaram extraordinariamente a publi- los, substituí-los e receber críticas e contribuições; ao
cação de documentos eletrônicos, há um consenso abso- submeter um trabalho para armazená-lo e disponibilizá-
luto de que outros fatores foram decisivos na emergência lo no arquivo eletrônico, um autor também o descreve,
dos arquivos de eprints, principalmente os seguintes: a) a em um formulário de catalogação, de onde serão extraí-
lentidão do ciclo de edição das revistas comparado à ra- dos os metadados como autor, título, idioma, assunto
pidez da geração de novos conhecimentos de algumas etc. que permitirão recuperar o documento; os metadados
áreas; b) a renúncia ao direito sobre a obra imposto pelas são, portanto, obtidos como um subproduto da submis-
revistas, que impede a ampla disseminação pelo autor de são de um documento. O site permite também a consulta
suas idéias; c) a perspectiva extremamente rígida e con- e o acesso direto aos trabalhos eletrônicos nele armaze-
servadora dos esquemas de peer review adotados pelas re- nado. Um servidor de eprints compatível com o
vistas, que não raro são impeditivos ao surgimento de OpenArchives Initiative Protocol for Metadata
idéias inovadoras, como é ilustrado no artigo de Martin Harvesting – OAI PMH – permitirá a exposição de
(1993) sobre uma hipótese pouco ortodoxa sobre o metadados dos trabalhos nele armazenados para coleta
surgimento da Aids, cuja publicação foi recusada pelos automática (harvesting) e reuso por provedores de servi-
principais periódicos do establishment médico; d) o alto ços de informação, que com eles podem criar diferentes
custo da subscrição dos periódicos, seja em papel ou em serviços de valor agregado.
meio eletrônico. Os arquivos abertos não são, como pos-
sa aparecer a princípio, uma proposta anárquica, que eli- A publicação na rede de textos completos de interesse
mina os critérios de qualidade da ciência; muitos deles para C&T começa a ser uma realidade também no Brasil.
utilizam o esquema de peer-review, ou uma separação en- Iniciativas pioneiras como o SCIELO – http://
tre textos avaliados e não-avaliados; muitos destes tex- www.scielo.br – (Packer, 1998), um portal que abrange
tos são cópias livres de artigos já publicados ou a serem dezenas de periódicos, associado a uma metodologia para
publicados em periódicos convencionais (Harnard). publicar e prover acesso a periódicos eletrônicos em tex-
to completo, os diferentes periódicos brasileiros já pu-
Muito recentemente, em 1999, em um passo seguinte à blicados na web em texto completo, a proposta de desen-
criação dos arquivos eprints, a comunidade científica in- volvimento de um ambiente web para edição de anais de
ternacional se mobilizou para torná-los interoperáveis, isto congresso pelo CIN/CNEN, as recentes iniciativas do
é, passíveis de serem consultados simultaneamente. Esta arquivo de eprints do IMPA (Chataignier, 2001), as pu-
interoperabilidade foi alcançada mediante adoção de um blicações digitais da biblioteca digital do LAMBDA
conjunto de especificações técnicas e princípios – Laboratório de Automação de Museus, Bibliotecas
organizacionais bastante simples, porém potencialmen- Digitais e Arquivos – da PUC-Rio – http://
te poderosos e de grande alcance, no objetivo de www.lambda.maxwell.ele.puc-rio.br, o Banco de Teses e
integração desses arquivos. Esta iniciativa é conhecida Dissertações do Programa de Pos-graduação em Enge-
como OAI – Open Archive Initiative, http:// nharia de Produção da UFSC – http://teses.eps.ufsc.br/ e
www.openarchives.org/ (Van de Sompel, 2000) e tem do repositório de teses da USP – http://www.teses.usp.br
como objetivos básicos apoiar o desenvolvimento de ar- –, (Masiero, 2001) mostram que esta é uma tendência
quivos de eprints e criar uma arquitetura tecnológica pa- irreversível aqui também.
dronizada que sustente a interoperabilidade entre eles. No
bojo da OpenArchives Initiative, foram desenvolvidas Recentemente (Marcondes, 2001b) o Instituto Brasilei-
tecnologias, padrões e metodologias para publicação, ro de Informação em Ciência e Tecnologia (Ibict), por
disponibilização, metadados e intercâmbio automático meio do projeto da Biblioteca Digital Brasileira em C&T
de metadados entre bibliotecas digitais. A dimensão da (BDB), passou a fomentar o desenvolvimento de recur-
iniciativa dos Open Archives em nível mundial e sua sos informacionais brasileiros de interesse para C&T em
cobertura regional e temática podem ser mais bem avalia- texto completo, como teses e dissertações, artigos de pe-
das consultando-se a lista dos arquivos eletrônicos exis- riódicos, trabalhos em congressos, arquivos eletrônicos
tentes em http://www.osti.gov/eprints/ppnbrowse.html. de preprints, integrando e provendo interoperabilidade
entre estes recursos mediante acesso unificado aos mes-
mos, via única interface Web. O projeto prevê o uso do
OAI PMH como um dos mecanismos para prover dro. Hoje em dia não é mais suficiente para garantir o
interoperabilidade entre os diversos recursos máximo de visibilidade de seu acervo que bibliotecas di-
informacionais contendo documentos digitais de inte- gitais simplesmente disponibilizem seus dados na
resse para C&T, coletando seus metadados para uma base Internet. A quantidade de informações disponível na
comum de onde será feito o acesso. rede é tão grande que identificar, localizar, descobrir a
existência e acessar informações relevantes torna-se um
COO P E R A Ç Ã O E N T R E S I S T E M A S DE problema crítico, demandando um tempo proibitivo aos
INFORMAÇÃO NA ERA DOS DOCUMENTOS usuários.
E ARQUIVOS DIGITAIS
Às bibliotecas digitais é novamente colocada, como já
A produção da ciência e a comunicação dos resultados foi há tempos para as bibliotecas convencionais, a ques-
de pesquisa na nossa sociedade se dão de forma dispersa, tão de cooperarem, agora sob novas bases organizacionais
segundo dois eixos: dispersa espacialmente – pesquisado- e tecnológicas, para garantir o máximo de visibilidade a
res em diversos locais geográficos produzem e comuni- seus acervos. Atingir esta visibilidade não significa mais
cam seus resultados de pesquisa por mecanismos de co- necessariamente que alguém buscando informações terá
municação científica diferentes; dispersa temporalmente – de acessar o site da biblioteca digital ou arquivo eletrôni-
pesquisadores produzem e comunicam seus resultados co para ter acesso aos documentos digitais nele deposita-
em momentos diversos. dos. A possibilidade que seus acervos possam ser consul-
tados simultaneamente, sem que um usuário acesse cada
Neste contexto, os sistemas de informação desempenham site individualmente, a chamada interoperabilidade, tem
um papel fundamental na economia da informação-co- sido perseguida como um mecanismo que viabilize esta
nhecimento, agregando valor ao servirem como pontos possibilidade. Atingir a interoperabilidade entre
focais, que concentram a informação científica, produzi- repositórios de eprints ou bibliotecas digitais, distintos e
da, por natureza, de forma dispersa. A eles os usuários heterogêneos, possibilitando que possam ser consulta-
recorrem para encontrar as informações de que necessi- dos simultaneamente, envolve um aporte intenso em
tam, com um alto grau de probabilidade de encontrá-las. termos de tecnologias, protocolos e padronização.
Tradicionalmente a informação de interesse para a pes- O OAI PMH é um protocolo que provê interope-
quisa científica é em grande parte composta pela chama- rabilidade não imediata (ou seja, não é, portanto, um
da documentação não-convencional, também chamada protocolo para busca on-line) entre repositórios de eprints,
de “literatura cinzenta”, documentos que não são en- bibliotecas digitais ou qualquer servidor na rede que quei-
contrados no circuito editorial convencional, como re- ra expor, ou seja, tornar visíveis metadados de documen-
latórios de pesquisa, trabalhos apresentados em eventos, tos nele armazenados para um programa externo que
preprints, teses e dissertações, que noticiam com grande queira coletá-los. Os participantes da OpenArchives
atualidade os resultados de pesquisa. Initiative rejeitaram opções como, por exemplo, o pro-
tocolo de recuperação de informações Z39.50, que distri-
O papel dos sistemas de informação sempre foi o de se bui uma busca imediata e simultânea por vários servidores
contrapor a esta dispersão, provendo um ponto de con- que hospedam catálogos de bibliotecas capazes de resolvê-
centração para a comunicação dos resultados das pesqui- la, em favor de uma solução mais simples e menos onerosa
sas. Os sistemas especializados em ICT organizaram-se em termos de recursos computacionais consumidos (Troll,
para prover acesso principalmente a este tipo de docu- 2001). As diferenças na interoperabilidade com o uso do
mentação, a “literatura cinzenta”, como o NTIS, o protocolo Z39.50 X o OAI-PMH podem ser bem
Dissertation Abstracts, o Chemical Abstracts, INIS, visualizadas na figura 1, a seguir.
AGRIS, ERIC e muitos outros. Estes sistemas trabalham
dentro do paradigma organizacional/metodológico/ O OAI PMH define a troca de solicitações e de metadados
tecnológico da informação referencial como etapa para entre o servidor de eprints e um programa robô externo.
o acesso a cópias de documentos em papel. Dentro da concepção OAI, existem as instituições cha-
madas provedoras de dados (Data Providers), que são ban-
Coletar esta “literatura cinzenta” sempre foi caro e ex- cos de documentos eletrônicos que oferecem facilidades
tremamente trabalhoso para os sistemas de ICT, devido para publicação e armazenamento de documentos ele-
à dispersão da literatura científica. O surgimento das pu- trônicos e sua disponibilização em um servidor conectado
blicações eletrônicas começa a mudar radicalmente este qua- à Internet, e as instituições provedoras de serviços
NO V O S S E R V I Ç O S C O O P E -
R A T IVOS VIABILIZADOS PELO
OAI PMH
formação organicamente mais complexos, como são as mações e a otimização da consulta a sistemas interliga-
redes cooperativas locais, regionais ou internacionais. dos. Esses resultados são bastante perceptíveis pelo usu-
O conjunto de metodologias e protocolos OAI torna o ário final.
ônus administrativo-financeiro destas redes muito me-
nor, a tarefa de criar os catálogos coletivos mais simples A Internet nos traz outra forma de interoperabilidade
e, sobretudo, deixa os centros cooperantes com um grau que é a linkagem ou enlaces entre sistemas. A linkagem
maior de independência, principalmente para cooperar permite a navegação via hiperlinks entre as várias mani-
com outros serviços/sistemas aderentes ou não ao pro- festações do trabalho acadêmico de um indivíduo, nor-
tocolo OAI. Por exemplo: poderíamos ter uma rede de malmente dispersas em vários sistemas, seja como autor,
teses eletrônicas das universidades paulistas que estives- orientador ou membro de banca de teses ou dissertações
se integrada ao Consórcio Brasileiro de Teses Eletrôni- eletrônicas, seja como autor de artigos de periódico, de
cas, que, por sua vez, fosse cooperante, ao mesmo tempo, trabalhos em congressos ou acessando seu currículo em
de uma rede de teses em língua portuguesa, formada pe- um sistema de currículos. Mas é de fundamental impor-
los países que falam este idioma e também de uma rede tância a adoção de padrões e metodologias que garantam
de teses eletrônicas de países latino-americanos. a persistência dos endereços eletrônicos dos recursos
informacionais, como o PURL - Persistent URL (http://
No entanto, para se chegar a esse nível de integração e www.purl.org/) e o DOI – Digital Object Identifier (http:/
articulação entre redes e sistemas de ICT, é necessária a /www.doi.org), no sentido de preservar o investimento
criação de níveis distintos de interoperabilidade (Miller, na linkagem entre sistemas.
2000), que se superponham à interoperabilidade
tecnológica estabelecida pelo conjunto de padrões e pro- A seguir são descritos alguns produtos e serviços de in-
tocolos preconizados pelo OAI e viabilizados facilmen- formação que podem ser implementados usando-se as
te pelo uso do software Eprint. metodologias OAI.
A interoperabilidade tem muitas faces: é ela que permite – Formação de bases de dados
que sistemas de ICT distintos e heterogêneos possam
aproveitar e agregar valor à informação criada por outro, A alternativa de gerar bases de dados a partir de infor-
gerando novos serviços e novas visões para a mesma in- mações disponíveis na Internet e do reuso de seus
formação. Não é, entretanto, uma questão meramente metadados se torna cada vez mais uma opção viável que
técnica e tecnológica, ela também depende da gestão, começa a ser adotada por sistemas internacionais de gran-
articulação e cooperação mútua entre sistemas de ICT de porte como é o caso do Energy Technology Data
no plano político. Esta faceta da interoperabilidade, aqui Exchange (ETDE), da Agência Internacional de Ener-
chamada de “interoperabilidade política”, depende fun- gia. Isto acontece principalmente pelo alto custo da co-
damentalmente da criação de organizações detentoras leta manual e do tratamento técnico – catalogação e
de canais e fóruns adequados, nos quais a discussão e o indexação –, fatores que têm inviabilizado a sustentação
consenso possam se estabelecer e as decisões possam ser econômica do modelo tradicional de formação de bases
tomadas endossadas pelo grau de representatividade des- de dados que, diga-se de passagem, sempre foi deficitário
sas organizações. Este é o caso da DLF (Digital Library e precisava de fortes subsídios externos. A coleta auto-
Federation), da PILA (Publisher International Linking mática de metadados – harvesting –, baseada no protoco-
Association) e do próprio OAI (Open Archives lo OAI, pode facilitar tremendamente a formação de
Initiative), para citar somente três iniciativas internacio- bases de dados, diminuir drasticamente os custos de co-
nais importantes neste momento. leta, catalogação e indexação e também o custo de gestão
destes processos. E o mais importante: as bases de dados
Outra faceta importante do mesmo problema é a organizadas dessa forma têm agregado um valor impor-
“interoperabilidade semântica”. Ela requer o uso gene- tantíssimo que é o acesso ao objeto digital referenciado,
ralizado de instrumentos comuns de descrição temática. seja ele um texto, um vídeo ou uma peça de museu. Pode-
Um conjunto mínimo de metadados padronizados, uma se construir bases temáticas, qualificadas, por tipologia
linguagem de descrição temática de cobertura ampla, tal de documento (teses, relatórios), orientadas por proble-
como a Tabela de Áreas do Conhecimento Capes/CNPq mas (epidemia de dengue, crise energética), orientadas
e a criação de servidores de autoridades cooperativos. por projetos ou missão (prospecção de petróleo em águas
A interoperabilidade semântica tem como reflexo ime- profundas, despoluição da Baía de Guanabara), com
diato a melhoria na qualidade da recuperação das infor- metadados e informações disponíveis por todo mundo.
– Estabelecimento de redes cooperativas nacionais, re- completo. Esses catálogos podem ser enriquecidos com
gionais e internacionais links, classificados por áreas do CNPq, por exemplo, para
o universo em expansão das revistas eletrônicas livres
O protocolo OAI pode facilitar sobremaneira o estabe- na Internet, tornando-se uma opção extremamente ba-
lecimento de redes de informação. Um exemplo impor- rata às assinaturas dos periódicos convencionais, sejam
tante é a rede de teses eletrônicas da Virginia Tech. eles impressos ou eletrônicos.
University – EUA –, a NDLTD que temalcance mundial.
No Brasil, dentro do âmbito da BDB, tem-se o Consór- – Ambiente para submissão eletrônica de contribui-
cio Brasileiro de Teses Eletrônicas, projeto em andamen- ções a congressos
to que, inicialmente, reúne as teses e dissertações eletrô-
nicas da USP, UFSC, PUC-Rio, ENSP (Fiocruz) e conta O Centro de Informações Nucleares está no momento
com o apoio do CNPq. O Consórcio tem a perspectiva desenvolvendo, também dentro do escopo da BDB, o
de estender-se por Portugal, por meio de convênio com a projeto Edição Eletrônica de Anais de Eventos em C&T,
Universidade do Minho. O uso do Protocolo OAI pode que também fará uso das facilidades de submissão eletrô-
ainda tornar-se uma alternativa a mais para as redes já nica e de críticas oferecidas pelo software Eprint. O projeto
estabelecidas, criando novas opções de contribuição e prevê a criação de uma biblioteca digital de anais de con-
coleta menos onerosa em termos financeiros e gerenciais gressos, além de mecanismos para edição de anais im-
para os membros dessas redes. Existe uma série de software pressos por meio convencional ou/e em meio digital.
livres, do tipo front-end, que podem tornar uma base de – Biblioteca como publicadora Web
dados de metadados aderente ao protocolo OAI sem in-
terferências com os processos internos da rede. Muitos Nesta nova configuração, a biblioteca e os demais unida-
destes software podem ser encontrados em http:// des de informação podem assumir um papel de grande
www.openarchives.org/tools/tools.htm. É também pos- relevância que é o de publicador Web da produção acadê-
sível estabelecer formas ainda mais simples de coleta mica de sua comunidade de usuários. O investimento
automática baseadas, por exemplo, na transferência de para isso é pequeno: é necessário equipá-la com servido-
arquivos-textos ou arquivos HTML, adequadamente res compatíveis com o Protocolo OAI, que podem ser
formatados, via FTP ou via mecanismos simples de cole- microcomputadores PC-Intel ligados à Internet, rodan-
ta automática, que podem implementar formas simples do o conjunto de software que formam o Eprints. É ainda
de crítica de dados. necessário o estabelecimento de políticas de submissão e
metodologias de gestão dos arquivos digitais. Um dado
– Edição de periódicos eletrônicos importante é que unidades de informação que possuem
O software Eprint (distribuído livremente) desenvolvi- estes servidores serão interoperáveis entre si, podendo
do pela Universidade de Southampton – UK, para disse- trocar dados via processos de harvesting automático ou
minar a implantação de repositórios digitais compatí- via processos tradicionais. Isto traz a perspectiva de ou-
veis com OAI, oferece facilidades interessantes para quem tros serviços descritos a seguir.
deseja editar revistas diretamente na rede. A caracterís- – Busca unificada
tica mais marcante para esta aplicação é que o software
implementa um ambiente de submissão eletrônica bas- Um bom exemplo é o Arc – Cross Archive Searching
tante sofisticado, que permite avaliação por parte de re- Service – primeiro serviço a proporcionar acesso inte-
visores e comentários vindos dos leitores, além de ins- grado a diversos arquivos eletrônicos – 30 em março de
trumentos para a gerência de publicação dos artigos em 2001 – a partir de uma única interface http://
uma biblioteca digital. Está crescendo rapidamente o arc.cs.odu.edu/. Outro exemplo é o site My.OAI, http://
número de revistas eletrônicas publicadas com esta www.myoai.com/.
tecnologia, e isto indica mais um serviço que será descri-
to a seguir. – Descoberta de recursos via perfis de DSI
– Catálogo coletivo de revistas eletrônicas OAI É possível implementar via processos de harvesting, a des-
coberta de recursos informacionais em fontes específi-
Já é possível implementar catálogos coletivos de revistas cas, previamente selecionadas. As informações captura-
eletrônicas que tenham seus metadados coletados com o das podem ser filtradas segundo perfis de DSI, funciona-
uso do Protocolo OAI, que permitam busca simultânea lidade já implementada pelo software Eprints, e enviadas
em todas as revistas e a recuperação dos artigos em texto via e-mail para indivíduos, comunidades, departamen-
tos, programas etc., dependendo do nível de capilaridade porção do conteúdo do documento constitui o título,
que se queira alcançar. identifica o autor, o assunto, as hipóteses, a conclusão
etc. (Berners-Lee, 2001).
Outros exemplos de serviços baseados em “harvesting”
de metadados usando o OAI PMH, implementados pela A possibilidade de coleta automática de metadados
DLF – Digital Library Federation, http://www.diglib.org/ viabilizada pelo OAI PMH é a chave para uma nova prá-
- muitos já em caracter operacional, estão relatados em tica de cooperação entre bibliotecas, desonerando os
Waters (2001). cooperantes do pesado ônus administrativo de gerenciar
o envio de lotes, correções, atualizações, operações estas
CONCLUSÕES que permitem, em um esquema de cooperação tão co-
Só aos poucos a comunidade envolvida com publicações nhecido dos sistemas de informação brasileiros, manter
eletrônicas e bibliotecas digitais vem conhecendo e ava- um catálogo coletivo. Software para tornar provedores de
liando o grande potencial de interoperabilidade do OAI dados e de serviços compatíveis com o OAI PMH está
PMH. Nestas comunidades, o protocolo vem tendo gran- disponível gratuitamente na Internet, no site da Open
de aceitação, devido provavelmente à sua grande simpli- Archives Initiative.
cidade conceitual e tecnológica. Já existem propostas de No contexto das bibliotecas especializadas, atividades
extensões para este protocolo, endereçando as interfaces como seleção e aquisição podem tornar-se quase auto-
entre módulos que comporiam uma biblioteca digital máticas, realizando periodicamente a coleta automática
completa (Suleman, 2001). Maiores detalhes técnicos de metadados dos arquivos eletrônicos suscetíveis de
sobre o OAI PMH podem ser encontrados em Lynch atender à determinada comunidade. Metadados dos
(2001) e Warner (2001). documentos digitais coletados já vêm tratados. Uma bi-
A divisão de trabalho entre provedores de dados e pro- blioteca digital não precisa mais ter a posse (Lancaster,
vedores de serviços prevista pelo OAI PMH, possibili- 1994) dos documentos que compõem o seu acervo, mas
tando a criação de novos serviços de valor agregado, abre simplesmente manter metadados dos mesmos apontan-
grandes possibilidades. Nada impede que uma biblioteca do para o texto completo, armazenado em um outro ser-
digital seja simultaneamente provedor de dados e de ser- vidor. O reuso de metadados que também foi sempre per-
viços. Na era dos documentos em papel, cada cópia deste seguido pelas bibliotecas, via sistemas e bancos de cata-
documento, armazenada em uma biblioteca, era descrita logação cooperativa, torna-se uma possibilidade real.
e indexada, produzindo registros que, organizados em fi- O antigo ciclo de comunicação científica, incluindo pes-
chários manuais ou catálogos automatizados, eram me- quisador, editor, serviços de informação e biblioteca nas
canismos para viabilizar a recuperação destes documen- etapas de produção de conhecimentos, registro deste
tos. Portanto, a criação de metadados era separada da conhecimento, publicação, seleção, aquisição, descrição,
produção do documento e repetida em diferentes biblio- armazenamento e disseminação, fica profundamente al-
tecas. A criação de metadados simultaneamente à sub- terado pelo aporte das tecnologias de informação. Estas
missão de um documento digital para publicação em um etapas se integram, estreitam-se. Produzir textos digi-
arquivo eletrônico, isto é, o encapsulamento do docu- tais já implica, praticamente, publicá-los, descrevê-los e
mento e seus metadados, realiza na prática a proposta disponibilizá-los para disseminação imediatamente.
antiga na área de biblioteconomia, da catalogação na fon-
te. Esta se torna viável pelo uso de um conjunto de A existência de documentos livres com os resultados de
metadados – o Dublin Core – tão simples “a ponto de pesquisas de ponta em diversas áreas de C&T disponíveis
poder ser utilizado pelo próprio autor” (Weibel, 1995). na Internet configura uma oportunidade altamente signi-
A biblioteca fica dispensada de realizar o tratamento téc- ficativa e até então inédita para a ciência dos países em
nico deste documento, geralmente tão oneroso. O docu- desenvolvimento como o Brasil, conforme analisa Chan
mento tratado na fonte se torna imediatamente insumo (2001). Constitui um mecanismo potencial de democra-
para diferentes serviços, possibilitando seu reuso. A cria- tização no acesso aos resultados de pesquisas e do conhe-
ção de documentos digitais formatados em XML cimento em geral. Esta oportunidade e suas potenciali-
(Extensible Markup Language (XML), 2000) avança ain- dades não podem passar despercebidas pela comunidade
da mais nesta direção: conteúdo e metadados vão com- acadêmica brasileira, nem pelos gestores e planejadores de
por um todo único, já que a linguagem XML permite a C&T, nem pelos gestores dos sistemas de ICT.
marcação das partes que compõem um documento digi-
tal, permitindo que um programa possa identificar que Artigo aceito para publicação em 19-11-2002