Sei sulla pagina 1di 13

USO DO DUBLIN CORE NA DESCRIO DE OBRAS RARAS NA WEB: A COLEO DA BIBLIOTECA BRASILIANA DIGITAL

Daniela Pires
Biblioteca Brasiliana Guita e Jos Mindlin. Universidade de So Paulo, So Paulo, SP. Bibliotecria. danipires@usp.br; tel. (11) 3091-1154

RESUMO
Acessvel ao pblico desde junho de 2009, a Biblioteca Brasiliana Digital, da Universidade de So Paulo tem por objetivo facultar para a pesquisa, a maior Brasiliana custodiada por uma universidade. Sua inteno disponibilizar virtualmente parte do acervo da Universidade oferecendo-se como um instrumento til e funcional para a pesquisa e o estudo dos temas e cultura brasileiros, alm de oferecer um modelo tecnolgico de gesto que possa ser difundido a outras colees, acervos e instituies. Este trabalho apresenta os resultado da implantao de um esquema de metadados baseado no formato Dublin Core, para a descrio de obras raras e especiais na web. Especificamente, apresenta os procedimentos e processos de descrio de contedos das diversas tipologias documentais (livros, peridicos, gravuras etc.) e formatos digitais (pdf, jpeg entre outros).
Palavras-Chave: Bibliotecas digitais; Metadados; Dublin Core.

ABSTRACT
Available for the public access since June 2009, the University of Sao Paulo Brasiliana Digital Library, aims to provide to the research the largest Brasiliana guarded by an University. The purpose is make available online part of the University Collection, as an useful and functional instrument to the research and study of Brazilian themes and culture, and also offer a technological management model able to be disseminated to other collections and institutions. This work shows the results of the implantation of a metadata schema based on Dublin Core format, for the description of rare and special works on the web. Specifically, it shows the content description procedures and processes of several documents typologies (books, journals, images etc) and digital formats (pdf, jpeg and others).
Keywords: Digital Libraries, Metadata, Dublin Core.

1 Introduo
Acessvel ao pblico desde junho de 2009, a Biblioteca Brasiliana Digital, da Universidade de So Paulo tem por objetivo facultar para a pesquisa, a maior Brasiliana custodiada por uma universidade, por meio da consolidao de um modelo de biblioteca digital, fundamentada em padres e normas internacionais. Sua inteno disponibilizar virtualmente parte do acervo da Universidade oferecendo-se como um instrumento til e funcional para a pesquisa e o estudo dos temas e cultura brasileiros, alm de oferecer um modelo tecnolgico de gesto que possa ser difundido a outras colees, acervos e instituies. Numa primeira etapa do projeto, foram digitalizados parte do acervo da Biblioteca Brasiliana Guita e Jos Mindlin, doada USP pelo biblifilo Jos Mindlin, que colecionou ao longo de sua vida um expressivo conjunto de livros e manuscritos, sendo sua coleo considerada a mais importante coleo do gnero formada por um particular. So cerca de 17.000 ttulos, ou 40.000 volumes, compreendidos entre o Sculo XVI at o atual, e conta com obras de literatura brasileira (e portuguesa), relatos de viajantes, manuscritos histricos e literrios (originais e provas tipogrficas), peridicos, livros cientficos e didticos, iconografia (estampas e lbuns ilustrados) e livros de artistas (gravuras). Com o desenvolvimento de novas tecnologias de gesto da informao, a gesto e a descrio dos conjuntos documentais tm passado por intensa transformao. Apresenta-se aqui, mais detalhadamente o modelo baseado em padres atualizados e compartilhados de descrio e a consolidao de um esquema de metadados descritivos e gerenciais dos dados e informaes produzidos pelo Projeto Brasiliana Digital. Este trabalho resultado da implantao de um esquema de metadados baseado no formato Dublin Core, para a descrio de obras raras e especiais na web, a partir da coleo da Biblioteca Brasiliana Guita e Jos Mindlin. Especificamente, apresentaremos os procedimentos e processos de descrio de contedos das diversas tipologias documentais (livros, peridicos, gravuras etc.) e formatos digitais (pdf, jpeg entre outros) alm do estudo realizado para a definio de quais campos e qualificadores utilizados e como estes atendem s necessidades da coleo e de suas diferentes tipologias documentais e seus nveis especializados de descrio, alm de atender as orientaes do prprio repositrio digital (DSpace) quanto ao uso de cada campo (e qualificadores) de informao. Apresentaremos inclusive as ferramentas de apoio utilizadas (catlogos de autoridades, vocabulrios controlados, obras de referncias entre outros). Alm disso citaremos os esforos para a consolidao de um padro de metadados baseado na simplicidade de descrio para acervos de vrias naturezas documentais, tendo como base o esquema Dublin Core e a sua disponibilizao na Plataforma Corisco (um sistema integrado de aplicativos e recomendaes para sustentar a implantao e gerenciamento de bibliotecas (repositrios) digitais, que foi desenvolvida pelo Laboratrio da Brasiliana Digital). Por ltimo trataremos da integrao e a consolidao de um esquema de metadados gerenciais e administrativos produzidos pelo Projeto da Brasiliana Digital.

2 Reviso de Literatura
As bibliotecas digitais so hoje um instrumento de multiplicao, universalizao de acesso e de democratizao de contedos documentais. So consideradas fundamentais para uma poltica de difuso cultural, pesquisa e formao. Essas novas bibliotecas so sistemas de informao que oferecem todos os tipos de contedo digital, incluindo gneros documentais e publicaes eletrnicas. De acordo com a Digital Library Federation (DLF):
bibliotecas digitais so organizaes que fornecem recursos, incluindo pessoal especializado, para selecionar, estruturar, oferecer acesso intelectual,

interpretar, distribuir, preservar a integridade e assegurar persistncia atravs do tempo de colees de objetos digitais, para que sejam facilmente e economicamente disponveis para uso de uma comunidade alvo definida ou um conjunto de comunidades. (DLF, 1998)

Com a evoluo do conhecimento cientfico e advento de novas tecnologias de informao houve necessidade de serem criados mecanismos para facilitar a recuperao de documentos e agilizar a comunicao. Isso gerou tambm para as bibliotecas a necessidade de acompanharem este desenvolvimento e oferecem aos seus usurios outras formas de acesso ao contedo de seus acervos. Hoje um dos grandes servios de disseminao da informao oferecidos pelas bibliotecas aos seus usurios a consolidao de um sistema de digitalizao e disponibilizao de seus acervos no formato digital, contribuindo para tornarem-se um instrumento de trabalho, investigao e difuso cultural e oferecendo aos usurios contedos em diversas tipologias documentais (livros, peridicos, mapas, gravuras etc) e em diversos formatos eletrnicos (pdf, mp3, jpeg entre outros). Sendo assim podemos afirmar que as bibliotecas digitais no vm para substituir o conceito tradicional da biblioteca como centro de transmisso da cultura e do saber, elas ampliam e renovam este conceito, como tambm abrem novos horizontes para as atividades das bibliotecas, uma vez que o acesso informao no ocorrer em determinado espao fsico, em um determinado horrio, ele ocorre no momento em que o usurio sente a necessidade de obter informao. Desde a formao das primeiras colees de documentos houve a preocupao de possibilitar o acesso produo intelectual dos povos. As primeiras bibliotecas surgiram do instinto de preservar a memria coletiva dos grupos sociais e da paixo de colecionar. Isto gerou a necessidade de ordenamento para seu posterior uso. Esta organizao/ordenamento permite que os documentos sejam recuperados com o intuito de oferecer informaes/conhecimentos necessrios ao desenvolvimento cientfico, ao exerccio de atividades profissionais ou simplesmente pelo prazer da leitura. (LEMOS, 1998). As atividades das bibliotecas compreendem, em termos simples, o atendimento aos usurios, a organizao, o tratamento e a disseminao de informaes para o pblico tendo como misso atender s cinco leis da biblioteconomia, de S. R. Ranganathan: - Os livros so para usar; - A cada leitor seu livro; - A cada livro seu leitor; - Poupe o tempo do leitor; - A Biblioteca um organismo em crescimento. A representao do conhecimento registrado, ou a catalogao de itens documentais, tem por objetivo central propiciar aos usurios que estes encontrem aquilo que procuram. Esta representao com sintaxe e semntica prpria, consiste no levantamento das caractersticas dos registros e na cognio das caractersticas do usurio. Estes registros podem pertencer a vrios acervos e estarem disponveis em diversos suportes e formatos. Contudo, esta caracterizao que permitir a individualizao dos documentos, bem como reuni-los em diversas outras colees, de acordo com suas semelhanas. (MEY; SILVEIRA, 2009) As atividades realizadas pelas bibliotecas e centros de informao/documentao so hoje gerenciadas por bancos de dados e sistemas de informao que permitem integrar todos os processos envolvidos no tratamento de documentos, inclusive com a integrao de ferramentas de apoio, como catlogos de autoridades, vocabulrios controlados, tesauros, obras de referncias entre outros. Um dos principais conceitos difundido hoje entre os profissionais que atuam na descrio de recursos eletrnicos na Internet o de metadados. De acordo com a National Information Standards Organization - NISO (2004, p. 1) metadados podem ser definidos como 3

informao estruturada que descreve, explica, localiza, ou ainda permite que um recurso informacional possa ser recuperado, usado e gerenciado. O termo metadados freqentemente designa dados sobre dados, ou informao sobre informao.

As bibliotecas sempre produziram metadados, por meio de seus catlogos, ndices entre outros instrumentos. So estes metadados, devidamente organizados e estruturados que garantem que a informao seja descoberta, localizada e possa ser utilizada. O desafio hoje est na descrio da informao que se encontra em diversos formatos digitais e que precisam atender a diferentes pblicos e usos. Os metadados podem ser descritos separadamente em um sistema de armazenamento de informaes (bancos de dados), como podem estar embebidos nos arquivos digitais. A utilizao de padres e normas para a descrio de registros informacionais necessria para garantir a interoperabilidade entre os diversos sistemas de informaes. Existem diferentes padres e normas para a descrio de documentos, cabe a cada instituio definir o que melhor se adapta s necessidades de seu acervo e tipos documentais. Para o gerenciamento de acervos digitais um dos formatos mais conhecidos e utilizados por grandes projetos de bibliotecas digitais para a descrio de seus recursos na web o formato Dublin Core. O formato Dublin Core surgiu em 1995 no Workshop patrocinado pela Online Computer Library Center (OCLC) em Dublin, Ohio (Estados Unidos), com o objetivo de definir um conjunto de elementos que poderiam ser utilizados pelos autores e nocatalogadores para descrever seus prprios recursos na Web e facilitar a descoberta destes recursos na Internet. Desde ento, este tem sido o formato utilizado por. Seu desenvolvimento gerenciado pelo Dublin Core Metadata Iniciative (DCMI). A partir de 2003 tornou-se o padro ISO 15836. O formato Dublin Core composto por 15 elementos de descrio: title, creator, subject, description, publisher, contributor, date, type, format, identifier, source, language, relation, coverage e rights. Este formato simples e conciso permite descrever vrios tipos de recursos na Internet. Contudo, com a evoluo do formato, estes 15 elementos de descrio se tornaram mais completos com a utilizao de Qualificadores. Estes qualificadores tm a funo de refinar ou tornar mais especfico o recurso descrito. Portanto, deciso do sistema sobre qual formato utilizar (simples ou qualificado). A opo do Projeto Brasiliana Digital foi por utilizar o formato de descrio com qualificadores, contudo o repositrio digital DSpace possui algumas orientaes especficas quanto ao uso de alguns campos de metadados que so diferentes da Iniciativa Dublin Core, como pode ser observado no Quadro 1. No quadro 2 apresentamos os metadados utilizados pelo Brasiliana Digital na plataforma Corisco.
Tabela 1 - Diferenas entre os elementos Dublin Core e seus qualificadores no repositrio DSpace (as diferenas esto destacadas em negrito)
Nome do elemento DC Title Creator Subject Qualificador Dublin Core DSPACE Elemento Title No recomenda utilizao Subject Dublin Core DSPACE Qualificador Alternative a Classification DDC LCC LCSH MESH Other Tableofcontents

Alternative

Description

Table of contents

Abstract

Abstract Provenance Sponsorship Statementofresponsability URI Version Publisher Contributor Advisor Author Editor Illustrator Other Created Accessioned Available Issued Copyrighted Submitted Updated Extend Medium Mimetype URI Bibliographic citation Govdoc ISBN ISMN ISSN Other Sici Slug No recomenda utilizao a ISO RFC3066 Is version of Has version Is replaced by Replaces Requires Is part of Has part Is referenced by Is format of Isbasedon Ispartofseries URI Coverage Spatial Temporal Holder URI

Publisher Contributor

Date

Created Valid Available Issued Modified Copyrighted Submitted Extend Medium URI Bibliographic citation

Date

Type Format

Type

Identifier

Source Language Relation Is version of Has version Is replaced by Replaces Is required by Requires Is part of Has part Is referenced by References Is format of Has format Conforms to Spatial Temporal Access Rights License

Coverage Rights

Tabela 2 - Metadados utilizados pela Brasiliana Digital na Plataforma Corisco


Elemento Dublin Core DC.Contributor Qualificador author Etiqueta / legenda para o site Autor Notas Entidade responsvel pelo contedo do item Pessoas ou entidades que contriburam para o contedo do item. Ex.: tradutores, ilustradores, gravadores, prefaciadores, impressor, etc Nome dado ao documento. Forma pelo qual o documento formalmente conhecido Forma alternativa ao ttulo. Neste campo incluem-se as tradues ou abreviaturas do ttulo Data de publicao do item Descrio de particularidades do item Referencia a edio Descrio da custdia do item. Utilizar este campo para descrever a que biblioteca pertence o item Sinopse do contedo do recurso Descrio do contedo do item: sumrio, lista de ilustraes Entidade responsvel por tornar o documento acessvel em sua forma. Incluem pessoas, organizaes ou servios. (Colocar Local de publicao e o nome da editora) Descrio dos aspectos fsicos do livro (n. de pginas, volume, ilustraes etc) Utilizar este campo para introduzir informao sobre a lngua diferente do formato ISO Relao do item. (Nestes campos de metadados devem ser atribudos as relaes de uma obra, deve-se utilizar para se estabelecer os links no acervo ou fora dele) Nome e nmero da srie/coleo Utilizar quando o item for parte de uma obra (Ex. captulos de livros, para imagens, mapas que fazem parte de um item que j faz parte do acervo, inserir o handle) Recurso possui parte fsica ou lgica de outro item Recurso est disponvel em diferentes verses Recurso est baseado em outro Recurso referenciado por outro recurso Recurso est disponvel em mais de um formato

DC.Contributor

other

Colaborador

DC.Title DC.Title DC.Date DC.Description DC.Description DC.Description DC.Description DC.Description

none alternative none none isversionof provenance abstract tableofcontents

Ttulo Ttulo alternativo Data de publicao Descrio/Notas Verso Procedncia Resumo da obra Contedo

DC.Publisher

none

Local de Publicao

DC.Format DC.Language

medium none

Descrio fsica Idioma

DC.Relation

none

Relao

DC.Relation

ispartofseries

Srie

DC.Relation

ispartof

Parte de

DC.Relation DC.Relation DC.Relation DC.Relation DC.Relation

haspart hasversion isbasedon isreferencedby isformatof

Possui parte Tem verso Baseado em Referenciado por Formato adicional

DC.Relation DC.Relation DC.Relation DC.Relation

requires replaces isreplacedby uri

Vinculado com Continua em continuao de Recurso relacionado

Recurso requer algum suporte para seu funcionamento, distribuio ou coerncia Recurso continua em outro ttulo ou forma Recurso continuao de outro Inserir neste campo o link para o catlogo eletrnico (quando item pertencer biblioteca parceira) Especificar sobre os direitos autorais (domnio pblico; proibido uso para fins comerciais etc) Assunto. Consultar vocabulrio controlado do SiBi-USP. (descritores em portugus) Tipologia documental

DC.Rights DC.Subject DC.Type

none none none

Direitos Assunto Tipo

3 Materiais e Mtodos
A digitalizao do acervo da Biblioteca Brasiliana Guita e Jos Mindlin realizada a partir de um sistema integrado de digitalizao robotizada de livros encadernados (APT 2400 RA BookScan da Kirtas Technologies, que possui 2 cmeras Canon de 25 megapixel) na sua mais moderna verso, que permitiu desdobrar espacialmente as atividades de digitalizao, processamento das imagens (atravs do software integrado ao scanner, BookScan Editor), preparao dos objetos digitais, metadados (administrativos, gerenciais e descritivos) e gesto do repositrio digital. A gesto das informaes bibliogrficas da Biblioteca Digital realizada pelo repositrio DSpace (www.dspace.org), que um software de cdigo aberto que permite a construo e gerenciamento de repositrios institucionais e bibliotecas digitais. O DSpace prov mecanismos para submisso, aprovao e publicao de documentos, alm de um motor de busca baseado no Apache Lucene (lucene.apache.org) e a possibilidade de interligao com outros repositrios digitais via protocolo Open Archives Initiative Protocol for Metadata Haversting (OAI-PMH - www.openarchives.org/pmh/). Contudo, diante do grande volume de dados e informaes gerados em cada um dos processos envolvidos na disponibilizao online de documentos (digitalizao, processamento das imagens, OCR, compactao de arquivos, metadados bibliogrficos, interface web e disponibilizao no site), foi necessria a organizao dos metadados de acordo com as seguintes caractersticas: Metadados descritivos: descrio e identificao dos recursos informacionais; tratase da descrio bibliogrfica, ou a catalogao dos itens; Metadados administrativos e gerenciais: administrao e gerenciamento das informaes relacionadas aos documentos, processos e pessoas; Metadados de preservao: gesto das informaes de preservao digital dos documentos; Metadados tcnicos: informaes tcnicas dos softwares, hardwares e processos utilizados; Metadados de uso: informaes sobre usos e usurios dos recursos de informao. Depois de definido o esquema de metadados (Dublin Core qualificado) para a descrio bibliogrfica, houve a necessidade de adapt-lo s necessidades da coleo, definindo quais campos e qualificadores seriam utilizados e como estes atenderiam s necessidades da coleo e as diferentes tipologias documentais, assim como atender as orientaes do repositrio 7

(DSpace), quanto ao uso dos campos. Abaixo descrevemos sucintamente como foi o planejamento das atividades: - Importao dos dados bibliogrficos: foi elaborada uma tabela de importao de dados, que definiram quais dados e campos bibliogrficos seriam importados do banco de dados da Biblioteca Guita e Jos Mindlin, que est na plataforma ISIS (software de armazenagem e recuperao da informao) para um arquivo XML no formato Dublin Core, que o formato de importao e exportao aceito pelo repositrio; a partir desta etapa os dados so importados para o repositrio conforme os documentos vo sendo digitalizados. Abaixo apresentamos o contedo de arquivo de metadados para ser importado no Repositrio Digital.

Imagem 1 Tabela de importao do Banco de dados e seu resultado em XML

- Definio do padro de descrio dos metadados: para garantir a uniformidade e a padronizao da descrio dos metadados foram adotados normas e padres utilizados e consolidados pelas bibliotecas, o documento norteador utilizado o AACR2. Aps a importao dos metadados para o DSpace os metadados so conferidos e descritos conforme o padro de descrio adotado pela Biblioteca Brasiliana Guita e Jos Mindlin para recursos na web. (As orientaes resumidas podem ser verificadas no Quadro 2). - Definio das tabelas auxiliares, vocabulrios controlados e tesauros utilizados: esta etapa consistiu em analisar as ferramentas auxiliares para a descrio bibliogrfica, com o objetivo de uniformizar e padronizar a entrada de dados, como por exemplo, vocabulrios controlados para a padronizao das entradas de assuntos, tabelas de autoridades para a padronizao dos nomes dos autores e colaboradores dos documentos, tesauros geogrficos para a cobertura geogrfica dos documentos. O formato Dublin Core tambm possui algumas sugestes de vocabulrios controlados para auxiliarem no preenchimento dos campos. No Projeto os campos e as tabelas auxiliares utilizadas so:
Tabela 3 - Tabelas auxiliares utilizadas no Projeto Brasiliana Digital Campos DC Tabelas auxiliares Subject - Vocabulrio controlado da USP (Disponvel para acesso no endereo: http://143.107.73.99/Vocab/SIBIX652.dll/Index) Contributor - Catlogo de Autoridades da Biblioteca Nacional (catlogos.bn.br) - Catlogo de Autoridades da LC (Library of Congress Authorities - http://authorities.loc.gov/) Type -Tabela de Tipologia Documental definida pelo Projeto Brasiliana Digital Coverage (qualifier: spatial) - Tesauros de nomes geogrficos da Getty (TGN Thesaurus of Geographic Names)

- Definio da estrutura de apresentao dos campos de metadados para o usurio: depois de instanciados os metadados (descritivos, administrativos, preservao, tcnicos e uso), estes foram selecionados para serem apresentados aos usurios da Biblioteca Digital em nosso site, contudo apenas os metadados descritivos dos itens digitalizados so apresentados aos usurios. Tambm foram definidos que os campos dc.contributor e dc.subject seriam formatados para funcionar como links, permitindo a busca a todos os itens que utilizem a mesma entrada de dados.

Imagem 2 Apresentao dos metadados no site

- Definio da tabela de tipologia documental: esta etapa envolveu a definio e descrio dos tipos documentais que compem o acervo digital e a definio das colees no repositrio que seriam criadas para abrigar o acervo. De forma simples apresentamos a tipologia documental definida que orientou a arquitetura das colees no site: Livros (que tambm inclui os folhetos), Imagens, Mapas, Peridicos, Manuscritos e Obras de Referncia (que possui tambm uma interface de busca fora do DSpace.

Imagem 3 Arquitetura das colees

- Definio da rotina de cadastramento e conferncia dos metadados: esta etapa consistiu em cadastrar a equipe de catalogadores e sistematizar a entrada de dados no repositrio, pois h diferenas para cada banco de dados. Depois de importadas as informaes bibliogrficas 9

so feitas alteraes, correes, atualizaes e a padronizao destas informaes. Como ltima etapa realizada uma conferncia no arquivo e nos dados para que estes possam ir para o servidor web. - Enriquecimento dos metadados: uma das exigncias para a descrio dos metadados permitir uma contextualizao do livro, oferecendo um pequeno resumo/sinopse do seu contedo. O campo Dublin Core utilizado para este tipo de informao dc.description.abstract. Para esta etapa a Biblioteca Brasiliana conta com um grupo de colaboradores especializados em determinadas colees e temas, que so responsveis pela elaborao de textos de apresentao que so publicadas na homepage e pela produo de sinopses para algumas obras. Alm disso, necessrio tambm o uso de ferramentas de apoio como dicionrios biobibliogrficos, enciclopdias, dicionrios e documentos especializados em brasiliana. Alm deste tipo de descrio, tambm procuramos descrever as subdivises de um documento, sempre que estas forem importantes para o entendimento da obra, como por exemplo, o sumrio, a relao de gravuras, ilustraes, estampas, mapas etc. O campo Dublin Core utilizado para descrever este tipo de informao dc.description.tableofcontents. - Estabelecimento de relaes entre os itens: um dos pontos positivos para o uso do Dublin Core para a descrio de recursos na web se baseia no conceito de estabelecer relaes entre itens do mesmo acervo ou mesmo com itens pertencentes a outros acervos ou catlogos. O campo utilizado para esta finalidade o dc.relation com seus qualificadores. Como exemplo, podemos citar a descrio de todas as gravuras de lbuns de iconografias e estabelecer a relao entre a obra completa, as relaes entre um item e suas partes feita atravs dos campos dc.relation.ispartof ( parte de) e dc.relation.haspart (tem parte). Tambm estabelecemos as relaes entre os vrios volumes de uma mesma obra (uma vez que cada volume descrito separadamente), atravs do campo dc.requires (vinculado com) e de todas as suas edies por meio do campo dc.relation.hasversion (tem verso/edio) e dc.relation.isversionof ( verso/edio).

Imagem 4 Exemplo de relao entre itens

- Elaborao de manual de tratamento da informao para os diferentes tipos documentais: para uniformizar a entrada de dados na Brasiliana Digital est sendo produzido 10

um manual de tratamento da informao para os diferentes tipos documentais (livros, peridicos, imagens etc.). Apresentamos de uma forma geral e sucinta as principais atividades realizadas pela equipe de metadados quanto descrio bibliogrfica dos documentos digitais da Brasiliana Digital. Os metadados que so produzidos em cada um dos processos e etapas da disponibilizao online de documentos passam por constantes reformulaes e adaptaes tendo como objetivo a adequao do repositrio aos diferentes tipos e necessidades de descrio documental que so impostas equipe de desenvolvimento da plataforma Corisco. Apresentamos a seguir alguns dos resultados finais e parciais de projetos de metadados em desenvolvimento.

4 Resultados Parciais
4.1 Trabalhos em desenvolvimento Muitos so os desafios enfrentados para a consolidao de um modelo de gesto de acervos digitais, que contemple o gerenciamento de todos os processos, informaes, pessoas e a comunicao das equipes e a consolidao da Plataforma Corisco, baseada no DSpace, como um sistema integrado de aplicativos e recomendaes para sustentar a implantao e gerenciamento de bibliotecas digitais. Apresentamos agora os resultados obtidos, alm de novos desenvolvimentos necessrios: Consolidao do formato Dublin Core como o esquema de metadados da Biblioteca Brasiliana Digital. Neste momento, est em andamento um estudo para a simplificao do esquema DC utilizado, cuja inteno diminuir o uso de qualificadores para utilizar o esquema de forma mais concisa e objetiva; Aplicao na plataforma Corisco de vrios esquemas de metadados, de forma que ela possa atender a acervos de vrias naturezas e tipos documentais, como documentos de arquivos, vdeos, msica etc. com o objetivo de se tornar uma ferramenta de fcil customizao para diferentes necessidades de descrio; Consolidao de um banco de dados que rena novos esquemas de metadados e que concentre as informaes gerenciais; bibliogrficas e de preservao digital, esta soluo consiste em um nico sistema de informaes, com vrios esquemas de metadados que permitam a unificao num mesmo ambiente dos dados e arquivos, utilizando o repositrio DSPACE como o ambiente centralizador destas informaes; Testes para a utilizao de metadados embutidos utilizando o esquema IPTC metadata: padro desenvolvido em 1970 pela International Press Telecommunications Council para descrever, inserir e editar dados dos arquivos de imagem digital. Este esquema de metadados tem por objetivo embutir dados nos arquivos digitais para facilitar a recuperao de arquivos por mecanismos de buscas. Workflow de produo: inicialmente, o projeto pretendia que o sistema de controle para o fluxo de processos da produo dos arquivos digitais da Brasiliana Digital fosse feito conjuntamente com banco de dados gerencial. Contudo, hoje percebemos que estes devem ser bancos de dados diferentes, com controles prprios e interligados. Neste momento estamos desenvolvendo um sistema de controle para padronizar o sistema de monitoramento dos arquivos digitais, avaliar a eficincia do modelo adotado, acompanhar os processos e as pessoas envolvidas em cada etapa da produo de objetos digitais com o propsito de obter dados e resultados para relatrios alm da produo de estatsticas sobre o fluxo de produo. Este sistema de controle utilizar uma ferramenta de trabalho colaborativo, uma vez que as equipes trabalham em ritmos 11

diferentes, e necessitam que a informao acessada esteja sempre atualizada e sincronizada. 4.2 Projetos em desenvolvimento A Biblioteca Brasiliana Guita e Jos Mindlin sedia um Grupo de Pesquisa em Humanidades Digitais cujos projetos desenvolvidos no mbito dos metadados so: Iconografia em lngua estrangeira: O projeto tem como meta especfica produzir descries dos documentos iconogrficos das obras em lngua estrangeira do acervo da Biblioteca Brasiliana Guita e Jos Mindlin, com a correta traduo dos ttulos, legendas e demais informaes relativas s imagens, cujo objetivo geral, a partir disso, colaborar para a uniformizao do catlogo de iconografia do acervo BrasilianaUSP e para a ampliao do acesso a esse catlogo por parte de mecanismos de busca. Estudo para sistematizar a descrio de topnimos em catlogos para proporcionar pesquisas interativas e inteligentes. Projeto desenvolvido em parceria com a Faculdade de Filosofia, Letras e Cincias Humanas, Departamento de Letras Modernas, nas reas de relacionadas s lnguas: alemo, latim e francs. Formao de bancos de dados a partir de obras de referncia na Biblioteca Brasiliana Digital: O objetivo deste projeto trabalhar com obras de referncia pertencentes ao acervo da Brasiliana, transformando-as em documentos digitais com funcionamento de bancos de dados. As obras, atualmente em formato de imagens digitais, sero convertidas para arquivos XML, anotados de forma a poderem servir de base para buscas cruzadas programadas em X-Query. Como produto deste projeto, ofereceremos ao usurio da Biblioteca Brasiliana Digital da USP um ndice remissivo de autores e personagens histricos, muitos deles presentes nos demais texto do acervo. Com isso, usurios de diversos perfis encontraro, na Brasiliana, um banco de informaes importante para pesquisas acadmicas e escolares. O resultado, desta forma, ser um fator de extroverso do contedo da Brasiliana, e um fator de ampliao e democratizao do seu acesso.

5 Consideraes Finais
A tarefa de agregar valor aos documentos que esto sendo digitalizados e permitir que estes sejam recuperados muito gratificante para todos os envolvidos na construo de acervos digitais. Pois alm da tarefa de padronizao e cadastramento das informaes teis e necessrias para a recuperao informao pelos mecanismos de buscas, h o processo de aprendizado que abrange tanto a rea de modelagem e criao de uma Biblioteca Digital quanto descoberta e o uso das fontes de informao relacionadas histria do pas e a preservao de nossa memria documental. No entanto, o processo de construo de um projeto desta dimenso lento e complexo, pois esto envolvidos conceitos interdisciplinares, relacionados gesto de projetos e pessoas, biblioteconomia e sistemas de bibliotecas, tecnologias da informao, design, histria, literatura, lingustica e um conjunto de profissionais e contextos que permitiram que a Biblioteca Brasiliana Digital entrasse no ar, em pleno funcionamento em junho de 2009 e pudesse ser construda desde ento com as sugestes dos usurios e diversos projetos de pesquisas. Muitos processos so constantemente revistos e passam por um processo de adequao e atualizao, inclusive neste momento uma das etapas inclui a implementao de um 12

protocolo de coleta de metadados em repositrios digitais com o objetivo de proporcionar a interoperabilidade, dar visibilidade e integrar metadados e informaes de diferentes repositrios digitais, utilizando, por exemplo, o protocolo OAI-PMH da Open Archives Iniciative Protocol for Metadata Harvesting. Quanto manuteno de bancos de dados em bibliotecas importante salientar que os repositrios digitais no substituem nossos catlogos gerenciais do acervo fsico, mantidos durante todos esses anos em formato MARC 21 ou em qualquer outro formato de descrio. Para o ambiente da web o esquema de metadados Dublin Core hoje uma alternativa segura, interopervel e consolidada para a descrio de documentos, inclusive para a catalogao de obras raras, cujo nvel de descrio deve ser mais especfico e detalhista. Desta forma, podemos afirmar que o Dublin Core proporciona uma descrio mnima e objetiva dos itens do acervo, como tambm permite que os itens sejam encontrados no repositrio digital. Para a Biblioteca Brasiliana Digital este esquema se mostra muito eficiente e atende as expectativas de descrio, permitindo inclusive estabelecer conexes entre vrios itens de um mesmo acervo ou de acervos diferentes. Diante disso, o que nos motiva e constitui a nossa misso poder inocular o vrus da leitura como dizia o Sr. Jos Mindlin, por meio da disponibilizao destes documentos, contribuindo para a construo de uma sociedade de leitores. Contudo, devemos sempre nos lembrar que para que o leitor chegue at o livro necessrio que ele primeiro o encontre e esta nossa principal tarefa enquanto catalogadores.

6 Referncias
DIGITAL LIBRARY FEDERATION. A Working Definition of Digital Library [1998]. Disponvel em <http://www.diglib.org/about/dldefinition.htm>. Acesso em: 04 maio 2007. DUBLIN CORE METADATA INITIATIVE. Dublin Core element set, version 1.0. Disponvel em: <http://dublincore.org/documents/dces/>. Acesso em: 25 maio 2008. DUBLIN CORE METADATA INITIATIVE. Using Dublin Core. Disponvel em: <http://dublincore.org/documents/2005/11/07/usageguide/>. Acesso em: 15 ago. 2008. DUBLIN CORE METADATA INITIATIVE. Using Dublin Core: Dublin Core Qualifiers. Disponvel em: <http://dublincore.org/documents/2005/11/07/usageguide/qualifiers.shtml>. Acesso em: 15 ago. 2008. LEMOS, Antonio Briquet de. Bibliotecas. In: CAMPELLO, Bernadete (Org). Formas e expresses do conhecimento: introduo s fontes de informao. Belo Horizonte: Escola de Biblioteconomia da UFMG, 1998. p. 347-366. MEY, Eliane Serro Alves; SILVEIRA, Naira Christofoletti. Catalogao no plural. Braslia: Briquet de Lemos/Livros, 2009. NISO (National Information Standards Organization). (2004). Understanding metadata. Bethesda, MD: NISO Press. Available: <http://www.niso.org/standards/resources/UnderstandingMetadata.pdf>. Acesso em: 15 set. 2009.

13

Potrebbero piacerti anche