Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
ARTIGO 04
Resumo: O artigo apresenta uma anlise comparativa dos modelos de metadados produzidos pelos principais projetos de
manuteno de documentos eletrnicos de arquivo. Esses projetos foram utilizados como referencial terico-metodolgico
para uma pesquisa de doutorado sobre a problemtica do documento eletrnico de arquivo, em andamento na Escola de
Cincia da Informao da Universidade Federal de Minas Gerais. Alm de divulgar os estudos j realizados no escopo dessa
pesquisa, o artigo tem como objetivo submeter apreciao da comunidade acadmica e dos profissionais ligados ao campo
da arquivstica um modelo preliminar de metadados para o gerenciamento eletrnico de documentos de carter arquivstico.
A expectativa promover a discusso acadmica em torno do tema e motivar o envio de crticas e sugestes que possam
contribuir para o desenvolvimento da pesquisa.
Palavras-chave: Arquivologia; Gesto de Documentos de Arquivo; Gesto Eletrnica de Documentos de Arquivo;
Documento Eletrnico de Arquivo; Metadados.
Abstract: This article presents a comparative study of metadata models proposed by some of the main projects on electronic
recordkeeping. These projects were analysed in order to formulate the theoretical and methodological basis for a doctoral
research project on the matter, which is being executed at School of Information Science of Federal University of Minas
Gerais, Brazil. The aim of this article is to make public and discuss the preliminary results of the research.
Keywords: Archival Science; Records Management; Electronic Recordkeeping; Electronic Record; Metadata.
1. Introduo
Em janeiro de 1991, pesquisadores de vrias reas do conhecimento e de diferentes pases se reuniram em
Washington, por iniciativa da National Historical Publications and Records Comission - NHPRC, rgo vinculado
ao National Archives and Records Administration - NARA. Os participantes desse encontro tiveram como objetivo
debater temas relacionados ao gerenciamento de documentos eletrnicos de carter arquivstico e produziram, ao
final do encontro, uma agenda contendo vrios itens a serem priorizados nas pesquisas da dcada que se iniciava
(NARA/NHPRC, 2000).
O encontro de Washington pode ser considerado um marco no desenvolvimento da pesquisa no campo dos
documentos eletrnicos de arquivo, pois, pela primeira vez, foi sistematizada uma agenda de pesquisa que se
desdobrou em projetos em vrias instituies acadmicas e arquivsticas. Alguns desses projetos foram
considerados fundamentais para compor o referencial terico do projeto de pesquisa para admisso no PPGCI [1],
nvel de doutorado, levando-se em conta o carter acadmico dos mesmos e a sua repercusso em eventos da rea.
Nesse artigo pretende-se desenvolver uma anlise comparativa desses projetos, de modo a se obter um
embasamento terico-metodolgico para a elaborao de um modelo conceitual de metadados, objetivo principal
da pesquisa de doutorado, ora em andamento. Os projetos selecionados para estudo foram os seguintes:
* Functional Requirements for Evidence in Recordkeeping- 1993 a 1996 (coordenado por Richardo Cox,
da Universidade de Pittsburgh, USA);
* Strategic Partnerships with Industry - Research & Training SPIRT 1998 a 1999 (coordenado por Sue
McKemmish da Universidade de Monash, Austrlia);
* International Research on Permanent Authentic Records in Electronic Systems - InterPARES - 1999 a
2001 (coordenado por Luciana Duranti, da Universidade de British Columbia, Canad).
Tentando cobrir o escopo mnimo necessrio para a compreenso dos assuntos tratados, o artigo foi estruturado nos
seguintes tpicos:
* o contexto do gerenciamento eletrnico de documentos de carter arquivstivo - GED/A
* metadados para preservao de objetos digitais
* o modelo de referncia Open Archival Information System (OAIS), um ponto de partida potencial para a
construo de uma estrutura de metadados de preservao digital
* estudo comparativo dos projetos de manuteno de documentos eletrnicos de carter arquivstico
* um modelo preliminar de metadados para gerenciamento eletrnico de documentos de carter arquivstico.
Cabe ressaltar o carter preliminar desses estudos, uma vez que a pesquisa encontra-se em andamento. A nossa
expectativa promover a discusso acadmica em torno do tema e motivar o envio de crticas e sugestes que
possam contribuir para o desenvolvimento desta pesquisa [2].
RECORDS MANAGEMENT
ELECTRONICS RECORDS
MANAGEMENTS
TRADITIONAL RECORDS
http://www.dgz.org.br/ago03/Art_04.htm (2 of 25)8/8/2005 08:27:29
MANAGEMENTS
Todos os
suportes,
inclusive papel
MANUAL
ELECTRONIC
RECORDKEEPING
Somente eletrnico
AUTOMATIZADO
Segundo a proposta do NARA, o termo "records management" est abrigando a gesto de documentos nos moldes
tradicionais, em que as operaes se davam manualmente, como tambm o uso de recursos eletrnicos para o
gerenciamento de documentos eletrnicos e outros suportes. Para esse ltimo caso, o NARA prope o termo
"electronic records management", cujo conceito poderia ser representado em lngua portuguesa pelo termo
gerenciamento eletrnico de documentos de carter arquivstico e pela sigla GED/A. Verifica-se, tambm, que
o termo "electronic recordkeeping", ainda segundo o NARA, est sendo usado para designar a parte desse
gerenciamento eletrnico que trata dos documentos efetivamente eletrnicos.
O estudo da literatura tem-nos levado a inferir que o termo "keeping" vem sendo empregado para se referir apenas
sistemtica de manuteno de documentos de arquivo, excluindo os processos gerenciais de planejamento e
administrao. Os projetos analisados neste artigo adotam o termo "recordkeeping" (sem o adjetivo "electronic")
para incorporar, dentro dessa sistemtica de manuteno, os documentos em suporte no eletrnico.
Considerando o exposto, estamos adotando ao longo deste artigo as seguintes tradues:
Os projetos analisados neste artigo e os principais autores do campo da arquivstica tm defendido a abordagem de
metadados para o gerenciamento eletrnico de documentos de arquivo, por considerarem mais adequada nova
realidade do alto volume de informao e complexidade do ambiente eletrnico. O grande desafio est na
identificao das caractersticas do mundo real e virtual (dos computadores) a serem preservadas.
Das trs categorias, a que tem recebido maior ateno, notadamente atravs da iniciativa de metadados Dublin
Core, a categoria descritiva que, como vimos, visa solucionar, apenas, a pesquisa de fontes eletrnicas.
Entretanto, conforme ressaltado pelo grupo OCLC/RLG, "a crescente preocupao dos desafios colocados pela
preservao digital - a reteno de objetos digitais por longo prazo - tem ressaltado a necessidade de metadados
alm da descoberta de fonte".
http://www.dgz.org.br/ago03/Art_04.htm (4 of 25)8/8/2005 08:27:29
Experincias anteriores no ambiente da computao indicam que o gerenciamento efetivo de objetos digitais tende
a ser facilitado atravs da criao, manuteno e evoluo de metadados. Os metadados podem, por exemplo,
documentar procedimentos associados preservao, especificar direitos de acesso e estabelecer a autenticidade do
contedo digital. Podem unir os diversos componentes constituintes de um objeto complexo e, ainda, as diversas
verses do mesmo objeto. Em resumo, a criao e o desdobramento de metadados de preservao tende a ser
um componente chave para a maioria das estratgias de preservao digital.
Assim, uma estrutura de metadados de preservao digital deve descrever os tipos de informao que devem ser
associados aos objetos digitais num ambiente de armazenamento e essa estrutura deve ser genrica, abrangente,
estruturada e aplicvel a uma vasta gama de objetos, atividades e instituies de preservao. Dentro dessa
perspectiva o modelo de referncia Open Archival Information System - OAIS tem-se destacado na comunidade
internacional dos profissionais ligados a instituies culturais, j contando com vrias iniciativas de implementao
(OCLC/RLG Working Group on Preservation Metadata, 2001, p. 6).
O modelo de referncia define um OAIS como "uma organizao de pessoas e sistemas que aceitaram a
responsabilidade de preservar informao e torn-la disponvel a uma Comunidade Alvo" (NASA/CCSDS, 2001).
Como pode ser observado pela FIG. 2, seu contexto formado pela interao de trs entidades: Produtores
(Producers), Consumidores (Consumers), e Gerncia (Management). Os Produtores fornecem as informaes que
o arquivo deve preservar. Os Consumidores so aqueles que utilizam tais informaes. Uma categoria especial de
Consumidores a Comunidade Alvo - o subconjunto de consumidores que deve entender a informao preservada
na forma armazenada. A Gerncia a entidade responsvel pelo estabelecimento das polticas gerais do arquivo,
dentro de um domnio mais abrangente de polticas.
digitais - e sua Informao de Representao (Representation Information) associada, isto , informao crtica
responsvel pela interpretao da cadeia de bit's do Objeto de Dados. A Informao de Representao pode ser
Estrutural (Structural) ou Semntica (Semantic). A Informao de Descrio de Preservao, por sua vez,
acrescenta significado Informao de Contedo em quatro aspectos: Informao de Referncia (Reference
Information), Informao de Provenincia (Provenance Information), Informao de Contexto (Context
Information) e Informao de Integridade (Fixity Information).
importante destacar a natureza recursiva da Informao de Representao. Se a prpria Informao de
Representao estiver na forma digital, mais Informao de Representao ser necessria para entender os seus
bit's e assim sucessivamente at um documento fsico, de total compreenso humana, que d incio ao o
processo de interpretao. Destaca-se, ainda, que a interpretao de um Objeto de Dados depende no somente da
Informao de Representao mas tambm da base de conhecimento dos Consumidores. Essa base de
conhecimento, utilizada para entender e interpretar os dados, externa ao modelo, no sendo, portanto, mantida,
desenvolvida ou preservada como parte da funo arquivstica.
Dada a fora do modelo de referncia OAIS, em vias de tornar-se um padro internacional (ISO 14.721), e sua
aplicabilidade aos objetivos do projeto de pesquisa, decidiu-se adot-lo como ponto de partida para a comparao
dos metadados dos modelos propostos pelos projetos analisados e elaborao de uma proposta preliminar.
por longo prazo, est ameaada por fatores de natureza diversa, tais como: a natureza proprietria do software e
meios de armazenamento, a obsolescncia tecnolgica, a grande diversidade de formatos, a grande complexidade
dos relacionamentos fsicos e lgicos no ambiente eletrnico, a fragilidade dos meios de armazenamento, a
facilidade de manipulao dos sistemas eletrnicos e a coexistncia de ambientes hbridos (convencional e
eletrnico).
Em termos de objetivos interessante verificar que os projetos podem ser considerados complementares. Enquanto
o projeto de Pittsburgh se dedica aos estudos de requisitos funcionais, o projeto SPIRT busca a definio de
metadados e o InterPARES volta-se para o desenvolvimento de polticas e estratgias. Na prtica, entretanto, o
projeto de Pittsburgh acabou modelando um conjunto de metadados que foi utilizado como base para o projeto
SPIRT.
Em termos de foco, os projetos de Pittsburgh e SPIRT preocupam-se com os arquivos nas fases corrente e
intermediria, por entenderem que uma soluo nessas fases se refletir naturalmente na fase subsequente - a
permanente. O projeto InterPARES, por sua vez, preocupa-se com os arquivos na fase permanente, e defende a
idia de que, nesta fase, cessam os interesses de preservao por parte da organizao produtora e, portanto, as
instituies pblicas devem assumir esse encargo em defesa dos interesses da sociedade. Nesse aspecto o projeto
InterPARES se diverge radicalmente do projeto de Pittsburgh e, por conseguinte, do projeto SPIRT, uma vez que
esses ltimos acreditam na possibilidade de permanncia dos documentos de arquivo nas organizaes produtoras
em sua fase permanente dentro da chamada "perspectiva de continuidade" (continuum perspective).
(ERLANDSSON, 1996)
Dentro de uma viso da arquivstica sistmica integrada contemplada nos pressupostos da legislao arquivstica
brasileira, acredita-se que os modelos devem ser adotados desde a fase corrente mas, de acordo com o projeto
InterPARES, julgamos necessria a transferncia definitiva dos documentos de arquivo para as instituies
arquivsticas pblicas em sua fase permanente.
Na verdade, vamos um pouco alm dessa idia e, em funo da natureza dinmica e flexvel dos negcios e do
legado de software aplicativo em funcionamento dentro das prprias organizaes produtoras, recomenda-se a
criao de um novo ambiente para a manuteno de documentos eletrnicos de carter arquivstico
considerados de valor permanente, ainda nas fases corrente e intermediria. Damos a esse novo ambiente o
nome de Armazm de Documentos de Arquivo (Records Warehouse) [8], cuja funo primordial manter
metadados para documentos de arquivo em formato convencional e eletrnico e, especificamente para os
documentos eletrnicos, promover seu recolhimento e formatao conforme padres de gerenciamento
previamente definidos. Cabe ressaltar que esse recolhimento se dar no ambiente operacional (hardware/
software) de gerao desse documentos.
5.2 Premissas e princpios fundamentais
O projeto de Pittsburgh parte das seguintes premissas:
d) reas de negcio similares tero os mesmos requisitos, mas a cultura corporativa determinar a escolha
das tticas; e
e) a cultura corporativa ser fator determinante para o atendimento dos requisitos.
Um dos pontos-chave para entendimento da abordagem adotada pelo projeto SPIRT a viso da gesto contnua
dos documentos de arquivo (continuum perspective). Na gesto contnua, os documentos no so vistos como
objetos passivos, descritos posteriormente no momento de sua transferncia para arquivos permanentes. Os
processos relacionados descrio podem iniciar no momento ou, mesmo, antes da criao dos documentos e
continuar ao longo de sua vida. No ambiente de rede e dos novos paradigmas emergentes da informao, o objeto
informacional do tipo documento (document-like infomation object DIO) pode, por si mesmo, tornar-se o agente
da ao. Nessa condio de agente, ele pode provocar a tomada automtica de decises ou atos, previamente
planejados por membros da organizao e, ainda, registrar essa deciso ou ato. Dentro dessa tica, as premissas
fundamentais do projeto so as seguintes:
a) possvel identificar, categorizar, rotular e apresentar de maneira formal e padronizada, metadados que
suportem a manuteno de documentos de arquivo atravs do tempo e espao independentemente de onde,
quando ou como esses metadados forem capturados; e
b) essencial desenvolver padres de metadados para a manuteno de documentos de arquivo, compatveis
com as iniciativas desenvolvidas na comunidade mais abrangente de metadados.
a) o projeto deve ser interdisciplinar e internacional, considerando o imenso escopo e abrangncia das
questes em torno da preservao por longo prazo de autnticos documentos de arquivo;
b) a tecnologia, por si s, no capaz de resolver todos os problemas ligados preservao de documentos
eletrnicos de arquivo por longo prazo (mesmo sabendo-se que os aspectos tecnolgicos inerentes questo
tendem a ser explorados em inmeros estudos e mtodos de migrao e que a indstria de software encontrase, de forma crescente, preocupada em desenvolver arquiteturas de sistemas abertos e promover
interoperabilidade entre tecnologias); e
c) na perspectiva da cincia arquivstica, a despeito de novas mdias e formatos de documentos eletrnicos,
os componentes essenciais que identificam e autenticam um documento de arquivo no se modificaram.
Nota-se que o projeto de Pittsburgh o nico a considerar em seus pressupostos a cultura corporativa como "fator
determinante para o atendimento dos requisitos". O projeto SPIRT focaliza a questo dos metadados como aspecto
central da preservao, bem como a interoperabilidade com outros padres de metadados para futuras trocas de
informao e utilizao de padres e ferramentas comuns. O projeto InterPARES destaca-se por retirar a nfase na
tecnologia voltando-se para o estudo e adaptao dos processos arquivsticos tradicionais.
Os trs aspectos levantados pelos projetos so importantes para um ambiente eletrnico para manuteno de
documentos de arquivo mas, a partir de nossos estudos, consideramos igualmente importantes os seguintes:
a) o documento eletrnico deve ser considerado dentro das seguintes perspectivas: documento originalmente
eletrnico versus documento digitalizado para fins de preservao/acesso e documentos que registram os
atos da organizao (fatos ou eventos) versus documentos ou informaes utilizadas exclusivamente para
fins de processamento eletrnico (potencialidades);
b) a tecnologia deve servir ao homem, no o homem tecnologia;
c) uma maior fragmentao no gerenciamento da informao arquivstica deve ser evitada, buscando-se uma
soluo conjunta, que leve em conta os documentos convencionais e eletrnicos;
d) tendo em vista o carter legal, cultural e histrico da informao arquivstica, a dependncia de hardware
e software deve ser minimizada a partir do uso de padres abertos;
e) tendo em vista as barreiras econmicas que assolam nossa regio e os altos custos envolvidos na
montagem de ambientes eletrnicos voltados para a manuteno segura de documentos de arquivo por
longo prazo, as solues conjuntas devem ser incentivadas.
a) Manuseio (Handle Layer): "declara" o documento de arquivo, indica seu contexto (em nvel de transao)
e fornece os termos para sua pesquisa;
b) Termos e Condies (Terms & Conditions Layer): define os controles de acesso, uso e destinao
(disposition);
c) Estrutura (Structural Layer): detalha a estrutura de armazenamento e apresentao dos dados para
permitir a manuteno de seu valor de prova e a migrao para novo software e hardware;
d) Contexto (Contextual Layer): identifica a origem (ou seja, a pessoa, sistema ou dispositivo responsvel
pela criao do documento de arquivo) e fornece dados de suporte para uso do documento de arquivo como
evidncia de uma transao;
e) Contedo (Content Layer): contm os dados realmente envolvidos na transao;
f) Histrico de Uso (Use History Layer): documenta os usos significativos do documento de arquivo aps
sua criao, incluindo descrio, reedies (redacted releases), e destinao/ eliminao (disposition/
destruction) autorizada pelo perodo de reteno.
O esquema de metadados definido no projeto SPIRT, Australian Recordkeeping Metadata Schema RKMS, foi
construdo sobre um arranjo estrutural [19] que considera quatro classes de entidades primrias: Transaes
(Business), Agentes (Agents), Documentos-de-Arquivo (Records) e Processos-Arquivsticos (BusinessRecordkeeping), bem como os Relacionamentos (Relationships) entre as entidades e os Instrumentos-Legais
(Mandates) que governam as entidades e seus relacionamentos. O RKMS possibilita a captura de contexto de duas
formas: como texto dentro de uma descrio de metadado, ou como um relacionamento com outras entidades. No
segundo, deve-se tomar as devidas precaues para garantia da integridade dos relacionamentos. Qualquer dvida a
esse respeito pode indicar a implementao de metadados centrados nos documentos de arquivo [20]. A estrutura
do RKMS prev a descrio das entidades em diversos nveis de agregao. O esquema inclui uma lista completa
dos nveis de agregao permitidos. Cada uma das entidades tem um conjunto prprio de metadados com dez
elementos comuns: Categoria (Category Type), Identificador (Identifier), Nome (Title), Data (Date), Instrumento
Legal (Mandate), Local (Place), Classificao Funcional (Functional Classification), Relacionamento (Relation),
Resumo (Abstract), Idioma (Language). Para a entidade Documentos-deArquivo foram definidos os seguintes
elementos especficos: Classificao Temtica (Subject Classification), Tipo Documental (Documentary Form),
Avaliao (Appraisal), Controle (Control), Preservao (Preservation), Recuperao (Retrieval), Acesso (Acess),
Uso (Use), Histrico (Event History). Os Relacionamentos e os Instrumentos-Legais ainda no foram descritos
como entidades, permanecendo apenas como elementos. A sintaxe do RKMS suporta descries de elementos,
altamente estruturadas, com a possibilidade de desdobramento atravs do emprego de qualificadores [21], domnio
de valor [22], referncias a autoridades de registro [23] e sintaxe [24]. Prev, ainda, a utilizao de elementos de
outros esquemas de metadados, permitindo que suas descries possam ser estendidas atravs da estrutura e
http://www.dgz.org.br/ago03/Art_04.htm (12 of 25)8/8/2005 08:27:29
Categorias identificadas
para um Open Archival
Information System OAIS
mtodo.
1.2.1.2.5. Mtodo de Criptografia (Encryption-Method):
identifica os algoritmos empregados para criptografar o
contedo do documento; todos os documentos de so
armazenados na forma "descriptografada", como teriam sido
vistos pelos receptores.
1.2.1.3. Apresentao do Arquivo de Dados (File Rendering):
identifica aspectos especficos para que o documento possa ser
devidamente visualizado no momento do recebimento.
1.2.1.3.1. Dependncia de Aplicao (Application
Dependency): indica, quando for o caso, as aplicaes das
quais o documento depende; se existirem dependncias, o
nome da aplicao, verso e informao de registro so
documentados em cada ocorrncia do campo no momento da
criao do documento; essa informao deve servir como
ponteiro para uma biblioteca registrada mantida pela
organizao produtora ou uma entidade pblica tal como o
Registro de Patentes.
1.2.1.3.2. Dependncia de Software (Software-EnvironmentDependency): indica, quando for o caso, o software bsico,
incluindo sistemas operacionais e APIs , do qual o
documento dependente; se existir uma dependncia, o
nome do(s) pacote(s) de software, a verso, informao de
registro e informao de apresentao (tais como grupos de
fontes ou outros atributos dependentes de software) so
documentados no momento da criao do documento.
1.2.1.3.3. Dependncia de Hardware (HardwareDependency): indica, quando for o caso, o hardware do qual
o documento dependente; se existir uma dependncia, o
hardware necessrio, modelo, nmero, configurao e
informao de sada (tais como, impressoras ou
visualizadores necessrios ou outros atributos de
dependncia de hardware) so documentados no momento
da criao do documento.
1.2.1.3.4. Regras de Apresentao (Rendenring-Rules):
identifica os procedimentos necessrios para que o
documento seja apresentado na tela, impressora ou de outra
forma representado como no momento da criao (macros,
dimension, dados geo-referenciados, etc.) pode operar em
nveis diferentes.
1.2.1.3.5. Padro de Representao (RepresentatonStandard/De Facto Standard): identifica padro(es),
incluindo a verso, aplicado(s) ao arquivo de dados que
afetam sua forma de apresentao (ex: SGML, Postcript,
http://www.dgz.org.br/ago03/Art_04.htm (15 of 25)8/8/2005 08:27:29
TIFF, etc).
1.2.1.4. Apresentao do Documento de Arquivo (Record
Rendering): aplica-se ao documento como um todo, uma vez que os
arquivos de dados tenham sido apresentados corretamente de acordo
com sua regra prpria.
1.2.1.4.1. Regra ou Padro de Ligao dos Arquivos (FileLinking-Rule/Standard): identifica as regras ou padres
necessrios para possibilitar as ligaes necessrias entre os
arquivos de dados que produzem o documento; contem
informao textual a respeito das regras ou padres
aplicados.
1.2.1.4.2. Padro para Intercmbio de Dados: Verso (FileInterchange-Standard: Version): identifica o(s) padro(es),
incluindo a verso, empregado(s) pelo documento para
possibilitar o intercmbio de arquivo de dados.
1.2.2. Informao
Semntica: acrescenta
significado s estruturas de
dados identificadas pela
Informao Estrutural (por
exemplo, idioma)
2.3. Informao de
Contexto: documenta os
relacionamentos da
Informao de Contedo
com seu ambiente (por
exemplo, porque foi criado,
relacionamentos com
outras Informaes de
contedo)
3. Informao de
Empacotamento: une ou
relaciona, realmente ou
logicamente, a Informao
de Contedo e a
Informao de Descrio
de Preservao, numa
entidade identificvel,
numa mdia especfica
Tendo em mente uma aplicao em nvel mundial, seria interessante associar ao identificador do documento de
arquivo uma identificao nica para o sistema eletrnico de gerenciamento de documentos de carter arquivstico
ou, conforme nossa proposio, para o Armazm de Documentos de Arquivo (Records Warehouse). O nome do
sistema poderia ser formatado de acordo com um padro que oferece aos usurios ou outros arquivos parceiros a
informao necessria para estabelecer uma conexo, como o padro ISO X.500 Directory Services Naming.
(NASA/CCSDS, 2001)
H, tambm, um aspecto de suma importncia a ser destacado no que diz respeito ao item 1.2 (Informao de
Representao). O modelo de referncia OAIS afirma que "a preservao de informao por prazo indeterminado
exige uma descrio completa e compreensvel da Informao de Representao". Exemplificando com um
documento produzido em processador de texto recomenda que "se o formato do processador de texto for
proprietrio e no puder ser adquirido, mesmo no nvel de um simples visualizador de documento, necessrio
migrar o documento para um formato no proprietrio para assegurar sua Preservao por Longo Prazo" (NASA/
CCSDS, 2001). Sobre essa questo a comunidade arquivstica deve acompanhar o desenvolvimento do padro
Portable Document Format/Archive - PDF/A cujo "principal objetivo oferecer 'padres para preparao de
documentos e metadados associados para fins arquivsticos', ou seja, permitir que as pginas de um documento
armazenadas como um PDF/A sejam vistas da mesma forma daqui a 50 anos". Se tudo correr bem, o padro deve
ser publicado pela ISO em dois anos. Os primeiros documentos esto programados para 18 de novembro de 2003.
(DUHON, 2002)
Levando-se em conta as possibilidades de um projeto individual de pesquisa, com o nvel de aprofundamento
desejvel, a etapa seguinte desta pesquisa buscar detalhar e validar, para o caso brasileiro, as condies
necessrias ao adequado monitoramento das tecnologias (hardware/software/mdia) envolvidas no funcionamento
de um Armazm de Documentos de Arquivo (Records Warehouse). Acredita-se que aos elementos factuais
inseridos no item 1.2.1.3 (Apresentao do arquivo) devam ser associados indicadores gerenciais que apontem,
com um grau confiabilidade desejvel, a necessidade de planejamento de aes preventivas de preservao
(migrao, converso, emulao, dentre outras).
Notas
http://www.dgz.org.br/ago03/Art_04.htm (20 of 25)8/8/2005 08:27:29
[1] THOMAZ, Katia P. A guarda de documentos eletrnicos de arquivo; novos desafios, velhos problemas. Belo
Horizonte, 2002. (Projeto de pesquisa)
[2] Interessados podero enviar crticas/sugestes atravs do endereo de correio eletrnico katia.thomaz@uol.com.
br.
[3] Para maiores detalhes a respeito do modelo consultar NATIONAL AERONAUTICS AND SPACE
ADMINISTRATION (NASA). Consultative Committee for Space Data Systems (CCSDS). Reference model for an
Open ArchivalInformation System (OAIS); draft recommendation. Washington, 2001.
[4] UML - Unified Modeling Language, uma notao padro para modelagem de objetos do mundo real, como
primeiro passo no desenvolvimento de uma metodologia de anlise e desenho de sistemas orientada-a-objeto.
[5] Julgamos mais adequada a traduo do termo ingls "container" para o portugus "continente", que segundo o
Dicionrio Aurlio Eletrnico Sculo XXI - Verso 3 - Novembro de 1999, significa "aquilo que contm algo" (3),
sentido exato que desejamos expressar.
[6] Para o projeto de Pittsburgh, requisitos funcionais (functional requirements) so o conjunto de elementos
necessrios para garantir o adequado funcionamento de um sistema de manuteno de documentos de arquivo ou
documentos eletrnicos de arquivo, extrados da literatura (Arquivstica, Computao, Direito e Administrao), de
padres nacionais e internacionais, da legislao e das necessidades especficas de uma organizao.
[7] Para o projeto de Pittsburgh, sistemas de manuteno de documentos de arquivo (recordkeeping systems),
so "sistemas que criam, identificam, capturam, mantm e usam documentos de arquivo, independente se na forma
eletrnica ou papel". (UNIVERSITY OF PITTSBURGH. School of Information Sciences, 2001)
[8] A escolha do nome se deu por uma analogia ao termo Armazm de Dados (Data Warehouse) da computao
que trata-se de um repositrio central para todos ou parte dos dados significativos colecionados pelos diversos
sistemas de negcios de uma organizao. Um Armazm de Dados, tipicamente, reside num servidor de grande
porte (mainframe) de uma organizao. Os dados das diversas aplicaes de processamento de transao on-line
(on-line transaction processing - OLTP) e outras fontes so seletivamente extrados e organizados no banco de
dados do armazm para uso por aplicaes analticas e consultas de usurios (<www.whatis.com> em 22 jan.
2003).
[9] Documentos convencionais de arquivo so aqueles em formatos variados no eletrnicos, como papel,
microforma, etc. (NARA/NHPRC, 2000)
[10] A equipe do projeto de Pittsburgh utilizou uma tcnica do campo da inteligncia artificial para expressar
formalmente cada requisito funcional numa linguagem de regras de produo. Espera-se que essas regras possam
ser testadas em avaliaes de sistemas de manuteno de documentos de arquivo. (UNIVERSITY OF
PITTSBURGH. School of Information Sciences, 2001)
[11] Resource Description Framework "uma iniciativa do World Wide Web Consortium para permitir a criao,
intercmbio e uso de metadados. O RDF fornece um arcabouo (framework) sobre o qual as comunidades
independentes podem desenvolver vocabulrios de metadados que atendam suas necessidades especficas e
compartilhar esses vocabulrios com outras comunidades. O RDF define uma linguagem para descrio desses
vocabulrios, influenciada pelas idias de representao de conhecimento da inteligncia artificial e das
comunidades de banco de dados". (W3C RDF Homepage: <http://www.w3.org/RDF> )
[12] Object-Role Modelling "um mtodo para o desenho de modelos de base de dados. uma abordagem de
modelagem conceitual, ou seja, especifica o modelo utilizando conceitos e linguagem de fcil entendimento para
usurios leigos. Vislumbra o mundo em termos de objetos e papis que desempenham. Atravs de uma tcnica
http://www.dgz.org.br/ago03/Art_04.htm (21 of 25)8/8/2005 08:27:29
especfica de desenho de esquema conceitual, esses objetos e papis so identificados e expressos em sentenas de
linguagem natural elementar. O ORM particularmente adequado modelagem de um esquema de metadados. Em
primeiro lugar, porque mais expressiva do que outras (tal como a modelagem de entidade-relacionamento) e essa
expressividade permite um nvel mais elevado de detalhamento e, consequentemente, uma anlise mais rigorosa.
Em segundo lugar, porque um diagrama ORM pode ser povoado com amostras de dados, permitindo a validao
por um especialista utilizando linguagem natural e exemplos reais." (UNIVERSITY OF PITTSBURGH. School of
Information Sciences, 2001)
[13] ISO/IEC 11179-1 Information technology - Specification and standardization of data elements - Part 1-6.
"Para facilitar as comunicaes eletrnicas globais, a comunidade de Padres Internacionais tem insistentemente
trabalhado para definir um Open Systems Interconnection Environment (OSIE) dentro do qual diferentes hardware
e aplicaes possam compartilhar informaes. Padres vm sendo propostos ou definidos para trs (hardware,
software e comunicaes) dos quatro (hardware, software, comunicaes e dados) componentes bsicos
necessrios para sistemas abertos de processamento de informaes. A norma ISO/IEC 11179 para especificao
de dados, constitui o quarto componente para sistemas abertos de informao, oferecendo mecanismos para
permitir que dados sejam compartilhados no OSIE". (ISO/IEC 11179, 1999)
[14] Engenheiro do conhecimento o "cientista da informtica que constri um sistema especialista atravs da
aquisio do conhecimento necessrio e da converso desse conhecimento em um programa" (MICROSOFT
PRESS, 1998). As caractersticas exigidas para esse profissional geralmente so obscuras sendo, a maioria deles,
portanto, auto-didatas. PAYNE & AWAD (citados por BARACSKAI & VALENCEI, 2002) esclarecem que seus
conhecimentos e habilidades incluem: conhecimento da tecnologia da computao, tcnicas gerais de localizao
de fatos, mtodos de prototipao, fatores humanos, reas funcionais, habilidades de comunicao, habilidades de
planejamento de projeto, habilidades de relacionamento humano, habilidades organizacionais e qualidades
pessoais.
[15] Uma entidade "qualquer coisa de interesse, concreta ou abstrata, incluindo associaes entre coisas". (ISO/
IEC 11179, 1999).
[16] Um atributo uma caracterstica de um objeto ou entidade. (ISO/IEC 11179, 1999)
[17] IDEF(0) - Integration Definition for Function Modelling um US Federal Information Processing Standard
para elaborao de modelos funcionais, detalhado na Publicao 183 do National Institute of Standards of
Technology - NIST de 21 de dezembro de 1993. Segundo este padro, "um modelo funcional uma representao
estruturada das funes, atividades ou processos dentro do sistema modelado ou rea de assunto".
[18]eXtensible Markup Language - XML um formato de texto bastante flexvel derivada da SGML (ISO 8879),
originalmente desenhada para atender os desafios da publicao eletrnica em grande escala (W3C, 2003). XML
vem desempenhando, de forma crescente, um importante papel no intercmbio de uma grande variedade de dados
na Web e qualquer outro ambiente. Segundo ROCKLEY (2002), suas principais vantagens so: (1) possibilita a
determinao de uma estrutura previamente definida, (2) tem como meta principal "tornar documentos
transportveis atravs de sistemas e aplicaes", (3) oferece liberdade para definio de nomes de rtulos (tags), (4)
foi especificamente projetada para trabalhar com bases de dados; (5) apresenta um poderoso mecanismo, XSL
(eXtensible Style Language), tanto para transformar quanto para formatar documentos XML; e (6) permite
adaptaes e personalizaes.
[19]Um arranjo estrutural um "mtodo de posicionamento de objetos em um contexto demonstrando seus
relacionamentos com outros objetos". Exemplos incluem modelos de entidade-relacionamento, taxonomias e
ontologias. (ISO/IEC 11179, 1999)
[20]Metadados centrados nos documentos de arquivo significa que todas as informaes de contexto sero
transportadas ou reproduzidas dentro dos limites do sistema de manuteno de documentos de arquivo
http://www.dgz.org.br/ago03/Art_04.htm (22 of 25)8/8/2005 08:27:29
propriamente dito, evitando-se qualquer referncia a fontes ou sistemas externos. (MONASH UNIVERSITY.
School of Information Management and Systems. Records Continuum Research Group, 2000)
[21]Qualificador "um termo que ajuda a definir e construir um conceito nico" (ISO/IEC 11179, 1999), como
por exemplo, nascimento para data de nascimento.
[22]Domnio de valor "o conjunto de valores permitidos" para um elemento de metadado. (ISO/IEC 11179,
1999)
[23]Autoridade de Registro "uma organizao autorizada a registrar elementos de dados ou outros
objetos" (ISO/IEC 11179, 1999), onde devero, futuramente, ser depositados os Esquemas de Metadados formais
(poderamos, talvez, fazer uma analogia com a Autoridade de Registro da Infra-Estrutura de Chaves Pblicas do
Governo Brasileiro e a assinatura digital).
[24]Sintaxe "uma estrutura de expresses de uma linguagem, e as regras que governam essas estruturas;
relacionamentos entre caracteres ou grupo de caracteres, independentemente do seus significados ou da forma de
interpretao e uso". (ISO/IEC 11179, 1999)
[25]Julgamos mais adequada a traduo do termo ingls "file", no sentido da computao, para o portugus
"arquivo de dados". Um arquivo de dados , portanto, uma entidade discreta, disponvel aos usurios do sistema
(incluindo o prprio sistema operacional e seus programas aplicativos). Para ser identificado, um arquivo de dados
precisa ter um nome nico dentro de um domnio (diretrio) especfico. Alguns sistemas operacionais e aplicaes
descrevem arquivos de dados de determinados formatos atravs de um sufixo especfico (tambm conhecido como
extenso do arquivo).
[26]A abordagem mais bsica [de assinatura eletrnica] simplesmente escrever seu nome. [...] Outro tipo de
abordagem capturar e apresentar uma imagem digitalizada da assinatura pessoal dentro do documento para
ilustrar a aprovao do contedo do documento e identificar o assinante. [...] Algumas aplicaes tambm coletam
dados biomtricos sobre a presso e o trao da assinatura e, ento, fecham o documento de forma que nenhuma
mudana possa anular a assinatura e as caractersticas da assinatura possam ser associadas ao usurio.
A maioria das solues de assinatura exigem software aplicativo tanto no computador do assinante quanto do
receptor. Isso pode funcionar bem dentro de uma organizao mas poderia no ser prtico entre indivduos ou
organizaes no vinculados. Na tentativa de preencher essa grande necessidade surgem as assinaturas digitais
[grifo nosso] utilizadas dentro de uma infra-estrutura de chave pblica ou ICP [...] que repousam no complexo
mundo da criptografia assimtrica." (MINIHAM, 2002)
Referncias Bibliogrficas
ARQUIVO NACIONAL. Conselho Nacional De Arquivos. Resoluo n. 4 - 28 mar. 1996. Dispe sobre o Cdigo
de Classificao de Documentos de Arquivo para a Administrao Pblica: Atividades-Meio, a ser adotado como
modelo para os arquivos correntes dos rgos e entidades integrantes do Sistema Nacional de Arquivos (SINAR),
e aprova os prazos de guarda e a destinao de documentos estabelecidos na Tabela Bsica de Temporalidade e
Destinao de Documentos de Arquivo Relativos s Atividades-Meio da Administrao Pblica.
BAILEY, C. Archival theory and machine readable records; some problems and issues. Vancouver: University of
British Columbia, 1988. (dissertao, mestrado).
BARACSKAI, Zoltn, VELENCEI, Joln. Important characteristics for a knowledge engineer. Budapest: DoctuS
http://www.dgz.org.br/ago03/Art_04.htm (23 of 25)8/8/2005 08:27:29
TM
pela CompTIA
TM