Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Keywords: Data collection. Platform Lattes (Brazilian curricula database). Institutional repository.
117
PontodeAcesso, Salvador, v.9, n.3, p. 117-132, dez. 2015
www.pontodeacesso.ici.ufba.br
1 INTRODUO
118
PontodeAcesso, Salvador, v.9, n.3, p. 117-132, dez. 2015
www.pontodeacesso.ici.ufba.br
119
PontodeAcesso, Salvador, v.9, n.3, p. 117-132, dez. 2015
www.pontodeacesso.ici.ufba.br
120
PontodeAcesso, Salvador, v.9, n.3, p. 117-132, dez. 2015
www.pontodeacesso.ici.ufba.br
121
PontodeAcesso, Salvador, v.9, n.3, p. 117-132, dez. 2015
www.pontodeacesso.ici.ufba.br
3.2 Converso
Aps a coleta e a juno dos currculos, foi necessrio converter os registros presentes
dentro deles em registros em um formato de importao aceito pelo DSpace e de acordo os
metadados utilizados no Repositrio.
Entre as diferentes linguagens de programao que poderiam ser utilizadas nessa
converso, foi escolhida a XSLT. Essa escolha deu-se em razo do uso que a Equipe j fazia
dessa linguagem para a converso dos registros de outras fontes (Web of Science, SciELO e
Scopus), como relatado por Assumpo et al. (2014).
A XSLT uma das tecnologias relacionadas XML desenvolvidas pelo World Wide
Web Consortium (W3C) (Consrcio World Wide Web) (W3C, 2007). Essa linguagem contm
um conjunto de elementos e de atributos para a criao de regras que, em folhas de estilo, so
utilizadas principalmente (1) para converter documentos XML em documentos HTML para
apresentao em navegadores e (2) para converter documentos XML criados com uma
linguagem de marcao em documentos XML de acordo com outra linguagem de marcao
ou em outros formatos, por exemplo, em um formato de texto simples (.txt).
Uma vez que com a XSLT possvel converter um documento XML em outro
documento XML ou um documento em outro formato, o fluxo para a converso dos registros
presentes nos currculos foi estabelecido como apresentado na Figura 1.
122
PontodeAcesso, Salvador, v.9, n.3, p. 117-132, dez. 2015
www.pontodeacesso.ici.ufba.br
123
PontodeAcesso, Salvador, v.9, n.3, p. 117-132, dez. 2015
www.pontodeacesso.ici.ufba.br
verificao dos dados, etc.). Um arquivo CSV um arquivo semelhante a uma planilha
(contem linhas e colunas), sendo que cada coluna representa um metadado e cada linha
representa um registro. Os arquivos no formato CSV podem ser visualizados e editados em
programas como o Microsoft Office Excel e LibreOffice Calc, embora este ltimo seja o mais
recomendado para a edio de dados para importao no DSpace.
A folha de estilo utilizada na primeira converso, alm de transformar o arquivo XML
com os currculos em um arquivo XML de acordo com os metadados utilizados no
Repositrio, permitiu a adequao dos dados e a seleo apenas dos registros de interesse para
o Repositrio.
Adequao dos dados envolveu, em outros: (1) a transformao dos valores, por
exemplo, a transformao da palavra Portugus no cdigo por da norma ISO 639-2; (2) a
juno de valores, por exemplo, ttulo do peridico, volume, nmero, ano, etc. foram juntados
para compor a referncia do documento; (3) e a correo do uso de maisculas, por exemplo,
nos ttulos dos peridicos.
Para a seleo dos registros de interesse foi estabelecido um filtro que permitiu a
converso apenas dos registros referentes aos artigos cientficos. A deciso por converter
apenas os artigos, descartando, assim, livros, captulos de livros, trabalhos publicados em
anais de eventos, etc., foi tomada considerando, principalmente:
eventos, por exemplo, nem sempre esto disponveis na Web ou podem ser facilmente
localizados, j os livros e seus captulos, so publicados na maior parte das vezes apenas em
formato impresso.
Aps a concluso das converses, o arquivo no formato CSV resultante foi
encaminhado para a etapa de remoo dos registros duplicados, descrita no item seguinte.
125
PontodeAcesso, Salvador, v.9, n.3, p. 117-132, dez. 2015
www.pontodeacesso.ici.ufba.br
completar os dados que no puderam ser obtidos a partir dos currculos, por
corrigir possveis erros, por exemplo, ordem dos autores e o endereo correto
Equipe Tcnica, para incluir automaticamente no DSpace cada arquivo PDF em seu
respectivo registro, poupando, assim, o trabalho manual de upload desses arquivos um-a-um
no Repositrio.
4 RESULTADOS ALCANADOS
Segundo
seu
anurio
estatstico
de 2015
(UNIVERSIDADE ESTADUAL
PAULISTA, 2015, p. 3), a UNESP conta com 3.880 docentes, distribudos em 34 unidades
universitrias localizadas em 24 cidades do estado de So Paulo. Algumas unidades
contemplam apenas uma rea de estudo, por exemplo, as faculdades de odontologia, enquanto
outras contemplam diversas reas, por exemplo, o Instituto de Biocincias, Letras e Cincias
Exatas (IBILCE).
Considerando essa configurao da Universidade e a disponibilidade de recursos
humanos na Equipe Tcnica, a coleta dos dados da Plataforma Lattes para o povoamento do
Repositrio foi pensada para ser executada em uma unidade universitria de cada vez. Alm
disso, foi definido que, inicialmente, seriam coletados apenas os dados referentes aos artigos
publicados nos cinco anos anteriores (2010 a 2014).
Para a conduo de um projeto piloto que possibilitasse a verificao e o
aperfeioamento dos procedimentos esquematizados pela Equipe Tcnica, foi utilizada a
Faculdade de Filosofia e Cincias (FFC). Essa unidade contava com 180 docentes distribudos
em dez departamentos (Administrao e superviso escolar, Cincia da informao, Cincias
polticas e econmicas, Didtica, Educao especial, Filosofia, Fisioterapia e terapia
Ocupacional, Fonoaudiologia, Psicologia da educao, e Sociologia e antropologia), cuja
produo cientfica predominantemente da rea de cincias humanas.
Os 180 currculos foram coletados no final de janeiro de 2015 e deles puderam ser
extrados 1.701 registros referentes a artigos publicados no perodo de 2010 a 2014. Aps a
remoo das duplicaes, restaram 1.150 registros, que foram encaminhados para a etapa de
verificao dos dados e das licenas e de coleta dos arquivos digitais. A verificao foi
realizada pela Equipe Tcnica, composta por trs bibliotecrios, durante cerca de duas
semanas e meia. Ao final da verificao, foram removidos os registros que no faziam parte
da produo institucional ou eram duplicados mas no foram identificados na etapa de
128
PontodeAcesso, Salvador, v.9, n.3, p. 117-132, dez. 2015
www.pontodeacesso.ici.ufba.br
remoo de registros duplicados. Os 959 registros restantes foram ento organizados nas
colees e importados no Repositrio junto dos 760 arquivos digitais que puderam ser
coletados para o arquivamento.
Antes da importao dos registros obtidos a partir da Plataforma Lattes, as colees da
FFC no Repositrio somavam 630 artigos. Aps a importao, essa quantidade passou para
1.589, o que representa um aumento de 152%.
Considerando os resultados obtidos com o piloto realizado na FFC, os procedimentos
utilizados foram considerados adequados e passaram a integrar o rol de procedimentos j
estabelecidos para o povoamento do Repositrio. Com isso, foi iniciada a coleta dos
currculos dos docentes das demais unidades universitrias da UNESP. At a data da redao
deste trabalho (setembro de 2015) foram coletados, convertidos, verificados e importados os
registros referentes aos currculos dos docentes de 6 unidades universitrias. A quantidade de
artigos includa no Repositrio a partir da Plataforma Lattes para cada uma dessas unidades
universitrias apresentada na Tabela 1.
Tabela 1 Quantidade de artigos includos no Repositrio a partir da Plataforma Lattes
Unidade universitria
Faculdade de Filosofia e
Cincias (FFC)
Instituto de Biocincias,
Letras e Cincias Exatas
de So Jos do Rio Preto
(IBILCE)
1.
Instituto
de Qumica de Araraquara
(IQ)
Faculdade de Cincias e
Letras de Araraquara
(FCLAR)
Faculdade de Odontologia
de Araraquara (FOAR)
Faculdade de Cincias e
Letras de Assis (FCLAS)
Quant. de
docentes
Quant. de
artigos antes
da coleta do
Lattes
Quant. de
artigos
coletados
do Lattes
Quant. de
artigos aps
a coleta do
Lattes
Aumento da
quantidade de
artigos (%)
180
630
959
1.589
152%
251
2.439
662
3.101
26%
116
4.376
240
4.616
5,48%
252
1.869
889
2.758
47,56%
125
2.946
764
3.710
26%
167
1.355
560
1.915
41,32%
129
PontodeAcesso, Salvador, v.9, n.3, p. 117-132, dez. 2015
www.pontodeacesso.ici.ufba.br
5 CONSIDERAES FINAIS
Nessas consideraes finais, dois dos entraves encontrados pela Equipe Tcnica
durante a realizao dos procedimentos merecem destaque: (1) o mau preenchimento dos
currculos e (2) a falta de clareza das revistas nacionais sobre as polticas de direitos autorais.
Apesar da importncia da Plataforma Lattes enquanto reflexo da produo cientfica
ser reconhecida pelos docentes, observa-se, com uma alta frequncia, o preenchimento
incorreto dos currculos nessa Plataforma, sendo dois dos erros mais frequentes a ordem
incorreta dos autores e os links incorretos. Isso evidencia, entre outros, a necessidade de aes
da Universidade para a conscientizao e a capacitao para o preenchimento do currculo.
Ainda que a maior parte das revistas nacionais disponibilize seus artigos
gratuitamente, nota-se pouca clareza de seus editores acerca das questes de direitos autorais
e de acesso aberto. possvel encontrar, por exemplo, revistas sem qualquer meno aos
direitos autorais ou com declaraes contraditrias, tais como o uso de uma licena Creative
Commons seguida pela frase Reproduo proibida ou Todos os direitos reservados.
Esses entraves, multiplicados, por exemplo, por um mil artigos, aumentam
consideravelmente o tempo demandado pela Equipe Tcnica na preparao dos registros para
a importao no Repositrio. No entanto, mesmo com esses entraves, o uso dos dados da
Plataforma Lattes, assim como ocorre com o uso dos dados da Web of Science, da SciELO e
da Scopus, isentar o docente do esforo de submeter sua produo no Repositrio ou envi-la
para uma submisso mediada, sendo que essa iseno do docente considerada um aspecto
importante para o desenvolvimento do Repositrio Institucional UNESP.
Embora os resultados alcanados no permitam uma generalizao, pode-se destacar
que, como estimado pela Equipe Tcnica, a utilizao dos currculos da Plataforma Lattes
mostrou-se vantajosa para as reas de cincias humanas, cuja produo cientfica nacional
pouco contemplada nas bases de dados que at ento haviam sido utilizadas como fontes de
dados. Com isso, entende-se que os procedimentos apresentados neste trabalho esto
permitindo ao Repositrio contemplar a produo da Universidade de maneira mais fidedigna,
compensando a nfase que at ento havia sido dada s publicaes das reas de cincias
exatas e biolgicas.
Por fim, destaca-se que existem procedimentos e ferramentas para a integrao dos
repositrios s plataformas de currculos (por exemplo, Lattes e DeGis) com o objetivo de
130
PontodeAcesso, Salvador, v.9, n.3, p. 117-132, dez. 2015
www.pontodeacesso.ici.ufba.br
REFERNCIAS
ASSUMPO, F. S. et al. A converso de registros na implantao de repositrios institucionais: o caso do
Repositrio Institucional UNESP. In: SEMINRIO NACIONAL DE BIBLIOTECAS UNIVERSITRIAS, 18.,
2014, Belo Horizonte. Anais... Belo Horizonte: UFMG, 2014. p. 1-16. Disponvel em:
<http://hdl.handle.net/11449/123645>. Acesso em: 16 set. 2015.
CONSELHO NACIONAL DE DESENVOLVIMENTO CIENTFICO E TECNOLGICO. Sobre a
Plataforma Lattes. Braslia, [2015?] Disponvel em: <http://www.cnpq.br/web/portal-lattes/sobre-aplataforma>. Acesso em: 16 set. 2015.
IMPORTING Items via basic bibliographic formats (Endnote, BibTex, RIS, TSV, CSV) and online services
(OAI, arXiv, PubMed, CrossRef, CiNii). In: DSPACE 5.x Documentation. DuraSpace, 2015. Disponvel em:
<https://wiki.duraspace.org/pages/viewpage.action?pageId=45548176>. Acesso em: 16 set. 2015.
LEITE, F. et al. Boas prticas para a construo de repositrios institucionais da produo cientfica.
Braslia: Ibict, 2012. Disponvel em: <http://livroaberto.ibict.br/handle/1/703>. Acesso em: 16 set. 2015.
MACIAS-CHAPULA, C. A. O papel da informetria e da cienciometria e sua perspectiva nacional e
internacional. Cincia da Informao, v. 27, n. 2, p. 134-140, maio/ago.1998. Disponvel em:
<http://dx.doi.org/10.1590/S0100-19651998000200005>. Acesso em: 16 set. 2015.
SHERPA/RoMEO. FAQ: Publisher copyright policies & self-archiving. Nottingham, 2011. Disponvel em:
<http://www.sherpa.ac.uk/romeo/faq.php>. Acesso em: 21 set. 2015.
UNIVERSIDADE ESTADUAL PAULISTA. Anurio estatstico 2015. So Paulo: 2015. Disponvel em:
<https://ape.unesp.br/anuario/pdf/Anuario_2015.pdf>. Acesso em: 21 set. 2015.
UNIVERSIDADE ESTADUAL PAULISTA. Portaria n. 88, de 28 de fevereiro de 2013. Dirio Oficial do
Estado de So Paulo, Executivo, So Paulo, 01 mar. 2013. Caderno 1, p. 47.
10
O programas e folhas de estilo descritos neste trabalho esto disponveis nos seguintes repositrios do GitHub:
https://github.com/fsassumpcao/metadata-conversions-to-dspace,
https://github.com/vitorsilverio/Item2CollectionRuler e https://github.com/jaideraf/DSpace-tools.
131
PontodeAcesso, Salvador, v.9, n.3, p. 117-132, dez. 2015
www.pontodeacesso.ici.ufba.br
132
PontodeAcesso, Salvador, v.9, n.3, p. 117-132, dez. 2015
www.pontodeacesso.ici.ufba.br