Sei sulla pagina 1di 7

A Web Semntica, as Redes Sociais e o Futuro dos Profissionais da Informao1

Cludio Gottschalg Duque (PPGCI/UnB) Shirley do Prado Carvalhdo (PPGCI/UnB)

Resumo: O presente artigo apresenta o resultado qualitativo de um projeto desenvolvido em sala de aula com alunos do 4 perodo do curso de Arquivologia do CID/UnB. Durante este estudo foram apresentados aos alunos, e discutidos visando a aplicao profissional, os conceitos de Web Semntica, Ontologia, Softwares Livres, Weblogs, Wikis, Linguagens de Marcao, como XML e Dublin Core, e-Arq e SIGAD. As novas tecnologias foram identificadas e contextualizadas atravs de uma simulao, na qual os alunos deveriam explorar as possibilidades oferecidas pelos novos padres e novas tecnologias e apresentar um trabalho final visando avaliao na disciplina. As diversidades culturais encontradas ao longo do trabalho foram preponderantes para a definio das polticas a serem adotadas para o tratamento da informao, que j era disponibilizada em meio digital, porm sem utilizao de linguagens de marcao e sem nenhum critrio classificatrio preestabelecido que pudesse auxiliar os futuros profissionais da informao. Palavras-chave: Web Semntica. Linguagens de marcao. Profissionais da informao. Weblogs, Wikis.

Abstract: This article presents the qualitative result of a project developed in the classroom with students of the 4 period Arquivologia the course of the Department of Information Science and Documentation at the University of Brasilia. During this study were presented to students, and discussed to implement training, the concepts of Semantic Web, Ontologia, Free Software, Weblogs, Wikis, the Markup Language, as XML and Dublin Core, eArq and SIGAD. New technologies have been identified and contextualized through a simulation, in which students should explore the possibilities offered by new standards and new technologies. The cultural diversity found throughout the work were clear for policy to be adopted for the processing of information that was already available in digital media but without use of markup languages and without any predetermined classification criterion that could help the future of professional information. Keywords: Semantic Web. Markup Languages. information professionals. Weblogs. Wikis.

Introduo A evoluo dos meios de comunicao ocorrida nos ltimos tempos permitiu e permite que o acesso a informao seja facilitado sobretudo pelo advento de novas tecnologias da informao. Com o surgimento da Web, um maior nmero de cidados passou a ser leitor/escritor, e a informao disponibilizada nesse servio atemporal pois ao mesmo tempo em que contempornea (ns no Brasil temos acesso imediato a informao sobre eventos que ocorrem atualmente no mundo) e coetnea (ns no Brasil temos acesso imediato a informao sobre novas tecnologias que, algumas quase sem defasagem temporal, tambm ocorrem/ro no Brasil) pode no ser (temos acesso a informao histrica, inclusive disponibilizada em material multimdia reformatado, temos acesso a informao de culturas que apesar de terem a mesma idade que a nossa so impares em vrios aspectos).

Comunicao oral apresentada ao GT-08 - Informao e Tecnologia.

Por meio desta evoluo tecnolgica surge um conceito, Web Semntica (SOUZA & ALVARENGA, 2004). A Web Semntica uma evoluo natural da atual Web, alguns autores a denominam como Web 3.0. Esta Web Semntica permite (assim que for realmente implantada, o que alguns autores apregoam como sendo impossvel na prtica) que o contedo informacional disponibilizado na Web seja processado automaticamente. Enquanto a Web atual foi desenvolvida para ser apresentada e processada (principalmente atravs da leitura) apenas pelos seres humanos, a Web Semntica ser processada tanto pelos seres humanos quanto pelas mquinas, na forma de agentes computacionais (softbots), que so capazes de compreender a informao e seus significados. Portanto, teramos uma grande rede de informao e no uma grande rede de dados, que a Web de hoje. Tim Berners-Lee (2001), considerado o pai da Web, prope que a Web se torne uma rede semntica passvel de ser processada por mquinas. Nesse sentido pode-se citar o exemplo utilizado por Tim Berners-Lee de um cidado que ao sofrer um acidente, pede ao seu computador porttil (algo como um smartphone), atravs de comando verbal, que encontre um mdico ortopedista nas imediaes em que o cidado se encontra. Para ser localizado no sistema, este mdico deve ter seu consultrio na mesma rea e deve ser membro da comunidade acadmica. Em milsimos de segundo o computador, atravs de um softbot, (HENDLER, 2001) encontra algumas opes de resposta para esta necessidade solicitada, de acordo com as especificaes dadas. Atravs da utilizao macia de metadados, ontologias e mquinas de inferncia, o softbot acessa a agenda dos mdicos disponveis na regio e oferece ao cidado as possibilidades de horrio de atendimento. Por este novo modelo conceitual, a Web ser capaz de fazer conexes semnticas entre conceitos que esto, a princpio, totalmente desconexos. O uso de metadados, baseados em XML, conjuntamente com regras de inferncia, a premissa para que a Web Semntica se concretize. A representao do conhecimento, por meio de ontologias, permite a elaborao de um repositrio de conhecimento, ampliando as possibilidades de recuperao e disponibilizao da informao. Hendler (2001) sugere que a Web Semntica um arranjo de diversas ramificaes de nodos ontolgicos que convergem de acordo com as necessidades informacionais do usurio. Logo, as organizaes, sejam pblicas ou privadas, obrigatoriamente, tero que ter seus processos, servios e produtos informacionais disponibilizados atravs de ontologias, tendo em vista que ferramentas inteligentes estaro atuando de maneira invisvel para o usurio, auxiliando-o, conversando e compreendendo essas informaes que se encontram na Web. Entretanto, mesmo com todos os atributos citados anteriormente, fazse necessrio pontuar que existe uma grande possibilidade de que a Web Semntica nunca venha a existir, pois, sua existncia depende do fato de que todos os seus recursos informacionais obrigatoriamente contenham metadados. Faria e Girardi (2002) entendem que uma aplicao prtica da Web Semntica a Gesto do Conhecimento. A Gesto do Conhecimento, aqui entendida como sendo um processo sistemtico, articulado e intencional, apoiado na gerao, codificao, disseminao e apropriao de conhecimentos, com o propsito de atingir a excelncia organizacional, encontra na Web Semntica um terreno frtil para o seu crescimento e implementao automtica. Uma forma de Comunicao Midiada por Computador (CMC) que preconiza a Web Semntica so os chamados weblogs (ou blogs como so mais conhecidos). O termo weblog foi utilizado primeiramente por Jorn Barger, em seu site Robot Wisdom em 1997 (AUBURN apud BRANUM, 2003; e BLOOD, 2000), e agora usado para descrever sites pessoais que oferecem gobservaes freqentemente atualizadas, notcias, manchetes, comentrios, links recomendados e/ou entradas de dirio, geralmente organizadas cronologicamente (WERBACH, 2001). Os blogs tradicionais resgatam uma caracterstica das publicaes impressas que os diferencia das outras CMCs, o papel central representado pelo autor do blog (conhecido como blogger), que determina o contedo a ser publicado e disponibilizado para seus freqentadores. Blogs podem ser direcionados a

um assunto especfico, ou podem refletir o interesse do autor em um tempo determinado (GURAK et al., 2004). O Problema Abordado Para entendermos o objeto de estudo que ser discutido, faz-se necessrio explicitar o contexto em que tal projeto se encontra, bem como as caractersticas da disciplina oferecida. A disciplinai tem por finalidade o uso das tecnologias e mtodos relacionados informtica, aplicada aos processos documentrios, ao uso de bases de dados bibliogrficas e cadastrais, aos aspectos tericos e prticos da recuperao de informao, a automao de servios de informao e aos processos de arquivos. Portanto, o objetivo desta disciplina propiciar ao aluno conhecimentos bsicos relacionados com as aplicaes da informtica nos processos documentrios, nas unidades e servios de informao, para desenvolver habilidades de elaborao, implantao e participao de projetos de sistemas de informao. Nessa direo, props-se o seguinte problema aos alunos: possvel criar uma unidade de informao para atender a um segmento especfico, no caso o turismo, utilizando softwares livres e servios gratuitos na Web? O tema proposto foi o Turismo tendo em vista que Braslia por ser um plo poltico e por ter uma arquitetura moderna, apresenta um grande potencial para a explorao desse segmento, outra prerrogativa deve-se ao fato que os alunos que esto inseridos no mercado de trabalho, a maioria atua em rgos pblicos. Portanto, o Turismo como tema de pesquisa seria praticamente uma rea desconhecida dos alunos, o que tornaria a atividade mais estimulante do ponto de vista do aprendizado, pois no envolve o trabalho com documentos tradicionais, objeto de trabalho constante nos orgo pblicos. Com o intuito de facilitar o desenvolvimento do trabalho, a turma foi dividida em 6 grupos,. Cada grupo escolheu um segmento do mercado de turismo: 1. Turismo Classe A (Grupo A), 2. Turismo para Estudantes (Grupo B), 3. Turismo para Terceira Idade (Grupo C), 4. Turismo para Crianas (Grupo D), 5. Turismo Econmico (Grupo E) e, 6. Turismo Ecolgico (Grupo F). Para a realizao dessa atividade, os alunos tiveram aulas expositivas e prticas sobre 4 grandes tpicos divididos em sub-tpicos especficos, como se apresenta na figura abaixo: Usurio, Usabilidade, Linguagens de MarcaAcessibilidade Incluso o Digital

Linguagens de Marcao, Aplicao.


E-ARQ Brasil

Os usurios e o acesso informao Preservao de documentos digitais Segurana da informao na documentao digital

Introduo a Linguagem de Marcao HML XML

XML Dublin Core

Parte I - gesto arquivstica de documentos Parte II - especificao de requisitos para sistemas Informatizados de gesto arquivstica de documentos (SIGAD)

Figura 1 Tpicos da Disciplina. 3

Metodologia Adotada Os grupos realizaram as atividades seguindo as seguintes etapas: Primeiramente, os alunos pesquisaram as informaes sobre a histria de Braslia, seus pontos tursticos e seus recursos naturais encontrados nos limites da cidade e do Distrito Federal. Esta pesquisa foi realizada tanto em fontes de informao primrias quanto em secundrias: a) via Web (utilizaram mquinas de busca, diretrios, sites de rgos oficiais, sites de ONGs, etc), b) via Bibliotecas, c) via arquivos, Em segundo lugar os grupos criaram os Weblogs de acordo suas respectivas temticas. Em terceiro lugar visitaram os locais relevantes para seus pblicos-alvo. Em quarto lugar, realizaram entrevistas e obtiveram imagens a partir de cmaras fotogrficas digitais destes lugares, seja fotografando ou filmando. Em quinto lugar, os grupos alimentaram os Weblogs com as informaes obtidas. Em sexto lugar os grupos inseriram vnculos (links) na Weblog de sites que tivessem algum valor informacional (horrio de nibus ou de vos por exemplo). Em stimo e ltimo lugar marcaram no Google Maps os locais que interessavam especificamente ao grupo e colocaram um link para estes locais. Paralelo a estas atividade, os grupos escreveram um relatrio (utilizando o GoogleDocs, ou o Zoho Office ou qualquer outro servio online de edio de textos) sobre suas atividades, apontando os erros e os acertos no tocante ao planejamento e execuo das tarefas. Materiais e Servios utilizados Nesta disciplina, todas as aulas so ministradas no laboratrio de informtica, facilitando assim a utilizao prtica das ferramentas e servios apresentados ao longo do curso, bem como a discusso sobre os tpicos esquematizados na tabela acima. No primeiro tpico foram utilizadas duas apostilas ii sobre incluso digital. Para o segundo tpico foram utilizadas as ferramentas NVU e Peters Editor os dois softwares gratuitos esto disponibilizados na Web. O NVU um editor de HTML com recursos WYSIWYG e o Peters Editor um editor de XML. Para o terceiro tpico, utilizou-se o Peters Editor. Para o quarto tpico utilizou-se o Protg, que um editor de ontologias, e o KnowledgeTree que um Gerenciador Eletrnico de Documentos (GED). Como os alunos ficaram incumbidos de criar um Weblog, referente empresa fictcia de Turismo, por grupo, foi utilizado o servidor de Weblogs VOX, considerado pela crtica especializada como o Weblog mais amigvel e com mais recursos disponveis para o usurio comum. A inteno era transformar os Weblogs em verdadeiros mashups (sites que convergem vrios servios). Mtodos de Coleta e de Anlise dos Dados Para avaliar os Weblogs, o professor da disciplina fez um acompanhamento presencial e virtual de todas as etapas das atividades. Presencialmente os grupos respondiam verbalmente s questes apresentadas pelo professor (como por exemplo, qual a poltica adotada pelo grupo para facilitar a indexao do Weblog por mquinas de busca?) e apresentavam os resultados na tela do computador. Virtualmente o professor visitava os Weblogs e checava a qualidade e autenticidade do contedo informacional disponibilizados. Tambm foi estabelecido pelo professor que os Weblog seriam avaliados entre os grupos, quando a usabilidade seria o fator de maior relevncia para avaliao. Fatores Manipulados Com o objetivo de avaliar a aplicao prtica dos textos tericos trabalhados em sala de aula, referente aos tpicos, e sua eficcia na construo de Weblogs, foram examinados os seguintes fatores e medidas. Os fatores so: 4

A metodologia aplicada pelo grupo para a obteno da informao necessria; A qualidade da informao veiculada e a veracidade da fonte informacional; A qualidade das imagens disponibilizadas no Weblog. Em relao s medidas verificou-se: O tipo de reproduo feita pelos grupos em relao s fontes; O tipo de comentrio feito no Weblog pelos outros grupos.

Anlise
A anlise do contedo informativo do Weblog foi qualitativa e subjetiva, o objetivo maior era fazer uma anlise apurada dos recursos oferecidos pelos Weblogs. Se as informaes eram significativas e os contedos fidedignos e precisos. Se o texto vinculado s imagens era condizente, se houve criatividade na disposio das informaes, se o Weblog apresentava boa navegabilidade e recursos teis para o usurio. Discusso Atravs destas atividades cujo foco era a informao digital, foi possvel permitir aos alunos vislumbrarem os problemas que afligem grandes colees de documentos digitais e a prpria Web. O tamanho da Web gera, do ponto de vista da Cincia da Informao, mais problemas que solues (WITTEN, MOFFAT & BELL, 1999; LYMAN and VARIAN, 2000). Uma simples atividade acadmica, simples quando contrastada com a realidade das grandes organizaes hoje em dia, permite aos alunos repensarem algumas questes. Esta informao que est na Web, e supostamente acessvel a todos, est sendo gerada e manipulada em vrios idiomas e estilos e representa a expresso de vrias culturas, ideologias, crenas, etc.: Como a informao vem sendo organizada? Como trat-la e recuper-la? Saracevic (1999) em seu ensaio discorre, de forma breve, sobre a origem, o contexto social, a estrutura e os problemas da Cincia da Informao (CI). Para o autor, qualquer avano na CI depende dos seus problemas e os mtodos utilizados para resolv-los, devendo ser pensada em trs aspectos: a) uma interdisciplinar por natureza; b) est inexoravelmente ligada tecnologia; c) por ter uma forte dimenso social e humana acima e alm da tecnolgica, participa ativamente da evoluo da sociedade da informao. Nessa direo, a informao, em um sentido estrito, na abordagem de Saracevic seria um processo ou causa que diferencia a fixao e o melhoramento de situaes. Em um sentido amplo, a informao deve vista como um fenmeno relacionado a diversas contingncias, sempre tendendo a mudanas. Na contemporaneidade, a exploso da informao nos remete a preocupao quanto relevncia da informao, sobretudo no mundo virtual, como o prprio Saracevic afirma: the Web is a mess. Por ser uma enorme baguna, Weinberger (2007), acredita que a reside a criatividade do ser humano e que, inclusive, todas as formas de classificao so falhas por limitarem esse talento. O promissor para o autor seria explorar os mecanismo de RI e observar os plos de irradiao de informao, eis a a relevncia. Nessa direo, a CI deveria centrar-se na RI como metodologia e problema. A recuperao da Informao (RI) surge medida que o autor pontua as especialidades da CI, dentre as quais se pode citar a Bibliometria, Estudo de Usurio e Comunicao Cientfica, entretanto, destaca-se pelo fato que muitos problemas com raiz ou derivado de objetos e fenmenos envolvidos na RI compe o cerne da CI, segundo o autor. 5

O trabalho de Belkin (1978) se centra em delimitar o conceito de informao adequado e til para a CI. Importante destacar que o autor trabalha com conceito e no com definio, para levantar o objeto da CI. E por qu? Por que para ele a definio diz o qu o fenmeno e o conceito, sendo mais que uma definio universal, torna-se livre no olhar quanto utilidade conceitual. Para o autor, o conceito evolui em termo de utilidade e a definio se fecharia na verdade. Para sabermos o conceito de informao, temos que ns mirar no prprio problema - implica em um processo social de comunicao (gerador e usurio) - da CI elaborado por ele, que seria a comunicao, transmisso, recuperao e necessidade de informao. Quanto aos requisitos do conceito de informao para a CI, vale a pena ressaltar o universo que envolveria o contexto, a necessidade de informao, o comportamento do usurio consistindo ento em RI. De acordo com Gonzlez de Gmez (2000, p.5), a recuperao da informao, as novas tecnologias de informao e comunicao e a nfase na informao cientfica e tecnolgica seriam os objetos, participantes de um sistema, a incorporarem idias paradigmticas e acrescenta: [...] A Cincia da Informao surge no horizonte de transformaes das sociedades contemporneas que passaram a considerar o conhecimento, a comunicao, os sistemas de significado e os usos da linguagem como objetos de pesquisa cientfica e domnios de interveno tecnolgica [...] alguns focos temticos desenham uma nova figura assimtrica da pesquisa. Por um lado, intensifica-se a relao entre informao e conhecimento, atrelada aos novos conceitos de gesto do conhecimento e inteligncia social e organizacional, deslocando a centralidade temtica da informao cientficotecnolgico e promovendo-se a migrao de tecnologias e estratgias de tratamento e recuperao da informao para novos cenrios organizacionais, com nfase na reutilizao de seus estoques organizados nas novas funes de diagnsticos, controle e monitoramento de ambiente tecnolgico e dos negcios. Os representantes deste sistema, conforme a autora, seriam os arquivos, bibliotecas, museus e centros de documentao e estes seriam denominados Sistema formal intermedirio de recuperao de informao para destacar o carter de interveno intencional das aes sistmicas de informao no contexto de outras prticas sociais. Dentro deste sistema haveria um fluxo de informao entre os dois plos (geradores e usurios), buscando otimizar a gesto da informao (gerao, coleta, armazenagem, organizao, representao, recuperao e disseminao) (GONZLEZ de GOMEZ, 1990, p. 118). Nesse sentido, a autora afirma que um dos paradigmas e desafios seria estudar o processo de comunicao presente no sistema sob o ponto de vista dos fatores externos - condies culturais, histricas, sociais que seriam o universo da ao, do conhecimento e do discurso social pois estes fatores alterariam a posteriori as aplicaes ou a distribuio dos produtos do conhecimento/informao j construdos e, alm disso, estas condies constituem parte das condies iniciais de gerao e uso de conhecimento-informao. Para o profissional de informao importante entender as possibilidades que a chamada Web 2.0 e os CMCs fornecem enquanto ferramentas de trabalho. Entretanto, apesar dos inmeros benefcios que as novas tecnologias podem propiciar ao ser humano em se tratando de aquisio de informao (GRGOIRE et al., 1996; KINTSCH et al., 1978; NEGROPONTE, 1995; GATES et al., 1995; LVY, 1995), como podemos recuper-las, process-las automaticamente e de uma maneira adequada? Como produzir Sistemas de Recuperao de Informao mais eficientes? Como necessrio inserir metadados em todos os contedos informacionais disponveis na Web para que tenhamos a Web Semntica, ento quais estratgias cognitivas utilizadas pelos seres humanos na leitura podem ser emuladas pelas mquinas para auxiliar o tratamento automtico de textos atravs da leitura destes metadados por mquinas? Pesquisas como este estudo permitem, cada vez mais, que os alunos de graduao se atentem para os novos paradigmas da Cincia da Informao e que se sensibilizem para as questes relevantes do mercado, questes que exigem os conhecimentos especficos, pontuais, de arquivistas e bibliotecrios, por exemplo, conhecimento este que tecnlogos (ainda) no dispem. Este estudo pretende tambm fornecer subsdios pedaggicos para professores que atuam direta e indiretamente 6

com tecnologias da informao. Para que a academia brasileira realmente possa preparar da melhor maneira possvel, atravs de um salto qualitativo, a formao do futuro profissional da informao e do futuro profissional do conhecimento. REFERNCIA Auburn, B. (1999) A Penny for Your 'pinion. The Atlantic Online, October 21, 1999 Retrieved December 12, 2001 from http://www.theatlantic.com/unbound/citation/wc991021.htm <http://www.ajy.net/jmb/blogphenomenon.htm>. BLOOD, R. Weblogs: A History and Perspective. [S.l.]: Rebeccas Pocket, 2000.Disponvel em: <www.rebeccablood.net/essays/weblog_history.html>. BRANUM, J. A. The blogging phenomenon: an overview and theoretical consideration. Texas: Southwest Texas State University, 2003. Disponvel em: <http://www.ajy.net/jmb/blogphenomenon.htm>. BELKIN, N.J. Information Concepts for Information Science. Journal of Documentation, Vol.34, N. I, March 1978, pp 55-85. BERNERS-LEE, T. The Semantic Web. Scientific American. May, 2001. FARIA, C. G.; GIRARDI, R. Uma anlise da web semntica e suas implicaes no acesso informao. 2002. GATES, B., MYHRVOLD, N. & RINEARSON, P. The Road Ahead. London, Viking. 1995 GONZLES de GOMES, Maria Nlida. Dos Estudos Sociais da Informao aos Estudos do Social desde o ponto de vista da informao. In: O Campo da Cincia da Informao: gnese, conexes e especificidades. Joo Pessoa: Editora Universitria, 2002. GONZLES de GOMES, Maria Nlida. O objeto de estudo da Cincia da Informao: paradoxosdesafios. Cincia da Informao, Braslia, 19 (2):117-22, jul./dez. 1990. GONZLES de GOMES, Maria Nlida. Metodologia de pesquisa no campo da cincia da informao. DataGramaZero Revista de Cincia da Informao, v.1, n.6, 2000 [Artigo 03]. GRGOIRE, R. inc.; BRACEWELL, Robert; and LAFERRIRE, Thrse. SCHOOLNET/RESCOL. The Contribuition of New Technologies to Learning and Teaching in Elementary and Secondary Schools.Technical Report McGill University. August 1st, 1996. GURAK L., ANTONIJEVIC, S., JOHNSON, L., RATLIFF, C., REYMAN, J.Introduction: weblogs, rhetoric, community, and culture. Minnesota: University of innesota, 2004. Disponvel em: <http://blog.lib.umn.edu/blogosphere/introduction.html>. HENDLER, J. Agents and the semantic web. IEEE Intelligents Systems, mar./abr. 2001. KINTSCH, W. & van DIJK, T. A. Toward a model of text comprehension and production. Psychological Review, 85 (5), 1978. pp 363-394. LVY, P. As Tecnologias da Inteligncia: O Futuro do Pensamento na Era da Informtica. Rio de Janeiro: Ed 34. 1995. LYMAN, P. and VARIAN, H. R. How Much Information. Technical Report. UCLA, Berkley. http://www.sims.berkley.edu/how-much-info/ (2000). NEGROPONTE, N. A Vida Digital. Companhia das Letras, 1995. SARACEVIC, Tefko. Interdisciplinary nature of information science. Cincia da Informao - Vol 24, nmero 1, 1995. SOUZA, R. R.; ALVARENGA, L. A Web Semntica e suas contribuies para a cincia da informao.Ci. Inf., Braslia, v. 33, n. 1, p. 132-141, jan./abril 2004 WERBACH, K. Triumph of the Weblogs. , jun. 18, 2001. Disponvel em:<http://www.eadventure.com/conversation/article.afm?Counter=7444662>. WITTEN, I. H.; MOFFAT, A. & BELL, T. C. Managing Gigabytes. Morgan Kaufmann Publishers, Inc. Second Edition, 1999
i

Esta turma composta de 36 alunos, todos estudantes do curso de Arquivologia e todos cursando no mnimo o 4 perodo. ii Produzidas pelo projeto Rede l: incluso e letramento digital da Universidade Federal de Minas Gerais (UFMG), disponvel no site http://www.ufmg.br/rede.le/index.php acessado no dia 04.06.08 7