Sei sulla pagina 1di 2

Gazetteer Ontolgico para Recuperao de Informao Geogrfica

Ivre Marjorie R. Machado1, Clodoveu A. Davis Junior1


1

Dep. de Cincia da Computao Universidade Federal de Minas Gerais (UFMG) Av. Antnio Carlos 6627 ICEx 31270-010 Belo Horizonte MG Brasil
{ivre,clodoveu}@dcc.ufmg.br

1. Introduo
A Web um grande repositrio de dados que cresce a cada dia. A recuperao desses dados ainda hoje um problema importante, cuja soluo passa pelas chamadas mquinas de busca (Google, Cuil, Alta Vista, entre outras). Uma mquina de busca um sistema de recuperao de informao (SRI) que permite ao usurio traduzir sua necessidade por informao atravs de palavras-chave e como resultados so retornados diversas pginas e documentos que de certa forma atendam ao desejo desse usurio. A principal caracterstica de um SRI a busca da relevncia para os usurios (BaezaYates and Ribeiro-Neto 1999). Para isso, o SRI tenta ao mximo compreender o que o usurio deseja ao realizar uma consulta. Sendo assim, feito um ranking com o uso de algoritmos que classifiquem os documentos em ordem de relevncia. Dentre as consultas, destacam-se aquelas em que o usurio fornece palavraschave com significado geogrfico e pretende obter a localizao de pontos de seu interesse, ou delimitar espacialmente os resultados da busca. No entanto, o uso de mquinas de busca para consultar termos referentes a lugares nem sempre tem um resultado to bom quanto o esperado, porque as palavras-chave geograficamente relevantes no so entendidas como tal pelas mquinas de busca. Alm disso, a recuperao de informao geogrfica atravs de mquinas de busca ainda tem problemas para reconhecer referncias a relacionamentos espaciais e para lidar com nomes ambguos (por exemplo, So Paulo pode ser um estado, uma cidade ou um time de futebol). Tambm existem dificuldades em recuperar informao restrita a um contexto geogrfico (por exemplo, descobrir, na indexao, que o contedo de uma pgina se refere a um lugar, ou alterar a posio de uma pgina no ranking caso seu contedo se refira a um determinado lugar). O reconhecimento de um termo como sendo o nome de um lugar em geral realizado com o apoio de um gazetteer, um dicionrio de nomes de lugares (Hill 2000). Atualmente, os gazetteers disponveis online possuem estruturas muito simples, com apenas trs componentes: o nome do lugar, o tipo do lugar (conforme definido em uma hierarquia de tipos) e o seu footprint (localizao geogrfica, restrita a um simples par de coordenadas). Com essa estrutura, os gazetteers possuem diversas limitaes, que dificultam seu uso em problemas comuns em recuperao de informao geogrfica. Alm disso, o contedo de gazetteers em geral no inclui nomes de lugares intraurbanos, tais como nomes de ruas, de bairros, pontos de referncia e atraes tursticas,

e no existem recursos que permitam registrar e utilizar o relacionamento espacial entre seus elementos. Mesmo com a estrutura limitada, diversas aplicaes geogrficas baseadas na Web utilizam esse mecanismo, como mostram Goodchild e Hill (2008). Isso mostra a necessidade e importncia em desenvolver estudos nessa rea e evoluir a estrutura dos gazetteers. Sendo assim, o objetivo deste trabalho propor um novo modelo conceitual para o gazetteer, e implement-lo sob a forma de uma ontologia de lugares, capaz de apoiar o desenvolvimento de projetos de recuperao de informao geogrfica. Um gazetteer ontolgico, conforme idealizado, permitir no apenas identificar nomes de lugares, mas tambm registrar conceitos e termos relacionados a um lugar, como em uma ontologia em que os conceitos principais so os lugares e suas caractersticas. Com isso, o gazetteer ontolgico proposto poder apoiar a soluo de problemas como a desambiguao de nomes e o reconhecimento do contexto geogrfico de textos a partir da semntica associada aos lugares e dos relacionamentos entre eles.

2. Estagio Atual e Trabalhos Futuros


At o momento, foi feita a nova modelagem conceitual e fsica para o gazetteer. Um banco de dados geogrfico est sendo criado e populado, usando fontes, tais como GeoMinas, IBGE e outros gazetteers. Esse banco de dados geogrfico ser utilizado para determinar relacionamentos topolgicos entre objetos, de modo a formar parte do contedo do gazetteer. Em paralelo a isso, ser desenvolvida uma nova verso do Locus, um sistema de localizao espacial e gazetteer simples desenvolvido no DCC/UFMG (Souza 2005). A nova verso do Locus pretende prover acesso aos dados referentes a lugares por meio de um conjunto de servios Web, isolando o contedo do gazetteer da interface de visualizao, e favorecendo o desenvolvimento de outras aplicaes, que tero acesso online aos dados.

Referncias
BaezaYates, R. and B. A. Ribeiro-Neto (1999). Modern Information Retrieval. New York. Goodchild, M. F. and L. L. Hill (2008). "Introduction to digital gazetteer research." Int. J. Geogr. Inf. Sci. 22(10): 1039-1044. Hill, L. L. (2000). Core Elements of Digital Gazetteers: Placenames, Categories, and Footprints. Proceedings of the 4th European Conference on Research and Advanced Technology for Digital Libraries, Springer-Verlag. Souza, L. A. (2005). LOCUS: um sistema de localizao geogrfica atravs de referncias espaciais indiretas, Universidade Federal de Minas Gerais.

Potrebbero piacerti anche