Sei sulla pagina 1di 18

CONSIDERAES SOBRE A CARTOGRAFIA DESTINADA GEOCODIFICAO PROCHNOW, Ronan Max; OLIVEIRA, Francisco Henrique

Laboratrio de Geoprocessamento e Sensoriamento Remoto - GeoLab Universidade do Estado de Santa Catarina - UDESC

Resumo: A Geocodificao de Endereos nos Sitemas de Informaes Geogrficas SIG demanda uma cartografia com caractersticas especficas, uma vez que dotada de vetores, ou seja, de segmentos de retas que assumem como atributos intervalos numricos. Esses intervalos numricos permitem a representao geogrfica correspondente a numerao nos logradouros e portanto a viabilidade da espacializao dos temas associados a geocodificao. Este processo transforma informaes tabulares de endereos em representaes pontuais combinadas aos intervalos armazenados no eixo dos segmentos de reta. Primeiramente, o estudo apresenta o procedimento para se realizar a geocodificao, e em seguida o padro genrico de endereamento utilizado no Brasil. Em uma segunda etapa, atravs de um estudo de caso, avalia a aplicao do mtodo de geocodificao utilizado em um SIG realizando uma modelagem segundo a perspectiva do conceito voltado a cincia Geogrfica e aos interesses das redes varejistas tipo delivery. Neste sentido, foi modelado um banco de dados contendo informaes descritivas (cadastro) sobre os clientes em formato (.xls) de uma loja franqueada da Rede China in Box no Municpio de Florianpolis SC. Como dado de entrada no sistema, foram empregados os layers de arruamento e diviso administrativa municipal em formato (.shp) cobrindo a regio central do Municpio. As informaes de cadastro descritivo contendo o endereo fsico dos clientes foram processadas na extenso Geocoding da soluo ESRI Arcgis 9.3, na qual foi empregando o Gerenciador Localizador de Endereos no padro Estilo brasileiro simples com Intersect. Como resposta, o sistema transformou as informaes descritivas em um layer de pontos contendo as coordenadas geogrficas atribudas a cada endereo de cliente. Como resultado, a aplicao do processo de geocodificao no ArcView atravs da modelagem desenvolvida apresentou 95% de combinaes isentas de erros, resultado que pode ser considerado aceitvel pela larga margem de acerto. Com relao aos 5% faltantes, realizou-se o processo de re-combinaes restando apenas uma pequena porcentagem de erros grosseiros contidos na planilha de cadastro dos clientes, e que portanto no atingem a eficincia do uso da extenso em anlise. O estudo demonstrou que o mtodo desenvolvido trar aos demais usurios princpios de referncia e facilidade no gerenciamento e gesto da cartografia para fins de geocodificao. Dentre os ganhos efetivos, ressaltam-se: otimizao de tempo e economia, considerando em especial os trabalhos de campo. Por fim, o alto ndice de acertos das combinaes, ou seja da realizao do endereamento geocodificado com sucesso, demonstrou o potencial de aplicao do procedimento automatizado para anlises espaciais com fins geogrficos. Palavras-chave: Sistemas de Informaes Geogrfica, Geocodificao de endereos, localizao espacial, espacializao de informaes

Abstract: The Geocoding Addresses in Geographical Information System - GIS - mapping with a demand of specific features, it is endowed with a vector, i.e. line segments that take attributes as numeric ranges. These ranges allow the numerical representation corresponding geographic numbering in places, and therefore the viability of the spatial distribution of topics relate to geocoding. This process transforms information in tabular addresses off representations combined with the intervals stored in the axis of the line segments. First, the study presents the procedure for performing geocoding, and then the standard generic address used in Brazil. In a second step, a case study could evaluate the implementation of the method used in a GIS geocoding performing a modeling concept

from the perspective of science oriented "Geographic" and the interests of retailers such as "delivery". In this sense, a database was modeled containing descriptive information (register) on the client format (.Xls) from a franchised store China in Box in Florianpolis - SC. As input into the system, we employed the layers of roads and municipal administrative division format (.Shp) covering the central region of the county. The description registration information containing the physical address of the customers was processed in the extension Geocoding Solution ESRI ArcGIS 9.3, in which we used the Address Locator Manager in the standard "Brazilian Style simple with Intersect." In response, the system became the descriptive information in a point layer containing the geographic coordinates assigned to each customer address. As a result, the application of the geocoding process in ArcView, through the developed modeling, showed 97% error-free combinations, a result that can be considered acceptable by a large margin of success. Regarding the missing 3%, there was the process of recombinations with only a small percentage of gross errors contained in the spreadsheet of customer registration, and therefore will not affect the efficiency of using the extent analysis. The study showed that the developed method brings principles to other users of reference and ease of management, as well as management of mapping for geocoding. Among the effective gains, it is worth underscoring: optimization of time and economy, especially considering the field work. Finally, the high rate of correct combinations, i.e. the completion of the geo-coded address successfully demonstrated the potential application of the automated procedure for geographical spatial analysis purposes. Keywords: Geographic Information Systems, Address Geocoding, Spatial location, Spatial information

Sistema de Informaes Geogrficas - SIG Definir Sistemas de Informaes Geogrficas no uma tarefa simples. Do ponto de vista epistemolgico, para se chegar a uma definio precisa do que SIG, ser antes necessrio identificar as fontes de contribuio terico-conceitual que formam esta "cincia nascente" e em desenvolvimento. No entanto, o SIG se configura neste trabalho como a ferramenta bsica para o desenvolvimento deste, logo, exige um esforo de definio. Partindo deste preceito, e fazendo uso da base terica desenvolvida por Cmara, Monteiro e Medeiros (2001, p.1), iniciamos considerando que, apesar de seu carter interdisciplinar, o fundamento bsico da Cincia da Geoinformao a construo de representaes computacionais do espao. Cmara aprofunda a respeito da interdisciplinaridade que envolve o termo em anlise. As razes deste problema esto na prpria natureza interdisciplinar (alguns diriam transdisciplinar) da Cincia da Geoinformao. Ponto de convergncia de reas como Informtica, Geografia, Planejamento Urbano, Engenharia, Estatstica e Cincias do Ambiente, a Cincia da Geoinformao ainda no se consolidou como disciplina cientfica independente; para que isto acontea, ser preciso estabelecer um conjunto de conceitos tericos, de aplicao genrica e independentes de aspectos de implementao. (CMARA et al, 2001, p.1) Clarke segue pela mesma linha de dificuldade. Embora no aborde to especificamente a multidisciplinaridade, deixa claro que a definio da cincia permanece em aberto. "SIG pode ser definido de muitas maneiras diferentes. Cada definio que voc escolher depende do que voc procura. Comum a todas as definies um tipo de dados, dados geogrficos, so nicos porque eles podem ser ligados a um mapa geogrfico. (CLARKE, 2003, p.2).

Mas importantssimo notar que no s Clarke, mas tambm Harmon deixam uma questo muito clara. Trata-se da informao de localizao espacial atrelada as demais informaes, o que faz destas uma informao geogrfica. "SIG uma acumulao organizada de dados e procedimentos que ajudam as pessoas a tomar decises sobre o que fazer com as coisas. Em um SIG, estas coisas tm uma caracterstica que os torna, no mnimo, um pouco especial - sua localizao uma parte importante do que eles so." (HARMON;ANDERSON, 2003, p.1) Agora que ressaltados estes tens muito importantes, a componente espacial e a questo da multidisciplinaridade, partiremos para uma definio de SIG enfocada sob um ponto de vista mais tcnico e sob a tica da aplicabilidade cotidiana. Desta maneira, para Armani, SIG um sistema de informao formado por um conjunto de funes para a estocagem, criao, manipulao e visualizao de uma variedade de dados espaciais representados por feies pontuais, lineares ou zonais (polgonos) (LOCH apud ARMANI, 2007, p.16). De acordo com DeMers (2009, p.19-20) os SIG so sistemas concebidos para inserir, armazenar, editar, recuperar, analisar e extrair dados geogrficos e informaes, sendo composto de um dito "orquestrado" conjunto de peas que permitem o exerccio das suas muitas tarefas inter-relacionadas. Estas partes incluem hardware e software, espao e organizaes dentro deste espao, os usurios que usam o sistema, os clientes que obtm e usam os produtos, os fornecedores que fornecem o hardware e software, e outros sistemas (financeiro, intitucional e legal) dentro dos quais o SIG opera. O autor emprega o termo orquestrado no sentido de ressaltar a qualidade principal do SIG, que diz respeito a possibilidade que os softwares SIG abrem de manusear as informaes para diversos fins, permitindo analises diversas, na forma estrutural de camadas, desde que estes dados estejam georeferenciados no plano cartogrfico, ou seja, apresentem o mesmo sistema de projeo cartogrfica e sistema de referncia. Harmon e Anderson (2003, p.2) analisam de forma semelhante ao afirmarem que um SIG composto de: Pessoas, os usurios do sistema; Aplicaes, os processos e programas usados nas tarefas dos usurios; Dados, as informaes necessrias para a realizao das anlises; Software, o ncleo do SIG; Hardware, os componentes fsicos nos quais o sistema roda. Desta maneira, DeMers conclui afirmando que "a tarefa principal de um SIG a anlise de dados espacialmente referenciados e de informao para realizar muitas outras tarefas tais como a entrada, edio, recuperao e sada de dados." (DEMERS, 2009, p.20). Ainda conforme DeMers (2009, p.20), os SIG's operam apoiados em algortimos e cdigos de computao especialmente desenvolvidos para organizar dados geogrficos dentro dos sistemas de referncia apropriados, realizar consultas seletivas a estes dados e agregar estes para melhor compreeno, contar e mensurar feies de forma individualizada ou em conjunto, classificar e reclassificar feies baseado nas especificaes do usurio, sobrepor informaes temticas relacionadas e por fim estar habilitado para combinar estas tcnicas individuais em sequencias de operaes ordenadas com a finalidade de simular aspectos e ocorrncias naturais ou de carcter antropognico para a tomada de decises futuras.

Sistema de codificao de caracteres ou Encoding

No ambiente computacional, todas as informaes visualizadas na tela do computador necessitam estar armazenadas em algum lugar e de alguma forma. Desta forma, todas as feies visualizadas na forma de mapas na interface de um aplicativo SIG, mais especificamente aqui o pacote ESRI ArcGIS 9.3 Environmental Systems Research Institute, sejam elas pontos, polgonos ou linhas, so armazenadas no HD do computador na forma de nmeros. De acordo com Clarke (2003, p.67) no nvel fsico, o mapa, assim como os atributos, eventualmente dividido em uma seqncia de nmeros que so armazenados nos arquivos dos computadores. Ou seja, todas as informaes so transformadas em nmeros para serem armazenadas e processadas. O processo de transformar informaes em nmeros, enconding em ingls, ou sistema de codificao de caracteres, consiste basicamente em um padro de relacionamento entre um conjunto de caracteres como o alfabeto com um conjunto de nmeros, pulsos eltricos ou cdigos pr-definidos e tabelados como o caso deste estudo. O aplicativo empregado neste estudo faz uso do padro ASCII - American Standart Code for Information Interchange, onde cada caracter representado por um cdigo de 8 bits (1 byte), que conforme Clarke (2003, p.67) formam um total de 256 significados padro para os valores que se enquadram em um byte. Alguns dos cdigos ASCII so nmeros, outros letras maisculas ou minsculas, alguns so caracteres especiais como "$" ou ">" e os demais so as chaves para as operaes. A tabela 1 representa a estrutura do padro ASCII.

Tabela 1 - Padro texto ASCII / Fonte desconhecida

Estrutura de dados no modelo vetorial Uma vez transformadas as informaes em nmeros pelo processo descrito no tpico acima, estas informaes podem ser representadas seguindo dois modelos no ambiente SIG. So eles: estrutura de dados no modelo matricial ou formato raster e estrutura de dados no formato vector, do ingls, ou modelo vetorial. Neste trabalho foi empregado o modelo vetorial por apresentar algumas caractristicas descritas a seguir. O importante salientar que "Estruturas de dados vetoriais permitem a representao do espao geogrfico de modo que visualmente mais intuitiva e possui maior familiaridade com um mapa analgico." (DEMERS, 2009, p.111) conforme descrito por DeMers.

Um vetor pode ser descrito como uma classe de objetos matemticos, ou seja, segmentos, com a mesma direo, o mesmo sentido e o mesmo mdulo ou intensidade, sendo que a direo a da reta que contm o segmento, o sentido dado pelo sentido do movimento e o mdulo ou intensidade dado pelo comprimento do segmento. A caracterstica mais importante e que diferencia um vetor relativa a sua estrutura que formada por dois pares ordenados: o ponto onde ele comea (origem) e um outro ponto onde ele termina (extremidade), sendo que a estes pontos so atribudas as coordenadas do vetor, as quais atravs do clculo da diferena entre as coordenadas da extremidade e as coordenadas da origem permitiro a gerao das coordenadas do eixo do segmento que se prolonga entre os dois pontos. Nesto ponto, DeMers (2009, p111) ressalta que existe uma srie de maneiras para se gerar informaes vetoriais que nos possibilitem examinar as relaes entre as varireis em um nico mapa ou muitas variveis em diferentes mapas. Ainda conforme DeMers, as trs estruturas bsicas so Spaguetti, chain codes ou cdigos em cadeia e estrutura topolgica. Esta ltima empregada pelo SIG empregado neste trabalho e portanto brevemente descrita a seguir. Na estrutura topolgica, os relacionamentos espaciais entre as feies geogrficas so representados por ns, arcos e polgonos, e esto armazenados em tabelas diferentemente da estrutura Spaghetti. Os ns so uma entidade unidimensional que representam os vrtices inicial e final dos arcos, alm das feies pontuais. Os arcos correspondem a entidades unidimensionais, iniciando e finalizando por um n, podendo representar o limite de um polgono ou uma feio linear. Os polgonos, que representam feies de rea, so definidos por arcos que compem o seu permetro. DeMers complementa: "Cada linha da tabela possui dois conjuntos de nmeros: o par de coordenadas e um nmero de n associado. O n mais que somente um ponto; um interseco de duas ou mais linhas e este nmero usado para se referir a qualquer linha com que este esta conectado" (DEMERS, 2009, p113) Desta maneira, esta estrutura permite estabelecer as seguintes relaes entre as feies: pertinncia, onde os arcos definem os limites dos polgonos fechados definindo uma rea; conectividade, na qual os arcos so conectados com outros a partir de ns, permitindo a identificao de rotas e de redes, como rios e estradas; e por fim contigidade em que os arcos comuns definem a adjacncia entre polgonos. Por fim, em Harmon (2003, p.75) afirma que o modelo de dados vetorial representa caractersticas do mundo real na forma de cadeias de pares com valores em X/Y representando informaes espaciais das feies. Em funo da sua forma, os elementos podem ser expressos pelas seguintes feies geomtricas: Pontos - representados por um vrtice, ou seja, por apenas um par de coordenadas, definindo a localizao de objetos que no apresentam rea nem comprimento. "Um ponto um nico par de valores com um valor X representando a longitude ou a X dimenso do ponto em algum espao do plano coordenado e o valor Y representa a latitude ou a dimenso Y do ponto." (HARMON, 2003, p.75) Linhas poligonais ou arcos - representados por, no mnimo, dois vrtices conectados, gerando polgonos abertos que expressam elementos que possuem comprimento ou extenso linear. "Feies lineares podem ser constitudas por um conjunto de pontos conectados ou alguma funo matemtica que descreve o ponto de partida da feio e da frmula que a constri." (HARMON, 2003, p.75)

Polgonos - representados por, no mnimo, trs vrtices conectados, sendo que o primeiro vrtice possui coordenadas idnticas ao do ltimo, gerando, assim, polgonos fechados que definem elementos geogrficos com rea e permetro.

Tabela 2 - Feies / Fonte: adapatado de (HARMON, 2003, p.76)

Geocodificao Seguindo pela lgica do sistema de codificao de caracteres, o processo de geocodificao operacionalizado seguindo o mesmo padro, mas com o diferencial de agregar informao geogrfica aos atributos. Latour e Floch apud Cavion (2008, p.35) afirmam que a geocodificao, igualmente chamada de georreferenciamento, um processo que consiste em associar coordenadas a um ponto no espao: o endereo postal ou geogrfico. A localizao de um dado pode ser feita pelo centride de uma rua ou, no caso deste estudo, de uma maneira ainda mais precisa, por um nmero em uma rua. Ela usada em situaes onde dados pontuais precisam ser tratados espacialmente, mas suas coordenadas geogrficas no esto disponveis, sendo apenas conhecidos os seus endereos. O objetivo da geocodificao de endereos determinar, por estimativa, a posio geogrfica correspondente a cada endereo em um mapa. Os dados utilizados pertencem sempre a duas vertentes: de localizao (ou georreferenciamento) e de descrio. Qualquer objeto retratado em uma anlise de geormarketing ter sua localizao determinada atravs do seu endereo geogrfico , dado por suas coordenadas x, y e z (ponto) ou pela posio do seu centride geogrfico (rea). (CAVION, 2008, p.35) Deste modo, basicamente, uma informao espacial na forma de texto, como endereos residenciais ou comerciais conforme exemplificado abaixo, pode ser representada em um mapa atravs da realizao do procedimento de geocodificao, que atribui informao do endereo as coordenadas geogrficas de um elemento no plano cartesiano nos eixos X e Y respectivamente. "TIPO" "NOME" "NMERO" "Rod" "Admar Gonzaga" "600"

Portanto, no processo de geocodificao, alm das informaes descritivas, imprescindvel a existncia de um arquivo vetorial que armazene as informaes do plano de arruamento de uma regio por exemplo. Cada segmento de reta existente neste arquivo ou layer em ingls, obrigatoriamente dever armazenar ao longo do eixo do segmento de reta um intervalo de valores numricos correspondentes aos "nmeros" dos lotes, bem como as demais informaes de "tipo" e "nome". Com estas informaes, o mecanismo de geocodificao opera conforme descrito por Zandbergen, e exemplificado na Figura 3: Nesta abordagem, um sistema virio representado como segmentos de linha de rua que armazenam os nomes das ruas e os intervalos de nmeros de casas e os nmeros das quadras em cada lado da rua. A geocodificao de endereos realizada primeiro combinando o nome de rua, em seguida o segmento que contm os nmeros de casa e finalmente adicionando um ponto ao longo do segmento com base em uma interpolao linear dentro o intervalo de nmeros das casas. Um recurso opcional pode ser utilizado para mostrar de que lado do segmento de linha da rua o endereo localizado. Esta abordagem para geocodificao de um endereo conhecida como modelo de "geocodificao de rua" e tornou-se a forma mais utilizada de geocodificao. (ZANDBERGEN, 2008, p.17) Este mtodo pode no localizar a posio geogrfica em diversas situaes, como por exemplo, quando nenhum segmento de rua com o nome do endereo for encontrado (ex. devido a erro de grafia), ou quando vrios segmentos de rua foram encontrados (ex. devido sobreposio de suas faixas de numerao, todas contendo o nmero do endereo). Nestes casos, necessrio realizar uma verificao das combinaes e corrigir os erros manualmente.

Figura 1 - Exemplo do padro de nomenclatura de endereo a ser empregado na geocodificao / Fonte: autor

Anlise espacial Muitas so as definies do termo anlise espacial, mas uma questo consenso entre os autores que trabalham esta temtica. Trata-se do fator espacializao dos dados, ou seja, manusear dados que possuem uma relao direta com o espao geogrfico e portanto apresentam a condio de serem visualizados espacialmente ou ao menos armazenam em sua estrutura as coordenadas do local os quais os dados ocupam no espao fsico. Cmara et al diz que "A nfase da Anlise Espacial mensurar propriedades e relacionamentos, levando em conta a localizao espacial do fenmeno em estudo de forma explcita" (CMARA et al,

2002, p.3) e Clarke (2003, p.162) complementa ao afirmar que o propsito dos questionamentos geogrficos so examinar as relaes entre as feies geogrficas coletivamente e usar estas relaes para descrever fenmenos do mundo real que os mapas representam. Esclarecido este aspecto principal, compreendemos que anlise espacial a habilidade de se combinar dados espaciais de naturezas diversas, manipulando-os e aplicando-lhes tcnicas matemticas, estatsticas, ou outras com intuito de extrair respostas e concluses evidentes apenas com o recurso da espacializao dos dados. Bailey apud Rocha (2004, p.3) contribui considerando analise espacial uma ferramenta que possibilita manipular dados espaciais de diferentes formas e extrair conhecimento adicional como resposta. Neste contexto, esta dita ferramenta, inclui funes bsicas, como consulta de informaes espaciais dentro de reas de interesse definidas, manipulao de mapas e a produo de breves sumrios estatsticos dessa informao. Por fim, como anlise exploratria espacial, permite-nos descrever e visualizar distribuies de dados espaciais, descobrir padres de associao espacial, bem como identificar nos fenmenos, outros tipos de comportamento considerados atpicos. Cmara aborda a questo de forma mais completa. Analise espacial compreende um conjunto de procedimentos encadeados cuja finalidade a escolha de um modelo inferencial que considere explicitamente o relacionamento espacial presente no fenmeno. Os procedimentos iniciais da anlise incluem o conjunto de mtodos genricos de anlise exploratria e a visualizao dos dados, em geral atravs de mapas. Essas tcnicas permitem descrever a distribuio das variveis de estudo, identificar observaes atpicas no s em relao ao tipo de distribuio, mas tambm em relao aos vizinhos e buscar a existncia de padres na distribuio espacial. Atravs desses procedimentos possvel estabelecer hipteses sobre as observaes, de forma a selecionar o modelo inferencial melhor suportado pelos dados. (CMARA et al, 2002, p.4-5) A tecnologia de sistemas de informao geogrfica evoluiu de maneira muito rpida a partir da dcada de 70 de conforme com Cmara et al (2001, p.5). Desta maneira, o advento da computao e o desenvolvimento de tcnicas estatsticas configuram-se como os principais aspectos que facilitaram o desenvolvimento das tcnicas de anlise espacial ao longo dos anos a ponto de atingirem o estado atual. Como dados de entrada no sistema, Cmara et al (2002, p.4) considera trs formas bsicas que possibilitam a realizao e representao de anlises espaciais. So elas as Superfcies Contnuas, as reas com Contagens e Taxas Agregadas e por fim os Eventos ou Padres Pontuais. Neste trabalho abordaremos apenas os Eventos ou Padres Pontuais por tratarem-se dos dados a serem empregados nas anlises propostas. Esta categoria de dados congrega fenmenos expressos atravs de ocorrncias identificadas por um conjunto de pontos irregularmente distribudos no espao, cuja localizao foi gerada por um mecanismo estocstico, denominados de processos pontuais. Desta maneira, ao manusear dados desta categoria, o objetivo estudar a distribuio espacial destes pontos, testando hipteses sobre o padro observado: se aleatrio, ou ao contrrio apresenta-se em aglomerados ou regularmente distribudo, estabelecendo o relacionamento de ocorrncia de eventos com caractersticas do indivduo, incorporando a possibilidade de haver algum fator ambiental como descreve Cmara et al (2002, p.5). Para DeMers, nas anlises espaciais as "Feies pontuais, assim como todas as entidades, diferem no somente em sua localizao mas tambm nas caractersticas de seus atributos." (DEMERS, 2009, p.186). Estas diferenas fornecem diferentes e freqentemente relacionados padres espaciais para

cada grupo de feies que permitem aos usurios identificar padres de distribuio como fenmenos e determinar se h alguma razo lgica que causa tal padro. Pode-se classificar feies pontuais por categorias nominais e ordinais e tambm pode-se selecionar estas categorias por intervalos, taxa de valores bem como por tipos. Estes atributos quantitativos permitem a seleo de um amplo intervalo de grupos ou classes para cada feio em funo da necessidade do usurio.

Materiais Cmara et al (2002, p.2) lembra que basta dispor de um banco de dados e de uma base geogrfica como o mapa do sistema virio por exemplo, que o SIG capaz de apresentar um mapa colorido permitindo a visualizao do padro espacial do fenmeno. Desta maneira, os insumos bsicos que compem este trabalho so um banco de dados cadastral e um arquivo vetorial de sistema virio. A ferramenta de anlise empregada foi pacote SIG - ArcGIS verso 9.3 com licena para ArcInfo e para a funo Geocoding tambm disponvel nesta soluo SIG. O banco de dados de cadastro de clientes foi adquirido junto ao ponto de venda da rede de franquias Delivery Fast-Food sob anlise China in Box localizado na regio Central do Municpio de Florianpolis - SC, mais precisamente no Bairro Centro, sob autorizao dos proprietrios da loja franqueada. Foi retirado do sistema de automatizao de vendas que a loja em questo emprega o intervalo de tempo correspondente aos meses de Janeiro do ano de 2010 Junho do mesmo ano que contm as informaes de cdigo do cliente, nome, telefone, endereo para entrega, data do primeiro e do ltimo pedido dentro do intervalo em anlise, total de pedidos realizados por cliente dentro do intervalo, valor mdio dos pedidos e valor total de pedidos dentro do intervalo. O intervalo do banco de dados foi extrado do sistema de automatizao de vendas no formato (.xls) comum ao pacote Microsoft Office. O arquivo vetorial contendo as informaes lineares do sistema virio da Ilha de Santa Catarina foi adquirido junto ao Instituto de Planejamento Urbano de Florianpolis - IPUF atravs do setor de Geoprocessamento em formato (.shp). Como a rea de estudo no abrange a totalidade da Ilha de Santa Catarina, foram apenas empregadas as informaes de recobrimento do sistema virio da rea central do Ilha e regies aonde localizam-se os clientes atendidos pelo ponto de vendas em estudo conforme apresentado na Figura 4. O arquivo vetorial que passaremos a denominar neste trabalho de layer de arruamento de acordo com a linguagem padro dos SIG's, armazena em seu banco de atributos uma classe com os tipos de vias de acesso (rua, avenida, rodovia, etc), nomes das ruas, endereos de Cdigo de Endereamento Postal - CEP, e as informaes indispensveis a geocodificao: intervalos numricos ao longo do eixo das ruas com a informao de numerao dos lotes tanto a direita como a esquerda do eixo. O mecanismo de geocodificao disponvel no software responsvel pela georreferenciamento automtico de endereos a partir de tabelas de endereos foi empregado com o chamado geocodificador de endereos "Estilo Brasileiro com Intersect" desenvolvido pela empresa representante do pacote Arcgis no Brasil e modelado para adaptar-se ao padro de arruamento caracterstico do Brasil.

Mtodo O mtodo desenvolvido neste estudo baseou-se principalmente em duas principais etapas. A primeira concentrou esforos para espacializar os clientes e a segunda em representar estes clientes de acordo com o nvel de consumo. A metodologia empregada representada no fluxograma a baixo.

Figura 2 - Fluxograma metodologia / Fonte: autor

Seguindo o fluxograma, para realizar a Geocodificao dos endereos dos clientes, antes de mais nada foi necessrio empreender um processo de edio das informaes de endereo na planilha de cadastro de clientes, uma vez que estas apresentavam uma srie de erros dos mais variados gneros. Desta maneira, erros de grafia dos nomes das vias, endereos incompletos ou ainda endereos no verdicos ou trocados precisaram ser corrigidos. Endereos no verdicos so aqueles que os residentes no local o qual esta sendo realizado o pedido assumem como verdadeiro mas que no cadastro municipal possuem outro nome e ao serem questionados no momento do cadastro no sistema de automatizao de vendas da loja, o operador do sistema insere as informaes citadas pelo cliente ao invs das informaes corretas de acordo com o cadastro do municpio. No processo de edio da planilha foi ainda necessrio padronizar a escrita dos endereos, afim de combin-los com os atributos das colunas "tipo, nome e nmero" agregados a cada eixo linear no layer de arruamento. Uma vez realizada a edio da planilha de cadastro, foi configurado no Software Arcgis 9.3 o sistema de coordenadas mtricas Projeo Universal Transversal de Mercator na Zona 22 Sul empregando como sistema de referencial geodsico o Sistema SIRGAS 2000. Desta maneira, os dados foram carregados no sistema. A ferramenta geocoding disponvel no SIG foi empregada para realizar o procedimento de geocodificao de endereos. Para isto, foi realizado primeiramente o download no site > http://www.img.com.br/suporte_artigos_tecnicos.aspx?id=204< do padro brasileiro de endereamento. Este dito "Padro Estilo Brasileiro com Intersect" na verdade uma adequao ao modelo de sistema de endereamento em vigor no Brasil elaborado pela empresa Imagem para atender as necessidades de geocodificao no Brasil.

O "Padro Estilo Brasileiro com Intersect" carregado na ferramenta de geocodificao e deve ser ento criado o chamado identificador de endereos. Criar o identificador de endereos nada mais que um acerto de configuraes. Basicamente, deve-se indicar qual a planilha a ser geocodificada bem como as colunas que sero empregadas desta planilha para realizar as combinaes com as colunas do de atributos do layer de arruamento. Realizadas estas configuraes, pode-se iniciar o processo de combinaes conforme Figura abaixo:

Figura 3 - Geocodificao dos Endereos (os circulos em vermelho representam os clientes) / Fonte: autor

Assim que realizado o processo de geocodificao, os endereos que foram geocodificados, ou seja, que foram combinados, so representados no mapa na forma de pontos. Os endereos no combinados por qualquer motivo, devem repassar pelo processo de geocodificao. As recombinaes, no entanto, sero realizadas nesta segunda etapa de forma no automatizada. Neste reprocesso, o usurio deve verificar um a um cada tentativa de combinao e identificar o erro, sendo este, passvel de correo e possibilitando a combinao dos endereos de acordo com a Figura 6 abaixo.

Figura 4 - Processo de recombinao supervisionada dos endereos / Fonte: autor

O processo de geocodificao gera uma nova layer de pontos no formato vetorial. Nesta layer, a cada ponto, so atribudas as coordenadas X/Y do ponto e os atributos da planilha de cadastro so mantidos. Desta maneira, torna-se possvel cruzar informaes e realizar anlises espaciais diversas com os atributos da planilha. Por fim, assim que geocodificados os endereos e espacializados os clientes de acordo com a Figura 7, a segunda etapa consistiu em organizar as informaes de atributos de cada cliente de forma a representar as informaes pretendidas na forma de mapas temticos.

Figura 5 - Endereo geocodificado visualizado sobre a base de endereamento / Fonte: autor

De acordo com Martinelli "A construo de mapas temticos tem incio com a delimitao da parte da realidade a ser problematizada pelo pesquisador interessado na realizao da representao, com vistas a estabelecer diretrizes que orientem a busca de respostas s questes a ela colocadas." (MARTINELLI, 2003, p.33). Desta maneira, para representar o volume de vendas para cada cliente dentro do intervalo de tempo em anlise, de acordo com a forma de manifestao, empregou-se o mtodo de representaes quantitativas - manifestao pontual: mtodo das figuras geomtricas proporcionais por melhor representar o tema sob anlise. Martinelli (2003, p.51) afirma que este mtodo recomendado para representao quantitativa de fenmenos localizados e a relao de proporcionalidade entre objetos dever ser transcrita por uma variao visual de mesma propriedade perceptiva. Os objetos foram ento classificados de forma proporcional e divididos em 5 (cinco) classes agrupando os valores absolutos pela quantidade de vendas por cliente (ponto) dentro do intervalo de tempo em anlise. Ainda conforme Martinelli (2003, p.52), para calcular a proporcionalidade representada pela rea do crculo foi empregado para definir o raio mnimo dos crculos a frmula:

Raio do crculo = Q*K onde: Q = quantidade em valores absolutos para determinar o raio mnimo K = Constante A constante K empregada em funo da variabilidade de dados onde os crculos podem por vezes ficar muito grandes ou muito pequenos. Desta maneira, para Q foi empregado o valor 1 correspondente a (1) um pedido do cliente dentro do intervalo de tempo, sendo este o valor mnimo possvel. Para K assumiu-se o valor 3 como normalizador por melhor se adaptar visualmente na escala de mapeamento empregada. Os raios das circunferncias no seguem nem uma unidade mtrica pr estabelecida e a frmula apenas foi aplicada para gerar o raio mnimo, ou seja, o raio da primeira circunferncia, sendo que os demais raios no foram estipulados mecanicamente pelo sistema. Assim, de acordo com o aumento do montante de pedidos atrelado a cada cliente, o tamanho do raio aumenta de forma automatizada regulada pelo prprio software. Neste sentido, as (5) cinco classes concentraram os seguintes intervalos de valores com as quantidades de vendas: classe 1 (raio 3) at um pedido; classe 2 (raio no definido) at 5 pedidos; classe 3 (raio no definido) at 10 pedidos; classe 4 (raio no definido) at 50 pedidos; classe 5 (raio no definido) at 100 pedidos;

Tabela 3 - Raio das circunferncias / Fonte: autor

Resultados A aplicao do processo de geocodificao de endereos no ArcView empregando uma planilha com informaes cadastrais de clientes e seu respectivo histrico de consumo de produtos do ponto de venda sob anlise se mostrou eficaz segundo a metodologia empregada conforme tabela abaixo:
RESULTADOS DA GEOCODIFICAO DE ENDEREOS 1 COMBINAO RE-COMBINAO SUPERVISIONADA QUANT (%) STATUS QUANT QUANT (%) STATUS 95% COMBINADOS 4069 98% COMBINADOS 2% AMARRADOS 0 0% AMARRADOS 2% NO COMBINADOS 102 2% NO COMBINADOS Tabela 4 - Resultados dos processos de geocodificao de endereos / Fonte: autor

QUANT 3969 99 103

O processo foi aplicado aos 4171 cadastros de pedidos registrados na planilha, os quais representam 100% do total de pedidos. Desta maneira, a aplicao do 1 processo de combinaes apresentou 95% de combinaes isentas de erros, ou seja, as coordenadas X e Y dos endereos em questo foram determinadas.

Com relao aos 5% faltantes, destes, embora o sistema tenha arredondado os valores, um pouco mais que 2% foram apresentados com o status amarrados. O status amarrado refere-se aos endereos que tiveram suas coordenadas X e Y identificadas, mas o sistema por algum motivo de dvida (verificar erro nmero 1 e 2 na Tabela 5) exige reviso do usurio afim de checar a situao do ponto em questo e classific-lo como combinado ou no-combinado. O restante dos endereos no foram combinadas por problemas diversos no primeiro processo, e portanto, aplicou-se o reprocesso chamado de recombinao, o qual realizado de maneira supervisionada. No processo de recombinao, apenas um endereo pode ser devidamente combinado por apresentar erro grave de grafia. Os demais no combinados, 102 endereos, que representam apenas 2% do universo total, no foram passveis de geocodificao por apresentarem o erro nmero 3 da Tabela 5 abaixo:
N. erro ERROS OCORRIDOS DURANTE PROCESSO DE GEOCODIFICAO DE ENDEREOS Descrio Recombinao Processo Muitas praas possuem nome popular diferente do nome Foi necessrio alterar estes oficial. Quando os clientes realizam o pedido, estes citam o endereos no campo endereo popularmente conhecido ao invs do endereo ENDERECOS da planilha oficial da prefeitura. A base de endereamento (layer de POSSVEL de cadastro de clientes, arruamento .shp), segue o cadastro de nomenclatura oficial. dando a estes endereos os Desta forma, alguns endereos no foram geocodificados de nomes das ruas semelhantes forma automatizada. a base de endereamento Endereos como os de alguns hospitais e outras instituies Por apresentarem pblicas no necessariamente possuem um nmero de quantidade representativa de endereo, como so os casos dos hospitais: Hospital pedidos realizados nestes Governador Celso Ramos, na rua Rua Irm Benwarda em POSSVEL locais, atribuiu-se a estes Florianpolis e do Hospital de Caridade em Florianpolis, nmero de endereo ou ainda, prdios dentro do Campus Universitrio da existente mais prximo Universidade Federal de Santa Catarina. Por erros de digitao ou qualquer outro no momento da venda, o numero de endereo passado pelo cliente no Nestes casos, no h o que registrado de maneira correta na planilha e portanto no est IMPOSSVEL se fazer e os pontos devem contido no intervalo de nmeros de endereo cadastrado ser considerados perdidos base de endereamento (layer de arruamento .shp). Tabela 5 - erros encontrados no processo de Geocodificao / Fonte: autor

A representao cartogrfica empregada, Mtodo das representaes quantitativas - manifestao pontual; mtodo das figuras geomtricas proporcionais, apresentou como resultado uma srie de pontos com raios variados proporcionais a quantidade de pedidos realizados por cada endereo cadastrado seguindo os eixos virios com maior concentrao de pedidos realizados. Figura 6. Embora conforme afirmao de Martinelli de que este mtodo o mais apropriado para representar cartograficamente feies pontuais desta magnitude, a visualizao e identificao dos pontos (clientes) e a quantidade de pedidos realizada por cada cliente - neste estudo variando de 1 a 103 pedidos dentro do intervalo de tempo em anlise, tornou-se de difcil compreenso em virtude de fatores como a escala de mapeamento, leia-se zoom empregado e pelo fator volume de vendas realizado para o mesmo endereo - endereo de cadastro ocupando as mesmas coordenadas X / Y. Com relao a este ltimo caso, endereo de cadastro ocupando as mesmas coordenadas, comum em virtude da grande quantidade de clientes que possuem o mesmo endereo, como o caso dos residentes em edifcios, os quais no processo de geocodificao, em virtude de apresentarem o mesmo tipo e

nome de rua, bem como o nmero, recebem como atributo as mesmas corrdenadas X / Y mas configuram-se como clientes distintos.

Figura 6 - mtodo das representaes quantitativas - manifestao pontual / Fonte: autor

Outro problema relacionado a visualizao a questo do tamanho do raio das circunferncias. Embora agrupadas em cinco classes, com tamanhos de circunferncias diferentes e proporcionais aos valores dos atributos em anlise para facilitar a anlise espacial, as quantidades de pedidos para cada cliente cadastrado se sobrepem em funo da escala de mapeamento, pois com uma escala menor os pontos ficam mais prximos uns aos outros e as circunferncias formam um verdadeiro arranjo de circunferncias sobrepostas espacialmente. Mesmo que empregando como recurso para distinguir estas feies umas das outras e facilitar a visualizao e interpretao das mesmas um contorno em cor preta, este apenas sinaliza que para o mesmo ponto existem diversas feies sobrepostas, ou ainda, que dentro da rea circular de cobertura de uma feio que contenha um valor elevado esto localizadas no mapa outras feies de menor circunferncia representando outros clientes e valores diferentes atribudos a classe em anlise para esta feio. Percebe-se que embora a escala de mapeamento seja alterada, a proporcionalidade das figuras circulares se mantm, embora no mantenha o mesmo tamanho em todas as escalas, e tambm que para os pontos que armazenam mltiplos pedidos, mesmo que empregando uma grande escala, a sobreposio se mantm e a extrao de informaes mais detalhadas das feies torna-se uma tarefa muito complicada.

PADRO DE APRESENTAO DAS FEIES EM DIFERENTES ESCALAS CARTOGRFICAS Escala 1:12000 Escala 1:6000

3 1 2 1 2

1 - multiplas circunferncias sobrepostas lado a lado e no mesmo ponto 2 - circunferncia maior sobreposta por circunferncias menores 3 - circunferncias com vrios raios sobrepostas linearmente Escala 1:3000

1 - circunferncias com vrios raios sobrepostas linearmente 2 - mltiplas circunferncias com mais de um tamanho de raio sobre o mesmo ponto

Escala 1:1000

mltiplas circunferncias com mais de um tamanho de raio sobre o mesmo ponto

mltiplas circunferncias com mais de um tamanho de raio sobre o mesmo ponto

Figura 7 - Padro visual diferenciado para as vrias escalas de mapeamento / Fonte: autor

Concluses O mtodo de geocodificao de endereos avaliado mostrou-se eficaz em sua utilizao para os fins propostos e com os dados de input empregados, pois apresentou o potencial de aplicao do procedimento automatizado para anlises espaciais com fins geogrficos. O alto ndice de acertos das combinaes obtidos na etapa no supervisionada, mais que 95%, comprovam a eficcia do mtodo, o qual apenas foi melhorado realizando a etapa de recombinaes, deixando o resultado muito prximo a 100% de combinaes. Para aplicao do processo de geocodificao fazendo uso dos materiais e mtodo empregados neste estudo, no entanto, a edio da planilha de cadastro de clientes indispensvel, e os atributos a serem relacionados no processo de geocodificao necessitam estar adequados ao mesmo padro dos atributos

da base de arruamento. Seguindo estes passos, dentre os ganhos efetivos da aplicao deste processo, ressaltam-se: otimizao de tempo e economia, considerando em especial os trabalhos de campo. O mtodo de representao cartogrfica empregado, embora defendido como o mais apropriado, apresenta limitaes quando se trabalha com alta concentrao de feies localizadas sobre a mesma coordenada geogrfica. Medidas como agrupar os valores em classes e padronizar o raio mnimo das circunferncias foram testadas e melhoraram a qualidade interpretativa do mapa, mas notou-se que o melhor recurso empregado foi a variao da escala de mapeamento. Aumentando a escala nos pontos de maior densidade de pontos para a melhor compreenso das feies espaciais, em muitas situaes, a resposta adquirida no foi a mais adequada para a realizao de anlises mais complexas, mas apresentou uma maior facilidade na identificao visual. Desta maneira, prope-se empregar nestes mapeamentos caixas com zoom nas reas de maior concentrao de feies. Para a simples visualizao da posio geogrfica e da concentrao espacial de clientes na regio atendida pelo ponto de vendas o mtodo empregado se mostrou muito eficaz, sendo que os dados gerados por esta anlise podem ser empregados para futuras anlises diversas. Desta maneira, em conjunto, o processo de geocodificao e o mtodo de representao das feies cartogrficas podem ser amplamente empregados em estudos de geomarketing. O estudo demonstrou ainda que o mtodo desenvolvido trar aos demais usurios princpios de referncia e facilidade no gerenciamento e gesto da cartografia para fins de geocodificao e representao cartogrfica. Atravs deste estudo, a Rede de Franquias Delivery Fast Food China in Box pode fazer uso deste processo para anlises de mercado, empregando alm da anlise empregada no exemplo, outras diversas de acordo com o que se pretende demonstrar.

Referncias ARMANI, Felipe Restitutti. Ilha de So Francisco do Sul: Anlise dos Ambientes Naturais e Uso da Terra Utilizando SIG. 2007. 111p. Trabalho de Concluso de Curso (Bacharel) - Curso de Geografia, Universidade do Estado de Santa Catarina - UDESC, Florianpolis, 2007. CDROM. CMARA, G.; MONTEIRO, A. M.; FUCKS, S. D.; CARVALHO, M. S. Anlise espacial e geoprocessamento. In: FUKS, Suzana Druck; CARVALHO, Marilia S; CMARA, Gilberto; MONTEIRO, Antonio Miguel Vieira (Ed.). Anlise espacial de dados geogrficos.. So Jos dos Campos: INPE, 2002. p. 26. (Acompanha CD-ROM INPE-8556-PRE/4300). (INPE-8556-PRE/4300). Disponvel em: <http://urlib.net/sid.inpe.br/sergio/2004/10.07.14.45>. Acesso em: 09 nov. 2010. CMARA, G.; MONTEIRO, A. M. V.; MEDEIROS, J. S. Fundamentos epistemolgicos da cincia da geoinformao. In: CMARA, Gilberto; DAVIS, Clodoveu; MONTEIRO, Antnio Miguel Vieira (Ed.). Introduo cincia da geoinformao. So Jos dos Campos: INPE, 2001. p. 16. (INPE8565-PRE/4309). Disponvel em: <http://urlib.net/sid.inpe.br/sergio/2004/04.19.14.42>. Acesso em: 08 nov. 2010. CAVION, Renata. Geomarketing para Gesto Territorial: mapeamento de ameaas e oportunidades. Florianpolis, 107p. Dissertao (Mestrado em Engenharia Civil) Programa de Ps-

Graduao em Engenharia Civil Cadastro Tcnico Multifinalitrio e Gesto Territorial Universidade Federal de Santa Catarina / UFSC, Florianpolis, 2008. CDROM CLARKE, Keith C., Getting started with geographic information systems, 4th ed. Prentice Hall series in geographic information science, 2003, 340p DEMERS, Michel N. Fundamentals of Geographic Information Systems. 4 ed John Wiley & Sons, Inc. Hoboken, New Jersey. 2003, 164p HARMON, John E. ANDERSON, Steven J. The design and implementation of geographic information systems. John Wiley & Sons, Inc. Hoboken, New Jersey. 2003, 164p MARTINELLI, Marcello. Mapas da geografia e cartografia temtica. So Paulo, Contexto, 2003, 111p ROCHA, M. M. Modelagem da Disperso de Vetores Biolgicos com emprego da Estatstica Espacial, Dissertao de Mestrado, Instituto Militar de Engenharia-IME, Rio de Janeiro, 2004 ZANDBERGEN, Paul A. A comparison of address point, parcel and street geocoding techniques Original Research Article Computers, Environment and Urban Systems, volume 32, 3 ed, Maio 2008, Pginas 214-232