Sei sulla pagina 1di 22

Centro de Convenes Ulysses Guimares

Braslia/DF 4, 5 e 6 de junho de 2012

UMA ANLISE DAS DIMENSES DA


QUALIDADE DE DADOS EM PROJETOS
DE DADOS GOVERNAMENTAIS ABERTOS

Edson Carlos Germano


Hiroo Takaoka

Painel 38/138

Novas tecnologias e aplicaes de governo eletrnico

UMA ANLISE DAS DIMENSES DA QUALIDADE DE DADOS


EM PROJETOS DE DADOS GOVERNAMENTAIS ABERTOS
Edson Carlos Germano
Hiroo Takaoka

RESUMO

Este artigo apresenta o resultado parcial de um trabalho de pesquisa que tem como
objetivo analisar quais aspectos da Qualidade de Informao (QI) so contemplados
na literatura que discute os princpios dos dados governamentais abertos e destacar
as dimenses da QI que devem receber uma maior ateno em projetos de Dados
Governamentais Abertos (DGA). Para construo desta anlise adotou-se uma
abordagem metodolgica bibliogrfica, realizando uma reviso da literatura de QI e
da literatura de DGA e em seguida realizou-se uma anlise para o cruzamento de
cada dimenso da QI com cada principio dos DGA, a fim de fundamentar a
avaliao das dimenses de Qualidade de Informao empreendida neste estudo e
ainda a teoria de Dados Governamentais Abertos. Os resultados preliminares desta
investigao cientfica produziram uma matriz que mostra a interao dos princpios
dos DGA com as dimenses de QI. A analise mostrou que o princpio de DGA
Completos possui o maior numero de dimenses da QI inter-relacionada, e ainda
que o princpio de DGA Atuais possui a menor quantidade de dimenso da QI interrelacionada.
Palavras-chave: Dados Governamentais Abertos. Qualidade da Informao.
Governo Eletrnico.

1 INTRODUO
Hoje, a Sociedade da Informao tem pressionado no apenas o setor
empresarial, mas tambm os governos de todo o mundo para melhorarem seu
funcionamento, a fim de tornarem-se mais eficientes e eficazes. Modernas
Tecnologias de Informao e Comunicao (TICs) ampliam os impactos e moldam
as atividades de Governo a fim de permitir que os governos cooperem com a
sociedade, cidados, empresas e com outras agncias governamentais dentro dos
pases e atravs das fronteiras de uma forma mais eficiente e eficaz.
No mundo moderno as mudanas so absolutamente necessrias e os
problemas se tornam cada vez mais complexos e imunes a modelos ultrapassados
de governabilidade. Exigem solues inovadoras e quando tratados de forma
burocrtica, afastam o governo da cidadania e agravaram os problemas. O governo,
como qualquer organizao, s se torna efetivo quando reinventado para a era do
conhecimento e da colaborao acessvel (AGUNE et al., 2009).
A inovao em governo deve integrar os servios, a gesto, os poderes
em todas as esferas de governo atravs de um modelo participativo, com
comunicao em mltiplas vias e participao da populao nas decises de
governo e na webcidadania. A web 2.0, as redes sociais e o crowdsourcing so
partes fundamentais de uma estrutura de governo aberto.
As TICs promoveram uma revoluo nos meios de informao, construindo
uma nova relao entre governo e cidados. Esta nova relao deu origem ao
chamado e-Government, ou Governo Eletrnico, que possibilita uma administrao
pblica mais acessvel, eficiente, democrtica e transparente. Dentro deste contexto, o
conceito de Dados Governamentais Abertos surge para ampliar esta relao,
promovendo a disponibilizao das informaes governamentais em formatos abertos
e acessveis a fim de possibilitar a reutilizao e a interligao com informaes de
outras fontes, gerando novos significados. (W3C Escritrio Brasil, 2010).
Diversos documentos estratgicos e iniciativas vm sendo divulgadas e
incentivadas no cenrio mundial, principalmente na comunidade Europeia e na
Amrica do Norte, com objetivo de construir um governo mais eficiente e
participativo. Alm disso, existe hoje uma grande quantidade de pesquisas

relacionadas a e-Government em andamento. Nesse contexto se fortalece o


conceito de Governo Aberto ou Open Data Gov, que a disponibilizao, por meio
da Internet, de bases de dados governamentais de domnio pblico para livre
utilizao da sociedade, de forma a garantir acesso a dados primrios, em formato
aberto, de forma que o interessado possa combin-los, cruz-los e produzir novas
informaes e aplicativos.
Atualmente no Brasil muitos dados governamentais esto disponveis na
Web, mas estas informaes, na maioria das vezes, so oferecidas sem a utilizao
de padres, em formatos proprietrios ou apenas para a visualizao, dificultando a
reutilizao. Para bem aproveitar o potencial representado pelo acervo de
informaes do governo, essas informaes precisam ser disponibilizadas em
formato padronizado, aberto e acessvel (AGUNE et al., 2009).
Porm entendemos que a qualidade do retorno que os dados abertos
propiciaro esto diretamente ligadas a Qualidade da Informao que transmitida
por eles. Uma pobre qualidade da informao tem um forte impacto na efetividade
geral de uma organizao (WAND; WANG, 1996); o conhecimento e os critrios de
deciso utilizados nesses sistemas devem ser altamente estruturados, e aliados a
informaes

de

alta

qualidade

para

proporcionar

tomada

de

deciso

(DAVENPORT; HARRIS, 2005).


O tema Qualidade da Informao (QI) tem sido abordado com maior
ateno desde a dcada passada, especialmente com os trabalhos de Strong, Lee e
Wang (1997a, 1997b) e Wang (1998). Desde ento, esforos tm sido realizados
para solucionar os problemas da QI pelos pesquisadores nas universidades e por
profissionais nas organizaes, pois h a necessidade crtica de uma metodologia
que mea o quanto as organizaes desenvolvem produtos e servios de
informao com qualidade aos seus usurios (KAHN; STRONG; WANG, 2002).
Problemas de Qualidade da Informao vo muito alm de valores
incorretos. Podem tambm incluir problemas e erros de produo, problemas
tcnicos com armazenamento e acesso a dados, e aqueles causados pelas
mudanas das necessidades informacionais dos consumidores (STRONG; LEE;
WANG, 1997b).

Em sistemas de informao em rede, os processos de negcio esto


envolvidos na troca de informaes complexas e que frequentemente operam a
partir da entrada de dados obtidos de fontes externas, que podem ser
desconhecidas a priori. Como consequncia, a qualidade geral dos dados que flui
atravs de sistemas de informao podem rapidamente degradar ao longo do tempo
se a qualidade de ambos os processos e insumos de informao no controlado.
Por outro lado, os sistemas de informao em rede, oferecem novas oportunidades
para os dados de gesto da qualidade, incluindo a disponibilidade de uma ampla
gama de fontes de dados e a capacidade de selecionar e comparar dados de
diferentes fontes para detectar e corrigir erros, e, assim, melhorar a eficincia global
qualidade dos dados (BATINI et al, 2009).
No contexto de Dados Governamentais Abertos a definio das
qualidades, dimenses e mtricas para avaliao dos dados uma atividade crtica.
Em geral, diversas mtricas podem ser associados a cada dimenso de qualidade.
Em alguns casos, a mtrica nica e a definio terica de uma dimenso coincide
com a definio operacional da mtrica correspondente. Dimenses da qualidade
podem dizer a respeito tanto para a extenso de dados, como os valores de dados,
quanto para a sua intenso, como seu esquema. Embora a qualidade dos esquemas
conceitual e lgico de dados reconhecida como uma rea de pesquisa relevante
(IWCMQ 2003)(14), a maioria das definies de dimenses de qualidade de dados e
mtricas so referentes a valores de dados ao invs de esquemas. Este artigo
concentra-se principalmente sobre as dimenses e mtricas de qualidade que se
refere a valores de dados.
Este

trabalho

pretende

identificar

os

desafios

oportunidades

relacionados qualidade dos dados na implantao de iniciativas de governo aberto


e inovao na gesto pblica. Esperamos tambm identificar as dimenses comuns
da qualidade de dados e dos dados governamentais abertos. A partir da
identificao das dimenses que se interligam novos desafios podero ser
vislumbrados e algumas recomendaes podero ser sugeridas para facilitar o
desenvolvimento tcnico de programas de governo eletrnico no Brasil, podendo ser
aplicadas no planejamento estratgico de mdio e longo prazo e na concepo de
aplicaes automatizadas de governo eletrnico, possibilitando uma maior
efetividade na aplicao dos recursos pblicos nessa rea.

Este trabalho est organizado como se segue, no primeiro capitulo


apresentamos uma introduo dos assuntos principais do trabalho, a definio do
problema de pesquisa e a importncia do tema estudado. No segundo capitulo
apresentado uma reviso da teoria conhecida de qualidade de informao, seguido
de uma definio de governo eletrnico e dos dados governamentais abertos. No
capitulo seguinte apresentamos a metodologia utilizada no estudo e no ultimo
capitulo apresentamos as concluses e anlise desenvolvida at o momento pelos
autores sobre quais dimenses da qualidade de dados influenciam diretamente nos
projetos de dados governamentais abertos.

REVISO TERICA
A presente seo visa discutir os fundamentos tericos que sero
utilizados pelo estudo, iniciando com uma reviso da teoria de dimenses da QI,
seguido por uma reviso da teoria de Princpios de DGA.

2.1 Qualidade da Informao


As organizaes tm investido cada vez mais em tecnologia para coletar,
armazenar e processar grandes quantidades de dados. Mesmo assim, muitas vezes
elas se vem frustradas em seus esforos para traduzir esses dados em idias
significativas que podem ser usadas para melhorar os processos de negcios, tomar
decises mais inteligentes e criar vantagens estratgicas. Questes envolvendo a
qualidade de dados e informaes podem variar desde dificuldades de natureza
tcnica (por exemplo, integrao de dados de fontes diferentes) at dificuldades
no-tcnicas (por exemplo, a falta de uma estratgia integrada em toda a
organizao para assegurar o direito das partes interessadas de acessar a
informao certa no formato certo na hora e lugar certo) (Madnick et al, 2009).
Para Madnick et al. (2009) embora no se tenha havido um consenso
sobre a distino entre a qualidade dos dados e a qualidade da informao, h uma
tendncia de usar a qualidade dos dados para se referir a questes tcnicas e
qualidade da informao para se referir a problemas no tcnicos. Segundo este

autor a Qualidade da Informao (QI) trata da semntica, ou seja, do sentido destes


dados no tempo, espao e contexto, isto , transformar dados em informao.
Preocupa-se com qualquer componente que afete a interpretao e a transformao
do dado em informao, desde a forma e contexto em que apresentada at a
prpria capacidade de anlise e discernimento do usurio.
Segundo os pesquisadores Kahn e Strong (1998) informao de
qualidade aquela que atende s suas especificaes ou requisitos e qualidade da
informao a caracterstica da informao de atender ou exceder s expectativas
dos usurios. Huang et al (1999) definem a qualidade da informao como sendo a
informao que adequada para o uso pelos usurios da informao. Ainda
segundo English (1999) a qualidade da informao pode ser definida como a
informao que adequada para o uso por todos os usurios da informao.
Para Madnick et al. (2009) a Qualidade de Dados (QD) trata da sintaxe
dos dados, isto , da estrutura e da forma, preocupando-se com dados em si. Para
Raghunathan (1999) a QD deve ser tratada como parte integrante da QI devido
interseco entre elas e relao de causa e efeito entre primeira e a segunda.
Segundo o autor uma baixa QD certamente traz conseqncias para a QI das
informaes que fundamentam a deciso das pessoas e das organizaes. Por
outro lado, uma alta QD no necessariamente significa uma melhor QI, uma vez que
outros fatores igualmente importantes devem ser considerados, principalmente a
qualidade do responsvel pela deciso.
Para responder s preocupaes de QD, pesquisadores do MIT em 1992
lanaram oficialmente o programa MIT Total Data Quality Management (TDQM) para
ressaltar a qualidade dos dados como uma rea de pesquisa (Madnick e Wang 1992).
O primeiro trabalho no programa TDQM estabeleceu uma base de dados de pesquisa
de qualidade de dados e atraiu um nmero crescente de pesquisadores para conduzir
a investigao de ponta nesta rea emergente dando origem a criao de um
importante peridico da rea, o ACM Journal of Data and Information Quality (JDIQ).
Os pesquisadores do MIT desenvolveram o framework TDQM, que
defende a melhoria contnua da qualidade dos dados, seguindo os ciclos de Definir,
Medir, Analisar e Melhorar (Madnick e Wang 1992). O framework estende o
framework Total Quality Management (TQM) para melhoria da qualidade no domnio

de produo (Deming 1982; Juran e Goferey 1999) para o domnio de dados. A


percepo fundamental consiste em, embora os dados so, de fato, um produto (ou
subproduto) fabricados pela maioria das organizaes, os mesmos no so tratados
nem estudados como tal. Pesquisas posteriores desenvolveram teorias, mtodos e
tcnicas para os quatro ciclos do quadro TDQM.

2.2 Dimenses da QI
A percepo da QI depende da real utilizao desta. O que pode ser
considerado uma boa informao em um caso pode no ser suficiente em outro
caso. Esta relatividade da qualidade apresenta um problema. A QI gerada por um
sistema de informao depende de seu projeto. Ainda, o uso real da informao est
fora do controle do projetista. Portanto, importante prover uma definio de
orientao de projeto de um SI com QI (WAND e WANG, 1996).
Segundo Wang et al. (2000), um problema que a m qualidade dos
dados que geram informao provoca, muito pior que o custo direto, o descrdito
interno e externo e suas conseqncias sobre os processos de tomada de deciso,
e sobre a percepo que os clientes e fornecedores formam acerca dos sistemas
da empresa. Por outro lado, uma boa qualidade da informao da organizao
pode ser considerada uma vantagem competitiva. Ainda so poucas as
organizaes que adotam prticas estruturadas de gesto da informao e, sem
esta prtica, certa a exposio a riscos e falhas nas iniciativas de Tecnologia da
Informao e de negcio.
O valor de um sistema determinado pela qualidade dos dados que o
mesmo usa e processa e as informaes produzidas. A informao pode ser vista
como um bem, com dimenses (atributos) de qualidade que podem ser medidas.
Uma vez identificados os atributos, a qualidade da informao pode ser gerenciada
(MILLER et al., 2001). Conforme Wand e Wang (1996)(9), a qualidade da
informao um conceito multidimensional, e assim como um produto fsico tem
dimenses de qualidade associadas, um produto de informao tambm tem
dimenses de qualidade da informao.

A literatura de QI fornece uma classificao completa das dimenses da


qualidade de dados, no entanto, h uma srie de discrepncias na definio de
dimenses devido natureza contextual de qualidade. As seis classificaes mais
importante das dimenses de qualidade so fornecidos pelos autores Wand e Wang
(1996); Wang e Strong (1996); Redman (1996); Jarke et al. (1995); Bovee et al.
(2001), e Naumann (2002). Ao analisar estas classificaes, possvel definir um
conjunto bsico de dimenses de QI, incluindo acuracidade (acuracy), integridade
(completeness), consistncia (consistency) e temporalidade (timeliness), que
constituem o foco da maioria dos autores (Catarci e Scannapieco, 2002).
Entretanto no existe qualquer consenso geral sobre qual conjunto de
dimenses definem a QI, ou sobre o significado exato de cada dimenso. As
diferentes definies dadas na literatura foram discutidas por BATINI et al (2009).
As dimenses so referncias para a QI. Em algumas situaes,
determinado grupo de dimenses podem ser importantes, e este grupo varia
conforme a situao. Neste trabalho sero adotadas as dimenses apresentadas por
Wang et al. (2000) com o significado para cada dimenso apresentado na Tabela 1.

Tabela 1: Categorias, dimenses e definies da QI.


CATEGORIA
Intrnseca

Acessibilidade

Contextual

Representao

DIMENSO

DEFINIO

Acuracidade (acuracy ou free-of-error)

Quanto a informao correta e


confivel

Objetividade (objectivity)

Quanto a informao imparcial

Credibilidade (believability)

Quanto a informao considerada


como verdadeira e verossmil

Reputao (reputation)

Quanto a informao considerada em


termos de sua fonte ou contedo

Acessibilidade (accessibility)

Quanto a informao est disponvel,


ou fcil e rapidamente recupervel

Segurana no acesso (access security)

Quanto o acesso a informao,


restrito apropriadamente para manter
sua segurana

Relevncia (relevancy)

Quanto a informao aplicvel e til


para a tarefa a ser realizada

Valor agregado (value-added)

Quanto a informao benfica e


proporciona vantagens por seu uso

Temporalidade/oportunidade
(timeliness)

Quanto a informao est


suficientemente atualizada para a
tarefa a ser realizada

Integridade/perfeio (completeness)

Quanto a informao no est


extraviada e suficiente para a tarefa
em amplitude e profundidade

Quantidade de informao apropriada


(appropriate amount)

Quanto o volume da informao


apropriado para a tarefa ser executada

Interpretabilidade (interpretability)

Quanto a informao est em


linguagem apropriada, smbolos e
unidades, e as definies so claras

Facilidade de entendimento (ease of


understanding )

Quanto a informao facilmente


compreendida

Representao concisa (concise


representation)

Quanto a informao est


compactamente representada

Representao consistente (consistent


representation)

Quanto a informao apresentada em


um mesmo formato

Facilidade de manipulao /operao


(ease of manipulation /operacion)

Quanto a informao fcil de ser


manipulada e aplicada em diferentes
tarefas

Fonte: Adaptado de WANG et al., 2000 e Pipino, Lee e Wang (2002).

10

Segundo WANG et al. (2000), o significado de cada categoria a


seguinte:
Intrnseca: caractersticas intrnsecas dos dados, independentes da sua
aplicao;
Acessibilidade: aspectos relativos ao acesso e segurana dos dados.
Contextual: caractersticas dependentes do contexto de utilizao dos
dados;
Representacional:

caractersticas

derivadas

da

forma

como

informao apresentada;

2.3 Dados Governamentais Abertos


Segundo o Grupo de Interesse e-Gov do W3C (GI PARA E-GOV, 2009),
criar um Governo Eletrnico exige abertura, transparncia, colaborao e
conhecimento. Um governo transparente mais do que a interao e a participao
aberta; os dados do governo precisam ser partilhados, descobertos, acessveis e
manipulveis por aqueles que os desejam para bem aproveitar as vantagens da
Web e o acervo de informaes das organizaes.
A disponibilizao de Dados Governamentais Abertos (DGA) permite que
os usurios possam facilmente encontrar, acessar, entender e utilizar os dados
pblicos segundo foco e interesses prprios, trazendo diversos benefcios como a
reutilizao, incluso, transparncia, responsabilidade, melhoria nas buscas,
integrao, participao, colaborao, crescimento econmico, inovao e eficincia
(DINIZ, 2009).
O Open Government Working Group (OPENGOVDATA.ORG, 2007),
elaborou os 8 Princpios dos DGA. Eles devem ser:
1) Completos. Todos os dados pblicos esto disponveis. Dado pblico
o dado que no est sujeito a limitaes vlidas de privacidade,
segurana ou controle de acesso.
2) Primrios. Os dados so apresentados tais como os coletados na
fonte, com o maior nvel possvel de granularidade e sem agregao ou
modificao.

11

3) Atuais. Os dados so disponibilizados to rapidamente quanto


necessrio preservao do seu valor.
4) Acessveis. Os dados so disponibilizados para o maior alcance
possvel de usurios e para o maior conjunto possvel de finalidades.
5) Processveis por mquinas. Os dados so razoavelmente estruturados
de modo a possibilitar processamento automatizado.
6) No discriminatrios. Os dados so disponveis para todos, sem
exigncia de requerimento ou cadastro.
7) No proprietrios. Os dados so disponveis em formato sobre o qual
nenhuma entidade detenha controle exclusivo.
8) Livres de licenas. Os dados no esto sujeitos a nenhuma restrio
de direito autoral, patente, propriedade intelectual ou segredo industrial.
Restries

sensatas

relacionadas

privacidade,

segurana

privilgios de acesso so permitidas.


Eaves (2009) apresentou as trs leis dos dados governamentais abertos:
1) Se o dado no for encontrado e indexado na web, ele no existe;
2) Se no estiver aberto e disponvel em formato compreensvel por
mquina, ele no pode ser aproveitado;
3) Se algum dispositivo legal no permitir sua replicao, ele intil.
Os benefcios da adoo dos DGA no campo da transparncia e do
controle social so, ao menos em tese, evidentes. A oferta de DGA tende a
contribuir para o aumento da transparncia do governo, criando melhores
possibilidades de controle social das aes governamentais. Outros benefcios
tambm pode ser apontados, como a possibilidade de criao de novas informaes
e aplicativos a partir dos dados governamentais abertos. Nesse caso, no somente a
transparncia fomentada, mas tambm novos servios podem se originar da
interao entre o governo e sociedade atravs da utilizao dos DGA.
Esses servios podem ser gerados atravs de novas formas de atuao
participativa e colaborativa entre governo e instituies privadas, uma vez que o
conceito de DGA permite superar a viso do cidado como simples receptor da
informao pblica. Permite que qualquer interessado possa, ao processar livremente
os dados governamentais, criar contedo a partir da reutilizao dos dados.

12

Segundo Diniz (2010):


A disponibilizao de dados governamentais abertos permite que as
informaes sejam utilizadas da maneira e convenincia do interessado de
tal forma que elas possam ser misturadas e combinadas para agregar mais
valor aos dados.

Ainda segundo o autor, o objetivo de que as informaes pblicas sejam


disponibilizadas segundo as regras dos dados abertos
superar as limitaes existentes para que usurios de informaes do
servio pblico possam facilmente encontrar, acessar, entender e utilizar os
dados pblicos segundo os seus interesses e convenincias.

O World Wide Web Consortium (W3C) define dados governamentais


abertos como: a publicao e disseminao das informaes do setor pblico na
web, compartilhados em formato bruto e aberto, compreensveis logicamente, de
modo a permitir sua reutilizao em aplicaes digitais desenvolvidas pela
sociedade. Alm disso, a W3C entende que os governos devem incentivar os
cidados a usarem os dados abertos disponveis pelos governos, ou seja, eles
devem ser estimulados a reutilizarem os dados conforme as suas necessidades e
vontades. Diniz (2010) resume o objetivo desse incentivo: No h valor na
disponibilizao de dados governamentais abertos se a sociedade no tem interesse
em reutiliz-los.
As principais tecnologias e formatos utilizados para a publicao de dados
governamentais abertos so: (1) arquivos CSV (Comma Separated-Values), que
armazenam dados tabulares; (2) informaes Atom e RSS (Really Simple
Syndication), que agregam contedo baseado em XML, usadas para compartilhar
novidades ou textos completos atravs dos denominados feeds; (3) interfaces
REST, que associam um recurso a um URI usando HTTP, permitindo que um site
possa ser enriquecido com aplicativos que expandam o valor de um recurso
disponvel; (4) tecnologias da web semntica, que oferecem um arcabouo comum
onde os dados podem ser compartilhados e reutilizados alm dos limites de
aplicativos, empreendimentos e comunidades (GI para E-GOV, 2009).
H

um

movimento

global

de

governos

autoridades

locais

disponibilizando seus dados na web. Projetos de dados governamentais abertos


surgiram em vrios pases do mundo, como Estados Unidos, Reino Unido, Austrlia,
Nova Zelndia, Noruega, Holanda, Sucia, Espanha, Estnia, ustria, Grcia,

13

Canad e Dinamarca, existindo tambm um nmero crescente de iniciativas locais


de estados e cidades (SHERIDAN e TENNISON, 2010; AGUNE, GREGORIO
FILHO, BOLLIGER, 2010). Alguns governos criaram catlogos ou portais para tornar
a localizao e a utilizao desses dados mais fcil para o pblico (BENNETT e
HARVEY, 2009), como o portal data.gov e data.gov.uk.
Alm

disso,

pessoas

organizaes

vm

publicando

dados

governamentais por conta prpria em vrios formatos (BERNERS-LEE, 2009). O


Brasil tem uma boa oferta de dados em todas as esferas e poderes oferecidos
pblica e gratuitamente, mas existem poucas iniciativas do governo que se propem
a dar acesso base integral estruturada e em linguagem aberta. O exemplo mais
recente de iniciativa brasileira neste sentido o projeto Governo Aberto SP, em fase
de implantao (GOVERNO ABERTO, 2010). Enquanto o governo no libera mais
dados em formato aberto, esto surgindo no Brasil iniciativas no sentido de extrair os
dados de sites e portais governamentais, reorganiz-los, torn-los abertos e/ou
conferir novo valor a eles atravs de diferentes aplicaes, como o Congresso
Aberto, o Parlamento Aberto, o Legisdados, entre outros (THACKER, 2011). Dado o
crescente interesse civil aps exemplos bem sucedidos em outros pases, espera-se
que novas iniciativas sejam realizadas em esferas polticas brasileiras.
A reutilizao de dados governamentais, inclusive atravs da integrao
com dados de outras fontes de dados, requer que a semntica destas informaes
seja estabelecida, de modo preciso e explcito, e associada aos dados publicados
(Harris et. al. 2008). Caso contrrio, dados referentes a conceitos que no so
semanticamente equivalentes e nem mesmo relacionados podem ser integrados,
gerando resultados errneos.
A fim de evitar este tipo de problema, alm dos dados em si, devem ser
publicados os seus metadados e os conceitos e definies do vocabulrio especfico
do domnio, em formato partilhvel e referencivel, de modo a contextualizar e
transformar os dados em informaes. Atravs das tecnologias desenvolvidas pelo
avano da Web Semntica, os dados governamentais podem ser disponibilizados
anotados em relao a este vocabulrio e as interfaces de busca podem permitir que
os aplicativos recuperem e acessem estas informaes de uma forma no prdefinida (W3C Brasil 2011 b).

14

3 ANLISE E DISCUSSO DOS RESULTADOS


Ao analisar os princpios dos DGA com base nas dimenses da QI ser
possvel identificar quais dimenses da QD influenciam no atendimento de cada
principio. Dessa forma os projetos de DGA podem ser construdos com ateno a
parmetros que garantam a QI fornecida aos usurios assegurando-se que a
estrutura de aplicativo de divulgao de DGA foi construda com ateno aos
requisitos de QI.
Foi construda uma matriz para o cruzamento das dimenses de QI com
os princpios dos DGA. A partir dessa matriz foi possvel identificar quais dimenses
da QI interferem diretamente com o cumprimento de cada principio dos DGA. Abaixo
apresentamos a matriz de interao dos princpios dos DGA com as dimenses de
QI. As dimenses da QI foram dispostas nas linhas da matriz e os princpios dos
DGA foram colocados nas colunas. As dimenses que influenciam em cada um dos
princpios so indicadas no cruzamento entre a linha e coluna.

Tabela 2 Matriz de interao dos princpios dos DGA com as dimenses de QD


Principios dos dados governamentais abertos
Categoria

Dimenses da QD

completos primrios atuais acessveis

processveis nopor mquinas discriminatrios

noproprietrios

licenas livres

Acuracidade
Objetividade

Intrns eca

Credibilidade
Reputao
Acessibilidade

Aces s i bi l i da
de
Segurana no acesso

X
X
X

X
X

X
X

Relevncia
Valor agregado

Contextua l

Temporalidade/oportunidade
Integridade/perfeio
Quantidade de informao apropriada

X
X
X

Interpretabilidade

X
X

X
X

X
X

Facilidade de entendimento

Repres enta Representao concisa


o

Representao consistente
Facilidade de manipulao /operao

Fonte: adaptado pelo autor de WANG et al.(2000), Pipino, Lee e Wang(2002) e Opendata.gov(2007)

15

A anlise de cada dimenso da QI influenciando cada um dos 8 Princpios


dos DGA elaborada pelos autores desta pesquisa esta apresentada abaixo:
Completos. Como j visto na seco anterior, todos os dados pblicos
no devem estar sujeito a limitaes vlidas de privacidade, segurana
ou controle de acesso, dessa forma as dimenses da QI que devem
ser principais neste princpio so a Objetividade, pois para ser
completa a informao precisa ser imparcial, a Acessibilidade, pois
todas as informaes precisam estar disponveis e serem de fcil
acesso, a Integridade, pois no se deveria permitir que dados fossem
extraviados da base de dados, a Quantidade de Informao
Apropriada. Pois o volume de dados divulgados sobre cada tema
proposto dever ser o maior possvel, e por fim a Representao
Consistente, pois os dados devem ser divulgados seguindo se um
mesmo formato ou padro.
Primrios. Os dados devem ser apresentados tais como os coletados
na fonte, com o maior nvel possvel de granularidade e sem
agregao ou modificao, dessa forma a trs dimenses da QI
interagem diretamente para o atendimento deste principio, a
Credibilidade, pois os dados divulgados devem ser verdadeiros e
verossmeis,

Reputao,

pois

deve-se

levar

em

conta

confiabilidade de sua fonte e a Quantidade de Informao Apropriada,


pois entende-se que com uma maior granularidade dos dados maior
ser o volume das informaes divulgadas.
Atuais. Os dados devem ser disponibilizados to rapidamente, dessa
forma a dimenso Temporalidade a principal dimenso considerada
neste principio. Os dados divulgados precisam ser constantemente
atualizados de forma que se diminua o tempo entre a criao do dado e
sua divulgao.

16

Acessveis. Os dados devem ser disponibilizados para o maior nmero


possvel de usurios e para todas as possveis de finalidades, as
dimenses consideradas neste principio so a Acessibilidade, pois
deve se garantir o rpido e fcil acesso aos dados, a Quantidade de
Informao Apropriada, pois o maior volume de dados deve ser
divulgado e a Segurana no Acesso. Nesta ltima dimenso,
verificamos uma influencia inversa a dimenso da QI, pois enquanto
em muitos projetos os dados devem possuir polticas de segurana e
restrio dos dados, em projetos de DGA os dados no devem fazer
distino entre seus usurios, pois todos deveriam ter acesso a todas
as informaes.
Processveis por mquinas. Os dados devem estar organizados de
forma estruturada de modo a possibilitar processamento automatizado,
dessa forma as dimenses da QI que influenciam diretamente neste
principio so a Interpretabilidade,.pois os dados devem estar em
linguagem apropriada e os smbolos e unidades devem estar
claramente entendidos e divulgado. A dimenso Representao
Consistente, pois os dados devem sempre ser apresentados em um
mesmo formato e a Facilidade de Operao, pois os dados devem ser
facilmente manipulados e aplicados em qualquer tipo de tarefa na
analise dos mesmos.
No discriminatrios. Os dados devem estar disponveis para todos,
sem exigncia de requerimento ou cadastro, assim as dimenses
Acessibilidade e Segurana no Acesso influenciam neste principio. A
acessibilidade visa garantir o acesso rpido e fcil ao dado a qualquer
momento e a Segurana no Acesso mais uma vez influenciando
inversamente pois todos os dados devem estar acessveis a todos os
usurios, sem polticas ou regras de acesso aos dados.

17

No proprietrios. Os dados devem estar disponveis em formato


sobre o qual nenhuma entidade detenha controle exclusivo. Dessa
forma no deve-se usar nenhum padro proprietrio de divulgao dos
dados, as dimenses Interpretabilidade, Representao Consistente e
Facilidade de Manipulao influenciam diretamente o atendimento a
este principio.
Livres de licenas. Os dados no devem estar sujeitos a nenhuma
restrio de direito autoral, patente, propriedade intelectual ou segredo
industrial. Restries sensatas relacionadas privacidade, segurana e
privilgios de acesso so permitidas. As dimenses Objetividade,
Reputao e Segurana de Acesso influenciam diretamente no
atendimento a este principio.
Notou-se que algumas dimenses no aparecem como principais
influenciadoras nos princpios, isso no significa que elas no causem influencia nos
projetos de DGA, o autor acredita que elas exeram uma menor influencia se
comparada as dimenses principais.
Identificou-se tambm que as dimenses Acuracidade, Relevncia, Valor
Agregado, Facilidade de Entendimento e Representao Concisa no aparecem
como influenciadoras nos princpios de DGA. Ressalta-se que estas dimenses so
do ponto de vista do usurio e no do DGA.

18

REFERNCIAS
AGUNE, R. M.; GREGORIO FILHO, A. S.; BOLLIGER, S. P. Governo aberto SP:
disponibilizao de bases de dados e informaes em formato aberto. In:
CONGRESSO CONSAD DE GESTO PBLICA, III, Braslia, 2010.
Batini, C., Cappiello, C., Francalanci, C., and Maurino, A. 2009. Methodologies for
data quality assessment and improvement. ACM Comput. Surv. 41, 3, Article 16 (July
2009), 52 pages. DOI = 10.1145/1541880.1541883
http://doi.acm.org/10.1145/1541880.1541883
BOVEE, M., SRIVASTAVA, R., AND MAK, B. September 2001. A conceptual
framework and belief-function approach to assessing overall information quality. In
Proceedings of the 6th International Conference on Information Quality.
BROWNSWORD, L. et. al. Current Perspectives on Interoperability (CMU/SEI-2004TR-009). Pittsburgh, PA: Software Engineering Institute, Carnegie Mellon University,
2004. [http://www.sei.cmu.edu/publications/documents/04.reports /04tr009.html]
CATARCI, T., AND SCANNAPIECO, M. 2002. Data quality under the computer
science perspective. Archivi Computer 2.
COMMISSION OF EUROPEAN COMMUNITIES 2004. European Interoperability
Framework for Pan-European e-Government Services version 1.0. Luxembourg:
European Communities.
DEMING, W. E. 1982. Out of the Crisis. MIT Press, Cambridge, MA.
DINIZ, V. Como conseguir dados governamentais abertos. In: CONGRESSO
CONSAD DE GESTO PBLICA, III, Braslia, 2010.
EAVES, D. The three laws of open government. Disponvel em:
http://eaves.ca/2009/09/30/three-law-of-open-government-data/. Acesso em: 15 dez.
2011, 2009.
ENGLISH, L. P. 1999. Improving Data Warehouse and Business Information Quality,
John Wiley & Sons, Inc.
FERREIRA, Cludio Lus Pereira. 2001. Maestro: um middleware para suporte a
aplicaes distribudas baseadas em componentes de software. 2001. 143 p.
(Mestrado) ESCOLA POLITCNICA, Universidade de So Paulo, So Paulo.
GOMES, R. L. ; HOYOS-RIVERA, G. J. H. ; COURTIAT, J. P. 2006. . Um Ambiente
para Integrao de Aplicaes Colaborativas. In: Simpsio Brasileiro em Sistemas
Colaborativos, 2006, Natal. Anais do Simpsio Brasileiro em Sistemas Colaborativos

19

HASSELBRING, W. 2000. Information Integration System. Communications of the


ACM, v. 43, n. 6, p. 32 - 38.
HUANG, K., LEE, Y. and WANG, R. 1999, Quality Information and Knowledge.
Prentice Hall, Upper Saddle River: N.J..
IEEE 2000 Standards Information Network. IEEE 100. The authoritative dictionary of
IEEE standards terms, Seventh Edition. New York, NY: IEEE.
JARKE, M., LENZERINI, M., VASSILIOU, Y., AND VASSILIADIS, P., Eds. 1995.
Fundamentals of Data Warehouses. Springer Verlag.
JURAN, J. AND GOFEREY, A. B. 1999. Jurans Quality Handbook. 5th ed. McGrawHill, New York.
KAHN, B. K., STRONG, D. M. 1998. Product and Service Performance Model for
Information Quality: An Update. in Proceedings of the 1998 Conference on
Information Quality. Cambridge, MA: pp. 102-115.
LANDSBERGEN JR, D.; WOLKEN JR, G.2001. Realizing the promise: government
information systems and the fourth generation of information technology. Public
Administration Review. Vol. 61 (2), p. 205-218, march/april.
LEWIS, G., Wrage, L. 2004. Approaches to Constructive Interoperability Technical
Report CMU/SEI-2004-TR-020 Software Engineering Institute, Carnegie Mellon
University 59pp., Pittsburgh (USA), Dec.
http://www.sei.cmu.edu/pub/documents/04.reports/pdf/04tr020.pdf
LUNARDI, G. L., DOLCI, P.C. e GASTAUD, A. C. 2010. Adoo de tecnologia de
informao e seu impacto no desempenho organizacional: um estudo realizado com
micro e pequenas empresas. Revista de Administrao da USP, v.45, n.1, p. 5-17.
MADNICK, S. AND WANG, R. Y. 1992. Introduction to total data quality management
(TDQM) research program. TDQM-92-01, Total Data Quality Management Program,
MIT Sloan School of Management.
MADNICK, S. E., LEE, Y. W., WANG, R. Y., and ZHU H. 2009. Overview and
framework for data and information quality research. ACM J. Data Inform. Quality 1,
1, Article 2 (June 2009) 22 pages. DOI = 10.1145/1515693.1516680.
http://doi.acm.org/10.1145.1515693.1516680.
MILLER, B., et al.2001. Towards a framework for managing the information
environment. Information and Knowledge Systems Management, v. 2.
NAUMANN, F. 2002. Quality-driven query answering for integrated information
systems. Lecture Notes in Computer Science, vol. 2261.

20

NCS.National Communications System. Telecommunications: Glossary of


Telecommunication Terms (Federal Standard 1037C). Arlington, VA: National
Communications System, 1996.[http://www.its.bldrdoc.gov/fs-1037/]
NELSON, J., POELS, G., GENERO, M., AND PIATTINI, EDS. 2003. Proceedings of
the 2nd International Workshop on Conceptual Modeling Quality (IWCMQ). Lecture
Notes in Computer Science, vol. 2814, Springer.
PIPINO, L. L.; LEE, Y. W.; WANG, R. Y. 2002. Data quality assessment.
Communications of the ACM, New York, v. 45, n. 4, p. 68-73, Apr.
RAGHUNATHAN, S. 1999. Impact of information quality and decision-making quality
on decision quality: A theoretical model. Decision Support Syst. 25, 4, 275287.
REDMAN, T. 1996. Data Quality for the Information Age. Artech House.
W3C Brasil. Dados Abertos Governamentais. Disponvel em
http://www.w3c.br/divulgacao/pdf/dados-abertos-governamentais.pdf. ltimo acesso
em 12/dezembro/2011.
W3C Brasil. Melhorando o acesso ao governo com o melhor uso da web. Disponvel
em http://www.w3c.br/divulgacao/pdf/gov-web.pdf. ltimo acesso em 12/dez/2011.
WAND, Y.; WANG, R. 1996. Anchoring data quality dimensions in ontological
foundations. Communications of the ACM, v. 39, n. 11,
WANG, R. AND STRONG, D. 1996. Beyond accuracy: What data quality means to
data consumers. J. Manage. Inform. Syst. 12, 4.
WANG, R.; ZIAD, M.; LEE, Y. W. 2000. Data Quality. Kluwer Academic Publishers.

21

___________________________________________________________________
AUTORIA
Edson Carlos Germano Consultor na FUNDAP Fundao do Desenvolvimento Administrativo.
Aluno de Mestrado da Universidade de So Paulo Programa de Ps-Graduao em Administrao
(PPGA)/FEA SP.
Endereo eletrnico: edson.germano@usp.br / edson.germano@hotmail.com
Hiroo Takaoka Professor Doutor da Universidade de So Paulo Programa de Ps-Graduao em
Administrao (PPGA)/FEA SP.
Endereo eletrnico: takaoka@usp.br

Potrebbero piacerti anche