Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
estatísticas na web
Resumo executivo
67,5% dos cidadãos e 92,6% dos servidores acreditam que se os dados são públicos, eles devem estar
disponíveis online;
Cidadãos estão mais propensos em votar, com uma margem de 3 para 1, em políticos que carregam a
bandeira da transparência de dados;
Mais cidadãos acreditam que a transparência de dados é importante o suficiente a se financiar com recursos
públicos do que os que discordam (47% concordam contra 32,6% que discordam). Entre servidores públicos,
essa diferença é ainda maior: 82,4% concordam e 16,5% discordam;
27% dos servidores que defendem a publicação citaram como principal obstáculo a falta de liderança ou
vontade política;
Segurança pública aparece como categoria mais importante de dados a ser publicada segundo o cidadão;
Uma das boas práticas mais inovadoras identificada é permitir aos cidadãos que propaguem dados interessantes em
redes sociais como Facebook, Twitter e Blogs pessoais, criando um canal social de distribuição de dados e
informações governamentais.
Outra delas é a possibilidade de órgãos e entidades publicarem descentralizadamente seus dados, tornando-se por
iniciativa própria parte integrante de um sistema centralizado de informações governamentais.
Introdução
O presente trabalho buscou obter uma análise da disponibilização de dados e indicadores na web por diferentes
entidades governamentais, com o intuito de identificar melhores práticas adotadas. Inicialmente foram identificados
princípios desejados na publicação de dados e estatísticas, a partir dos quais se elencou critérios desejados a serem
seguidos.
USAspending (http://www.usaspending.gov/)
Entre os resultados da pesquisa, destaca-se um grande suporte do público e de servidores do governo à dados
abertos na web: 67,5% dos cidadãos e 92,6% dos servidores acreditam que se os dados são públicos, eles devem
estar disponíveis online. Além disso, os cidadãos estão mais propensos em votar, com uma margem de 3 para 1, em
políticos que carregam a bandeira da transparência de dados. O GRÁF. 1 apresenta a opinião dos cidadãos quanto à
transparência de dados:
Além disso, mais cidadãos acreditam que a transparência de dados é importante o suficiente a se financiar com
recursos públicos do que os que discordam (47% concordam contra 32,6% que discordam). Entre servidores
públicos, essa diferença é ainda maior: 82,4% concordam e 16,5% discordam. O GRÁF. 2 mostra a opinião dos
servidores:
Concorda Discorda Incerto
Já quando perguntados sobre quais os maiores obstáculos à publicação de dados, 27% dos servidores que defendem
a publicação citaram falta de vontade políticas ou liderança como principal razão, seguido da ausência de
financiamento (19%) e de questões de privacidade e segurança (16,5%). O GRÁF. 3 apresenta estes valores:
30,%
25,%
20,%
15,%
27,0%
10,% 19,0%
16,5%
14,0% 12,5%
5,%
5,5% 5,5%
,%
Ausência de Financiamento Privacidade e Comprometimento Administração Qualidade dos Recursos técnicos
liderança ou Segurança interno inadequada dos dados disponíveis
vontade política dados
Com relação aos temais considerados mais importantes, aparecem nos primeiros lugares questões como segurança
pública, orçamento e finanças, e educação, conforme apresenta o GRÁF. 3:
Muito importante Importante Não relevante Nada importante Incerto
Gráfico 4 – Importância das diferentes categorias de dados segundo a opinião dos cidadãos
Fonte: Benchmarking de dados públicos – Socrata.
Já no que diz respeito à experiência online e contato com os dados, 2 a cada 3 respondentes preferem explorar e
interagir com os dados online a baixá-los em uma planilha. Segundo a pesquisa, baixar os dados (atualmente o maior
meio de consumo de dados do governo) é menos desejado do que explorar visualizações pré-processadas de dados
(37%) ou descobri-los por meio de interações em redes sociais e comunidades. Estas preferências podem ser
visualizadas na TAB. 1:
Forma %
Explorar e interagir com dados online 63,%
Explorar gráficos e mapas pré-processados dos dados 37,%
Ver o que outros têm a dizer sobre os dados, e compartilhar a própria opinião 29,%
Baixar os dados e trabalhá-los em planilhas 16,%
Outra 2,%
Fonte: Benchmarking de dados públicos – Socrata.
O princípio fundamental e mais evidente relacionado à publicação de dados públicos é a transparência, que informa
uma série de outros princípios e critérios, relacionados a seguir:
Efetividade: a oferta se adéqua à demanda da informação.
Para que haja efetividade na publicação dos dados e indicadores, as informações disponibilizadas devem atender às
reais necessidades do público interessado. Um critério interessante a se observar nesse sentido é se “Há um módulo
de sugestões que permita a cidadãos, jornalistas, pesquisadores e demais interessados propor e votar propostas
de novas informações a serem disponibilizadas?”. O cidadão propõe a disponibilização de novos dados e
indicadores, a força de sua proposta é mensurada por meio de votação aberta, e somente as propostas mais fortes
são implementadas.
Com um sistema de feedback, que cria estatísticas sobre o acesso aos dados disponibilizados, é possível observar se
as novas informações (e as antigas também) estão sendo acessadas e utilizadas. Caso haja pouco acesso a
determinadas informações em um período delimitado, elas são excluídas do site, retirando-se informações “lixo” e
reduzindo-se o custo de manutenção da base de dados. Assim mantêm-se apenas informações realmente
apropriadas pelo público, tornando-as fáceis de encontrar e utilizar. Nesse sentido, deve-se observar o critério “Há
um registro (estatística) de quais dados são populares e como eles estão sendo consumidos, por método de acesso
(visualizações online, downloads, API calls, embeds)?”.
Outro método interessante de obter informações sobre a demanda de informação são os sistemas de busca. “Há um
registro das tendências de busca que informam quais palavras-chave são mais populares?”. Em conjunto com
outras práticas de feedback, esse registro acaba com um processo de “adivinhações” a respeito das necessidades de
informação. Os administradores do site sabem quais informações o público busca e trabalha para disponibilizar
aquelas mais importantes.
Além disso, para que a oferta de informação seja efetiva, deve se verificar se “Há destaque em indicadores mais
relevantes?”. Com o feedback, é possível identificar as informações mais acessadas e torná-las mais fáceis de
encontrar, alinhando a oferta à demanda.
Para que haja transparência, a disponibilização das informações deve ocorrer de modo que a audiência não-técnica
possa interagir intuitivamente com os dados online e compreendê-los facilmente. Para tal, é necessário que o
conteúdo esteja disponível na própria página, e não apenas para download. Além disso, é desejável também que
haja uma série de possibilidades de visualização dos dados, em diferentes tipos de gráficos como linhas, setores,
colunas, mapas e afins. Se implementadas estas possibilidades, é importante que haja processamento prévio dos
gráficos disponibilizados, de forma se evitar lentidão na exibição dos dados.
Por outro lado, como a disponibilização de dados se volta também a pesquisadores e acadêmicos, é desejável que se
possibilite o tratamento e análise de dados, discutidos a seguir.
Se por um lado os indicadores devem estar disponíveis na própria web para atender à audiência não-técnica, é
desejável também que o download dos dados esteja disponível para atender aos pesquisadores. Para garantir que
haja transparência de fato das informações, é desejável não apenas que os dados consultados estejam disponíveis
para download, mas também a possibilidade de download completo do banco de dados, para que se estimule a
cooperação do público interessado na construção de conhecimento sobre as questões públicas.
É desejável também que estas informações sejam disponibilizadas em uma grande variedade de formatos (CSV,
JSON, PDF, RDF, RSS, XLS, XLSX, XML), que atendam aos diversos tipos de público dependendo do destino dado às
informações obtidas.
Para este tipo de público, é desejável também que haja informações adicionais sobre os indicadores, além dos
dados. Descrição, limitações, fonte, links para pesquisa e questionários que geram os dados são bons exemplos.
Este princípio pode ser incorporado à “efetividade a oferta se adéqua à demanda da informação”. Para sermos
efetivos na publicação dos dados, estes devem ter uma grande exposição entre os cidadãos. Um meio importante
de aumentar o alcance das informações disponibilizadas é permitir aos cidadãos que propaguem dados
interessantes em redes sociais como Facebook, Twitter e Blogs pessoais, criando um canal social de distribuição
de dados e informações governamentais.
Estimular a apropriação de dados e indicadores entre diferentes atores, assim como sua parceria
e participação na construção de conhecimento.
Para estimular a participação na construção do conhecimento, é desejável que o público possa fornecer
comentários e idéias sobre os dados, e que estejam visíveis à comunidade, de modo a se recuperar na sociedade
informações que de outra forma seriam ignoradas pela administração pública.
É interessante também que órgãos e entidades possam publicar descentralizadamente seus dados, tornando-se
por iniciativa própria parte integrante de um sistema centralizado de informações governamentais. Cada unidade
seria responsável por atualizar seus próprios dados, reduzindo-se assim o custo de recuperação do sistema. Com o
registro de feedback, unidades com baixo acesso podem ser desligadas do sistema, reduzindo-se custos de
administração.
Nesse sentido, seria desejável que estas unidades pudessem validar seus dados com uma assinatura digital,
garantindo sua integridade ao reconhecê-los como autênticos.
Além disso, outra idéia interessante seria uma seção com dados carregados pela própria sociedade. Esta
possibilidade aumentaria a apropriação do site pelo público interessado, pois cria um espaço para que possam dar
visibilidade frente à sociedade a indicadores que julgam importantes.
Quanto à correção e qualidade dos dados, é importante que sejam disponibilizadas séries históricas consistentes,
não fragmentadas por ano ou local em sua visualização ou download, de forma a não se ferir o princípio da
transparência.
Além disso, deve ser possível e fácil ao público reportar problemas nos dados, como inconsistência nos números,
registros duplicados e dados existentes na fonte mas faltantes na série histórica. Trata-se de mais uma forma de se
garantir a qualidade dos dados com custos reduzidos de administração, pois além do governo, o próprio público
contribui para a correção das informações.
Sobre a tempestividade e atualidade dos dados disponíveis, é desejável também que haja um registro da data em
que foi adicionado o último dado da série. Com este registro, o público poderá identificar e reportar casos em que
existam dados mais recentes não inseridos no banco, contribuindo para que os dados disponibilizados estejam
sempre atualizados.
Sigilo
Questões de privacidade e segurança são uma das barreiras que podem impedir a publicação de dados do governo.
Para amenizar estas questões, é possível que conjuntos de dados sejam marcados como privados, compartilhados
seletivamente ou abertos ao público. Assim, informações que não interessem ao público podem ser compartilhadas
somente entre um grupo restrito de interessados.
Abrir API para reduzir custos e retirar barreiras para a comunidade de desenvolvedores,
aumentando as chances de que eles investiam mais tempo em produzir aplicativos que usam
dados do governo;
A publicação de dados em uma estrutura padronizada e aberta, bem documentada, permite o acesso programático a
dados e metadados de qualquer indicador ou banco disponível no site, facilitando o desenvolvimento de aplicativos,
pela comunidade, que usam os dados do governo.
Para incentivar a participação da comunidade de desenvolvedores, é possível constituir uma galeria promovendo os
últimos aplicativos criados pelo público.
Considerações finais
Os critérios elencados neste estudo são baseados em princípios considerados importantes na publicação dos dados e
indicadores públicos, por isso “é importante ou desejável que” não sejam ignorados no desenvolvimento de uma
plataforma de publicação.
Além disso, a implementação de uma série destes critérios reflete um trade-off entre qualidade e custos. Portanto, é
possível que alguns dos critérios discutidos sejam ignorados em razão de limitações de tempo ou recursos humanos
e financeiros, de acordo com a restrição orçamentária que se coloca.