Sei sulla pagina 1di 12

Matias Peruyera Visualizaes realizadas com dados disponveis na internet e novas possibilidades na comunicao.

Curitiba 2009

Matias Peruyera Visualizaes realizadas com dados disponveis na internet e novas possibilidades na comunicao.
Trabalho apresentado s disciplina de Jornalismo Impresso e Histria da Arte, no Curso de Jornalismo (manh), 2 semestre, da Faculdade Internacional de Curitiba FACINTER. Professores Adriana Amaral e Mnica de Freitas.

Curitiba 2009

A chamada Web 2.0 se caracteriza por ser um espao onde o usurio quem cria e alimenta os sites com seu contedo. Essa interao gera bancos de dados gigantescos com as informaes vindas do contedo do usurio, seja no contedo em si ou em metadados1 embutidos nos arquivos enviados. Muitos desses sites abrem seu contedo para que programadores possam desenvolver aplicativos que usem os bancos de dados. Geralmente so aplicativos que acrescentam novas funcionalidades aos sites, mas alguns programadores tem aproveitado a quantidade de dados como ponto de partida para transform-los em visualizaes2 atravs das quais possvel ver novas informaes. Este trabalho trata brevemente da representao grfica, ou visualizao, de dados disponveis atravs dos sites, e sua influncia sobre a infografia jornalstica e a arte. Para isto, ser analisado as visualizaes produzidas pelo programador e artista Jim Bum-

Introduo

gardner.

Como afirmam Unwin, Theus e Hofmann, Visualizao de dados boa para limpeza dos dados, para explor-los, para identificar tendncias e agrupamentos, para encontrar padres locais, para avaliar modelos de representao de grficos e para apresentar resultados.3 Essas qualidades esto presentes at em grficos mais simples, como os usados em infografia jornalstica, que seguem cdigos j conhecidos. Por exemplo, a densidade demogrfica de um pas costuma ser representada com mapas coloridos que seguem uma escala de cores associada a valores; alguns dados econmicos, como pontuao de bolsas, so representados por grficos de linhas que mostram sua evoluo ao longo do tempo; pesquisas de opinio usam grficos de pizza. A linguagem dos grficos se tornou comum a ponto de poder ser parodiada (Fig. 1) Dados mais incomuns exigem novas formas de visualizao, possivelmente combinando duas ou mais formas j conhecidas. Por exemplo, grandes volumes de informao, como as informaes vindas de institutos de estatstica de governos. Grficos onde cada elemento tem mais de um atributo que representa uma informao: por exemplo, seu tamanho representa uma varivel, sua posio outra varivel e sua cor uma terceira.

Aprendendo a linguagem

1 Dados embutidos em arquivos digitais, referentes ao prprio arquivo, como informaes sobre a exposio de uma fotografia ou o artista de um arquivo de msica. 2 O termo visualizao usado neste artigo como sinnimo de grfico, j que o termo geralmente usado para se referir a grficos de alta densidade de dados. 3 UNWIN, THEUS E HOFMANN, Graphics of Large Datasets, pg. 2.

Fig. 1: Grficos do site GraphJam.com, que permite aos usurios criar grficos, geralmente com sentido humorstico.

Um exemplo antigo de grfico complexo o que narra o caminho e as baixas sofridas pelas tropas de Napoleo durante a tentativa de invadir a Rssia, feito por Minard em 1869 (Fig. 2). Ele mostra vrias informaes ao mesmo tempo. A ida representada em bege, a volta em preto. A largura da linha representa o nmero de homens do contingente. O caminho deles representado de maneira esquemtica, assim como as bifurcaes no caminho. A temperatura enfrentada pelas tropas no caminho de volta mostrada em um grfco separado, mas relacionado com o caminho das tropas. Este grfico apontado por Edward Tufte como o melhor grfico estatstico da histria: Minards graphic tells a rich, coherent story with its multivariate data, far more enlightening than just a single number bouncing along over time.4

Fig. 2: Grfico sobre as tropas de Napoleo durante a invaso da Rssia, feito por Minard em 1869. 4 TUFTE, The Visual Display of Quantitative Information, pg. 40

Enquanto o mapa de Minard guarda certa relao com a realidade, outro tipo de dados exige uma abstrao maior. Exemplo disso so os Butterfly Graphs (Fig. 3), feitos pela primeira vez pelo astrnomo ingls Edward W. Maudner em 1904, nos quais ele organizou informao sobre ciclos de manchas solares observadas em diferentes latitudes. Esse tipo de grfico foi aperfeioada com o uso de cores e associando o grfico a outro grfico que mostra a porcentagem do sol coberta por manchas solares, resultando em um grfico de densidade alta que, apesar de precisar de um conhecimento prvio para ser lido, permite vrias leituras que no seriam possveis se a informao no estivesse registrada graficamente.

Fig. 3: Butterfly Graphs modernos, em uma releitura dos criados por Maudner.

A abertura para a participao do pblico a principal inovao da chamada Web 2.0, como afirma Henrique Antoun (2008). Alguns sites, alm de permitir upload de arquivos, permitem que programadores tenham acesso a suas bases de dados atravs da abertura das APIs,5 o que permite que programadores criem suas prprias formas de visualizar o contedo do site. Exemplos disso so o BigHugeLabs6, que uma interface alternativa que tambm oferece algumas ferramentas para o contedo do Flickr, usando os metada-

Abundncia de dados na web 2.0

dos das fotografias, que tem informaes de abertura e exposio da foto, geolocalizao, nome do dono da cmera; e informaes acrescentadas posteriormente, como tags e comentrios sobre as fotos; alm das informaes da prpria fotografia, como cores e sua distribuio. Ou os vrios sites que analisam perfis de usurios do Twitter acessando diretamente a base de dados dos tweets7 dos usurios. Considerando o nmero gigantesco de usurios que alimentam as bases de dados de sites como Twitter8 e Flickr9, temos um universo de informaes que ainda no fo5 6 7 8 9 Interface de Programao de Aplicativos, na sigla em ingls www.bighugelabs.com Termo que se refere a cada um dos textos postados no Twitter www.twitter.com www.flickr.com

ram devidamente exploradas. Por outra parte, o volume de informao gigantesco, e a forma mais adequada de gerar novas informaes a partir desses dados a visualizao atravs de grficos.

Fig. 4: visualizao realizada por Jer Thorp, mapeando os tweets dizendo Good Morning

Talvez por no encontrar utilidade nesses dados, a maioria dos projetos de visualizao caminha entre a pardia e a anlise do site, como o trabalho de Jer Thorp, que mapeou os twits dizendo bom dia (Fig. 4)10. Esse trabalho parodia o uso dado ao Twitter, e tambm questiona a qualidade do contedo gerado e classificado pelos usurios. Por exemplo, as limitaes no uso de tags ou etiquetas11 apontadas por Begelman, Keller e Smadja (2008): As pessoas pensam e etiquetam de maneiras diferentes. Isto cria um tagspace com rudos, fazendo mais difcil encontrar material etiquetado por outras pessoas. Apesar dessa limitao, a informao presente nas tags pode gerar informao interessante quando visualizada de maneira adequada, como no trabalho de Jim Bumgardner. Jim Bumgardner teve contato com programao enquanto estudava vdeo e msica no California Institute of the Arts, entre 1980 e 1984. Atualmente, ele continua desen-

Jim Bumgardner e sua srie Time Graphs

volvendo aplicativos para a web, trabalhando em sites (atualmente trabalha no site de msica Topspin12 e escrevendo, ocasionalmente, msica.
10 Disponvel em <http://blog.blprnt.com/blog/blprnt/goodmorning>. Acesso:10/12/2009. 11 Palavras-chave associadas a contedos digitais. 12 www.topspin.com

Sua relao com arte se manifesta mesmo em seus projetos mais ligados programao. Tenho tendncia a associar arte com falta de utilidade, e a maioria dos meus projetos pessoais so gloriosamente sem utilidade, diz, aproximando seu trabalho do campo artstico. Entre seu trabalho, a srie Time Graphs13 a que mais transmite informao. Eles es aproximam da estrutura de um grfico estatstico convencional, com um grid14 onde o eixo horizontal representa os meses do ano, e o vertical representa as horas do dia. Nesse grid so organizadas miniaturas de fotos disponveis no Flickr, segundo as informaes presentes nos metadados do arquivo. As fotografias so filtradas segundo suas tags. Em alguns casos, ele filtra tambm dados de diferentes regies do mundo. Cada grfico rene aproximadamente 30 mil fotografias. Cada uma delas transparente, o que permite que pontos de alta concentrao de imagens fiquem mais brilhantes. Para realizar estes grficos, Bumgardner escreveu um script em Perl e Imagemagick15, que se conecta base de dados do Flickr atravs de sua API para baixar as fotos e gerar os grficos. O design dos grficos tambm impecvel: as linhas que separam os meses e as horas so da cor e Fig. 5: Visualizao das fotografias com os tags breespessura certa para no atrapalhar a visualizaakfast, lunch e dinner do Flickr (caf da manh, o das fotos, assim como seus rtulos16 e o preto almoo e janta, respectivamente), organizadas pelo horrio do dia em que foram tiradas (6 da manh, o fundo ideal para contrastar com a cor clara meio-dia e 6 da tarde, de cima para baixo). das imagens. H uma tcnica para fazer grficos que tambm uma forma de arte. Mas neste caso, eu tambm os fiz de uma maneira brincalhona, que eu identificaria claramente como um processo artstico, similar maneira que eu fao algumas msicas diz. Podemos afirmar que o conhecimento em programao de Bumgardner o meio atravs do qual ele faz arte; isso mais evidente em outros projetos, como em seus caleidoscpios17.
13 Disponvel em <http://www.flickr.com/photos/krazydad/sets/140323/>. Acesso em 10/12/2009. 14 Srie de eixos horizontais e verticais para organizar informao 15 Perl uma linguagem de programao. ImageMagick um software de manipulao de imagens 16 TUFTE, Envisioning Information, pg. 59 17 Disponveis em <http://www.krazydad.com/bestiary/bestiary_yinyang_scope.html>. Acesso: 10/12/2009.

O resultado um grfico intrigante, de alta densidade de dados18, que permite leituras micro e macro19. Uma leitura macro a leitura do grfico como um todo. No caso do grfico feito a partir da tag sunset (Fig. 6), uma das concluses que podemos tirar que no vero o sol se pe mais tarde, como indica a curva que desce na parte do grfico referente aos meses de junho e julho, vero no hemisfrio norte. Como essa curva reflete as estaes do hemisfrio norte, o grfico tambm pode indicar que no Flickr h uma predominncia de fotos dessa regio. Em uma leitura micro, o que se v so os detalhes; em agosto a curva fica mais densa, coincidindo com o perodo que o Flickr deu maior suporte a geolocalizao; o usurio do site GustavoG observou um ritmo mensal, que poderia coincidir com o momento que o Flickr zera seu limite de upload para usurios gratuitos20, que seria quando os usurios podem postar novamente. Essa leitura micro evidencia algumas inconsistncias. Por exemplo, a presena de fotos com a tag pr-do-sol feitas s nove da manh pode ser explicada pelo horrio incorreto da cmera ou pelo fotgrafo ter etiquetado a foto com essa palavra por outros motivos (problemas tpicos da folksonomia, apontados por Begelman, Keller e Smadja). Sobre a informao revelada nos grficos, Bumgardner diz: Os fenmenos que os grficos mostram no so necessariamente de interesse cientfico (por exemplo, o fato que fotos de caf da manh serem tiradas mais cedo que as de almoo (Fig. 5) no grande novidade), ento sua falta de utilidade tambm evidncia de suas propriedades artsticas. Apesar da preciso cientfca do mtodo, ele no v os grficos como algo til, e sim como algo brincalho. Eu fiz estes grficos para minha diverso no necessa18 TUFTE, Envisioning Information, pg 4951. 19 Idem, captulo 3. 20 Comentrio visvel em <http://www.flickr.com/photos/krazydad/292424841/>

Fig.6: Visualizao construda com o tag sunset (pr do sol).

Fig.7: Visualizao construda com o tag full moon (lua cheia), onde visvel o ciclo da lua ao longo dos meses.

riamente para sua elucidao disse Jim, no frum do site de Edward Tufte, onde estava sendo discutido seu trabalho.21 Essa aparente contradio entre a concepo divertida dos projetos e a exatido cientfica do processo e da tcnica artstica o que faz o trabalho de Bumgardner ser difcil de encaixar nos modelos de grficos mais conhecidos. Estamos acostumados a grficos estatsticos de assuntos mais relevantes e de fontes mais confiveis. A srie Time Graphs rompe com vrios parmetros atuais e abre novos caminhos para o design de informao, a arte, e visualizao de dados cientficos. A disponibilidade de informao estatstica revoluciona a maneira de procurar informao. Com toda essa informao disponvel, necessrio mostr-la de maneira adequada para serem comprendidos pelas pessoas a quem a informao destinada. E essa linguagem, que apesar de no ser to nova, est cada vez mais popular no repertrio de artistas; e no s a linguagem visual, mas os recursos, que podem ser usados para criar arte. A srie Time Graphs, de Jim Bumgardner rene todas essas caractersticas. Usa informao de uma maneira nova, com um mtodo exato. O resultado rico em informao, e permite, a quem estiver disposto a fazer novas leituras, criar novas informaes. Mostra as possibilidades artsticas da programao e uso de computadores, que ainda so vistos pelos artistas como uma tcnica nova, que no ensinada no contexto da arte. E, como bnus, feita com humor. Trabalhos como este influenciam vrias reas, e aos poucos abrem caminho para novas experincias na arte, no design, no jornalismo e em outras reas da comunicao, fazendo com que o pblico se habitue a novas linguagens e maneiras de ler e entender informao.

Concluso

21 Disponvel em <http://www.edwardtufte.com/bboard/q-and-a-fetch-msg?msg_id=0001iT>. Acesso em 10/12/2009.

Bibliografia

ANTOUN, Henrique (org.). Web 2.0: participao e vigilncia na era da comunicao distribuda. Rio de Janeiro: Mauad X, 2008. BEGELMAN, Grigory; KELLER, Philipp; SMADJA, Frank. Automated Tag Clustering: Improving search and exploration in the tag space. Esccia, 2006. Disponvel em: <http:// www.pui.ch/phred/automated_tag_clustering/>. Acesso: 10/12/2009. TUFTE, Edward. The Visual Display of Quantitative Information. Connecticut: Graphic Press, 2001. ______, ______. Envisioning Information. Connecticut: Graphic Press, 1990. UNWIN, Antony THEUS, Martin, HOFMANN, Heike. Graphics of Large Datasets. Nova Iorque: Springer, 2006.

Anexo: entrevista com Jim Bumgardner, via email.


Id like to know about your relationship with art. You have worked with music and poetry. Do you consider that your Time graphs series are art too? There isnt a clear boundary between art and not art. There is a craft to making graphs which is a form of art. But in this case, I also made them in a playful way that I would clearly identify as an artistic process, simliar to the way I make some music. Also, the phenomena that the graphs illustrate are not necessarily of scientific interest (e.g. the fact that photos taken during breakfast occur earlier than lunch isnt groundbreaking news), so their uselessness is also evidence of their artistic properties. I tend to associate art with lack of utility, and most of my personal projects are gloriously useless.

Did you intend making an exhibition with them, other than showing on Internet? (I personally would like to see them printed big) I have indeed displayed some of them (at the Data+Art show at the Pasadena Museum of California Art, last year). See this link. Incidentally, the pieces in that art show explored the boundary between data and art, in a manner which you would find interesting. Having said that, I didnt originally create these with the intention of showing them in an art show. They were just personal experiments that I shared on Flickr. I was invited to the show.

The Time graphs have more design elements than other of your works. For example, you chose a logical way to arrange the photos, and didnt change them after it was done; I see it as a design decision, rather than an artistically one. What can you say about that? I dont think design decisions are different than artistic decisions. Design is a subset of art, and all design decisions are artistic decisions. Some artistic decisions involve form and layout, and some involve semantics, messaging and other things. How did you choose the tags to get the photos? It was like I want to see what happens if I choose this tag or more like I bet this tag would make an interesting graph? Its usually a bit of both. In some cases, I specifically chose tags that I knew were time correlated and might be interesting (such as sunset, breakfast lunch dinner, full moon), in other cases, (such as accidents) I was intentionally looking for things that werent highly time correlated, because I was interested to find out what I would get. What happens if I choose this was the question I asked when I built my color of graph. (<http://www.flickr.com/photos/krazydad/5035125>)

What kind of tags worked better? Well, better is subjective. The time-correlated tags tend to be more interesting to me, but they can also be kind of boring, because of the predictability of them. I think sunsets and breakfast lunch dinner are the strongest pieces, personally, because the subject matter pertains to matters which are core to human experience.

Do somebody discovered something that you hadnt realized, other than GustavoG in the Sunsets in different parts of the world graph? I think there was another photographer who recognized a strip of his photos in one graph. When Edward Tufte first saw them, he liked their use of images as data points, and commented that they were a counter example to Priit Ps assertion that montage probably cannot be used as evidence in the strict sense Can you name your influences in this style of work? Edward Tufte, Eadward Muybridge, Harold Edgerton, John Whitney Sr., John Cage

Potrebbero piacerti anche