Sei sulla pagina 1di 74

ISSN 1980-3958

Julho, 2012

235

Introduo a organizao, tratamento


e anlise descritiva de bases de dados
em planilha eletrnica (Libre Office Calc)

ISSN 1980-3958
Julho, 2012

Empresa Brasileira de Pesquisa Agropecuria


Embrapa Florestas
Ministrio da Agricultura, Pecuria e Abastecimento

Documentos 235

Introduo a organizao,
tratamento e anlise
descritiva de bases
de dados em planilha
eletrnica (Libre Office
Calc)
Jos Mauro Magalhes vila Paz Moreira

Embrapa Florestas
Colombo, PR
2012

Embrapa Florestas
Estrada da Ribeira, Km 111, Guaraituba,
83411-000, Colombo, PR - Brasil
Caixa Postal: 319
Fone/Fax: (41) 3675-5600
www.cnpf.embrapa.br
sac@cnpf.embrapa.br
Comit Local de Publicaes
Presidente: Patrcia Pvoa de Mattos
Secretria-Executiva: Elisabete Marques Oaida
Membros: lvaro Figueredo dos Santos, Antonio Aparecido
Carpanezzi, Claudia Maria Branco de Freitas Maia, Dalva Luiz
de Queiroz, Guilherme Schnell e Schuhli, Lus Cludio Maranho
Froufe, Marilice Cordeiro Garrastazu, Srgio Gaiad
Superviso editorial: Patrcia Pvoa de Mattos
Reviso de texto: Mauro Marcelo Bert
Normalizao bibliogrfica: Francisca Rasche
1a edio
Verso digital (2012)
Todos os direitos reservados
A reproduo no-autorizada desta publicao, no todo ou em
parte, constitui violao dos direitos autorais (Lei no 9.610).
Dados Internacionais de Catalogao na Publicao (CIP)
Embrapa Florestas

Moreira, Jos Mauro Magalhes vila Paz.


Introduo a organizao, tratamento e anlise descritiva de bases de
dados em planilha eletrnica (Libre Office Calc) [recurso eletrnico] / Jos
Mauro Magalhes vila Paz Moreira. - Dados eletrnicos. - Colombo :
Embrapa Florestas, 2012.
(Documentos / Embrapa Florestas, ISSN 1980-3958; 235)
Sistema requerido: Adobe Acrobat Reader.
Modo de acesso: World Wide Web.
<http://www.cnpf.embrapa.br/publica/seriedoc/edicoes/doc235.pdf>
Ttulo da pgina da web (acesso em 13 ago. 2012).
1. Planilha eletrnica. 2. Programa de computador. 3. Dado. I. Ttulo.
II. Srie.
CDD 005.368 (21. ed.)

Embrapa 2012

Autor

Jos Mauro Magalhes vila Paz Moreira


Engenheiro Florestal, Doutor,
Analista da Embrapa Florestas
josemauro@cnpf.embrapa.br

Apresentao

Vivemos na era da informao, quando dispomos de uma


infinidade de bases de dados que podem nos trazer variadas
e importantes informaes, desde que possamos trabalha-las
e extrair delas as informaes que necessitamos. Atualmente
temos acesso ferramentas computacionais (hardware
e software) que nos permitem realizar esta tarefa, mas o
conhecimento necessrio para faz-lo pode limitar o acesso para
a maioria dos usurios.
Na falta de conhecimentos mais especializados em ferramentas
de bancos de dados, as planilhas eletrnicas podem, at certo
ponto, auxiliar na superao desta barreira ao ser utilizada como
ferramenta para a gerao dos relatrios desejados. Entretanto,
para que as planilhas possam ser utilizadas desta forma,
necessrio que o usurio tenha algum conhecimento bsico
sobre organizao e tratamento destes dados neste ambiente
e sobre as ferramentas de anlise de dados que as mesmas
disponibilizam.
A flexibilidade de insero e organizao dos dados uma
das grandes vantagens oferecidas pelas planilhas eletrnicas.
Entretanto, esta facilidade de organizao leva aos usurios

a adotarem a forma de entrada e apresentao dos dados


que melhor lhes convenha, geralmente mais semelhantes aos
formulrios de coleta de dados ou do relatrio que desejam
elaborar ao final do trabalho. Contudo, muitas vezes esta
forma de organizao dos dados pode no permitir o uso das
ferramentas da planilha eletrnica para a sua anlise de maneira
mais eficaz e eficiente.
O objetivo desta publicao compartilhar alguns conhecimentos
a respeito da organizao, tratamento e anlise descritiva de
bases de dados utilizando planilhas eletrnicas, em especial a
planilha eletrnica do pacote Libre Office.
Washigton L. E. Magalhes
Chefe de Pesquisa e Desenvolvimento

Sumrio

Organizao de dados....................................................9
Tratamento de bases de dados......................................19
Utilizando funes da planilha eletrnica.................................... 20
Utilizando outras ferramentas da planilha eletrnica..................... 28

Unio de bases de dados..............................................37


Conceito de relacionamento entre bases de dados...................... 38
Unindo bases de dados com um relacionamento um para um........ 39
Unindo bases de dados com um relacionamento um para muitos... 47

Anlise descritiva de dados..........................................51


Consideraes finais....................................................69
Referncias ...............................................................70

Introduo a organizao,
tratamento e anlise
descritiva de bases
de dados em planilha
eletrnica (Libre Office
Calc)
Jos Mauro Magalhes vila Paz Moreira

Organizao de dados

Atualmente vivemos na era da informao, onde h


disponibilidade de uma grande quantidade de dados, alm de
ferramentas computacionais (hardware e software) que nos
permitem extrair variadas informaes das bases de dados
disponveis. Entretanto, a maioria dos softwares estatsticos
ou de banco de dados relacionais que lidam com grandes
quantidades de dados exige conhecimento especializado para o
seu uso, tornando o seu acesso mais difcil para a maioria dos
usurios.
Esta barreira pode ser superada, at certo ponto, pelo uso
das planilhas eletrnicas, desde que o usurio tenha algum
conhecimento bsico sobre organizao e tratamento destes
dados neste ambiente e sobre as ferramentas de anlise de
dados que as mesmas disponibilizam. Atualmente, as planilhas
tm capacidade de lidar com aproximadamente um milho de
registros, e dispem de ferramentas de fcil uso para a anlise
preliminar destes dados. Alm disso, so mais fceis de aprender

12

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

do que os programas convencionais de estatstica, tornando a


anlise de bases de dados maiores mais acessveis a usurios
finais (NEUFELD, 2003).
A flexibilidade de insero e organizao dos dados uma
das grandes vantagens oferecidas pelas planilhas eletrnicas.
Entretanto, esta facilidade de organizao leva aos usurios
a adotarem a forma de entrada e apresentao dos dados
que melhor lhes convenha, geralmente mais semelhantes aos
formulrios de coleta de dados ou do relatrio que desejam
elaborar ao final do trabalho. Contudo, muitas vezes esta forma
de organizao dos dados pode no ser a melhor, por no
permitir o uso das ferramentas da planilha eletrnica para a sua
anlise de maneira mais eficaz, eficiente, e minimizando os erros
que possam ocorrer no processo de organizao, tratamento e
anlise da base de dados.
Caso o usurio deseje utilizar o potencial das ferramentas de
anlise descritiva de dados e facilitar a juno de bases de
dados, a organizao dos dados na planilha eletrnica deve
seguir o mesmo padro de organizao de dados utilizado em
qualquer software de estatstica, no qual cada observao da
base de dados inserida em uma linha, e cada coluna representa
uma varivel.
O objetivo desta publicao compartilhar alguns conhecimentos
a respeito da organizao, tratamento e anlise descritiva de
bases de dados utilizando planilhas eletrnicas, em especial a
planilha eletrnica do pacote Libre Office.
Dados podem ser entendidos como informaes numricas
necessrias para nos ajudar a tomar decises melhor
fundamentadas em determinadas situaes (LEVINE et al.,
2000).

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Dados e variveis

Uma varivel pode ser compreendida como uma classificao


ou uma medida que se altera para cada caso em estudo
(observao) (DUARTE, 2008). Segundo Iemma (1992), as
variveis podem ser classificadas em dois tipos: quantitativas,
quando descrevem quantidades, podendo ser comparadas a
conjuntos numricos; e qualitativas, que so utilizadas para
descrever qualidades, categorias, etc. As variveis quantitativas
podem ser contnuas, quando so utilizadas para descrever dados
contnuos, ou seja, que podem assumir qualquer valor no conjunto
dos nmeros reais; ou discretas, sendo aquelas que assumem
apenas determinados valores no campo dos reais. As variveis
qualitativas podem ser ordinais, quando os valores das suas
observaes apresentarem um sentido possvel de ordenamento,
tais como classe de renda, nvel de escolaridade, qualidade de
um dano em uma rvore ou uma classificao de fuste. Tambm
podem ser classificadas como nominais, quando no houver um
sentido de ordenamento nos seus valores, tais como gnero,
estado civil, nome de municpio, nome cientfico, etc.
As variveis tambm podem ser classificadas de acordo com as
suas escalas de razo (GUJARATI, 2006), sendo enquadradas
nas categorias escalas de razo, de intervalo, ordinal e nominal.
Quando o resultado da razo (x1/x2) e distncia (x1 x2) de valores
de variveis diferentes (x1 e x2) resultam em grandezas com
significado, ento temos duas variveis com escala de razo. Outra
caracterstica destas variveis que elas possuem um ordenamento
natural dos seus valores ao longo da escala (GUJARATI, 2006).
Variveis com escalas de intervalo apresentam as caractersticas
de distncia e ordenamento natural entre dois valores distintos.
Por exemplo, a distncia entre dois perodos de tempo faz
sentido, e h um ordenamento natural entre os dois, j a razo
entre os mesmos uma grandeza que no tem sentido.

13

14

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Variveis com escala ordinal satisfazem a terceira propriedade


da escala de razo (ordenamento natural), tais como classes de
renda (alta, mdia, baixa) ou classificao de danos em rvores
(leve, mdio e grave).
Variveis com escala nominal so aquelas que no satisfazem
nenhuma das trs propriedades da escala de razo, tais como
gnero (masculino e feminino), estado civil (casado, solteiro,
divorciado).
Compreender como se classificam as variveis nos auxilia no
momento de escolher que tipos de anlises ou tratamentos podem
ser aplicados para extrair informaes a partir das mesmas.
Uma observao da base de dados composta por uma linha,
e o ideal que ela contenha valores para todas as variveis
armazenadas na base de dados.
Ao longo desta publicao, iremos compartilhar algumas
tcnicas e ferramentas para organizar e tratar bases de dados em
planilhas eletrnicas por meio de um estudo de caso aplicado a
bases de dados florestais de fontes secundrias. Iremos construir
uma base de dados que contenha as quantidades produzidas e
o valor da produo de lenha e madeira em tora dos municpios
paulistanos entre o perodo de 2001 e 2010, e classific-los de
acordo com a mesorregio e microrregio qual pertencem.
Iniciaremos com a obteno dos dados de quantidade produzida
dos produtos da extrao vegetal e silvicultura do site do
Instituto Brasileiro de Geografia e Estatstica (IBGE). Execute a
seguinte sequncia de passos:
1) Acesse o site do IBGE no endereo www.ibge.gov.br;
2) No menu localizado no lado direito, clique na opo Banco de
Dados;

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

3) Clique na opo SIDRA, conforme ilustrado na Figura 1.

Figura 1. Acesso ao banco de dados agregados (SIDRA).(IBGE, 2012).

4) Aps entrar na base de dados SIDRA, acesse o tema


Silvicultura;

Figura 2. Acesso ao banco de dados agregados (SIDRA). (IBGE, 2012).

15

16

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

5) Acesse a aba intitulada Produo (Figura 3);

Figura 3. Acesso aba Produo do tema Silvicultura. (IBGE, 2012).

6) Acesse a tabela de quantidade produzida ao longo dos anos


(Figura 4);

Figura 4. Acesso tabela Quantidade Produzida. (IBGE, 2012).

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Para os nossos trabalhos, selecionaremos a base de dados com


as seguintes caractersticas:
I)Tipo de produto da silvicultura:
a) Lenha;
b) Madeira em tora para papel e celulose;
c) Madeira em tora para outras finalidades.
II) Ano:
a) Incio em 2001 e trmino em 2010.
III) Unidade territorial:
a) Todos os municpios do estado de So Paulo [Em So Paulo (549)].
A Figura 5 apresenta a elaborao da consulta desejada.

Figura 5. Construo da consulta sobre produo da silvicultura na base SIDRA. (IBGE,


2012)

17

18

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Durante o processo para montar a nossa base de dados


importante lembrar dos seguintes aspectos:
1) Marcar a opo na linha para cada varivel selecionada,
isto ir organizar a base de maneira que a variao dos valores
de cada varivel selecionada (tipo de produto, ano, unidade
territorial) varie na linha e no nas colunas, mantendo a nossa
base de dados organizada de maneira que cada coluna seja uma
varivel e cada linha contenha uma observao.
2) Marcar as opes exibir cdigo e exibir nome na caixa
de seleo das unidades territoriais, uma vez que o cdigo de
cada municpio nico. Tal informao ir facilitar o trabalho de
juno desta base de dados com outras bases desagregadas por
municpio, tal como o valor da produo.
3) Selecione a opo de gravao mais adequada ao seu caso. Neste
exemplo, como a consulta realizada gera menos de 20.000 valores,
podemos escolher a opo imediata, e dar um nome a nossa consulta.
4) Aps o trmino da elaborao da consulta, clique no boto OK
e a consulta gerada ser exibida. Clique no nome do arquivo com
o boto direito do mouse, escolha a opo Salvar link como...
e salve a consulta gerada no seu computador (Figura 6).

Figura 6. Salvar arquivo contendo a base de dados gerada na base SIDRA.

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

A base de dados deve ter apenas uma linha de cabealho


contendo o nome das variveis, todas as demais linhas devem
conter as observaes, no podendo haver linhas completamente
em branco no meio da base.
a)Abra a planilha eletrnica (LibreOffice Calc);
b)v em Arquivo => Abrir;
c)escolha o arquivo gerado pela consulta.
A planilha ir abrir um importador de texto, pois a base est
salva utilizando um formato especial de apresentao de dados
tabulados em arquivos de texto, que so valores separados por
vrgula (comma-separated values csv). Neste caso, como o
idioma da mquina est definido como Portugus, os valores vm
separados por ponto e vrgula.
Selecione as seguintes opes na tela de importao da planilha:
a) na seo Importar, escolha da linha 3, uma vez que as duas
primeiras linhas do arquivo contem cabealhos com informaes
da tabela e da consulta fornecidas pelo IBGE, e os cabealhos
das variveis aparecem na linha 3;
b) em opes de separadores, desmarque todas as outras e
selecione a opo ponto e vrgula (Figura 7);
c) Clique em OK.

19

20

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Figura 7. Importando o arquivo csv para a planilha eletrnica Calc do OfficeLibre 3.4.

Ao abrir o arquivo, digite o cabealho da varivel quantidade


produzida na clula D1, exclua as linhas no final da base com
as notas de rodap e a fonte, deixando apenas a base de
dados com os cabealhos das variveis na primeira linha e as
observaes nas linhas restantes. A base dever ficar como
apresentado na Figura 8.

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Figura 8. Formato inicial da base de dados de produo da silvicultura.

A nossa base conta com 16.470 registros e uma linha de


cabealhos, totalizando 16.471 linhas na planilha eletrnica.
Salve o arquivo como uma planilha eletrnica [Planilha ODF
(.ods)] em um local de sua preferncia. O prximo passo
realizar o tratamento dos registros da nossa base de dados para
facilitar a sua anlise, a sua juno com outras bases de dados e
a obteno de informaes.

Tratamento de bases de dados

Optou-se por abordar o tema de tratamento da base de dados


em planilha eletrnica nesta publicao devido necessidade
que se encontra de separar ou unir valores das observaes
para as diferentes variveis de uma base de dados. Quando a
base apresenta poucos registros, tais modificaes podem ser
realizadas manualmente, registro a registro. Entretanto, quando
a base de dados composta de milhares de registros, torna-

21

22

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

se necessrio automatizar esta tarefa, tanto para aumentar a


eficincia do processo como para minimizar a ocorrncia de erros
no resultado final. Neste documento, enfatizaremos o tratamento
de bases de dados utilizando funes e ferramentas disponveis
na planilha eletrnica.

Utilizando funes da planilha eletrnica

A varivel Municpio da nossa base de dados de produo da


silvicultura possui trs informaes (variveis) agregadas em uma
nica varivel: o cdigo do municpio, o nome do municpio e a
sigla da Unidade da Federao (UF). interessante separar os
trs valores em trs novas colunas, facilitando a unio posterior
desta base de dados com outras de interesse que tenham
informaes discriminadas por municpio, alm de facilitar a
obteno de informaes agregadas por UF.
O primeiro passo para se proceder a separao de valores de
uma varivel buscar um padro de separao que se repita
em todos os registros da base. O cdigo do municpio uma
sequncia de caracteres dada pelo IBGE, com comprimento de
sete caracteres. Ento, iremos construir uma frmula que retorne
os sete primeiros caracteres a partir da esquerda da sequencia
de caracteres da varivel municipio. Insira trs novas colunas
entre as colunas das variveis municpio e tipo de produto da
silvicultura, para o armazenamento das variveis cdigo do
municpio, nome do municpio e sigla da UF; e renomeie as
trs colunas, sendo a primeira como CodMunicipio, a segunda
como NomeMunicipio e a terceira como SiglaUF. A frmula a
ser inserida na clula B2 ESQUERDA(A2;7). O resultado da
frmula ser exibido na clula B2, sendo o valor 3500105 para
o primeiro registro da nossa base. Copie a frmula para todos os
registros ao longo da coluna B para obter os valores dos cdigos
de municpios em separado. A Figura 9 apresenta a base de
dados aps estas alteraes, e destaca a frmula utilizada em
detalhe.

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Figura 9. Separando o cdigo dos municpios dos registros da base de dados.

O prximo passo separar o nome do municpio de cada registro


e inseri-lo na varivel NomeMunicipio. Para isto utilizaremos
a funo EXT.TEXTO() da categoria texto, que retorna uma
sequencia de caracteres a partir de um texto, onde informamos
a funo, qual a posio que se inicia a sequencia de caracteres
que desejamos e o seu comprimento. Poderamos construir uma
frmula mais complexa que identificasse a posio de incio do
nome do municpio e a posio de trmino do mesmo, sendo o
seu comprimento dado pela diferena entre as duas posies.
Entretanto, podemos observar um padro que foi seguido para
construo do nome da varivel municpio, sendo composta
pela insero inicial do cdigo do municpio com sete caracteres
(definido pelo IBGE), seguido da sequncia de trs caracteres
dados por - , seguido pelo nome do municpio, acrescido de
uma nova sequncia de trs caracteres - , terminando com
a sigla da UF, que apresenta sempre dois caracteres. Desta
forma, mesmo que no saibamos o comprimento da sequencia
de caracteres do nome do municpio, sabemos que ela ser
igual ao comprimento total da sequncia de caracteres da

23

24

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

varivel municpio menos quinze caracteres (sete do cdigo do


municpio mais seis das duas sequncias separadoras acrescidos
de dois caracteres da sigla da UF). A Figura 10 apresenta a
frmula utilizada para a obteno do nome do municpio dos
registros da varivel municpio, a ser inserida na clula C2
[ESQUERDA(A2;11;NM.CARACT(A2)-15)]. Perceba que a
frmula se ajustou ao comprimento dos valores das diferentes
observaes, extraindo sempre o nome correto de cada
municpio.

Figura 10. Obtendo o nome dos municpios dos registros da base de dados.

Para obteno da sigla da UF, iremos construir uma frmula para


extrair os dois ltimos caracteres do texto, ou os dois primeiros
caracteres a partir da direita. A funo utilizada na frmula ser
a funo DIREITA() da categoria texto, a qual ser inserida na
planilha conforme apresentado na Figura 11.

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Figura 11. Obtendo a sigla da unidade da federao (UF) dos registros da base de dados.

Aps estas modificaes, a nossa base de dados dever ficar


conforme apresentado na Figura 12.

Figura 12. Aparncia da base de dados aps a separao da varivel municpio.

25

26

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Para facilitar a juno da base de dados de quantidade produzida


da silvicultura com a base de dados de valor da produo da
silvicultura, vamos separar os valores de cdigo de produto da
silvicultura e descrio do tipo de produto da silvicultura, que
esto unidos em uma nica varivel na coluna E (tipo de produto
da silvicultura).
Incialmente insira duas novas colunas entre as colunas E e F,
e as intitule CodProduto e DescProduto, respectivamente. Para
buscar um padro na composio da escrita das observaes
da varivel tipo de produto da silvicultura, vamos utilizar a
ferramenta AutoFiltro da planilha eletrnica. Clique em qualquer
clula da base de dados, v no menu Dados => Filtro =>
AutoFiltro para fazer aparecer as caixas de listagem contendo as
opes de filtro para cada varivel. Clique na caixa de listagem
da varivel tipo de produto da silvicultura e observe que apenas
trs valores distintos so exibidos (Figura 13), de modo que a
frmula a ser elaborada precisar se adequar apenas a estes trs
registros distintos para que a mesma seja aplicvel em toda a
base de dados.

Figura 13. Registros nicos de tipos de produto da silvicultura.

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Primeiramente observamos que o comprimento da sequncia


de caracteres que representa o cdigo do produto muda,
apresentando comprimentos variados para as diferentes
observaes da nossa base de dados. Entretanto, todos os
cdigos de produto terminam no momento em que aparece o
primeiro espao da sequncia de caracteres, sendo este um
padro que podemos utilizar para a elaborao da nossa frmula.
Sendo assim, elaboraremos uma frmula que retorne a sequncia
de caracteres de comprimento igual posio do primeiro espao
menos um, contados a partir da esquerda. A frmula a ser
inserida na clula F2 ESQUERDA(E2;PROCURAR( ;E2;1)-1).
Copie e cole a frmula para todos os registros da base ao longo
da coluna F e teremos os cdigos de produto da silvicultura em
uma varivel, na coluna CodProduto (Figura 14).
Para separao da descrio do tipo de produto da silvicultura,
vamos elaborar uma frmula que retorne a sequncia de
caracteres com comprimento igual ao comprimento total da
sequncia de caracteres de cada observao da varivel tipo
de produto da silvicultura menos o nmero de caracteres da
posio do primeiro espao menos dois (que so os caracteres
referentes ao hfen e ao segundo espao do conjunto de
caracteres que separam as duas variveis), contando a partir da
direita. A frmula a ser utilizada na clula G2 ser a seguinte:
DIREITA(E2;NM.CARACT(E2) - PROCURAR( ;E2;1) 2). O
resultado observado aps a insero destas frmulas em todas
as observaes da base ao longo da coluna G, est apresentado
na Figura 15.

27

28

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Figura 14. Separao dos cdigos de produtos da silvicultura.

Figura 15. Separao da descrio dos produtos da silvicultura.

Para finalizar o tratamento da base de dados de quantidade


produzida da silvicultura, vamos eliminar as frmulas da base e
excluir as colunas com as variveis municpio e tipo de produto
da silvicultura, uma vez que os valores destas variveis j esto
inseridos nas variveis CodMunicipio, NomeMunicipio, SiglaUF,
CodProduto e DescProduto. Copie todos os registros da base

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

de dados e cole na mesma posio, utilizando a opo colar


especial, desmarcando as opes colar tudo e frmulas
(Figura 16). Em seguida exclua as colunas contendo as variveis
Municpio e Tipo de produto da silvicultura. O resultado final
pode ser observado na Figura 17.

Figura 16. Colar especial para eliminar as frmulas dos registros da base de dados.

Figura 17. Aspecto final da base de dados de quantidade produzida da silvicultura.

Passaremos agora a efetuar o mesmo tratamento j realizado


com a base de dados de quantidade produzida da silvicultura para
a base de dados de valor da produo da silvicultura, tambm
obtida no site do IBGE com os mesmos parmetros utilizados na
construo da consulta, com a diferena de que ela ser realizada
na tabela de valor da produo e no de quantidade produzida.

29

30

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Utilizando outras ferramentas da planilha eletrnica

A utilizao das ferramentas de tratamento de dados


disponibilizadas pelas planilhas eletrnicas (no caso o
LibreOffice verso 3.4) permitem a separao do contedo
de variveis da nossa base de dados de maneira muito
mais rpida e eficiente do que aquela realiza por meio de
frmulas. Entretanto, consideramos a apresentao do
primeiro mtodo de extrema importncia, pois permitiu
apresentar o raciocnio de elaborao das frmulas
para obteno das sequncias de caracteres desejadas,
possibilitando ao usurio a futura utilizao de tais funes
para obteno de subsequncias de caracteres que possam
envolver outras situaes alm da separao de valores
compostos de uma varivel. Alm disso, as ferramentas
apresentadas a seguir no estavam disponveis em verses
anteriores das planilhas eletrnicas, e a absoro deste
conhecimento permitir ao usurio a separao de variveis
em verses de planilhas eletrnicas mais antigas.
Para obter a base de dados de valor da produo,
acesse o SIDRA no site do IBGE seguindo os mesmos
passos apresentados nas Figuras 1 e 2, sendo que a aba
selecionada ser a de valor ao invs de produo (Figura
18). Monte o quadro respeitando as mesmas opes
descritas no passo 6 (pgina 16) e salve o arquivo com o
nome de SilvValorSP.csv no mesmo local onde foi salvo o
arquivo SilvProdSP.csv.

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Figura 18. Tabela para consulta dos dados de valor da produo da silvicultura.

Abra o arquivo SilvValorSP.csv e realize a importao dos


dados para a planilha eletrnica a partir da linha 3, conforme
apresentado na Figura 7. Em seguida, insira o nome do cabealho
da varivel Valor (Mil R$) na clula D1 e exclua as duas ltimas
linhas da planilha, pois elas no possuem observaes, apenas
as notas de rodap. Salve a planilha com o mesmo nome, mas
com uma extenso de planilha eletrnica [Planilha ODF (.ods)] no
mesmo local do arquivo SilvProdSP.ods. A forma inicial da nossa
base de dados de valor da produo da silvicultura dever ser
semelhante Figura 19.

31

32

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Figura 19. Formato inicial da base de dados de valor da produo da silvicultura.

Aparentemente, as variveis cdigo e nome de municpio e sigla


da UF so separadas por um hfen. Para confirmarmos se a
nossa suspeita est correta, vamos construir uma frmula que
conte a quantidade de hifens em cada observao da varivel
municpio. Se o resultado for dois, ento temos um forte
indcio de que podemos utilizar o hfen como separador entre
as variveis. Como no h uma funo que conte a quantidade
de um determinado caractere dentro de um texto, utilizaremos
uma funo que conte o total de caracteres do texto e subtraia
este valor da quantidade de caracteres do texto sem os hifens,
de modo que o resultado ser a quantidade de hifens contida
no texto. Para isto, utilizaremos as funes NM.CARACT() e
SUBSTITUIR() em uma nova coluna, inserida entre as variveis
municpio e tipo de produto da silvicultura, intitulada verifica
(Figura 20).

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Figura 20. Frmula para contar o nmero de hifens dos registros da varivel municpio.

A frmula apresentada na Figura 20 composta por dois


termos, sendo que o primeiro possui uma funo e o segundo
duas funes. O primeiro termo calcula o comprimento
da cadeia de caracteres contido na clula A2 [NM.
CARACT(A2)], e o segundo termo composto de duas
funes encapsuladas. Primeiro, substitumos o caractere
hfen por um caractere vazio, em seguida calculamos o
comprimento da nova cadeia de caracteres sem os hfens [NM.
CARACT(SUBSTITUIR(A2;-;))]. Um argumento de texto
(string) sempre deve ser passado para a funo entre aspas
duplas, no terceiro argumento da funo SUBSTITUIR() um
texto vazio. O resultado da nossa frmula 2, ou seja, existem
dois hifens na clula A2.
Ao copiarmos a frmula para as demais observaes da planilha
e utilizarmos a ferramenta de AutoFiltro, podemos verificar se
h a ocorrncia de registros com mais de dois hifens na nossa
base de dados. Ao clicarmos na caixa de listagem contida no
cabealho da varivel verifica, observamos a ocorrncia de
nmeros 2 e 3, indicando que existem registros cuja cadeia de
caracteres da varivel municpio possuem mais de dois hifens,
de modo que a utilizao do hfen para separar o cdigo do
municpio geraria uma separao errada em alguns registros

33

34

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

da nossa base. Um segundo olhar permite identificar que a


sequncia de caracteres composta por um espao, um hfen e
outro espao pode ser utilizada para separar as variveis.
Para testarmos esta nova hiptese, vamos modificar a nossa
frmula para substituir a sequncia de caracteres - ao invs
de -. Copie esta nova frmula para todos os registros e
observe a listagem de filtros novamente. Perceba que apenas
o nmero 6 aparece na listagem, ou seja, existem apenas duas
sequncias de caracteres - em todos os registros da nossa
base de dados (cada uma com trs caracteres). Sendo assim,
podemos utilizar esta sequncia de caracteres para separar os
valores de cdigo de municpio, nome de municpio e sigla da UF
da nossa base de dados, substituindo-os por um caractere vlido
como separador de campos na planilha eletrnica.
Os separadores de campos mais utilizados em tabulao de
dados em arquivos de texto so apresentados na Figura 21.
Como j sabemos que o separador de campos utilizado nas
observaes da nossa base de dados o conjunto de trs
caracteres compostos por - , vamos substitu-los por um
separador de caracteres vlido que possa ser utilizado pela
ferramenta de texto para colunas da planilha eletrnica, no caso
a sugesto o ponto e vrgula.

Figura 21. Conjunto de caracteres vlidos para a tabulao de dados em arquivos texto.

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Inicialmente altere os cabealhos das variveis municpio e tipo


de produto da silvicultura. Substitua o cabealho Municpio pelo
cabealho CodMunicipio;NomeMunicipio;SiglaUF, e o cabealho
Tipo de produto da silvicultura por CodProduto;DescProduto.
Em seguida selecione as colunas A e B, clique no menu Editar =>
Localizar e Substituir e solicite a substituio dos caracteres -
pelo caractere ;, conforme ilustrado na Figura 22.

Figura 22. Alterando os caracteres separadores das variveis.

Aps a substituio, insira duas novas colunas entre as


colunas A e B. Selecione a coluna A e clique no menu dados
=> texto para colunas. A insero das duas novas colunas
necessria porque a ferramenta ir separar o contedo da
coluna A de acordo com o nmero de caracteres separadores
encontrados em cada observao. Como temos dois pontos
e vrgulas em cada linha, os valores contidos na coluna A
sero separados em trs colunas, sendo a primeira a coluna
j ocupada pelos registros (coluna A) e as duas seguintes

35

36

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

pelas colunas imediatamente a direita da coluna A (no caso as


colunas B e C). A ferramenta substitui os valores encontrados
nas colunas caso estas j estejam sendo utilizadas, de maneira
que se no inserirmos duas novas colunas vazias direita
da coluna A, os valores originais das colunas B e C (tipo de
produto e ano) sero substitudos, acarretando em perda de
dados da nossa base.
Na janela de texto para colunas, execute o seguinte
procedimento:
1) Escolha o ponto-e-vrgula como opo de separador,
desmarcando as outras opes de separadores;
2)Na rea intitulada campos, selecione a primeira coluna e a
opo tipo de coluna ser habilitada. Escolha o tipo de coluna
texto;
3) Repita este procedimento para as outras duas colunas;
4) Clique no boto OK para realizar a separao dos valores.
O procedimento acima pode ser observado na Figura 23.

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Figura 23. Configurando a janela texto para colunas.

37

38

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

A Figura 24 apresenta o resultado deste procedimento na


nossa base de dados, onde os valores da coluna A esto agora
divididos nas colunas A, B e C.

Figura 24. Resultado da separao dos valores da varivel municpio.

Vamos agora repetir o procedimento para os valores da coluna


D, separando o cdigo dos produtos da silvicultura da descrio
dos produtos da silvicultura da nossa base de dados. Insira uma
coluna em branco entre as colunas D e E, selecione a coluna D
e execute a ferramenta texto para colunas, mantendo a mesma
configurao utilizada no procedimento anterior. O resultado
pode ser observado na Figura 25.

Figura 25. Formato final da base de dados de valor da produo da silvicultura.

A nossa prxima misso ser unir as bases de dados de


quantidade produzida e valor da produo da silvicultura.

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Unio de bases de dados


Muitas vezes gostaramos de aumentar o nvel de detalhamento
das informaes obtidas a partir de um conjunto de dados a
nossa disposio, sendo necessrio inclusive o uso de bases de
dados diferentes para a gerao das informaes desejadas. Em
relao ao nosso exemplo, se quisermos saber a evoluo do
preo mdio da madeira em tora para celulose no estado de So
Paulo, teramos que calcular o total anual da produo, o total
anual do valor da produo, e dividir o valor pela quantidade
em cada ano. Este processo pode parecer simples, mas caso
seja necessrio obter a srie com a evoluo do preo mdio
da madeira para cada produto, ou at por microrregio ou
mesorregio do Estado de So Paulo (informao ainda no
inserida na nossa base de dados), seria necessrio uma srie de
clculos e manipulaes dos dados na base, que tomariam muito
tempo e estariam sujeitos a erros durante o seu processo de
execuo.
Unir o total resultante das duas bases de dados registro a
registro no seria problema, uma vez que teramos apenas dez
registros (um para cada ano). Entretanto, faz-lo para a base
original inteira (mais de 16 mil registros) seria algo impensvel
e sujeito a erros de digitao, o que poderia comprometer
seriamente a qualidade das anlises obtidas a partir desta base
de dados. Poderamos, simplesmente, copiar e colar os registros
da coluna de valor da produo ao lado da coluna de quantidade
produzida, mas se os dados no estiverem exatamente na
mesma ordem, estaramos atribuindo valores da produo que
no se referem aos mesmos municpios, produtos e anos das
quantidades produzidas, gerando uma verdadeira confuso na
nossa base de dados.
As tcnicas que sero apresentadas a seguir possibilitam a
juno de bases de dados sem a preocupao com a ordem dos

39

40

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

registros, apenas com a correta construo da correlao das


bases de dados a serem unidas.

Conceito de relacionamento entre bases de dados

Antes de proceder unio das bases de dados de quantidade


produzida e valor da produo da silvicultura, vamos aprender
alguns conceitos bsicos utilizados no relacionamento de tabelas
em bancos de dados relacionais: o conceito de chave (primria
e estrangeira) e o conceito de tipos de relacionamento entre
tabelas (um para um, um para muitos, muitos para muitos).
Em um banco de dados relacional, as chaves esto diretamente
relacionadas com a capacidade de recuperao e manuteno
da integridade dos registros. Uma chave primria apresenta o
valor ou um conjunto de valores de uma ou mais variveis que
tornam aquele registro exclusivo em toda a tabela, sendo um
identificador nico do registro (UNIVERSIDADE DO ESTADO DE
SO PAULO, 2012). As chaves estrangeiras so utilizadas para
se estabelecer uma relao entre diferentes tabelas em um banco
de dados relacional.
As relaes entre tabelas podem ser de trs tipos
(UNIVERSIDADE DO ESTADO DE SO PAULO, 2012):
Um para um para cada registro da tabela 1 existe um nico
registro da tabela 2;
Um para muitos para cada registro da tabela 1 existem
muitos registros na tabela 2;
Muitos para muitos cada registro da tabela 1 pode ter
muitos registros na tabela 2 e vice-versa.
As duas bases de dados que queremos unir so um exemplo
de um relacionamento um para um, pois para cada registro de
quantidade produzida na silvicultura existe apenas um nico

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

registro correspondente de valor da produo. A unio da srie


contendo o ndice geral de preos disponibilidade interna (IGPDI) com a base de dados de valor da produo seria um exemplo
de um relacionamento um para muitos, para cada IGP-DI de cada
ano haveriam muitos registros com o mesmo ano na base de
dados de valor da produo. Em termos de planilha eletrnica,
no h como fazer um relacionamento de muitos para muitos
entre duas tabelas com uma nica operao. Tal relacionamento
resultaria da utilizao de duas operaes, utilizando as relaes
um para um ou um para muitos, dependendo do caso. No
entanto, no vamos aprofundar na descrio deste tipo de
relacionamento nesta publicao.
Em planilhas eletrnicas, as chaves primrias e secundrias no
existem e nem esto pr-definidas, de maneira que o usurio
que deseje utilizar estes conceitos para unir duas bases de
dados deve identificar quais campos na sua tabela tornam os
registros exclusivos, sendo esta ento a sua chave primria. O
importante definir a chave primria da tabela que possui a(s)
varivel(eis) que desejamos incorporar nossa base de dados,
para ento definir quais variveis sero utilizadas na tabela da
nossa base de dados como chave estrangeira para construo do
relacionamento entre as duas tabelas.

Unindo bases de dados com um relacionamento um


para um

No caso das bases de dados de quantidade produzida e valor da


produo, vamos utilizar a tabela de quantidade produzida como
base e trazer para ela a varivel valor (Mil R$) da tabela de valor da
produo. Na tabela de valor da produo, a combinao de variveis
que apresenta registros nicos dada pelo cdigo do municpio
(CodMunicipio), cdigo do produto (CodProduto) e pelo ano. Vamos,
ento, criar uma varivel auxiliar em cada base, que ser utilizada
como chave no relacionamento das duas tabelas. Em cada base
de dados, insira o cabealho chave na primeira linha da coluna
direita da ltima coluna da base de dados. Para criar os valores desta

41

42

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

varivel auxiliar vamos utilizar a funo texto CONCATENAR(), cujo


resultado ser a juno dos valores das variveis selecionadas para
compor a base. A insero da frmula na base de dados de valor da
produo pode ser observada na Figura 26.
Como apresentado na Figura 26, sugere-se a insero de um
caractere que no seja utilizado em nenhum registro das variveis
utilizadas como chave para separar os valores das variveis no
momento de realizar a sua concatenao (neste caso o underline
_). Este procedimento aconselhvel para permitir a visualizao
individualizada do valor de cada varivel no resultado da chave e para
impedir possveis erros na concatenao dos valores. Por exemplo,
se estivermos unindo duas variveis cujos valores do primeiro
registro sejam 00010 para a primeira e 809 para a segunda, e ocorra
em algum outro registro a combinao de 0001 para a primeira e
0809 para a segunda, ambas resultariam em uma chave com valor
00010809, de maneira que este registro no seria nico. A insero
de um caractere separador evita a possibilidade de ocorrncia deste
erro (o primeiro registro ficaria 00010_809 e o outro, 0001_0809,
sendo ambos nicos e atendendo o conceito de chave primria).

Figura 26. Construo da chave na base de valor da produo da silvicultura.

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

A concatenao dos valores tambm pode ser realizada por meio


do caractere & entre eles. A Figura 27 ilustra esta outra frmula
de concatenao aplicada construo da chave da base de
dados de quantidade produzida (SilvProdSP.ods). Neste caso,
o texto explicativo da frmula no faz sentido, uma vez que
utilizamos um caractere especial e no uma funo da planilha
eletrnica para realizar a concatenao.

Figura 27. Construo da chave na base de quantidade produzida da silvicultura

Agora precisamos saber como fazer para que a planilha eletrnica


busque o valor da produo da base de dados SilvValorSP.
ods, correspondente a cada registro de quantidade produzida
da base SilvProdSP.ods. Para isto, utilizaremos duas funes
em conjunto, a NDICE() e a CORRESP(), ambas da categoria de
funes Planilha.
A funo NDICE() da planilha eletrnica solicita quatro
argumentos, sendo o primeiro obrigatrio e os outros trs
opcionais, e pelo menos o segundo ou terceiro argumento

43

44

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

devem ser passados para a funo. Ela funciona como um jogo


de batalha naval, onde definimos um campo de coordenadas
discretas (podendo ser um vetor de uma dimenso ou uma
matriz de duas dimenses) e informamos funo qual a posio
da linha e da coluna que est o valor a ser extrado da matriz.
O ltimo argumento necessrio apenas se utilizarmos um
intervalo de clulas mltiplo, que no o caso aqui. Por exemplo,
se quisermos extrair a informao de qual vendedor realizou a
terceira venda da Tabela 2, utilizaremos a funo NDICE() da
seguinte forma: NDICE(A2:D5;3;2), obtendo-se o resultado
Marcos. Caso desejarmos o valor da primeira venda faremos
NDICE(A2:D5;1;4), e o resultado ser 550,00. A funo
tambm pode ser utilizada para extrair o valor de um vetor. Para
extrair o nome do produto carro, faramos: NDICE(C2:C5;4).
Vale ressaltar que o intervalo de clulas utilizado para Tabela
compreende apenas as linhas com observaes, no sendo
inclusa a linha com os cabealhos das colunas.
Tabela 2. Exemplo de base de dados para uso das funes de Planilha.

Ms

Vendedor

Produto

Valor (R$)

Janeiro

Joo

Bicicleta

550,00

Janeiro

Aline

Barco

1.500,00

Fevereiro

Marcos

Televiso

4.000,00

Fevereiro

Joo

Carro

35.000,00

No entanto, se precisarmos saber de antemo qual a posio que


o registro que queremos buscar ocupa em um vetor ou matriz
para ento inseri-lo na funo NDICE(), esta funo no nos
ajuda muito. Torna-se necessrio o uso de uma funo espi
que recebe de ns qual a informao que queremos e ento
se encarrega de descobrir qual a posio que esta informao
ocupa na nossa matriz de dados. A nossa funo espi a
CORRESP().

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

A funo CORRESP() solicita trs argumentos: o valor que


se deseja buscar; o vetor onde ser realizada a busca; e um
parmetro que indica qual tipo de correspondncia deve ser
utilizada na busca (-1,0,1). importante ressaltar que a funo
retorna o primeiro valor que atender s condies da busca. Se
quisermos saber a posio da primeira venda ocorrida no ms de
fevereiro na Tabela 2, utilizaramos a funo da seguinte forma:
CORRESP(Fevereiro;A2:A5;0), o resultado seria 3. Agora,
caso o nosso desejo fosse obter a posio do valor das vendas
de Joo no ms de fevereiro, teramos um problema, pois se
procurssemos por Joo na coluna de vendedor com a funo
CORRESP(Joo;B2:B5;0), o resultado seria 1, mas esta seria
a venda de janeiro. Por outro lado, se buscssemos a venda de
fevereiro por meio da funo CORRESP(Fevereiro;A2:A5;0),
o resultado seria 3, mas corresponderia venda do vendedor
Marcos. Para obtermos o registro correto, necessitamos de mais
de uma varivel para compor chave da nossa tabela, de maneira
a tornarmos os registros nicos. Sendo assim, se crissemos
uma coluna auxiliar contendo o valor concatenado das
observaes de ms e vendedor e a utilizssemos como vetor de
busca (chave) por meio da funo CORRESP(Fevereiro&Marco
s;Coluna Auxiliar;0), o valor obtido seria 4, que corresponderia
posio correta da venda de Marcos no ms de fevereiro.
O prximo passo trazer a coluna de valor da base de dados
valor da produo (SilvValorSP.ods) para a base de dados
de quantidade produzida da silvicultura (SilvProdSP.ods) de
tal maneira que os registros de valor da produo para cada
municpio, produto e ano sejam correspondentes aos registros
da base de quantidade produzida. Para no perdermos as bases
de dados originais (por medida de segurana), vamos criar uma
nova planilha eletrnica intitulada BaseSilv.ods, e copiar as
planilhas de produo e valor para este novo arquivo, conforme
apresentado na Figura 28.

45

46

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Vamos ento construir uma frmula que, para cada valor


da coluna chave da planilha de produo, procure o valor
correspondente na coluna chave da planilha de valor, retornando
a posio desse registro na planilha de valor. Ento retorne o
valor observado na coluna valor que esteja nesta mesma posio
na planilha de valor para a planilha de produo. A frmula que
utilizaremos ser dada de maneira geral por NDICE(Coluna
Valor;CORRESP(observao da coluna Chave da planilha
Producao;Coluna Chave da planilha Valor;0)) e pode ser
observada em detalhe na Figura 29, onde foi configurada para
retornar o valor correspondente ao registro inserido na linha 2 da
planilha Producao.

Figura 28. Copiando as bases de dados para um arquivo nico BaseSilv.

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Figura 29. Copiando as bases de dados para um arquivo nico BaseSilv.

Na Figura 29 pode-se observar que apenas dois argumentos


so passados para a funo NDICE(), o vetor que ela
deve retornar os resultados (no caso o valor da produo
[Valor.$G$2:$G$16471]) no campo referncia, e a posio da
observao desejada neste vetor, no campo linha. A funo
CORRESP() utilizada para encontrar a posio do registro
desejado, onde solicita-se buscar, no vetor da chave da base
valor (o segundo argumento da funo [Valor.$H$2:$H$16471]),
a posio do registro que tenha exata correspondncia (valor 0
no terceiro argumento da funo) ao valor 30500105_1.2_2001
(valor da clula H2 inserida no primeiro argumento da
funo), que representa a chave do registro desejado na base
de Producao. Outro ponto importante que os intervalos de
clulas correspondentes aos dois vetores devem estar fixados
(uso do $ antes da letra que representa a coluna e o nmero
que representa a linha do endereo de cada clula), de maneira
a no se alterarem aps executada a cpia da frmula para os

47

48

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

demais registros da base de Producao. Como desejamos que


o valor da chave da planilha Producao se altere medida que
copiamos a frmula para os demais registros da base de dados
de produo, o endereo da clula no primeiro argumento da
funo CORRESP() deve ser deixado livre (sem $) (Figura 29).
Aps copiarmos a frmula para os outros 16.469 registros da
base de dados de produo, devemos verificar se ocorreu algum
erro na busca dos valores. Caso algum valor da chave da base
de Producao no seja encontrado no vetor da chave da base
de valor, a frmula retornar o valor de erro #N/DISP, que quer
dizer no disponvel. Para verificar de maneira rpida se temos
algum registro com o valor de erro, habilite o autofiltro da base
de Producao e clique na caixa de listagem da varivel valor
(Mil R$). Na caixa de listagem aparecem todos os valores no
repetidos para os registros de valor, caso haja algum registro
com erro, o valor de erro ir aparecer ao final da caixa de
listagem. No nosso caso, no apareceu nenhum valor de erro,
de maneira que os registros foram importados com xito. Um
ltimo passo a excluso das frmulas da nossa base de dados.
Isto recomendvel uma vez que estas frmulas, mesmo sendo
ferramentas poderosas, tambm exigem uma elevada capacidade
de processamento da planilha, o que pode retardar muito o
processo de clculos futuros e tornar o manuseio da planilha
algo operacionalmente invivel. Para excluir as frmulas copie a
coluna da varivel Valor e cole os valores com a ferramenta Colar
Especial no selecionando a opo Frmulas. Aps isto, exclua
a coluna Chave da planilha Producao e exclua a planilha Valor,
j que ela no mais necessria uma vez que a sua informao
j foi incorporada na planilha Producao. O resultado destas
operaes na nossa base de dados pode ser observado na Figura
30.

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Figura 30. Base de dados contendo informaes sobre produo e valor da produo.

Unindo bases de dados com um relacionamento um


para muitos

Com o objetivo de possibilitar a agregao e posterior anlise


dos dados por meso e microrregio, e no apenas por Unidade
da Federao ou Municpio, vamos agora incorporar a descrio
da Mesorregio e da Microrregio a qual cada municpio
pertence nossa base de dados. Isto ser realizado buscando as
informaes a partir de uma tabela contendo todos os municpios
brasileiros e as suas respectivas Regies Geogrficas, Unidades
da Federao, Mesorregies e Microrregies. A tabela foi
elaborada a partir de um arquivo texto disponibilizado pelo IBGE
(2012), o qual contm a distribuio territorial nacional a partir
do ano de 2006, e pode ser observada na Figura 31.

49

50

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Figura 31. Planilha eletrnica contendo as Mesorregies e Microrregies brasileiras

Na tabela da Figura 31 observa-se a existncia de 5.564


registros, sendo cada registro correspondente a um municpio
brasileiro, cujo cdigo e descrio so apresentados nas colunas
I e J da planilha respectivamente. As demais colunas contm as
informaes de cdigo e descrio da Regio Geogrfica (A e
B), da Unidade da Federao (C e D), da Mesorregio (E e F) e
da Microrregio (G e H). A chave que individualiza os registros
desta tabela o cdigo do municpio e o seu relacionamento
com a nossa base de dados da silvicultura ser do tipo um para
muitos, uma vez que para cada registro da tabela contendo as
divises territoriais (cada municpio), temos muitos registros
correspondentes na tabela com a base de dados da silvicultura
(vrios registros com diferentes combinaes de produtos e
anos para cada municpio), mesmo que nos interesse apenas um
subconjunto dos registros da tabela com as divises territoriais
(os municpios do Estado de So Paulo).
Vamos ento inserir duas colunas entre as variveis
CodMunicipio (coluna A) e NomeMunicipio (coluna B) da
nossa base de dados de silvicultura, inserindo os cabealhos
Mesorregio e Microrregio nas clulas da linha 1 das novas
colunas B e C, respectivamente. Copie a planilha contendo as
divises territoriais para o arquivo contendo a planilha da base
de dados da silvicultura, para ento construir as frmulas que
iro buscar os nomes das Mesorregies e Microrregies de cada
municpio.

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

A frmula que retornar o nome da Mesorregio dever buscar,


para cada registro da nossa base de dados de silvicultura, a
posio do respectivo cdigo de municpio na base de dados de
divises territoriais, e ento retornar para a base de dados da
silvicultura o nome da Mesorregio da base de dados de divises
territoriais que se localize na mesma posio (linha) do cdigo de
municpio encontrado. A frmula que ser inserida na clula B2
pode ser observada com detalhe na Figura 32.

Figura 32. Inserindo a Mesorregio de cada municpio na planilha de silvicultura.

51

52

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

O resultado da frmula Presidente Prudente, indicando que


o municpio de Adamantina pertence aquela Mesorregio
geogrfica. Copie e cole a frmula para os outros registros
da coluna B da base de dados da silvicultura e, aps o
processamento dos clculos, elimine as frmulas por meio
da opo Copiar aplicada coluna B, seguido da opo Colar
Especial Nmeros e Textos. O prximo passo repetir o
procedimento para buscar o nome da Microrregio de cada
municpio para a base de dados da silvicultura. A frmula
detalhada para execuo deste procedimento pode ser observada
na Figura 33.

Figura 33. Inserindo a Microrregio de cada municpio na planilha de silvicultura.

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Agora que temos a base de dados de valor da produo e


quantidade produzida por municpio do Estado de So Paulo,
juntamente com as Mesorregies e Microrregies de cada
municpio, podemos partir para a anlise descritiva dos
dados utilizando as ferramentas que a planilha eletrnica nos
disponibiliza.

Anlise descritiva de dados

Analisar a nossa base de dados utilizando apenas as funes


mais comuns da planilha eletrnica, tais como a mdia e a
contagem de registros, seria algo trabalhoso e demandaria muito
tempo, principalmente se quisermos analisar a nossa base de
dados de maneira mais detalhada, discriminando os resultados
por municpio, mesorregio ou microrregio geogrfica. Para
aumentar a eficincia e eficcia das nossas anlises, iremos
lanar mo de uma poderosa ferramenta disponibilizada pela
planilha eletrnica, a Tabela Dinmica.
Segundo a ajuda do LibreOffice, a Tabela Dinmica permite
combinar, comparar e analisar grandes quantidades de dados.
possvel visualizar diferentes resumos dos dados de origem,
ver detalhes de reas de interesse, e pode criar relatrios.
Ela gera tabelas com funes de agrupamento de dados, tais
como mdia, desvio padro, contagem, varincia, em valores
absolutos ou percentuais, discriminadas por categorias definidas
pelo usurio, e que podem ser alteradas rapidamente. Para criar
uma tabela dinmica no Calc do LibreOffice clique em qualquer
clula da nossa base de dados, v no menu Dados => Tabela
Dinmica => Criar, conforme pode ser observado na Figura 34.

53

54

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Figura 34. Criando uma tabela dinmica.

Ao aparecer a janela de Seleo de Origem dos dados, deixe


marcada a opo Seleo atual e clique em OK. Em seguida ir
aparecer a tela para montagem do layout da tabela dinmica
(Figura 35). Os Campos de pgina so utilizados para filtrar
as observaes da base de dados utilizadas na realizao dos
clculos, os Campos de linha e de coluna so utilizados para
discriminar os clculos realizados, e os Campos de dados o
local onde devem ser inseridas as variveis que se deseja realizar
os clculos. direita da tabela aparecem as variveis disponveis
na nossa base de dados.

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Figura 35. Tela inicial para construo do layout da tabela dinmica.

Possivelmente, uma primeira informao que gostaramos de


saber seria a quantidade total produzida de cada produto em
todo o estado de So Paulo, gerando uma tabela contendo
os produtos direita dos totais (por exemplo) e a quantidade
total produzida de cada produto. Para gerar esta tabela, na
tela de layout da tabela dinmica, arraste a varivel qualitativa
DescProduto para os Campos de Linha e a varivel quantitativa
Quantidade para os Campos de dados, clique no boto OK
(Figura 36).

55

56

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Figura 36. Construo da consulta com o total da quantidade produzida por produto.

Como as quantidades produzidas dos diferentes produtos esto


na mesma unidade (m), o total gerado no final da tabela um
nmero que faz sentido, apresentando a quantidade total de
madeira em tora produzida no Estado de So Paulo entre 2010
e 2001 (Figura 37). Desta maneira, a atividade de silvicultura
nos municpios paulistas produziu mais de 300 milhes de m de
madeira bruta ao longo do perodo analisado.

Figura 37. Resultado da consulta com o total da quantidade produzida por produto.

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Apesar do total produzido no perodo ser uma informao


interessante, tambm desejamos saber a evoluo do total da
produo de cada produto ao longo do perodo analisado, o
que resultaria em uma tabela de dupla entrada (DescProduto
e Ano). Para construir esta consulta, selecione uma clula da
tabela dinmica, v no menu Dados => Tabela Dinmica =>
Criar para abrir a janela de Layout, e arraste a varivel Ano para
os Campos de coluna, em seguida clique em ok. O resultado
apresentado na Figura 38.

Figura 38. Total da quantidade produzida por produto ao longo do perodo estudado.

Agora vamos focar apenas na produo de Madeira em tora


para papel e celulose, e analisar a evoluo da sua produo
para cada Mesorregio do estado. Para isto, clique com o boto
direito do mouse em qualquer clula da tabela dinmica e escolha
a opo Editar layout (esta uma outra forma de acessar a janela
de Layout). Ao aparecer a janela de Layout da tabela dinmica
arraste a varivel DescProduto para os Campos de pgina e a
varivel Mesorregio para os Campos de linha (Figura 39).

57

58

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Figura 39. Consulta da evoluo da quantidade produzida por mesorregio.

Aps o reclculo da tabela dinmica, a soma da quantidade


produzida para cada mesorregio em cada ano poder ser
observada na tabela. Entretanto, o valor est somado para os
trs tipos de produtos, conforme podemos observar na clula
ao lado do campo DescProduto no canto superior esquerdo da
planilha. Para considerar apenas os resultados da Madeira em
tora para papel e celulose, clique na seta que aparece ao lado
do valor da varivel DescProduto e escolha a opo Madeira em
tora para papel e celulose. Para melhorar a apresentao, escolha
todas as clulas com nmeros e formate-as como nmeros sem
casas decimais e com separador de milhar. A tabela contendo a
nossa anlise est apresentada na Figura 40.

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Figura 40. Quantidade produzida de Madeira em tora para papel e celulose em cada Mesorregio ao longo do perodo de tempo analisado.

O resultado obtido (Figura 40) nos informa o valor absoluto


da produo de cada mesorregio a cada ano, mas como
poderamos obter a participao da produo das mesorregies
em cada ano e no perodo total, em percentuais? Normalmente
copiaramos os valores da tabela e calcularamos o percentual de
cada clula em relao ao total da sua coluna (participao de
cada mesorregio em cada ano). Entretanto, a tabela dinmica
nos disponibiliza ferramentas para a realizao destes clculos
de maneira mais fcil. Clique com o boto direito do mouse em
qualquer clula da tabela dinmica e escolha a opo Editar
Layout. D um duplo clique na varivel Soma Quantidade que
est no campo de dados e a janela Campo de dados ir aparecer.
Nela pode-se escolher a funo de agregao dos dados que ser
utilizada (Soma, Contagem, Mdia, Mx., Min., Produto, etc...),
no nosso caso a opo Soma j estar selecionada. Clique no
boto Mais para abrir as opes de Valor exibido onde estar
selecionada a opo Normal. Altere esta opo para % de coluna
e clique em Ok para sair do Campo de dados (Figura 41), e em
Ok mais uma vez para encerrar a configurao do layout.

59

60

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Figura 41. Elaborao da consulta de participao anual das mesorregies na quantidade


produzida de Madeira em tora para papel e celulose.

Aps o reclculo da tabela dinmica a opo de filtro na varivel


DescProduto foi retirada, voltando a utilizar os registros dos trs
produtos para a realizao dos clculos. Para voltar a obter apenas
a participao da Madeira em tora para papel e celulose, filtre a
descrio do produto novamente. O resultado obtido (Figura 42)
mostra que as principais mesorregies produtoras de madeira em
tora para papel e celulose no estado de So Paulo so Itapetininga,
Bauru, Macro Metropolitana Paulista, Vale do Paraba Paulista e
Ribeiro Preto, sendo responsveis por mais de 80% da produo
acumulada ao longo do perodo de tempo analisado.

Figura 42. Participao das mesorregies na quantidade produzida de Madeira em tora


para papel e celulose em cada ano ao longo do perodo de tempo analisado.

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Vamos concentrar a nossa anlise apenas nestas cinco


mesorregies, filtrando as demais do nosso relatrio, e observar
o comportamento da produo nas microrregies que compem
cada mesorregio selecionada. Clique na seta que aparece ao
lado da clula Mesorregio, desmarque a opo todos e marque
estas cinco mesorregies (Figura 43).

Figura 43. Filtrando as mesorregies no relatrio de tabela dinmica.

Em seguida, abra o layout da tabela dinmica e arraste a varivel


Microrregio para os Campos de linha, posicionando-a logo
abaixo da varivel Mesorregio. Dessa forma, a tabela dinmica
discriminar primeiramente a mesorregio e, em seguida, as
microrregies que pertencem a cada mesorregio (Figura 44).

61

62

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Figura 44. Layout da tabela dinmica com duas variveis nos Campos de linha.

Aps alterar o layout da tabela dinmica, filtre novamente a


varivel DescProduto para Madeira em tora para papel e celulose
e formate as clulas para nmeros com separador de milhar e
nenhuma casa decimal aps a vrgula. O relatrio obtido pode ser
observado na Figura 45.

Figura 45. Resultado da consulta discriminando mesorregio e microrregio.

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

O ltimo relatrio que faremos retornar a evoluo da


quantidade produzida de Madeira em tora para outras finalidades
dos seis municpios paulistas que apresentaram a maior produo
considerando apenas os trs ltimos anos da nossa srie de
dados (2008 a 2010).
O primeiro passo encontrar os seis principais municpios
produtores de Madeira em tora para outras finalidades
considerando apenas os trs ltimos anos. Abra o editor de
layout da tabela dinmica, arraste as variveis Mesorregio
e Microrregio para fora dos Campos de Linha e a varivel
NomeMunicpio para os Campos de linha. Arraste tambm a
varivel Ano para os Campos de pgina. D um duplo clique
na varivel Ano aps ela estar inserida nos Campos de pgina,
clique no boto Opes e na rea intitulada Ocultar itens, marque
os anos que no desejamos computar nos nossos clculos (2001
a 2007). Clique em OK para todas as janelas at sair do editor
de layout. Em seguida filtre o valor da varivel DescProduto para
Madeira em tora para outras finalidades. O resultado pode ser
observado na Figura 46.

Figura 46. Resultado da consulta discriminando os municpios e os trs ltimos anos.

63

64

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

O detalhe do filtro da varivel Ano foi deixado em destaque na


Figura 46 para evidenciar o resultado do ocultamento dos anos
entre 2001 e 2007 da varivel Ano. Para facilitar encontrarmos
os seis maiores produtores dentre os mais de 500 municpios,
vamos classificar os municpios por ordem decrescente de
quantidade produzida. Selecione as clulas contendo os nomes
dos municpios (deixe de fora o cabealho linha 5 e o total
geral na ltima linha), acesse o menu Dados => Classificar,
selecione a Coluna B e marque a opo Decrescente para a
primeira opo de filtro utilizada. Aps este procedimento,
podemos observar que os seis principais municpios produtores
de Madeira em tora para outras finalidades considerando a
produo entre 2008 e 2010, os quais so: Itapetininga, Lenis
Paulistas, Cabrlia Paulista, Botucatu e So Miguel Arcanjo.
Para filtrar apenas para os municpios que nos interessam
poderamos seguir o mesmo procedimento utilizado para a
filtragem dos valores de Ano. Entretanto, fazer isto para mais de
quinhentas observaes seria algo exaustivo e pouco eficiente.
O procedimento sugerido a seguir utiliza uma frmula para
classificar, em uma nova varivel diretamente na base de dados,
os registros que interessam a nossa anlise, e depois utilizar
esta varivel nos Campos de pgina para filtrar os registros que
desejamos inserir no nosso relatrio de tabela dinmica.
A frmula que utilizaremos ser composta pelas funes SE(),
.NO.DISP() e CORRESP(). A lgica da frmula se baseia
no erro que a funo CORRESP() retorna ao no encontrar o
valor procurado dentro do vetor indicado para busca. Quando
isto ocorre, a funo CORRESP() retorna o valor #N/DISP, o
qual indica que vetor indicado no contm o valor procurado.
A funo .NO.DISP() verifica se o argumento inserido um
erro do tipo #N/DISP e retorna o valor VERDADEIRO caso seja,
e FALSO caso contrrio. A funo SE() verifica se o primeiro
argumento VERDADEIRO ou FALSO, caso seja VERDADEIRO

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

ela retorna o segundo argumento inserido na funo, caso seja


falso ela retorna o terceiro argumento.
Primeiramente insira uma nova planilha no arquivo da base de
dados e copie os seis nomes dos municpios desejados ao longo
da primeira coluna, de maneira que os nomes iro ocupar o
intervalo de clulas com endereo A1:A6. Em seguida, insira o
cabealho MaiorMunicOF na primeira linha da coluna a direita da
ltima coluna da nossa base de dados. O terceiro passo inserir
a frmula a partir da segunda linha, conforme ilustrado na Figura
47.

Figura 47. Frmula para filtragem dos municpios selecionados na base de dados.

Como aumentamos o tamanho da nossa base de dados, a tabela


dinmica no incorpora automaticamente novas linhas ou colunas
que venhamos a inserir na nossa base, de maneira que se torna
necessrio modificar o intervalo de clulas que alimenta a tabela
dinmica. V na tabela dinmica e abra o layout da tabela, clique
no boto Mais no canto inferior direito e modifique o intervalo de
dados inserido na caixa de seleo Seleo a partir de, sendo
o novo intervalo de dados dado por $Producao.$A$1:$K$16471.
Clique em Ok, e abra a janela de layout da tabela dinmica
novamente. A primeira modificao que percebemos a insero
da varivel MaiorMunicOF no conjunto das variveis disponveis

65

66

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

na nossa base. D um duplo clique na varivel Ano, clique em


Opes e desmarque os anos que foram ocultados para que a
tabela dinmica possa voltar a exibir os valores para todos os
anos. Arraste a varivel Ano dos Campos de pgina para os
Campos de coluna e insira a varivel MaiorMunicOF nos Campos
de pgina. O layout da tabela dinmica dever estar conforme
apresentado na Figura 48.

Figura 48. Layout da tabela dinmica com a varivel filtro MaiorMunicOF.

A tabela dinmica voltar a apresentar a evoluo da soma da


quantidade produzida dos trs produtos da silvicultura para
cada um dos 549 municpios em cada ano. Para completar o
relatrio desejado escolha a opo Madeira em tora para outras
finalidades na caixa de listagem da varivel DescProduto e
o nmero 1 na caixa de listagem da varivel MaioMunicOF.

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Formate a exibio dos dados numricos com separador de


milhar e nenhuma casa decimal. O relatrio final pode ser
observado na Figura 49.

Figura 49. Evoluo dos seis maiores municpios produtores de Madeira para outros fins
entre os anos de 2008 a 2010.

A principal vantagem da frmula utilizada para filtrar os valores


de municpios desejados a sua flexibilidade, pois se precisarmos
aumentar o nmero de municpios filtrados na nossa anlise para
cinquenta, precisaramos apenas modificar o vetor de referncia
da funo CORRESP(), e a frmula se ajustaria a nova realidade.
Finalizando a nossa anlise dos dados, vamos construir uma
tabela com a contagem do nmero de municpios de acordo com
classes de valor da produo de lenha no ano de 2010 com o
auxlio da tabela dinmica. Abra o editor de layout da tabela
dinmica e faa as seguintes modificaes:
1) Arraste a varivel MaiorMunicOF para fora da janela de layout,
excluindo-a do relatrio a ser calculado;
2) Arraste a varivel Ano dos Campos de coluna para os Campos
de pgina;
3) Arraste a varivel Valor (Mil R$) para os Campos de linha;
4) Arraste a varivel NomeMunicipio para os Campos de dados
e altere a sua funo na janela Campo de dados de Soma para
Contagem;

67

68

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

5) Clique em OK para gerar o relatrio;


6) Na varivel DescProduto selecione a opo Lenha;
7) Na varivel Ano selecione a opo 2010.
O relatrio de tabela dinmica ir discriminar na primeira coluna
todos os registros no repetidos de valor da produo de Lenha
no Ano de 2010, variando de zero a 36.856, com a respectiva
ocorrncia de registros da nossa base em cada valor da produo
no repetido.
Clique em qualquer clula de Valor (Mil R$), v no menu Dados
=> Esquema => Agrupar. Para gerar um nmero razovel de
classes, vamos agrupar os nossos dados em classes constantes
de 2.500, inserindo este valor no campo Agrupar por (Figura 50).

Figura 50. Agrupando os valores de Quantidade nos Campos de linha.

A Figura 51 apresenta o resultado do nosso relatrio de tabela


dinmica, onde podemos perceber que 26 municpios paulistas
obtiveram valor da produo igual ou superior a R$ 2,5 milhes
com a venda de lenha de silvicultura no ano de 2010.

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Figura 51. Nmero de municpio por classes de valor da produo de Lenha em 2010.

Para retirar os municpios que no geraram renda a partir da


produo de lenha de silvicultura em 2010 da nossa anlise,
bem como calcular a frequncia relativa de municpios em cada
categoria, abra novamente o layout da tabela dinmica e, na
janela de opes da varivel NomeMunicipio, clique no boto
Mais e selecione a opo % de coluna. Clique em OK at
executar o relatrio, ento clique em uma clula de classes de
quantidade, v no menu Dados => Esquema => Agrupar,
marque o incio como Manualmente em e insira o valor 1, clique
em OK. Em seguida filtre novamente a varivel DescProduto para
Lenha e o Ano para 2010. Na Figura 52 se pode observar que
cerca de 30% dos municpios paulista obtiveram renda menor
que mil reais com a produo de lenha de silvicultura em 2010,
65% obtiveram entre mil e dois milhes e quinhentos mil reais, e
os 5% restantes obtiveram renda bruta acima de dois milhes e
meio de reais

69

70

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

Figura 52. Calculando a frequncia relativa das classes de Quantidade.

Com estas duas tabelas, teramos os instrumentos necessrios


para a construo de um histograma de frequncias absolutas
e relativas para estudar a distribuio da ocorrncia da varivel
Valor da produo de Lenha dos municpios paulistas em
2010. Para remover a configurao de categorias e voltar a
apresentao da tabela dinmica ao seu formato original, clique
em qualquer classe de quantidade, v no menu Dados =>
Esquema => Desagrupar.

Consideraes finais

A anlise de bases de dados maiores, bem como a obteno


de informaes conjuntas de bases de dados que no estavam
unidas, se torna acessvel a uma gama maior de usurios por
meio do uso das tcnicas e ferramentas de planilhas eletrnicas
apresentadas neste documento.

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

As planilhas eletrnicas disponibilizam outras ferramentas alm


das que foram apresentadas, que permitem a juno de bases de
dados de maneira rpida e eficiente. A tabela dinmica tambm
possui funcionalidades que podem ser muito teis dependendo
da anlise desejada.
O intuito ao se escrever este documento foi iniciar uma
exposio introdutria ao tema. O usurio que tenha interesse
em se aprofundar nestes conhecimentos pode faz-lo acessando
os vrios livros, textos ou sites na internet elaborados sobre o
assunto, alm dos manuais disponibilizados no LibreOffice.

Referncias

DUARTE, M. Conceito de varivel. InfoEscola: navegando e


aprendendo, 15 ago. 2008. Disponvel em: <http://www.
infoescola.com/matematica/conceito-de-variavel/>. Acesso em:
29 mar. 2012.
GUJARATI, D. M. Econometria bsica. Rio de Janeiro: Elsevier,
2006. 812 p.
IEMMA, A. F. Estatstica descritiva. Piracicaba, SP: QOP
Publicaes, 1992. 182 p.
IBGE. Diviso territorial brasileira em 2006. In: ___. Banco de
dados agregados: sistema IBGE de recuperao automtica:
Sidra. Disponvel em: <http://www.sidra.ibge.gov.br/bda/
territorio/download/default.asp?z=t&o=4>. Acesso em: 10 abr.
2012.

71

72

Introduo a organizao, tratamento e anlise descritiva de bases de dados em planilha eletrnica


(Libre Office Calc)

LEVINE, M. D.; BERENSON, M. L.; STEPHAN, D. Estatstica:


teoria e aplicaes usando o Microsoft Excel em portugus. Rio
de Janeiro: LTC, 2000. 811 p.
NEUFELD, J. L. Estatstica aplicada administrao usando o
Excel. So Paulo: Prentice Hall, 2003. 434 p.
UNIVERSIDADE DO ESTADO DE SO PAULO. Treinamento
em BrOffice.org base. Bauru: Faculdade de Cincias, [s.d.].
Disponvel em: <www.fc.unesp.br/upload/sti/broffice/BrOffice.
org_Base.pdf>. Acesso em: 05 abr. 2012.

CGPE 10050

Potrebbero piacerti anche