Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Objetivos
Assunto
Neste módulo, vamos entender como funciona a Estatística e como pode-
mos confiar que uma amostra seja representativa de uma população. Vimos
no primeiro módulo que a Estatística é baseada em probabilidades, então,
vamos compreender como as leis da probabilidade podem ser usadas para
estimar parâmetros de uma população.
Introdução
O termo “probabilidade” vem do latim probabilis, provável. Esse termo era
empregado, desde os tempos romanos, principalmente no contexto jurídico
e se referia à qualidade de uma testemunha legal ou à medida de autoridade
de um cidadão, e era, geralmente, relacionada à nobreza. Assim, um nobre
era provavelmente (probabilis) uma testemunha mais confiável que um
plebeu.
Estatística 85 UAB
Uma Ciência de Jogadores
O estudo das probabilidades é tão antigo quanto os chamados “jogos de
azar”. Há milênios que jogadores tentam entender as chances em jogos
diversos e apostam dinheiro, calculando a probabilidade de que os ganhos
cubram o investimento inicial.
Estatística 87 UAB
Conceitos básicos da Probabilidade
O estudo da probabilidade surgiu por causa dos chamados “jogos de azar”.
Desde a Grécia antiga, apostadores querem saber quais as chances que suas
apostas têm de ganhar “a sorte grande”. Essa relação entre jogos e proba-
bilidade perdura até hoje nos termos que usamos em Estatística: a palavra
“aleatório” vem do latim Alea, ou “dado de jogar”. É conhecida a frase de
Júlio César antes de uma dura campanha militar cujo resultado dependia
quase, totalmente, da sorte: Alea jacta est, o dado foi lançado.
Dessa vez, todas as faces aparecem. Mas, ainda, há uma grande diferença
entre as frequências com que as faces aparecem. Lembremos que, no caso
de um dado de jogar “honesto”, todas as faces têm chances iguais de apa-
Estatística 89 UAB
recer. Vamos continuar jogando o dado e anotando os resultados. Após 200
lançamentos, chegamos à distribuição vista na Figura 6.
Nesse caso, podemos afirmar que esse não é um dado “honesto”: se o cor-
tamos ao meio, é possível que achemos um peso dentro dele para que caia
com mais frequência na face 6. A distribuição de frequências desvia tanto
dos valores esperados, que não há dúvida de que algo (no caso, o peso den-
tro do dado) está enviesando os resultados.Assim, dizemos que esses valores
não são aleatórios, mas são influenciados por algum fator (o peso).
Estatística 91 UAB
Algumas Ideias Sobre Probabilidades
Há algumas ideias gerais sobre probabilidades que nada mais são do que o
óbvio. Por exemplo, a probabilidade de um evento impossível ocorrer é zero.
Algo que vá contra as propriedades da matéria, por exemplo, tem 0% de
chance de acontecer, ao menos no que se pode detectar do universo. Já um
evento certo tem probabilidade de 1, ou 100%. Tudo o mais tem uma pro-
babilidade entre 0 e 1, ou 0 e 100%, de acontecer, mesmo que infinitesimal.
Algo que possa ser respondido com um sim ou não tem 50% de chance de
acontecer ou não.
Logo, um adivinho de verdade teria que acertar 100% das previsões para
poder ser considerado, realmente, alguém com visão do futuro, ou pelo
menos alguém de muita sorte: a probabilidade que acerte, ao acaso, dez
previsões tipo “sim-ou-não” seguidas é de 0, 00098.
Leis da Probabilidade
Vimos como probabilidade é a chance que um evento ocorra ao acaso. Essa
chance é calculada, dividindo o número de vezes que o evento pode ocorrer
pelo número total de eventos possíveis.
Aqui já descobrimos que o evento “um seis em cada um dos dois dados” é
uma possibilidade em 36. Será que há 36 configurações diferentes ao se jo-
gar dois dados? Vamos colocar, na tabela 1, todas as configurações possíveis
ao se lançar dois dados de jogar.
Estatística 93 UAB
No caso que estamos estudando, o evento em questão é o valor de nove
com dois dados de jogar. Há quatro maneiras diferentes de conseguirmos
um nove e cada uma das formas tem 1/36, ou 2,78% de chance de ocorrer.
Vamos, então, ao cálculo:
(1,6)
(1,5) (6,1) (2,6)
(1,4) (5,1) (2,5) (6,2) (3,6)
(1,3) (4,1) (2,4) (5,2) (3,5) (6,3) (4,6)
(1,2) (3,1) (2,3) (4,2) (3,4) (5,3) (4,5) (6,4) (5,6)
(2,1) (2,2) (3,2) (3,3) (4,3) (4,4) (5,4) (5,5) (6,5) (6,6)
2 3 4 5 6 7 8 9 10 11 12
Está claro que o valor de sete é o mais provável de ser conseguido com dois
dados, pois há seis formas diferentes de rolar um sete. Vejamos qual a pro-
babilidade de conseguir um sete com dois dados:
Podemos dizer que, nesse grupo de dados estatísticos, a moda é sete, já que
esse é o valor mais comum. Se destrincharmos os valores, as configurações
dos dois dados de jogar - (3,4), (6,3), (2,2), etc. – teríamos todas as 36 barras
do mesmo tamanho, pois as 36 configurações têm chances iguais de ocorrer.
O exemplo que vimos é bem simples, mas podem ser usadas as mesmas leis
para entender a probabilidade de eventos muito complexos.
Estatística 95 UAB
O estudo das probabilidades é extremamente intricado e alguns matemáti-
cos dedicam suas carreiras a essa área, chamada Probabilística. Não é nossa
intenção, portanto, ter o entendimento profundo ou minucioso do cálculo
das probabilidades. Os conceitos básicos, no entanto, deverão nos servir
para que entendamos suas aplicações nos cálculos de estimativas que são
fundamentais nas análises estatísticas.
Prevendo Erros
Um dos pontos fundamentais da Estatística é que toda amostra contém er-
ros que variam com o tamanho da amostra em relação à população estu-
dada. A probabilidade de que nossos dados não representem a população
está, explicitamente, inserida em todo cálculo estatístico. Por isso mesmo,
como veremos mais tarde, nunca se tem certeza absoluta da validade de
uma amostra.
Esperado x Observado
Tudo em Estatística é baseado na ideia que as frequências de ocorrência de
todo evento ao acaso vão assumir probabilidades que podem ser calculadas.
Elas servem de base para a estimação das frequências de ocorrência desses
eventos em uma população.
Teoremas básicos
No estudo da probabilidade, há dois teoremas básicos.
Em nosso curso, vimos que é o que ocorre quando jogamos dois dados de
jogar juntos: a soma dessas duas variáveis aleatórias independentes (dois
dados) vai produzir, depois de muitas jogadas, uma distribuição que muito
se assemelha a uma curva gaussiana.
Probabilidade na Estatística
Agora que temos uma noção do cálculo das probabilidades, podemos co-
meçar a entender como isso se relaciona à Estatística. Primeiro, vimos como
as probabilidades são calculadas dentro de um número possível de even-
tos, como se comportam e são equivalentes às frequências relativas de uma
amostra.
Estatística 97 UAB
ou seja, têm apenas números inteiros e que se situam dentro de uma am-
plitude restrita (no caso, entre 2 e 12). Esse tipo de distribuição é chamado
binomial. Mas é possível calcular as probabilidades de quaisquer eventos,
mesmo de variáveis aleatórias contínuas, desde que se faça primeiro, uma
distribuição de frequências a partir de uma amostra. Então, estimam-se os
parâmetros populacionais que serão usados nos cálculos das probabilidades.
Figura 10: Histograma das frequências relativas da distância entre 319 domicílios e
um oleoduto.
Figura 11: Histograma de frequências relativas com curva normal da distância entre
319 domicílios e um oleoduto.
A linha que forma uma curva em sino é chamada Curva Normal. É uma curva
estimada que dá uma ideia da forma da distribuição e permite que se saiba
a probabilidade de ocorrência de qualquer evento dentro de uma população
com base em amostras.
Estatística 99 UAB
Estatística no Computador
Os programas de computador para Estatística são fundamentais para a análi-
se de grandes bases de dados e para o uso adequado dos testes de Estatísti-
ca Inferencial. Há vários programas disponíveis, desde os muito sofisticados,
usados por astrônomos, até programas mais simples, que ajudam a calcular
testes básicos.
Resumo
A análise de amostras retiradas de uma população pode servir de base para
a estimação de parâmetros populacionais através de estatísticas amostrais.
O tamanho da amostra é fundamental para que ela seja válida na estimação
dos parâmetros com base nas estatísticas. A Estatística se baseia na proba-
Referências
CHATFIELD, C.: Problem Solving – A Statistician’s Guide. London: CHAPMAN & HALL.
1991.
LEME, R. A. DA S.: Curso de Estatística – Elementos. Rio de Janeiro: AO LIVRO TÉCNICO.
1967.
LEVIN, J.: Estatística Aplicada às Ciências Humanas. São Paulo: HARPER & ROW DO
BRASIL. 1978.
SCHMULLER, J.: Statistical Analysis with Excel. Hoboken: Willey Publishing Inc. 2009.
SPIEGEL, M. R, Estatística. MAKRON. 1994