Sei sulla pagina 1di 19

Universidade Federal de Pelotas

Centro de Educao a Distncia


Curso de Gesto Pblica
Disciplina de Estatstica Descritiva
Professora Patrcia Fantinel

1. Introduo Estatstica










1.1. Generalidades
Por que estudar Estatstica ?
- Desenvolver o raciocnio estatstico extremamente til em aplicaes de carter cientifico,
comercial .
- um instrumento de grande utilidade na tomada de deciso.
- excelente para quantificar dados.

O que Estatstica?
A Estatstica entendida como um conjunto de tcnicas que permite, de forma sistemtica,
organizar, descrever, analisar e interpretar dados provenientes de estudos ou experimentos,
realizados em qualquer rea do conhecimento. Estamos chamando de dados um (ou mais)
conjunto de valores, numricos ou no.
A grosso modo podemos dividir a Estatstica em trs reas:
Estatstica Descritiva: em geral, utilizada na etapa inicial da anlise, quando toma-se contato
com os dados pela primeira vez. um conjunto de tcnicas destinadas a descrever e resumir
os dados, com o propsito de tirar concluses sobre caractersticas de interesse.
Probabilidade: a teoria matemtica utilizada para estudar a incerteza oriunda de fenmenos
de carter aleatrio, necessria para o entendimento de algumas tcnicas estatsticas.
Inferncia Estatstica: o estudo de tcnicas que possibilitam a extrapolao, a um grande
conjunto de dados, das informaes e concluses obtidas a partir de subconjuntos de valores,
usualmente de dimenso muito menor do grande conjunto de dados que contm a
caracterstica que temos interesse. Em geral, a impossibilidade de acesso a todo conjunto
deve-se por razes de natureza econmica, tica ou fsica.

Usos da Estatstica
As aplicaes da estatstica se desenvolveram de tal forma que, hoje, praticamente todo campo
de pesquisa se beneficia da utilizao de mtodos estatsticos. A anlise estatstica est
incorporada em nosso dia-a-dia, sendo necessrio no apenas o conhecimento da estatstica
descritiva, como tambm de algumas noes de inferncia estatstica para compreenso de
Ol!
Nas duas primeiras semanas pretendemos formalizar alguns
conceitos que constituem a base das tcnicas desenvolvidas
com objetivo de auxiliar a responder, de forma clara e segura,
situaes que envolvem grande quantidade de informaes.
Uma vez que, a utilizao dessas tcnicas, destinadas anlise
de situaes complexas ou no, tem aumentado e faz parte de
nosso cotidiano.
Vamos pensar por que estudar a estatstica?
Vejamos...










2

resultados de pesquisas relacionados inflao, balana comercial, produo industrial, ao
emprego, ao salrio, distribuio de renda, educao, etc. Veja que em transmisses de jogos
de futebol, o nmero de escanteios, o nmero de faltas cometidas e o tempo de posse de bola
so dados geralmente fornecidos aos telespectadores e fazem com que as concluses sobre qual
time foi o melhor em campo, se tornem objetivas. Os fabricantes fornecem melhores produtos a
custos menores atravs de tcnicas de controle de qualidade. Controlam-se doenas com auxilio
de anlises que antecipam epidemias. Espcies ameaadas so protegidas por regulamentos e leis
que reagem a estimativas estatsticas de modificao do tamanho das populaes. Visando reduzir
as taxas de casos fatais, os legisladores tm melhor justificativa para leis como as que regem a
poluio atmosfrica, inspees de automveis, utilizao do cinto de segurana e da bolsa de ar,
e dirigir em estado de embriaguez. Citamos apenas alguns exemplos, porque uma compilao
completa das aplicaes da estatstica facilmente tomaria o resto deste polgrafo.
Alguns estudantes escolhem um curso de estatstica porque exigido, mas um nmero cada vez
maior o faz voluntariamente, porque reconhecem seu valor e aplicabilidade em qualquer campo
em que pretendam trabalhar. Como os empregadores gostam de ver um curso de estatstica no
currculo de um candidato, o profissional que tiver estudado estatstica levar vantagem ao
procurar um emprego. Afora razes relacionadas com a obteno de emprego e com a disciplina,
o estudo da estatstica pode tornar o profissional mais crtico em sua anlise de informaes e
menos sujeito a afirmaes enganosas, como as que se acham comumente associadas a
pesquisas, grficos e mdias. Como membro educado e responsvel da sociedade, o leitor deve
aguar sua capacidade em reconhecer dados estatsticos distorcidos e de interpretar
inteligentemente dados que se apresentem sem distoro.

Existem vrias maneiras de se cometer erros ou abusos em Estatstica. Algumas por simples
distrao ou ignorncia; outras por m f. Eis alguns erros ou abusos:

Exemplo de afirmaes estatsticas incorretas:
Os motoristas mais idosos so mais seguros do que os mais moos?
A American Association of Retired People - AARP (Associao Americana de Aposentados) alega
que os motoristas mais idosos se envolvem em menor nmero de acidentes do que os mais
jovens. Nos ltimos anos, os motoristas com 16 a 19 anos de idade causaram cerca de 1,5 milho
de acidentes, em comparao com apenas 540.000 causados por motoristas com 70 anos ou
mais, de forma que a alegao do AARP parece vlida.
Acontece, entretanto, que os motoristas mais idosos no dirigem tanto quanto os mais
jovens. Em lugar de considerar apenas o nmero de acidentes, devemos examinar tambm as
taxas de acidentes. Eis as taxas de acidentes por 100 milhes de milhas percorridas:
- 8,6 para os motoristas com idades de 1 6 a 19;
- 4,6 para os com idade de 75 a 79;
- 8,9 para os com idade de 80 a 84 e
- 20,3 para os motoristas com 85 anos de idade ou mais.
Embora os motoristas mais jovens tenham de fato maior nmero de acidentes, os mais velhos
apresentam as mais altas taxas de acidente.


Uso de Pequenas Amostras
Embora as pequenas amostras no sejam necessariamente ms; entretanto, os resultados
obtidos com elas podem por vezes ser usados como uma forma de "mentira" estatstica. As
preferncias de apenas 10 dentistas por determinado creme dental no devem servir de base para

3

uma afirmao generalizada como "O creme dental XYZ recomendado por 7 em cada 10
dentistas. Mesmo que a amostra seja grande, ela deve ser no-tendenciosa e representativa da
populao de onde provm. s vezes uma amostra pode parecer realmente grande (como em
uma pesquisa com "2000 adultos escolhidos aleatoriamente"), mas se forem formuladas
concluses acerca de subgrupos, como gachos catlicos do sexo masculino, tais concluses
podem estar baseadas em amostras pequenas. E tendenciosas!

Nmeros Precisos
s vezes os prprios nmeros podem ser enganosos. Uma cifra, como um salrio anual de R$
12.735,29, pode parecer muito precisa, introduzindo alto grau de confiana em sua exatido. J a
cifra R$12.700,00 no infunde o mesmo senso de preciso. Entretanto, uma estatstica com
muitas casas decimais no necessariamente precisa.

Estimativas por Suposio
Outra fonte de engano estatstico envolve estimativas que so, na verdade, suposies (ou, na
linguagem popular, "palpites"), podendo apresentar erros substanciais. Assim faz-se necessrio
considerar a fonte da estimativa e a maneira como foi estabelecida. Quando o Papa visitou Miami,
as fontes oficiais estimaram a multido em 250.000 pessoas, mas, utilizando fotos areas, o Miami
Herald chegou a uma cifra mais precisa de apenas 150.000.

Porcentagens Distorcidas
Por vezes utilizam-se porcentagens confusas ou distorcidas. Em um anncio de pgina inteira, a
Continental Airlines anuncia melhores servios. No tocante ao caso de bagagem extraviada, o
anncio afirmava que "se trata de uma rea em que j melhoramos 100% nos ltimos seis
meses". E num editorial criticando essa estatstica, o New York Times interpretou corretamente a
melhora de 100%, como significando que agora no se extravia mais qualquer bagagem - o que
ainda no foi conseguido pela Continental Airlines.

Cifras Parciais
"90% dos carros vendidos nos EUA nos ltimos 10 anos ainda esto rodando. Milhes de
consumidores ouviram esta mensagem e ficaram com a impresso de que esses carros devem ter
sido muito bem construdos para durarem tanto. O que o fabricante no mencionou foi que 90%
dos carros por ele vendidos o foram nos ltimos trs anos. A alegao, embora tecnicamente
correta, era enganosa, por no apresentar os resultados completos.

Distores Deliberadas
No livro Tainted Truth, Cynthia Crossen cita um exemplo da revista Corporate Travel que
publicou dados mostrando que, entre as companhias locadoras de carros, a Avis foi a vencedora
em uma pesquisa junto aos locatrios. Quando a Hertz solicitou informaes detalhadas sobre a
pesquisa, as respostas desapareceram e o coordenador da pesquisa se demitiu. A Hertz processou
a Avis (por falsa propaganda baseada na pesquisa) e a revista.

Perguntas Tendenciosas
As perguntas em uma pesquisa podem ser formuladas de modo a "sugerirem" uma resposta. Um
caso famoso envolve o candidato presidncia dos EUA, Ross Perot, que formulou a seguinte
pergunta em um questionrio: "O presidente deve ter o poder de vetar decises do Congresso"?
97% das respostas foram "sim". Entretanto, o percentual de respostas "sim" caiu para 57%
quando a pergunta foi "O presidente deve ter, ou no, o poder de vetar decises Congresso?" s
vezes as perguntas se apresentam involuntariamente tendenciosas em virtude de fatores como a

4

ordem dos itens a serem considerados. Por exemplo, uma pesquisa alem formulou estas duas
perguntas:
- O leitor diria que o trfego contribui em maior ou menor grau do que a indstria para a
poluio atmosfrica?
- O leitor diria que a indstria contribui em maior ou menor grau do que o trfego para a
poluio atmosfrica?
Quando o trfego foi mencionado em primeiro lugar, 45% acusaram o trfego e 32% acusaram a
indstria; quando a indstria foi citada em primeiro lugar, as porcentagens se modificaram
grandemente para 24% e 57%, respectivamente.

Grficos Enganosos
Muitos dispositivos visuais - como grficos de barras e grficos em setores - podem ser utilizados
para exagerar ou diminuir a verdadeira natureza de um conjunto dados. Os dois grficos da Figura
1.1 representam os mesmos dados do Bureau of Labor Statistics (Departamento de Estatstica do
Trabalho), mas a parte (b) tem como objetivo exagerar a diferena entre ganhos dos homens e os
das mulheres. No partindo do zero, eixo vertical, o grfico (b) tende a produzir uma impresso
subjetiva errnea. A Figura 1.1 nos d uma lio importante. Devemos analisar as informaes
numricas contidas em um grfico no nos deixando enganar por sua forma geral.

Presso do Pesquisador
Quando se formulam perguntas a indivduos pesquisados, esses frequentemente do respostas
favorveis sua autoimagem. Em uma pesquisa telefnica 94% dos que responderam disseram
que lavam suas mos aps usar um banheiro, mas a observao em lugares tais como a Estao
Penn, em Nova York e Golden Gate Park em San Francisco mostraram que o percentual efetivo
de apenas 68%.

Ms Amostras
Outras fontes de estatstica enganosas so os mtodos inadequados de coleta de dados. comum
um pesquisador analisar dados e formular concluses errneas porque o mtodo de coleta de
dados foi deficiente.
Um exemplo tpico a pesquisa feita pelo programa voc decide em que o nmero espectadores
de televiso pagaram 27 centavos para discar um nmero de telefone dando sua opinio sobre o
final do programa a cada semana. Os resultados mostravam o desejo dos que ligavam, que eram
interpretados como o desejo da populao. Como os prprios espectadores que decidiram se
seriam includos na pesquisa, temos um exemplo de pesquisa autosselecionada. Ou seja, em tais

5

pesquisas o que frequentemente ocorre que participam apenas aqueles que tm uma opinio
formada, logo a amostra dos que respondem no representativa da populao como um todo.
Dessa forma, nada podemos concluir sobre a populao em geral, dada maneira como se
obteve a amostra.

1.2. Definio
Por onde quer que se olhe ou escute uma coleo de nmeros normalmente enunciada como
estatsticas. Estes nmeros referem-se aos mais diversos campos de atividades: esportes,
economia, finanas, etc. Como por exemplo:
- O nmero de carros vendidos no pas diminuiu em 30%.
- A taxa de desemprego na Argentina atinge, hoje, 25%.
- As aes da PETROBRAS valorizaram R$ 1,50 hoje.
- Resultados do Carnaval no trnsito brasileiro: 145 mortos, 2430 feridos.

Um nmero denominado uma estatstica (singular). No fechamento da bolsa as aes da Vale
foram cotadas a R$ 45,50. As vendas de uma empresa no ms constituem uma estatstica. Por
outro lado, uma coleo de nmeros ou fatos denominado de estatsticas (plural). Por
exemplo, As vendas da empresa QUALQUER COISA totalizaram: 2,5 milhes em janeiro, 2,7
milhes em fevereiro e 3,1 milhes em maro. No entanto o termo Estatstica tem um sentido
muito mais amplo, do que apenas nmeros ou coleo de nmeros. A Estatstica pode ser
definida como:

A cincia de coletar, organizar, apresentar, analisar e interpretar um conjunto de
dados com o objetivo de tomar melhores decises.

Assim como advogados possuem 'regras de evidncia' e contabilistas possuem 'prticas
comumente aceitas', pessoas que tratam com dados numricos seguem alguns procedimentos
padres. Alguns destes mtodos sero vistos nesta disciplina. No esquecendo que uma nica
disciplina de Estatstica no esgota o assunto, ou seja, esta disciplina dar apenas uma idia dos
procedimentos e tcnicas existentes para se lidar com dados numricos ou no.
1.3. Campos da Estatstica
A Estatstica que lida com a organizao, resumo e apresentao de dados numricos
denominada Estatstica Descritiva. Assim pode-se definir a Estatstica Descritiva como sendo:

Os procedimentos usados para organizar, resumir e apresentar dados numricos.

Conjuntos de dados desorganizados so de pouco ou de nenhum valor. Para que os dados e
transformem em informao necessrio organiz-los, resumi-los e apresent-los. O resumo de
conjuntos de dados feito atravs das medidas e a organizao e apresentao atravs das
distribuies de frequncias e dos grficos ou diagramas.
Muitas vezes, apesar dos recursos computacionais e da boa vontade no possvel estudar todo
um conjunto de dados de interesse. Neste caso estuda-se uma parte do conjunto. O principal
motivo para se trabalhar com uma parte do conjunto ao invs do conjunto inteiro o custo.
O conjunto de todos os elementos que se deseja estudar denominado de populao. Note-se
que o termo populao usado num sentido amplo e no significa, em geral, conjunto de
pessoas. Pode-se definir uma populao como sendo:


6

Uma coleo de todos os possveis elementos, objetos ou medidas de interesse.

Assim, so exemplos de populaes:
- Conjunto das rendas de todos os habitantes de Porto Alegre.
- Conjunto de todos as notas dos alunos de Estatstica.
- Conjunto das alturas de todos os alunos da Universidade, etc.

Um levantamento efetuado sobre toda uma populao dito de levantamento censitrio
ou Censo.

Uma populao pode ser pequena, grande ou infinita. O nmero de observaes em uma
populao finita designado pela letra N.
Fazer levantamentos, estudos, pesquisas, sobre toda uma populao (censo) , em geral, muito
difcil. Isto se deve a vrios fatores. O principal o custo. Um censo custa muito caro e demanda
um tempo considervel para ser realizado. Assim, normalmente, se trabalha com partes da
populao denominadas de amostras. Uma amostra (com n elementos) pode ser caracterizada
como:

Uma poro ou parte de uma populao de interesse.

As medidas estatsticas obtidas com base em uma populao so denominadas parmetros
populacionais, representadas, geralmente, por letras gregas. Genericamente representamos por
u . Alguns parmetros populacionais so: a mdia ( ) , a varincia ( )
2
o e o coeficiente de
correlao ( ) . As medidas estatsticas obtidas com base em amostras so denominadas de
estimadores ou estatsticas amostrais, genericamente representamos por u

. Alguns estimadores
amostrais so: a mdia ( ) x , a varincia ( )
2
s e o coeficiente de correlao ( ) r . Os valores
numricos assumidos pelos estimadores ou estatsticas amostrais so chamados estimativas, que
genericamente representamos por
0

u










Exemplo:









Populao de alunos da Turma: N = 50 alunos
Mdia das notas da populao: = 8,3
= 8,3
6 , 7 = x
Amostra de alunos da Turma: n = 10 alunos
Mdia das notas na amostral: 6 , 7 = x
POPULAO
AMOSTRA
PARMETROS
ESTIMADORES

7

O erro amostral o erro que ocorre justamente pelo uso da amostra. Designaremos o erro
amostral por c , na qual ser determinado pela diferena entre o valor do estimador e o valor do
parmetro, isto , u u c =

. Para nosso exemplo acima temos como valor do erro amostral:
7 , 0 3 , 8 6 , 7

= = = = u u c x
. Ou seja, a mdia das notas da amostra coletada
inferior a mdia das notas da populao em sete dcimos.

Utilizar amostras para se ter conhecimento sobre populaes realizado intensamente na
Agricultura, Poltica, Negcios, Marketing, Governo, etc., como se pode ver pelos seguintes
exemplos:
- Antes da eleio diversos rgos de pesquisa e imprensa ouvem um conjunto
selecionado de eleitores para ter urna idia do desempenho dos vrios candidatos nas
futuras eleies.
- Uma empresa metal mecnica toma uma amostra do produto fabricado em intervalos de
tempo especificados para verificar se o processo est sob controle e evitar a fabricao
de bens defeituosos.
- O IBGE faz levantamentos peridicos sobre emprego, desemprego, inflao, etc.
- Redes de rdio e TV se utilizam constantemente dos ndices de popularidade dos
programas para fixar valores da propaganda ou ento modificar ou eliminar programas
com audincia insatisfatria.
- Bilogos marcam pssaros, peixes, etc. para tentar prever e estudar seus hbitos.

O processo de escolha de uma amostra da populao denominado de amostragem.

O processo de amostragem envolve riscos, pois se tomam decises sobre toda a populao com
base em apenas uma parte dela. A teoria da probabilidade pode ser utilizada para fornecer
uma ideia do risco envolvido, ou seja, do erro que se comete ao utilizar uma amostra ao invs de
toda a populao, desde que, claro, a amostra seja selecionada atravs de critrios
probabilsticos, isto , ao acaso.
A seleo da amostra pode ser feita de vrias maneiras, dependendo, entre outros fatores, do
grau de conhecimento que temos da populao, da quantidade, de recursos disponveis, etc. A
amostragem mais utilizada a amostra casual simples, em que seleciona-se ao acaso, com ou
sem reposio, os itens da populao que faro parte da amostra. Se houver informao adicional
a respeito da populao de interesse, pode-se usar outros esquemas de amostragem mais
sofisticados, como a amostragem estratificada ou a amostragem sistemtica.
Baseado nos conceitos anteriores pode-se definir Estatstica Indutiva ou lnferencial como
sendo:

A coleo de mtodos e tcnicas utilizados para se estudar uma Populao baseada em amostras
probabilstica desta mesma populao.

8


Exemplo: Para a situao descrita a seguir, identifique a populao e a amostra correspondente.
Discuta a validade do processo de inferncia estatstica.
A fim de avaliar a inteno de voto para presidente do Brasil, 122 pessoas foram entrevistadas em
Braslia.
Soluo: Populao: conjunto de eleitores do pas. Amostra: 122 eleitores de Braslia. A amostra,
restrita a apenas uma cidade, no d conta da diversidade de opinies existentes no pas, a
menos que se assuma que a populao de Braslia represente bem o conjunto do pas. Mesmo,
nesse caso, precisaramos cuidados na escolha dos 122 eleitores. Por tudo isso, no parece
adequado extrapolar o resultado dessa amostra para o pas inteiro.

Exemplo: Discuta os cuidados que precisam ser tomados para garantir uma boa concluso a
partir da amostra: Aceitao popular de um certo projeto do governo.
Soluo: Dependendo do projeto do governo, pessoas com diferentes nveis de informao
podero ter opinies diferentes. Classe social, renda ou sexo podem ser fatores que influenciam
as respostas. Seria interessante ter representantes, de cada um desses segmentos da populao,
na amostra a ser coletada.

Pr@tic@ndo
1. Uma pessoa encarregada de uma pesquisa sobre uma determinada marca de calado,
decide utilizar a lista telefnica para fazer a pesquisa. Esta escolha esta correta (sim ou
no)? Justifique sua resposta.
2. Um relatrio patrocinado pela Beer cervejas S.A. concluiu que os nveis de leo Omega 3,
altamente benficos para o corpo, aumentam com a ingesto de cerveja. Porque esta
pesquisa pode ser suspeita?
3. Uma pesquisa afirmou que 89% das pessoas acham que aumentou a procura pelo servio
social no Brasil, nos ltimos anos. A questo foi apresentada numa revista e as respostas
foram encaminhadas por e-mail. At que ponto vlido este resultado?
4. Uma pesquisa feita incluiu o seguinte item a ser respondido pelos entrevistados: informe
sua altura. Registre dois problemas nesta pesquisa.
5. Uma pesquisa feita por um jornal perguntava: Voc apoia o desenvolvimento de armas

9

nucleares, que poderiam matar milhes de pessoas inocentes?. Os resultados mostraram
que, das 20 pessoas que ligaram e responderam, 87% disseram no e 13% disseram sim.
Pode-se aceitar este resultado, diga as razes para aceitar ou no?
6. Uma pesquisa afirma que mulheres grvidas podem aumentar suas chances de terem
bebes saudveis comendo lagosta. A alegao baseia-se em um estudo que os filhos de
mulheres que comeram lagosta na gravidez eram mais saudveis, do que os filhos das que
no comeram. Diga qual o erro na afirmao?
7. Para as situaes descritas abaixo, identifique a populao e a amostra correspondente.
Discuta a validade do processo de inferncia estatstica para cada um dos casos.
a) Para avaliar a eficcia de uma campanha de vacinao no Estado, 200 mes de recm-
nascidos, durante o primeiro semestre de um dado ano e em uma dada maternidade em Porto
Alegre, foram entrevistadas a respeito da ltima vez que vacinaram seus filhos.
b) Uma amostra de sangue foi retirada de um paciente com suspeita de anemia.
c) Para verificar a audincia de um programa de TV, 563 indivduos foram entrevistados por
telefone com relao ao canal em que estavam sintonizados.

1.4 Mtodos de Amostragem
Por uma questo de aplicabilidade dos resultados do estudo, muitas vezes a populao a ser
estudada formada por um conjunto de subpopulaes que so muito variveis e seria quase
impossvel estud-la inteiramente e se fosse possvel, poderia ser muito dispendioso em tempo e
dinheiro. Quando se estuda uma amostra, pode-se obter melhor resultado fazendo um trabalho
mais cuidadoso do que seria feito em uma populao inteira. Vemos assim que o estudo de uma
amostra, desde que seja de tamanho adequado e que represente adequadamente uma
populao, pode proporcionar resultados mais exatos, alm da economia de tempo, trabalho e
dinheiro. No entanto, o processo de amostragem traz em si a probabilidade do erro amostral cujo
controle ser realizado atravs de mtodos estatsticos apropriados.






H trs aspectos necessrios para que uma pesquisa realizada por amostragem gere resultados
confiveis: representatividade, suficincia e aleatoriedade da amostra. A amostra precisa retratar
a variabilidade existente na populao: ela precisa ser uma cpia reduzida da populao. Sendo
assim, todas as subdivises da populao precisam ter representantes na amostra. A chave
avaliar se as subdivises da populao (por sexo, classe econmica, cidade, atividade profissional)
podem influenciar nos resultados da pesquisa.
Exemplo do uso de representatividade: Na pesquisa eleitoral para governador devemos
entrevistar eleitores em todas as regies do Estado (assume-se que haja diferenas de opinio de
regio para regio), pois, se escolhermos apenas uma delas, e ela for base poltica de um
candidato, o resultado ser distorcido.
Existem situaes em que a utilizao de
amostragem pode no ser a melhor opo. Neste
caso, podemos enumerar basicamente quatro
motivos: populao pequena, caracterstica de fcil
mensurao, necessidades polticas e necessidade
de alta preciso.










10

Outro aspecto importante o tamanho da amostra, na qual deve ter um tamanho suficiente para
representar a variabilidade existente na populao. Quanto mais homognea for a populao
(menor variabilidade), menor poder ser o tamanho da amostra; contudo, quanto mais
heterognea (maior variabilidade), maior ter que ser o tamanho da amostra para represent-la.
Este aspecto chamado de suficincia.
O terceiro aspecto, a aleatoriedade da amostra o aspecto menos intuitivo, mas extremamente
importante. Significa que os elementos da amostra devem ser selecionados da populao por
meio de sorteio no viciado: todos os elementos da populao tm chance de pertencer
amostra. Assim necessria uma listagem com os elementos da populao, permitindo a
atribuio de nmeros a cada um deles, e faz-se o sorteio. Idealmente, ns escreveramos os
nmeros dos elementos da populao em pequenos papis, depositaramos em uma urna,
misturaramos os papis, e, de olhos vendados, escolheramos os nmeros, selecionando a
amostra. Mas para grandes populaes, esse procedimento invivel. A seguir conheceremos
formas de utilizar a aleatoriedade para escolha de amostras e quando isso no possvel.

1.4.1 Amostragem Probabilstica e No Probabilstica
A amostragem pode ser probabilstica (aleatria) ou no probabilstica (por convenincia). A
amostragem probabilstica o processo de seleo de uma amostra no qual cada unidade
amostral da populao tem probabilidade diferente de zero e conhecida de pertencer amostra.
Quando selecionamos amostras intencionais, a esmo ou de voluntrias estamos realizando uma
amostragem no probabilstica, pois a probabilidade de seleo desconhecida para alguns ou
todos os elementos da populao, podendo alguns destes elementos ter probabilidade nula de
pertencer a amostra.
As principais tcnicas de amostragem aleatria so:

Amostragem Casual Simples
Quando todos elementos da populao tm igual probabilidade de serem selecionados para a
amostra. Para obt-la, muitas vezes atribui-se um nmero a cada elemento da populao e
realiza-se um sorteio ou utiliza-se uma tbua de nmeros aleatrios com a mesma finalidade, ou
ento pela gerao de nmeros aleatrios por computador.
Exemplo1: Consideremos a populao formada por 1,2, 3, ...., 9.
A mdia da populao 5
9
45
9
9 8 7 6 5 4 3 2 1
= =
+ + + + + + + +
=
Retiremos dessa populao amostras de tamanho 3:
a) com reposio
a
1
) amostra com os menores valores 1, 1, 1
A mdia amostral 1
3
3
3
1 1 1
= =
+ +
= x . Assim o erro amostral ser: 4 5 1 = = = c x
a
2
) amostra com os maiores valores 9, 9, 9
A mdia amostral 9
3
27
3
9 9 9
= =
+ +
= x . Assim o erro amostral ser: 4 5 9 = = = c x . Logo
4 s c

11

b) sem reposio
b
1
) amostra com os menores valores 1, 2, 3
A mdia amostral 2
3
6
3
3 2 1
= =
+ +
= x . Assim o erro amostral ser: 3 5 2 = = = c x
a
2
) amostra com os maiores valores 7, 8, 9
A mdia amostral 8
3
24
3
9 8 7
= =
+ +
= x . Assim o erro amostral ser: 3 5 8 = = = c x
Logo 3 s c
Veja que o erro amostral menor quando se usa amostragem sem reposio.

A Utilizao de tabelas aleatrias
As tabelas aleatrias se caracterizam pelos algarismos estarem dispostos de tal maneira que a
probabilidade de qualquer um deles aparecer em determinado lugar numa sequncia igual
probabilidade de aparecimento de qualquer outro, alm disso a combinao de algarismos tm a
mesma probabilidade de ocorrncia que qualquer outra combinao. As tabelas obtidas foram
exaustivamente testadas, de forma a assegurar sua aleatoriedade. Outro mtodo que simula os
sorteios manuais de nmeros de 0 a 9 e procura garantir que todo nmero com a mesma
quantidade de algarismos tenha a mesma probabilidade de ocorrncia o algoritmo de gerao
de nmeros pseudoaleatrios, na qual programas computacionais geram nmeros a partir de uma
regra de formao.

Tabela de Nmeros Aleatrios
3690
0813
6477
0772
5692

2080
1039
7227
8506
5086

0092
0935
2605
7277
5484

2492
6790
5289
2160
9870

3828
3382
0104
6348
0303

1629
5565
3973
9889
3900

7171
6858
4092
7236
3583

7880
7600
4141
4612
7423

0377
2315
8204
0390
3485

7720
1489
4223
0812
8997

0586
1077
1521
8252
3298

3590
8030
4143
5579
0741

6509
2669
6454
4195
1533

8482
4455
9104
1062
3979

2209
7651
2677
4620
9069

7549
3743
7632
5589
6466

7811
8806
5563
1757
2831

4839
5189
0034
5650
5920

2330
1901
7577
0830
8830

6807
1822
1392
0964
2257

6332
0075
8601
0210
4326

5733
4971
2816
8261
7271

3309
1669
8238
2983
1508

1490
9353
3340
2082
7704

4730
8280
9202
9232
3809

2729
7501
4882
2244
7642

3092
1921
8383
4664
6525


12

6905
8387
4094
4951
9047

7274
9192
0554
9231
3995

2402
5295
5177
7315
5775

5500
3251
4675
3543
3521

5573
7478
3339
5505
6381
7127
5323
4957
3781
0199

9512
4011
1690
5627
9677

6250
7385
1191
3365
7517

2276
8902
1435
6130
8772

9396
7569
2854
8474
2086
5933
3753
0163
5101
5068

0074
0255
6333
1815
7765

9362
5474
2106
7203
8974

6307
8843
2192
4247
6612

3464
7551
9691
3167
5457
1137
1859
9717
1815
7447

6677
5458
1931
7171
3194

7373
2123
3351
1231
3961

2346
2112
0874
4859
0721

1702
3380
9562
8552
7703
7583
6043
4118
7068
1664

8676
6942
9433
8036
3222

4757
7035
5057
0546
2183

1285
8567
2897
2660
3899

9204
2152
3252
5409
2758
6450
0294
4276
6379
9278

0222
8043
2661
1832
4191

1716
9983
0967
6612
5295

7000
8131
0262
7852
2999

3389
5411
9848
1556
2963
5658
5110
9465
7252
1708

3335
6201
8690
2031
2734

1942
5192
4538
1038
3096

5306
8116
5092
9096
1263

5678
2647
6030
4247
8167
7678
6340
8820
1086
3625

1976
1587
2313
6298
4469

0417
1840
1246
1425
8536

0414
5270
5541
0578
7017

2589
7242
8472
4652
6712
3444
9137
4127
8919
2864

1645
0972
6999
6073
8617

5921
6176
3374
2709
9442

3383
5994
4014
0097
8057

0288
2800
2266
2953
9820
Fonte: Donaldo B. Owen, Handbook of Statistical Tables, Reading, Mass: Addison-Wesley, 1962.

Exemplo: Suponha que uma grande loja queira selecionar aleatoriamente 15 clientes de uma lista
de 830. A finalidade da amostragem pode ser estimar a frequncia das compras, determinar o
valor mdio de cada compra ou registrar queixas contra o sistema.
Os clientes podem ser listados alfabeticamente ou pelas datas em que abriram suas contas. No
importa. Atribumos consecutivamente aos elementos da lista, por exemplo, os nmeros 000 a
829, do 1 ao ltimo. Como a identificao exige nmeros de 3 algarismos, ser necessrio
lermos os nmeros de 3 algarismos da tabela de nmeros aleatrios, de modo a assegurar
correspondncia entre os nmeros aleatrios e os itens da lista. Estes nmeros aleatrios podem
ser lidos isoladamente ou em grupos, podem ser lidos em qualquer ordem, como por colunas,
num sentido ou noutro, por linhas, diagonalmente, etc. O que devemos ter cuidado de no
conduzir sempre ao mesmo ponto.

13

Claro que nmeros acima de 829 sero desprezados, assim como as repeties de nmeros lidos
anteriormente. O processo deve ser finalizado ao chegar-se ao nmero desejado de observaes.
Supondo que leiamos os 3 primeiros algarismos da ltima coluna da tabela, percorrendo a coluna
de cima abaixo, teremos:
473, 828, 920 (acima da populao), 923 (acima da populao), 380, 272, 750, 488, 224, 764,
309, 192, 838 (acima da populao), 466, 652, 344, 913 (acima da populao), 412, 891 (acima
da populao) e 286.

Amostragem estratificada
Para realizarmos uma amostragem por estratificao devemos usar uma varivel critrio para
separar a populao em estratos. Tais estratos devem ter as seguintes caractersticas: dentro de
cada estrato h uma grande homogeneidade ou ento uma pequena variabilidade e, entre os
estratos h uma grande heterogeneidade ou ento uma grande variabilidade.

Exemplo1: Considerando a populao formada por 1, 2, 3, ..., 9 o critrio de estratificao ser:
E
1
: grupo formado pelos 3 menores valores 1, 2, 3
E
2
: grupo formado pelos 3 valores centrais 4, 5, 6
E
3
: grupo formado pelos 3 maiores valores 7, 8, 9
Para formarmos amostras de tamanho 3 selecionaremos um elemento de cada estrato. Assim
teremos, por exemplo:
amostra com os menores valores 1, 4, 7
A mdia amostral
4
3
12
3
7 4 1
= =
+ +
= x
e o erro amostral ser:
1 5 4 = = = c x
.
amostra com os maiores valores 3, 6, 9
A mdia amostral
6
3
18
3
9 6 3
= =
+ +
= x
e o erro amostral ser:
1 5 6 = = = c x
.
Portanto
1 s c


Exemplo2: Dada a populao de 50 000 operrios da indstria automobilstica, conforme a tabela
abaixo, forme uma amostra de 5% de operrios para estimar seu salrio mdio.
Cargos Populao
chefes de seo 5 000
operrios especializados 15 000
operrios no
especializados
30 000
TOTAL 50 000



14

Soluo:
Cargos Populao Amostra
chefes de seo 5 000 250 05 , 0 5000 =

operrios especializados 15 000 750 05 , 0 15000 =

operrios no
especializados
30 000 1500 05 , 0 30000 =

TOTAL 50 000 2 500

Note que no primeiro exemplo retiramos o mesmo nmero de elementos de cada um dos
estratos, j no segundo fizemos uma partilha proporcional.

Amostragem por conglomerados
Divide-se o universo populacional em conglomerados (miniaturas da populao) e selecionam-se
aleatoriamente alguns conglomerados para compor a amostra. Aqui h uma mudana
fundamental na unidade de sorteio. Passamos de elemento para grupo.
Consideramos conglomerados os grupos de elementos com as seguintes caractersticas: dentro de
cada conglomerado h uma grande heterogeneidade ou ento uma grande variabilidade e entre
os conglomerados h uma pequena variabilidade ou ento uma grande homogeneidade.
Exemplo1: Considerando o exemplo da indstria automobilstica estaremos utilizando uma
amostragem por conglomerados quando, por exemplo, selecionarmos montadoras e dentro delas
estudarmos os salrios dos funcionrios.
Exemplo 2: A Pesquisa Nacional por Amostra de Domiclios (PNAD) do IBGE coleta informaes
demogrficas e socioeconmicas sobre a populao brasileira. Utiliza amostragem por
conglomerados em trs estgios:
primeiro estgio: amostras de municpios (conglomerados) para cada uma das regies geogrficas
do Brasil;
segundo estgio: setores censitrios sorteados em cada municpio (conglomerado sorteado); e
terceiro estgio: domiclios sorteados em cada setor censitrio.

Amostragem sistemtica
Para este tipo de amostragem necessrio que a populao esteja ordenada, por exemplo, por
nomes em uma lista telefnica ou por nmeros das casas de uma rua.
Inicialmente definimos o fator de sistematizao s, calculado por
n
N
s = . Aps sorteia-se um
nmero entre 1 e s. Seja m esse nmero, logo teremos:
o 1 elemento da amostra ser o de nmero m
o 2 elemento da amostra ser o de nmero m + s
o 3 elemento da amostra ser o de nmero m + 2s


15

o n-simo elemento da amostra ser o de nmero m + (n 1)s
Exemplo: De uma populao de N = 1000 elementos ordenados, retirar uma amostra sistemtica
de tamanho 100.

Soluo:
10
100
1000
= = =
n
N
s
. Seja 1s m s 10, supondo m = 7, teremos:
1 elemento da amostra: 7
2 elemento da amostra: (7 + 10 = 17) 17
3 elemento da amostra: (7 + 2. 10 = 27) 27

100 elemento da amostra: (7 + (100 1).10 = 997) 997







Ao usar a amostragem no probabilstica, o pesquisador no sabe qual a probabilidade de que
um elemento da populao tem de pertencer amostra. Portanto, os resultados da amostra no
podem ser estatisticamente generalizados para a populao, porque no se pode estimar o erro
amostral.
A amostragem no probabilstica utilizada habitualmente:
- como etapa preliminar em projetos de pesquisa;
- em projetos de pesquisa qualitativa e
- em casos nos quais a populao de trabalho no pode ser enumerada.
Existem vrios tipos de amostragem no probabilstica.
Amostragem a esmo
Na amostragem a esmo, o pesquisador procura ser o mais aleatrio possvel, mas sem fazer um
sorteio formal.
Exemplo: Imagine um lote de 10.000 parafusos, do qual queremos tirar uma amostra de cem. Se
fssemos realizar uma amostragem aleatria simples, o processo talvez fosse trabalhoso demais.
Ento, simplesmente retiramos os elementos a esmo. Este tipo de amostragem tambm pode ser
utilizado quando a populao for formada por material contnuo (gases, lquidos, minrios),
bastando homogeneizar o material e retirar a amostra.
Amostragem por julgamento (intencional)
Na amostragem por julgamento, o pesquisador escolhe alguns elementos para fazer parte da
amostra, com base no seu julgamento de que aqueles seriam representativos da populao. O
Quando no for possvel garantir a probabilidade de
todo elemento da populao pertencer amostra o
momento de partir para a amostragem no
probabilstica.









16

risco de obter uma amostra viciada grande, pois esta tcnica se baseia totalmente nas
preferncias do pesquisador, que pode se enganar.
Amostragem por cotas
A amostragem por cotas parece semelhante a uma amostragem estratificada proporcional, com o
diferencial de no empregar sorteio na seleo dos elementos. A populao dividida em vrios
subgrupos. Na realidade, comum dividir em um grande nmero para compensar a falta de
aleatoriedade, e seleciona-se uma cota de cada subgrupo, proporcional ao seu tamanho.
Na amostragem por cotas, os elementos da amostra so escolhidos pelos entrevistadores (de
acordo com os critrios), geralmente em pontos de grande movimento, o que sempre acarreta
certa subjetividade (e impede que qualquer um que no esteja passando pelo local no exato
momento da pesquisa possa ser selecionado). Na prtica, muitas pesquisas so realizadas
utilizando amostragem por cotas, incluindo as pesquisas eleitorais.
Rigorosamente os resultados da amostragem por cotas no tm validade estatstica, visto que
no contemplam o princpio de aleatoriedade na seleo da amostra.
Exemplo: Em uma pesquisa de opinio eleitoral poderamos dividir a populao de eleitores por
sexo, nvel de instruo, faixas de renda, entre outros aspectos, e obter cotas proporcionais ao
tamanho dos grupos (que poderia ser obtido atravs das informaes do IBGE).

Amostragem bola de neve
A amostragem bola de neve importante quando difcil identificar respondentes em potencial.
A cada novo respondente que identificado e entrevistado, pede-se que identifique outros que
possam ser qualificados como respondentes. Note que este mtodo pode levar a amostras
compostas apenas por amigos dos primeiros entrevistados, o que pode causar distores nos
resultados finais.
Resumindo:


Pr@tic@ndo
8. Uma lista numerada contm 7 000 nomes e endereos, numerados consecutivamente a

17

partir de 1. Descreva como usaria uma tabela de nmeros aleatrios para selecionar uma
amostra de 25 nomes:
a) Quantos algarismos devem ser lidos para cada nome?
b) Como comearia seu trabalho na tabela?
c) Use a tabela de nmeros aleatrios contida no texto e apresente a amostra selecionada de
25 nomes, comeando na segunda coluna e lendo-a de cima para baixo.

9. Um grupo industrial deseja determinar a reao do pblico rotulagem dos produtos.
Numa parte da cidade, h 40 quarteires, com 10 casas por quarteiro.
a) Esboce um plano de amostragem de dois estgios, utilizando a tabela de nmeros
aleatrios apresentada no texto, selecionando atravs da mesma primeiro 10 quarteires e,
em seguida, uma casa por quarteiro, lembrando que o total de 10 casas.
b) Suponha que se queira um plano de um estgio (por exemplo, selecionar 10 casas
diretamente)
b
1
) Que problemas poderiam surgir na escolha das casas?
b
2
) Como utilizaria a tabela de nmeros aleatrios?

10. Um assessor deseja reavaliar uma amostra aleatria de 20 das 7964 residncias familiares
de um condado. Para isso, ele cria uma estrutura amostral atribuindo-lhes os nmeros
01 0002 0003 ... 7963 7964
Obtm, ento, a seguinte seo de uma tabela de nmeros aleatrios:
23332
67740
53206
06326
39551
92384
95974
92499
57255
45041
35845
43281
80772
28019
75400
57548
99287
13962
30111
46571
94732
88926
34361
78176
46441
44044
72106
30792
65467
69408
41920
98774
91561
92153
85895
29143
01105
12635
87278
75134
Se ele toma os quatro algarismos finais de cada conjunto de 5 algarismos (comeando,
assim, com 3332, 7255, 9287, ...) quais residncias sero selecionadas?

11. Do-se, a seguir, as cifras mensais consecutivas do volume de correspondncia area (em
milhes de toneladas) transportada em operaes areas domsticas durante um perodo
de 4 anos:
67 62 75 67 70 68 64 70 66 73 73 97
76 73 80 78 78 72 75 75 73 83 76 108
84 78 86 85 81 78 78 75 78 86 76 111
79 77 87 84 82 77 79 77 80 84 78 117

a) Relacione as 6 amostras sistemticas de tamanho n = 8 que podem ser extradas da
populao, partindo de um dos seis primeiros nmeros e tomando cada sexto nmero
consecutivo na lista.
b) Se escolhermos aleatoriamente uma das 6 amostras para estimar o volume mdio de
correspondncia transportada por ms, explique por que h srio risco de se obter um
resultado altamente enganador.


18

12. Indique o tipo de amostragem mais adequado em cada caso:
a) Tendo em vista a impossibilidade de todos os estudantes apresentarem seus trabalhos para
a turma, o professor decidiu selecionar cinco estudantes para fazerem a apresentao.
b) O proprietrio de uma locadora de automveis deseja fazer uma pesquisa de satisfao
com seus clientes. A locadora tem 3000 clientes cadastrados em fichas numeradas em
ordem crescente.
c) Uma empresa de TV a cabo pretende averiguar o interesse dos moradores de uma cidade
em adquirir seus servios. Tendo em vista a impossibilidade de atender, inicialmente, toda
a cidade, a empresa pretende levantar informaes para verificar quais os bairros em que o
investimento inicial ser recuperado mais rapidamente.

1.5. Tipos de Variveis
Suponha que um questionrio seja aplicado (ou seja realizada uma pesquisa de campo) o
conjunto de informaes disponveis, aps a tabulao das respostas, denominada de tabela de
dados brutos e contm os dados da maneira que foram coletados inicialmente. Cada uma das
caractersticas perguntadas, por exemplo, a idade, denominada de varivel. As variveis
podem ser numricas ou no numricas. As numricas so denominadas de quantitativas e as
no numricas de qualitativas ou categricas.
A varivel qualitativa quando os possveis valores que assumem representam atributos e/ou
qualidades. Variveis como sexo (F ou M) e estado civil (solteiro, casado, ...) so classificadas
como qualitativas nominais, pois no h uma ordem natural entre seus valores. J as variveis
tamanho (P, M, G) e classe social (baixa, mdia, alta)so variveis qualitativas ordinais.
As variveis quantitativas, aquelas de natureza numrica, podem ser classificadas como discretas
ou contnuas. As variveis discretas podem ser vistas como resultantes de contagem, assumindo
assim, valores inteiros, temos como exemplo o nmero de irmo e o nmero de peas
defeituosas. J as variveis contnuas assumem valores em intervalos de nmeros reais,
geralmente, provenientes de uma mensurao, como o peso e a altura.
Convm ressaltar que, em muitas situaes prticas, a classificao de variveis quantitativas
depende de certas particularidades. Vejamos a varivel idade, que medida em nmero de anos,
pode ser vista como discreta, entretanto se levarmos em conta os dias, no absurdo dizer 2,5
ou 2,85 anos, passando a ser classificada como contnua. Assim devemos utilizar o bom senso na
hora de decidir qual procedimento adotar para caracterizar uma varivel.

Pr@tic@ndo

19

13. Classifique cada uma das variveis abaixo em qualitativa (nominal / ordinal) ou quantitativa
(discreta / contnua):
a) Ocorrncia de hipertenso pr-natal em grvidas com mais de 35 anos (sim ou no so as
possveis respostas para esta varivel).
b) Perda de peso de maratonistas na Corrida de So Silvestre, em quilos.
c) Intensidade da perda de peso de maratonistas na Corrida de So Silvestre (leve, moderada,
forte).

14. O questionrio abaixo foi aplicado aos estudantes de uma universidade que frequentavam
a livraria do campus durante a primeira semana de aula de 2013. A pesquisa foi realizada
pela Secretaria de Avaliao Institucional da universidade. Identifique o tipo de varivel.
a) Idade (em anos)
b) Sexo
c) Nmero de livros que voc costuma ler por ano.
d) Forma de pagamento utilizada na compra:
( ) em dinheiro ( ) cheque ( ) carto de crdito ( ) carto de dbito
e) Voc classificaria o servio prestado pela livraria como:
( ) timo ( ) bom ( ) pssimo
f) Valor gasto na compra do(s) livro(s)

Bibliografias:
REIS, M. M. Estatstica aplicada administrao. Florianpolis: Departamento de Cincias da
Administrao /UFSC, 2008.
PINTO, S. S. e Silva, C. S. Estatstica. Rio Grande: Editora da FURG, 2010, v.1.
SILVA, C. S. e Pinto, S. S. Estatstica. Rio Grande: Editora da FURG, 2010, v.2.

Potrebbero piacerti anche