Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Centro ScioEconmico
Departamento de Cincias Econmicas
Introduo Estatstica
Jos Francisco Fletes
94p. : il
Curso de Graduao Cincias Econmicas
Inclui bibliografia
ISBN 978-85-7426-064-8
Universidade Federal de Santa Catarina, Sistema UAB. Nenhuma parte deste material poder ser reproduzida,
transmitida e gravada, por qualquer meio eletrnico, por fotocpia e outros, sem a prvia autorizao, por
escrito, dos autores.
GOVERNO FEDERAL
Presidente da Repblica
Ministro da Educao
Secretrio de Educao a Distncia
Coodenador Nacional da Universidade Aberta do brasil
CENTRO SCIO-ECONMICO
Diretor Ricardo Jos Arajo Oliveira
Vice-Diretor Alexandre Marino Costa
DEPARTAMENTO DE CINCIAS ECONMICAS
Chefe do Departamento Helton Ricardo Ouriques
Sub-Chefe do Departamento Luiz Carlos de Carvalho Jnior
Coordenador Geral na modalidade a distncia Rabah Benakouche
Unidade 1
Anlise descritiva e exploratria de dados
1.2 Amostragem..........................................................................................................18
Fundamentos bsicos...............................................................................................18
Amostragem............................................................................................................... 20
Conceito de amostragem....................................................................................... 20
Caractersticas das amostras................................................................................. 20
Plano amostral............................................................................................................. 21
Tamanho da amostra................................................................................................22
Tipos de amostras......................................................................................................23
Erros potenciais de pesquisa................................................................................. 26
Questes ticas.......................................................................................................... 26
Unidade 2
Teoria da probabilidade e
modelos matemticos bsicos
2.1 Probabilidade........................................................................................................51
Fundamento bsico................................................................................................... 51
Conceitos de Probabilidade.................................................................................. 54
Teoremas fundamentais de probabilidade...................................................... 59
Unidade 3
Inferncia estatstica
Palavra do professor
Prezado (a) acadmico (a) do Curso de Cincias Econmicas:
Seja bem-vindo (a) Estatstica!
Voc est iniciando uma viagem que considero fascinante! E espero que
esta seja a sua opinio medida que for descobrindo as diversas paisagens
que a disciplina ir nos permitir.
Parafraseando Galileu Galilei, aprenderemos a lidar com a linguagem do
universo, a matemtica aplicada ao nosso cotidiano pessoal e profissional,
para entender melhor a realidade.
Nesta disciplina teremos como foco principal a viso prtica baseada na
inter e na transdisciplinaridade como base da apropriao autnoma e
independente, construindo novos conhecimentos em seu fazer cotidiano.
com esse esprito que voc ir resolver problemas concretos oriundos
do seu dia a dia, comeando pela sua casa (oikia ou domus) resgatando
assim a origem da disciplina economia (oiko nomos), buscando integrar a teoria com a prtica, bem como as diversas disciplinas com que a
Estatstica tem uma relao direta (Econometria, por exemplo) e indireta
(Auditoria, Teoria da deciso, Logstica, Teoria dos jogos, Controle estatstico de qualidade,).
Espero que nesta jornada, consigamos desfrutar de resultados prazerosos
e que um novo degrau pessoal e profissional seja a continuidade do que
representa a vida nas suas descontinuidades.
Estou sua inteira disposio para dirimir quaisquer dvidas na soluo
de problemas reais que voc ir enfrentar.
Mais uma vez, bem-vindo jornada da Estatstica!
Prof. Jos Francisco Danilo de Guadalupe Correa Fletes
Unidade 1
Anlise descritiva e
exploratria de dados
A Anlise descritiva de dados considerada a fase inicial do processo no estudo
das unidades coletadas de uma ou mais amostras. Nesta etapa, utilizar-se-o
tcnicas que resumem (ou sintetizam) e classificam os dados de forma a obter as
informaes que sero utilizadas na etapa de Inferncia Estatstica (Unidade 3).
A Anlise exploratria uma filosofia que privilegia a percepo grfica visando a um melhor discernimento do comportamento dos dados, bem como para
descobrir padres, anomalias e desenvolver modelos matemticos adequados
aplicados na teoria das probabilidades e na Inferncia Estatstica.
11
Introduo Estatstica
Palavra do Professor
Todos os conceitos e princpios estatsticos que iro ser abordados aqui so utilizados em vrias situaes reais, como nas aes governamentais, nos negcios, na
indstria, nas reas das cincias sociais, biolgicas e da sade.
12
Unidade 1
Saiba Mais
Acesse:
http://www.ence.ibge.gov.br/estatistica/default.asp
http://www.estatistica.ccet.ufrn.br/
13
Introduo Estatstica
Populao
Amostra
=?
n observaes de X
Amostrage
Inferncia
Qualitativas:
As observaes so
atributos ou
caractersticas possveis
de observao nos
elementos amostrados.
Nominais:
Ordinais:
De Escala:
As observaes
representam atitudes,
valoraes ou
sentimentos em
relao
questo investigada.
possvel ordenar
as categorias.
So nmeros
resultantes
de contagens ou
medidas dos
elementos
amostrados.
Discretas:
Conjunto limitado
de valores
Contnuas:
14
Unidade 1
15
Introduo Estatstica
Na maioria das situaes, podemos classificar as variveis com nveis de mensurao nominal ou ordinal como qualitativas, enquanto que aquelas com
nveis intervalar ou de razo, como quantitativas.
Deve-se destacar que algumas variveis podem ser observadas (medidas) por
mais de um nvel, dependendo do objetivo da anlise.
IMPORTANTE:
A Necessidade de definies operacionais
Independentemente do nvel de medio das variveis, definies operacionais
so necessrias para obter a resposta apropriada ou alcanar o produto apropriado.
No contexto de uma pesquisa, numa pergunta Qual a sua idade?. Para
evitar problemas de ambiguidade, deve-se desenvolver uma definio operacional para as respostas pergunta. Por exemplo, deve-se deixar claro se a
idade seria ao aniversrio mais prximo ou ao ltimo aniversrio, uma vez
que, se seu aniversrio no prximo ms, voc provavelmente escolheria o
prximo aniversrio se fosse completar 21 anos; no entanto, iria escolher sua
idade atual se estivesse completando 60 anos!
Encerramos esta seo. Faa a autoavaliao proposta a seguir e avalie seu prprio aprendizado. Caso perceba que alguns pontos no ficaram claros para voc,
releia o contedo. Se a dvida persistir, solicite ajuda de seu tutor. No siga em
frente com dvidas, pois isso pode comprometer todo o seu aprendizado.
16
Unidade 1
...
bandeira
gasolina comum
gasolina aditivada
diesel
lcool
observao
17
Introduo Estatstica
2 Faa a coleta dos preos considerando os diversos bairros da cidade e as vrias
bandeiras concorrentes.
3 Qual seria uma amostra significativa? Vamos coletar no mnimo em trinta (30)
postos de combustveis. Considere que o acesso ao preo, neste caso, fcil e rpido,
pois a tabela exposta ao pblico.
Obs.: nas prximas sees vamos abordar como analisar os dados coletados.
Atividade 1.1.3: Continuidade do caso prtico (aps a coleta dos dados)
Digite os dados coletados numa planilha Excel (extenso .xls), reproduzindo a planilha de dados acima (nas linhas os postos e nas colunas as caractersticas levantadas).
Identifique a planilha: COMBUSTVEIS.
Acesse o SestatNet e importe os dados, salvando no seu ambiente de trabalho.
Saiba Mais
Resumo da unidade:
Nesta seo voc estudou os fundamentos bsicos que permitiro compreender as
tcnicas de amostragem no processo de coleta de dados (seo1.2), bem como as
tcnicas analticas a serem empregadas no resumo de dados (seo1.3).
E importante ter claro os conceitos bsicos vistos no item 1.1.3, assim como os tipos
de variveis com os quais iremos lidar na anlise dos dados.
1.2 Amostragem
1.2.1 Fundamentos bsicos
Existem situaes especficas em que podemos ter acesso a toda a populao
para estudar caractersticas de interesse, o que resulta num estudo por Censo.
No entanto, na maioria das situaes, tal procedimento no pode ser realizado,
por alguns fatores limitantes:
18
Unidade 1
Populao
(N )
Amostra
(n<<N)
Uma amostra usualmente envolve o estudo de uma parcela dos itens de uma
populao, enquanto que um censo requer o exame de todos os itens. Embora
concentremos nossa ateno nas amostras, conveniente considerar tambm a
alternativa do censo. primeira vista pode parecer que a inspeo completa ou
total de todos os itens de uma populao seja mais conveniente do que a inspeo de apenas uma amostra deles. Na prtica, o contrrio quase sempre vlido.
Qualquer instituto ou entidade de pesquisa recorrer amostragem, por vrias razes. O custo geralmente o fator determinante para a deciso. Coletar
dados e analisar resultados envolve muitos recursos monetrios e humanos;
19
Introduo Estatstica
claro que quanto maior o nmero de dados a coletar, maior o custo. Outra
razo para o emprego de amostragem que o valor da informao dura pouco.
Para ser til, a informao deve ser obtida e usada temporalmente. A amostragem a alternativa tcnica de se fazer isso.
1.2.2 Amostragem
A amostragem utilizada cotidianamente com o propsito de
avaliar (inferir) sobre o valor, a qualidade ou caractersticas
de determinado item de interesse em uma populao.
Clinica: Reunio em
que se disponibiliza o
produto/bem para os
eventuais compradores/
consumidores para anlise,
comentrios, crticas e/ou
sugestes.
20
Unidade 1
Representao: a caracterstica de representatividade diz respeito capacidade da amostra em reproduzir a populao quanto aos aspectos de
suas caractersticas prprias. Assim, por exemplo, se estiver analisando
a preferncia pela grade de programao de uma emissora de TV, o sexo,
a idade, o grau de instruo, a classe social entre outras devem ser consideradas.
Significao: o tamanho da amostra deve ser suficiente para representar
a variabilidade presente na populao e deve ser tanto maior quanto
maior for a variabilidade da populao. No exemplo da programao da
TV, as caractersticas intrnsecas da populao devem ser consideradas
e quantificadas previamente.
Aleatoriedade: se os elementos que compem a amostra foram obtidos
por um processo aleatrio (por sorteio, ao acaso) todos teriam chance
de fazer parte da amostra, sendo possvel calcular o erro amostral quando da aplicao da tcnica de estimao.
Palavra do Professor
Embora nenhum plano de amostragem possa garantir que a amostra seja exatamente semelhante populao da qual foi extrada, uma amostra aleatria permite
estimar o valor do erro possvel, isto , dizer quo prxima est a amostra da populao, em termos de representatividade, motivo pelo qual se procura trabalhar com as
amostras probabilsticas.
21
Introduo Estatstica
22
Unidade 1
n0=1/e2
a qual, como pode ser vista, no leva em considerao o tamanho da populao.
Vamos considerar os seguintes termos:
n0 = valor inicial para o tamanho da amostra;
e = erro amostral considerado;
N = tamanho da populao (nmero de elementos da populao).
Agora com o tamanho da populao declarado, pode-se modificar a expresso
inicial do tamanho da amostra para a seguinte:
Casual ou aleatria simples Neste tipo de amostragem, cada elemento da populao tem probabilidade conhecida, diferente de zero e idntica dos
outros, dada por n/N, de ser selecionado para compor
a amostra. Cada elemento da populao deve estar
identificado por um nmero ou rtulo. adequada quando a populao
tiver um comportamento homogneo com relao varivel principal
em estudo.
Sistemtica Pode ser considerada uma derivao da casual. Se a populao for grande e a amostra necessria ao estudo tambm, o processo
de sortear n, de N elementos pode se tornar demorado e a repetio
23
Introduo Estatstica
de itens j sorteados podem aparecer seguidamente. Para este procedimento os elementos na populao devem aparecem em listas ordenadas.
Definido o tamanho da amostra n de uma populao de N elementos,
uma razo calculada k=N/n, aps o que um nmero entre, um e k, sorteado
correspondendo ordem do primeiro elemento na lista a compor a amostra,
sendo os demais obtidos pela soma da razo ordem do nmero imediatamente anterior.
Estratificada: muito comum que a populao de uma pesquisa seja
heterognea com relao aos objetivos da pesquisa, mas possvel identificar grupos dentro da populao, os quais tm caractersticas semelhantes dentro do grupo, mas diversas de outros. O estudo est focado
na populao; assim, preciso garantir a participao de indivduos na
amostra com as mais diversas caractersticas.
Definidos os estratos, estes passam a ser considerados, cada um, como uma
subpopulao diferente, e os elementos que comporo a amostra podero ser
obtidos atravs de uma das tcnicas j citadas (simples ou sistemtica), dependendo de como a populao est identificada.
Nesse caso a amostragem estratificada permite trs variaes que so:
Uniforme: sorteado o mesmo nmero de indivduos em cada estrato.
Proporcional: o nmero de indivduos que compor a amostra proporcional ao tamanho de cada estrato.
tima: alm do tamanho de cada estrato levada em considerao tambm a variao dentro de cada estrato da varivel principal da pesquisa.
Problemas: A amostragem estratificada mais difcil de ser aplicada por ter-se
que previamente definir os estratos, o que exige um bom conhecimento da
populao e da distribuio dos elementos dentro dela.
24
Unidade 1
A esmo ou sem norma: um processo que pretende simular uma amostra aleatria; todavia no se realiza nenhum
sorteio. O pesquisador quer obter itens da populao; contudo, no possvel, por qualquer motivo prtico, identificar e numerar cada elemento
da populao.
Intencional ou por julgamento: neste caso o pesquisador deliberadamente escolhe baseado num pr-conhecimento ou julgamento os elementos da populao que comporo sua amostra. Um problema neste
tipo de amostragem o de que na avaliao prvia tenha havido equvocos.
Por cotas: esta parece simular uma amostragem estratificada, s que no
so feitos os sorteios. A populao dividida em subgrupos dos quais
so tomados os elementos que comporo a amostra de maneira proporcional ao tamanho do subgrupo. Um problema que a escolha do
elemento da amostra fica a critrio pessoal ou da oportunidade que se
oferece ao pesquisador.
Populao disponvel: quando a totalidade da populao-objeto (aquela da qual se tem interesse em realizar o estudo) no est acessvel, os
elementos que comporo a amostra sero obtidos daqueles acessveis
(populao amostrada) e as concluses do estudo dependero da semelhana entre as duas.
Material contnuo: se estiver fazendo uma verificao quanto qualidade da gua, ao rudo numa indstria, a partculas suspensas em um
ambiente qualquer, no h possibilidade de numerar e sortear elementos da populao.
Outros tipos de amostragem probabilstica, aqui no estudados, so: bola de neve,
de voluntrios, de populaes infinitas e de estudos comparativos.
25
Introduo Estatstica
26
Unidade 1
27
Introduo Estatstica
Atividade 1.2.2: Uma determinada rede de loja de roupas masculina e feminina tem
100 filiais espalhadas pelas diversas regies do pas. O Gerente Geral deseja aplicar
um pequeno questionrio a uma amostra de pessoas que entram na loja. Um dos
objetivos traados para a pesquisa determinar a proporo de clientes que fizeram uma compra, considerando um grau de preciso (erro amostral) de 5%; o outro investigar os mritos da loja em relao aos competidores. Voc contratado
com consultor para propor um plano amostral e determinar o tamanho da amostra.
Considere que durante a hora do almoo cada loja particularmente cheia e o custo
de enviar entrevistadores para todas as filiais proibitivo. Faa tambm qualquer
suposio para seu planejamento (por exemplo, a distribuio geogrfica das lojas).
Saiba Mais
Resumo da unidade:
Nesta seo voc estudou as principais tcnicas de amostragem. fundamental ter
claro os itens que compem um Plano Amostral, para aplic-lo num trabalho de pesquisa com levantamento de dados, bem como os erros potenciais de pesquisa e as
questes ticas com que se defronta o profissional.
28
Unidade 1
Assim, a descrio e explorao dos dados tm por finalidade descrever os dados observados (amostra) procurando como extrair o mximo de informao.
Nesta fase utilizam-se:
a) tcnicas de agrupamento: distribuies ou tabelas de frequncias;
b) tcnicas grficas: ramo-e-folhas, histograma, curva de frequncia e boxplot (diagrama em caixa);
c) tcnicas analticas atravs do clculo de medidas de resumo: medidas
de tendncia central (ou de posio), de disperso (ou de variao) e de
forma (assimetria).
Objetivos bsicos no emprego dessas tcnicas:
1. obter o mximo de informao dos dados;
2. descobrir padres de comportamento ou estruturas bsicas;
3. identificar anomalias e/ou dados discrepantes (outliers)
4. obter modelos matemticos adequados (a ser abordado na Unidade 2)
que viabilizem a inferncia estatstica (a ser abordado na Unidade 3).
29
Introduo Estatstica
Exemplo 1.3.1: Suponha que voc conseguiu coletar os preos (R$) em dez (10)
postos de combustveis, obtendo os dados no site da Agncia Nacional de
Petrleo (A.N.P), resultando nos dados abaixo:
Tabela 1.1 Tabela de Freqncias conjunto de dados
Posto
Bandeira
Gasolina
Comum
Gasolina
Aditivada
lcool
BR
2,599
2,699
1,699
TEXACO
2,579
2,679
1,679
IPIRANGA
2,549
2,649
1,649
BR
2,599
2,659
1,659
IPIRANGA
2,549
2,699
1,699
SHELL
2,599
2,699
1,699
TEXACO
2,579
2,659
1,659
BR
2,599
2,659
1,659
SHELL
2,599
2,659
1,659
10
BR
2,599
2,699
1,699
Fonte: ANP
Contagem
Frequncia
2,549
II
2,579
II
2,599
IIIII I
Fonte: ANP
Organizada numa tabela de frequncias, sem perda de informao, seria apresentada como segue:
30
Unidade 1
* municpio Florianpolis/
SC dez. 08
Preo
Gas.Comum
Frequncia
(Num. Postos)
2,549
2,579
2,599
Total
10
Fonte: A.N.P
31
Introduo Estatstica
R = X n - X1
Etapa 3 Calcule o nmero de classes ou intervalos de classe (k) em
funo do nmero de valores observados (n). Para isto, existem dois
critrios empricos.
Critrio 1 Raiz de n: k = n
Critrio 2 de Sturges: k = 1 + 3,332* log n
Observao: o nmero de classes recomendado deve ser de tal forma que os
valores no fiquem muito compactados ou muito dispersos. Isto significa que,
em termos prticos, recomenda-se um nmero de classes entre 5 e 15, obtido
pelo critrio que melhor se ajusta situao a analisar (muito bom senso e
senso crtico).
Etapa 4 Calcule a amplitude de classe ou intervalo de classe (C), dividindo
a amplitude total pelo nmero de classes; isto ,
C = R / k = (Xn - X1) / k
Observao: arredondar o resultado para um nmero inteiro superior, ou
mltiplo de 10, para facilitar a interpretao dos valores.
Etapa 5 - Construa a distribuio ou tabela de frequncias estabelecendo os limites de classes e fazendo a apurao dos dados. Utilize como limite inferior
da primeira classe o menor valor observado (ou um inteiro imediatamente
inferior), somando ao valor a amplitude de classe para obter o limite superior
da primeira classe, isto :
Li 1 = X1
Ls1 = X1 + C
32
Unidade 1
Li 2 = Ls1
Ls2 = Li 2 + C
E assim sucessivamente...
Exemplo 1.3.2 Os dados abaixo se referem ao preo (R$) da gasolina comum
em 49 postos de combustveis de vrias cidades do estado de Santa Catarina.
Construa a distribuio ou tabela de frequncias com perda de informao,
utilizando as etapas anteriores.
Dados Originais
2,599
2,570
2,580
2,559
2,399
2,599
2,470
2,599
2,540
2,584
2,577
2,599
2,550
2,639
2,479
2,579
2,499
2,599
2,499
2,590
2,560
2,449
2,690
2,589
2,599
2,570
2,490
2,459
2,560
2,389
2,410
2,420
2,430
2,438
2,439
2,450
2,460
2,697
2,470
2,599
2,599
2,470
2,579
2,499
2,599
2,449
2,639
2,499
2,599
---
X49 = R$ 2,697
APURAO
N DE POSTOS
2,389 | 2,433
||||
2,433 | 2,477
||||| |||||
10
2,477 | 2,521
||||| |||
2,521 | 2,565
||||
2,565 | 2,609
19
2,609 | 2,653
|||
2,653 || 2,697
TOTAL
49
33
Introduo Estatstica
Observaes:
O smbolo | utilizado para delimitar os valores entre os limites de classes,
equivale ao utilizado na matemtica (intervalo fechado esquerda e aberto
direita), isto ,
Li |Ls [Li ;Ls) Li Preo < Ls
Na ltima classe o intervalo fechado nos dois extremos, pois o maior valor
observado coincide com o Ls da classe; do contrrio, teria que considerar mais
uma classe e incluir esse valor.
Ao apurar os dados, identificar cada valor em sua classe, separando de cinco
em cinco para melhor identificar a frequncia final.
A apurao j nos d um grfico que representa as Classes no eixo da abscissa
(X) e as frequncias no eixo da ordenada (Y), e denominado de HISTOGRAMA
(grfico processado no SEstatnet), como pode ser visualizado abaixo, onde
cada classe representada pelo valor central (denominado de ponto mdio de
classe, a ser visto adiante).
25
Contagem
20
15
10
5
0
2,411
2,455
2,499
2,543
2,587
2,631
2,675
GCOM
34
Unidade 1
http://www.sestatnet.ufsc.br/area_excl.php
35
Introduo Estatstica
Na atualidade, com as facilidades de acesso a calculadoras e/ou a computadores, recomenda-se no clculo de uma medida de resumo utilizar os
valores originais, principalmente quando se agrupam os valores em distribuies de frequncias (com perda de informao), pois se realizarmos os
clculos a partir desta, perdemos em preciso.
No caso em que no possvel ter acesso aos dados originais, tendo-se apenas a distribuio de frequncias, para o clculo das medidas de resumo,
necessrio obter o PONTO MDIO DE CLASSE, que passa a ser considerado o valor representativo de cada classe, e dado por:
Xi = (Li + Ls)/2
Atividade de Aprendizagem 1.3c
Orientao: Este um exerccio individual e deve ser encaminhado para o
tutor da disciplina.
Tarefa Individual 1.3.3: Calcule os pontos mdios de classe para a distribuio
dos preos de gasolina (Exemplo 1.3.2)
Utilize o Sestatnet para facilitar a organizao dos dados.
http://www.sestatnet.ufsc.br/area_excl.php
36
Unidade 1
Mediana
Moda
Observao: Alm da mdia aritmtica, existe a mdia harmnica, mdia geomtrica, mdia quadrtica, mdia bi-quadrtica, mdia cbica.
4. Medidas de disperso ou de variao:
Absolutas:
Amplitude total
Desvio padro
Coeficiente de variao
37
Introduo Estatstica
Frmula matemtica:
1. Mdia simples (Frmula 1.3.1)
n
X=
x
i =1
x1 + x 2 + ... + x n
n
= R$ 2,585
X=
(x
i =1
ni )
n
i =1
(x1 n1 ) + (x 2 n 2 ) + ... + (x k n k )
n1 + n 2 + ... + n k
n
i =1
38
Unidade 1
ni
Xi
2,389 | 2,433
2,411
2,433 | 2,477
10
2,455
2,477 | 2,521
2,499
2,521 | 2,565
2,543
2,565 | 2,609
19
2,587
2,609 | 2,653
2,631
2,653 || 2,697
2,675
TOTAL
49
---
X=
(2,411*4)+(2,455*10)+(2,499*8)+(2,543*4)+(2,587*19)+(2,631*3)+(2,675*1)
4+10+8+4+19+3+1
Para verificar a perda de informao, vamos obter a mdia dos dados originais
(a mdia simples, ou seja, sem perda de informao).
X = R$ 2,539
39
Introduo Estatstica
40
PREOS (R$)
ni
% Acumulado
2,389 | 2,433
8,2
8,2
2,433 | 2,477
10
20,4
28,6
2,477 | 2,521
16,3
44,9
2,521 | 2,565
8,2
53,1
2,565 | 2,609
19
38,8
91,8
2,609 | 2,653
6,1
98,0
2,653 || 2,697
2,0
100,0
TOTAL
49
100,0
---
Unidade 1
Observe que a quarta classe contm a mediana, pois h 50% dos valores
acumulados.
Assim, podemos obter a mediana:
Mo
Conceito: a Moda ou Norma de um conjunto ou de uma distribuio de frequncias representa o valor (ou valores), se existir (em) que mais se observa
(m) ou que (so) mais frequente (s).
Note que a moda poder no existir, pois se no houver nenhum valor que
predomina no conjunto ou na distribuio, no se tem moda, isto , amodal.
No entanto, poder existir mais de uma caracterizando o conjunto ou a distribuio e se diz plurimodal.
No caso de exemplo 1.3.1, a moda R$ 2,599.
No caso do exemplo 1.3.2, da distribuio de frequncias, a moda bruta dada
pelo ponto mdio da classe de maior frequncia, isto , R$ 2,587.
Comparao entre as medidas de tendncia central
A mdia uma funo de todos os valores e influenciada pela magnitude dos
valores Me = f (Xi; n)A mediana uma funo do total e da ordem dos
valores: Md = f (n)
A moda uma funo da maior frequncia: MO = f (nmx)
Karl Pearson desenvolveu uma frmula emprica de relao entres as medidas
de tendncia central, a mdia, a mediana e a moda. Para aplicar a frmula
preciso que algumas condies devam ser satisfeitas e que a relao proposta
por Pearson se verifique com maior aproximao:
41
Introduo Estatstica
X = Mo = 3( X - Md)
1.3.5 Esquema dos cinco nmeros o box-plot
A partir do conceito da Mediana (ou Percentil 50) pode-se construir um grfico que permite avaliar o comportamento dos dados subdividido em quatro
grupos, utilizando cinco nmeros:
1. o menor valor observado (P0);
2. o percentil 25 ou quartil1 (P25);
3. o percentil 50 ou quartil2 ou mediana (P50);
4. o percentil 75 ou quartil3 (P75);
5. o maior valor observado (P100);
No grfico abaixo, pode ser analisado cada um dos cinco nmeros, onde os
limites da caixa (box-plot) representam os Quartis 1 e 3, enquanto a mediana
dada pela linha que divide a caixa. Tambm representado o valor da mdia
(vista pelo sinal de +).
806
643.6
CPR
481.2
318.8
154.4
-6
M
SEXO
42
Unidade 1
R = X n - X1
Permite comparar conjunto de dados ou distribuies de frequncias avaliando a disperso total, sem considerar a distncia entre os valores. No entanto,
uma medida pouco utilizada por ser instvel, j que influenciada to somente
pelos valores extremos, no fornecendo informao sobre o comportamento
dos valores intermedirios.
Exemplo 1.3.3 Conforme os dados da tabela abaixo, em que as colunas de
preos da gasolina, comum e aditivada, podem ser considerados conjunto
de dados no agrupados, calcule a amplitude de cada conjunto de preos.
Interprete o resultado.
Tabela 1.4 Tabela de Freqncias Gasolina comum e aditivada
Posto
Bandeira
Gasolina
Comum
Gasolina
Aditivada
BR
2,599
2,699
TEXACO
2,579
2,679
IPIRANGA
2,549
2,649
BR
2,599
2,659
IPIRANGA
2,549
2,699
SHELL
2,599
2,699
TEXACO
2,579
2,659
BR
2,599
2,659
SHELL
2,599
2,659
10
BR
2,599
2,699
Fonte: ANP
43
Introduo Estatstica
R = X n - X1
R (Gas. Comum) = 2,599 2,549 = R$ 0,05
R (Gas. Aditivada) = 2,699 2,649 = R$ 0,05
Conceito: a Varincia ou Quadrado Mdio de um conjunto ou de uma distribuio de frequncias representa o valor da mdia dos quadrados dos desvios
de cada valor em relao sua mdia.
Note que a varincia uma mdia quadrtica dos desvios; portanto, a unidade
de medida passa a ser o quadrado da unidade de medida da varivel de anlise.
Por exemplo, no caso do preo do combustvel, cuja unidade de medida em
R$, a mdia expressa em R$ e a varincia em (R$)2.
Conceito: o Desvio padro de um conjunto ou de uma distribuio de frequncias dado pela raiz quadrada da varincia e representa o valor da raiz
quadrada da mdia dos quadrados dos desvios de cada valor em relao
sua mdia.
Note que o desvio padro expresso na mesma unidade de medida da varivel
de anlise e da mdia, podendo-se interpretar como a distncia mdia dos
valores em torno de sua mdia.
44
Unidade 1
Frmula matemtica:
1- Para dados simples (dados no agrupados)
O denominador n 1 da varincia (bem como do desvio padro) denominado de graus de liberdade, pois representa a quantidade de comparaes
independentes que podem ser feitas entre as n unidades da amostra.
O princpio dos graus de liberdade muito utilizado na Estatstica e parte da
considerao de que as diferenas de cada uma das observaes em relao
sua mdia no so independentes, j que a mdia calculada a partir dos valores.
Assim, quando do clculo da varincia, diz-se que os n graus de liberdade
originalmente disponveis no conjunto sofrem a reduo de uma unidade
porque uma estatstica, a mdia, j foi calculada dos dados do grupo e aplicada na determinao da varincia.
45
Introduo Estatstica
http://www.sestatnet.ufsc.br/area_excl.php
Saiba Mais
Para aprofundar os conceitos estudados neste captulo consulte:
http://www.ence.ibge.gov.br/estatistica/default.asp
46
Unidade 1
Resumo da unidade:
Nesta seo voc estudou as principais tcnicas analticas para o clculo das medidas de resumo (ou de sntese) de um conjunto de dados, optando por aquelas que
melhor representam os dados coletados.
importante a interpretao de cada uma das medidas, bem como a utilizao de
uma ferramenta informtica para obter com maior rapidez os indicadores estatsticos e os grficos que permitem uma visualizao do padro de comportamento.
ENCERRAMENTO DA UNIDADE 1
Nesta unidade, abordamos os tpicos que integram a Estatstica Descritiva e
Exploratria de Dados.
Para a sua maior compreenso, recomendamos o emprego do ambiente de
ensino-aprendizagem via Web, atravs do Sistema especialista SestatNet.
47
Anotaes
importante
Unidade 2
2.1 Probabilidade
2.1.1 Fundamento bsico
A Teoria do Clculo das Probabilidades tem a sua origem em meados do sculo XVII, quando dois matemticos franceses trocam
correspondncia (Blaise Pascal e Pierre de Fermat) sobre problemas formulados por um jogador compulsivo na cidade de Monte
Carlo, Chevalier de Mr.
A partir dos questionamentos de de Mr, Pascal e Fermat realizam
estudos de modelos matemticos com base nos jogos de azar (moedas, dados, baralho e roleta) desenvolvendo uma srie de conceitos
que se ampliam na aplicao para outras reas do nosso cotidiano.
Para o entendimento desses conceitos, utilizaremos os exemplos bsicos dos jogos de azar, pois facilitam a compreenso e a manipulao em exerccios. Como
ponto de partida, afirma-se que em todo jogo de azar h um fator presente no
resultado que incontrolvel e ao qual se lhe atribui como devido ao acaso.
51
Introduo Estatstica
Assim, ao realizar uma experincia da qual no se tem controle sobre o resultado, diz-se que este se d ao acaso. No entanto, se repeti-la um nmero
expressivo de vezes, possvel construir um modelo probabilstico e tomar
decises quanto ao processo restrito ao experimento, apenas pelas suas caractersticas, sem ser preciso repetir a experincia.
A prtica indica que muitas situaes experimentais ocorrem em condies
consideradas estveis, permitindo a aplicao em vrios ramos da cincia e
da indstria por seu comportamento idntico. Assim, o modelo matemtico
construdo ao se revelar satisfatrio, emprega-se no estudo de propriedades e
na obteno de concluses.
Exemplo simples: Tome uma moeda (de qualquer valor). Intuitivamente voc
sabe qual a proporo de cara e de coroa, isto , voc espera igual nmero
de caras e de coroas, ao lanar um determinado nmero de vezes. Se voc
lanar por dez vezes, no necessariamente ocorrem 5 faces de cada, e essa
diferena entre os resultados atribuda ao acaso. No entanto, se lanar cem
ou aumentar para quinhentos ou mil lanamentos, a tendncia se aproximar,
medida que aumenta o nmero de repeties, do valor esperado, 50/50, isto
, metade cara e metade coroa.
Atividade de Aprendizagem 2.1a
Orientao: Este um exerccio individual e deve ser encaminhado para o tutor da
disciplina.
Atividade 2.1.1: atividade individual: Prepare uma planilha para registrar os resultados, por exemplo:
Experincia
E10
E50
E100
...
...
...
...
10
...
...
...
50
11
...
...
100
Faa 10, 50 e 100 lanamentos! Anote a sequncia de resultados, cara (C) e coroa
(C), compare os resultados quanto proporo de cara e coroa, para cada nmero
de lanamentos.
52
Unidade 2
Outro exemplo simples: Ao se verificar a qualidade de componentes produzidos em uma fbrica, atravs de amostras que so retiradas periodicamente,
pode-se prever o percentual de componentes fora do padro (defeituosos)
esperados no processo de fabricao, desde que as condies experimentais
sejam mantidas. Este processo implica em considerar, na fabricao dos
componentes, o emprego da mesma matria-prima, o mesmo equipamento,
o mesmo tipo de operrio na manipulao e outras implicaes do estudo
realizado para estabelecer o modelo de representao.
Palavra do Professor
Pode-se concluir, desses exemplos, que estamos diante de experincias nas quais o
experimentador no tem controle sobre os resultados. A esse tipo de experincia se
denominam de experincias aleatrias.
n
Vamos denominar esta caracterstica como a repetitividade da experincia
aleatria.
2. Associa-se um Espao Amostral () isto , um conjunto total de possibilidades experincia. Este conjunto tem que ser exaustivo e todos os
seus eventos excludentes.
53
Introduo Estatstica
= {1; 2; 3; 4; 5; 6}
Laplace enunciou o
Princpio da indiferena
segundo o qual duas
probabilidades so
equiprovveis (igualmente
provveis) se, e somente
se, no existem motivos
para favorecer qualquer
delas.
Quando numa experincia equipossvel (igualmente possvel) forem enumerados todas as possibilidades, a probabilidade de um determinado evento de
interesse (ou sucesso) dada pela proporo entre o nmero de resultados
favorveis ao sucesso em relao ao total de possibilidades, isto :
P(S) = (n de resultados favorveis a S)/ (n de resultados possveis de )
P(S) =(n de resultados favorveis a S)/(n de favorveis a S + n de contrrios a S)
Frmula matemtica: (conhecida como Lei de Laplace)
54
Unidade 2
Enquanto a Probabilidade de um evento de interesse (ou sucesso), a interpretamos como a proporo de sucesso do evento, a Chance deve ser interpretada
como sendo a razo entre o sucesso em relao ao insucesso.
Assim, a Chance de um evento sucesso (S) dada por:
Ch (S) = (n de resultados favorveis a S) / ( n de resultados contrrios a S)
Ch (S) = nS nS'
(Frmula 2.2.2)
Palavra do Professor
Observe que a Chance de um evento, sendo uma razo, pode ser um valor maior do
que um! Por exemplo, a Chance de retirar uma Carta diferente de s de um baralho
comum dada por: Ch (s) = 48 4 ou seja, 12 contra 1.
55
Introduo Estatstica
0 P(S) 1
Assim, podemos interpretar que existe um espao de probabilidade entre o
limite inferior, onde ocorre o evento impossvel (ou espao vazio), e o limite
superior, quando ocorre o evento certo ou espao amostral, ou seja, no extremo inferior,
P () = 0 e no extremo superior, P () = 1.
Como consequncia, pode-se obter um Corolrio do axioma, em que se o
evento sucesso (S) e o evento insucesso (S) so excludentes e exaustivos, temse que:
SUS'=
P(S) = 1 P(S')
(Frmula 2.2.3)
56
Unidade 2
lim (nS / n)
tende
P(S)
Relacionada com a primeira lei dos grandes nmeros, existe a segunda lei dos
grandes nmeros, que pode ser expressa atravs de:
medida que o nmero de repeties de um experimento aleatrio cresce, maior
tende a ser o valor absoluto da diferena entre a frequncia absoluta experimental de um sucesso e a frequncia absoluta esperada (terica).
57
Introduo Estatstica
Observe que a primeira lei dos grandes nmeros refere-se frequncia relativa, enquanto a segunda lei refere-se frequncia absoluta!
58
Unidade 2
des de vitria que qualquer outro time (mesmo estando na zona de rebaixamento). Quem garante que o azaro no pode ganhar?
Palavra do Professor
Excluem-se dessa anlise outros fatores que podem influenciar no resultado do jogo!
P(A B) = P () = 0
A frmula bsica neste caso para calcular a probabilidade da ocorrncia de um
dos eventos, ou A ou B, dada por:
(Frmula 2.2.4)
59
Introduo Estatstica
P(A B) P () 0
A frmula bsica neste caso para calcular a probabilidade da ocorrncia de um
dos eventos dada por:
(Frmula 2.2.5)
Unidade 2
(Frmula 2.2.6)
(Frmula 2.2.7)
61
Introduo Estatstica
U
i=1
Ei =
e
[P (Ei)] = P() = 1
i=1
62
Unidade 2
2 etapa Tem-se informao adicional de evento sucesso (S) que ocorre e que
permite reduzir o espao amostral para S.
n
U
(EiS) = S
i=1
e
n
[P (EiS)] = P(S)
i=1
P (Ei S) = P (Ei ) * P(S/Ei)
3 etapa Corrigem-se as probabilidades a priori a partir da informao
adicional do evento sucesso (S) e que permite calcular as probabilidades a
posteriori.
Em que:
P(S) = i=1
[P (Ei S)]
Exemplo em exerccio da aplicao do Teorema de Bayes:
Um artigo entregue a uma loja por 4 fornecedores (Fi; i = 1 a 4).
O nmero de artigos fornecidos por cada um dos Fi :
Tabela 2.1 Exemplo em exerccio da aplicao do Teorema de Bayes
Fornecedor (Fi)
F1
F2
F3
F4
Total
Numero de artigos
800
400
300
500
2000
Proporo de cada Fi
8/20
4/20
3/20
5/20
3%
4%
5%
6%
---
63
Introduo Estatstica
S [P (Fi) ]
i=1
i=1
i=1
F1
F2
40,00%
3%
4%
1,20%
0,80%
28,24%
F3
F4
Total
25,00%
100,00%
5%
6%
---
0,75%
1,50%
4,25%
18,82% 17,65%
35,29%
100,00%
20,00% 15,00%
Encerramos esta seo. Faa a autoavaliao proposta a seguir e avalie seu prprio aprendizado. Caso perceba que alguns pontos no ficaram claros para voc,
releia o contedo. Se a dvida persistir, solicite ajuda de seu tutor. No siga em
frente com dvidas, pois isso pode comprometer todo o seu aprendizado.
64
Unidade 2
65
Introduo Estatstica
Saiba Mais
http://www.sestatnet.ufsc.br/area_excl.php
Resumo da unidade:
Nesta seo voc estudou os principais conceitos de probabilidade, bem como os teoremas fundamentais que iremos utilizar no desenvolvimento de modelos matemticos
que sero a base da Unidade 3.
Observe com ateno que, para resolver problemas de clculo de probabilidades, existem quatro etapas fundamentais:
Etapa 1 identifique o espao amostral da experincia aleatria;
Etapa 2 atribua as probabilidades aos eventos da experincia;
Etapa 3 identifique o (s) evento (s) de interesse, principalmente o sucesso (S);
Etapa 4 calcule as probabilidades desejadas associando os teoremas abordados.
de probabilidade
66
Unidade 2
Palavra do Professor
Nesta seo aprenderemos a associar valores numricos aos eventos do espao
amostral de uma experincia aleatria. A esse valor numrico denominaremos de
varivel aleatria (X), a qual ser analisada como uma funo cujo domnio de definio o conjunto de resultados e cuja imagem o conjunto dos nmeros reais.
Atravs da varivel aleatria descrevemos os resultados de uma experincia
aleatria por meio de nmeros em vez de palavras, possibilitando o tratamento matemtico dos dados.
Exemplo 2.2.1
Considere a experincia
simultaneamente.
aleatria
( a):
Jogam-se
duas
moedas,
{(C; C)}
(C; C)
(C; C)
(C; C)}
67
Introduo Estatstica
p(x i ) = 1
para todo i
Exemplo 2.2.2
Vamos obter a distribuio de probabilidade para a varivel aleatria do
Exemplo 2.2.1.
{(C; C)}
Probabilidades
(C; C)
(C; C)
(C; C)}
0,25
0,25
0,25
0,25
2 caras
1 cara
0 cara
P(X =x)=p(x)
0,25
0,50
0,25
para todo i
f(x) dx = 1
68
Unidade 2
c) A probabilidade num dado intervalo de interesse, que descreve um evento de interesse, [a; b], igual rea sob o intervalo, ou seja,
b
P(a x b) = a f(x) dx
Onde a e b so quaisquer valores de x, com a restrio de que a<b.
Observao: No caso do clculo da probabilidade num dado intervalo, equivale-se para as situaes descritas abaixo,
Introduo Estatstica
Exemplo 2.2.3
Exerccio: Valor esperado do ganho em loteria
Em uma loteria, o jogador pode ganhar certa quantia x1 com probabilidade
p, ou pode perder outra quantia x2 com probabilidade q=1-p.
Observe que, ao comprar um bilhete de loteria ou jogar, voc j est perdendo
a quantia x2.
O valor esperado de ganho dado por:
Prmio
Valor (R$)
03
Automveis
20.000,00 cada
100
Bicicletas
250,00 cada
1.500
Prmios de...
100,00
8.000
Prmios de...
50,00
60.000
Prmios de...
10,00
90.000
Prmios de...
5,00
350.000
Prmios de...
2,00
450.000
Bilhetes grtis
Outra raspadinha
Soluo:
O nmero de casos possveis de 5.000.000 (total de bilhetes).
Ao comprar a raspadinha o apostador j perde R$ 1,00 e no tem 975.603
chances de retorno porque em 450.000 vezes obtm como retorno outra
raspadinha.
Assim, o valor esperado de ganho dado por:
E(G) = [3*20.000+100*250+1.500*100+8.000*50+60.000*10+90.000*5+3
50.000*2+
+450.000*0+(5.000.000 975.603)*(-1)] 5.000.000
= - R$ 0,30 (h uma perda esperada de trinta centavos)
70
Unidade 2
para todo i
Varivel
Probabilidade
SUCESSO (S)
X=1
INSUCESSO (S')
X=0
q=1-p
Total
1,0
71
Introduo Estatstica
Saiba Mais
Para aprofundar os conceitos estudados nesta seo, consulte:
HTTP://pt.wikibooks.org/wiki/Categoria:Probabilidade_e_Estatstica
Resumo da unidade:
Nesta seo voc estudou os principais modelos matemticos probabilsticos diferenciando o tipo segundo a varivel aleatria associada ao experimento.
Os dois modelos fundamentais a aplicar na Unidade 3 (Inferncia Estatstica) so
o Binomial e o Normal. Assim, se alguma dvida persistir, anote-a e entre em contato com o Tutor da disciplina.
72
Unidade 3
Inferncia estatstica
Introduo
Para que uma inferncia estatstica seja vlida, a amostra deve ser representativa da populao. Isto significa que se a seleo da amostra
no obedece a critrios tcnicos, mas apenas convenincia, esse procedimento introduz um erro ou vis (ou tendenciosidade), e o resultado que se quer inferir para a populao poder estar subestimado ou
superestimado.
Na perspectiva de ter-se amostras representativas, tecnicamente recomendvel a seleo de amostras aleatrias utilizando algum mecanismo
em que o acaso seja o fator relevante do estudo. Dessa forma, toma-se
como base uma experincia aleatria para associar um modelo probabilstico de anlise, segundo a situao.
Palavra do Professor
Dentre os procedimentos da inferncia estatstica, abordaremos dois considerados fundamentais: a estimao de parmetros e o teste de hipteses paramtrico.
Lembrando o que ressaltamos na seo 1.1, geralmente os parmetros de uma populao so desconhecidos; em funo disso, necessrio, com base em amostra
selecionada daquela populao, estimar o valor ou planejar um teste sob a hiptese
de assumir um determinado valor associando um nvel de confiabilidade.
75
Introduo Estatstica
P ( L) = 1 -
2. Bayesiano: baseado no conhecimento prvio sobre a distribuio da populao, de parmetros desconhecidos, em conjunto com os dados da
amostra.
E()-=0
ou
E()=
A diferena entre o valor esperado do estimador, E (), e o parmetro (),
denominamos de VIS ou BIAS.
Exemplos 3.1.1:
- a mdia da amostra ( X ) no tendenciosa da mdia da populao ();
- a varincia da amostra (s2) no tendenciosa da varincia da populao (2);
- a proporo de sucesso da amostra (p) no tendenciosa da proporo de
sucesso da populao ().
2. Eficincia (ou de Mnima Varincia)
Se 1 e
76
Unidade 3
V(Xi) = 2
, um estimador no tendencioso de
V( X ) = 2/n
Se n =1 V(X1) = V( X )
Se n > 1 X MAIS EFICIENTE que X1, pois tem menor varincia!
3. Consistncia
Esta propriedade verificada, na prtica, atravs da aplicao da lei dos grandes nmeros aplicada estimao, em que o valor esperado do estimador
tende ao parmetro medida que o nmero de observaes aumenta, com a
varincia diminuindo sensivelmente.
Na prtica: verifica-se atravs de
lim E() =
lim V() = 0
n
77
Introduo Estatstica
Amostra 1
Amostra 2
Amostra 3
96
40
72
99
86
96
56
56
49
52
67
56
70 80 93
86 85 90
56 52 67
40 78 57
89 49 48
99 72 30
96 94
= 71,55
Erro
Amostral
()
= 75,75
4,2
= 62,25
9,3
= 68,25
3,3
Palavra do Professor
Observe que, as diferenas entre as mdias amostrais e a mdia da populao sero
atribudas ao acaso, e a amostra que mais se aproximar do parmetro ser o melhor
estimador, no caso a amostra 3, que tem o menor erro.
78
Unidade 3
n1
n2
n3
n4
n5
n6
n7
n8
5
5
7
Mdias
m = 4,2
Varincias
s2 = 5,2
Populao
1
3
1,0
2,0
3,0
4,0
2,0
3,0
4,0
5,0
0,0
2,0
8,0
18,0
2,0
0,0
2,0
8,0
n9
n10
n11
n12
n13
n14
n15
n16
5
5
7
Mdias
m = 4,2
Varincias
s2 = 5,2
10
11
12
13
14
15
16
3,0
4,0
5,0
6,0
4,0
5,0
6,0
7,0
8,0
2,0
0,0
2,0
18,0
8,0
2,0
0,0
79
Introduo Estatstica
1,0
2,0
3,0
4,0
5,0
6,0
7,0
Total
25
(X i )
Nde amostras
(ni)
pi
1/25
2/25
5
5/25
6/25
6/25
4/25
1/25
1,0
105/25
* pi
1,0*1
2,0*2
3,0*5
4,0*6
5,0*6
6,0*4
7,0*1
E(
)= 4,2
Observaes importantes:
Observao 1: a mdia amostral mais estvel do que os valores individuais
que a compem;
Observao 2: da varincia das mdias, podemos obter o desvio padro das
mdias das amostras (o que conhecido como erro padro da mdia).
O exemplo da Observao1, acima, pode ser analisado no nosso cotidiano, que
o fato de a compensao dos desvios do peso atravs de uma balana digital
(dessas que existem em farmcias), tender a fornecer diferentes valores de seu
80
Unidade 3
p = V( X ) = 2/n = /n
Com o auxlio do erro padro da mdia, podemos encontrar o mbito de valores das mdias no qual nossa verdadeira mdia populacional provavelmente
se situa. Podemos tambm estimar a probabilidade da mdia populacional
situar-se efetivamente dentro daquele intervalo de valores mdios. Este o
conceito de intervalo de confiana para a mdia populacional.
81
Introduo Estatstica
- 1;
1, de duas populaes;
P ( - + ) = 1 -
a) Intervalo de confiana para a mdia da populao, quando o desvio padro da populao conhecido.
e = z. /n
Assim,
P (X
- z . / n
+ z . / n ) = 1 -
82
Unidade 3
P (X
- t * s / n
+ t * s / n) = 1 -
83
Introduo Estatstica
a) identifique a populao estudada;
b) identifique a varivel estudada;
c) determine um intervalo de 95% de confiana para a verdadeira diferena mdia
das faturas;
d) explique, com suas palavras, o significado do intervalo calculado.
Atividade 3.1.2: Resolva o problema abaixo
Assentos no ocupados em voos de companhias de aviao comparam-se a produtos perecveis porque, uma vez decolado o avio, esto perdidos, causando prejuzo.
Uma empresa fez o levantamento de 300 voos, selecionados aleatoriamente nos ltimos seis meses e anotou o nmero de assentos vazios, obtendo, para essa amostra,
mdia de 14,6 e desvio padro de 3,9 assentos.
e) Estime, com 90% de confiana, o nmero mdio de assentos vazios nos vos
dessa empresa durante os ltimos seis meses.
f ) Qual a sua opinio em utilizar esse intervalo para servir de base para o prximo
ms? Justifique a sua resposta.
Resumo da unidade:
Nesta seo voc estudou as principais propriedades de um estimador de um parmetro, bem como a aplicao desses critrios na estimao atravs de intervalos de
confiana.
As frmulas ora abordadas encontram-se resumidas no fluxograma a ser visto na
prxima seo, para cada situao experimental.
Portanto, fundamental a compreenso de cada uma das situaes para melhor
identificar a expresso adequada e aplicar tanto em estimao quanto em teste
de hipteses.
84
Unidade 3
Assim, podemos afirmar que um teste estatstico um conjunto de procedimentos para calcular a probabilidade da diferena entre duas mdias (ou duas
propores); ou ainda, para calcular a probabilidade de a razo entre duas
varincias ser devida ao fator do acaso ou a um determinado motivo (causa).
1 Princpio da deciso estatstica
O fator acaso l-se como ausncia de causa para explicar a diferena, e o
motivo, como causa sistemtica atribuda diferena.
Ao analisar o fator preponderante, se temos explicao para a situao, o fator
acaso (embora, presente) minimizado. J o contrrio mostra a necessidade
de investir em estudos para ter argumentos que auxiliem na explicao das
situaes reais.
Isso pode ser analisado pela figura abaixo:
ACASO
CAUSA OU MOTIVO
ACASO
CAUSA OU MOTIVO
H0
H1
85
Introduo Estatstica
Exemplo 3.2.1:
Se o julgamento de uma pessoa que considerada suspeita de ter feito algo
condenvel for avaliado como um teste de hiptese estatstico, qual a hiptese
nula e alternativa para a situao?
86
Unidade 3
DECISO ESTSTICA
REALIDADE
No rejeita H0
H0 Verdadeira
H0 Falsa
Deciso Correta
Erro II
(1 - )
()
NVEL DE CONFIANA
Rejeita H0
Erro I
Deciso Correta
()
(1 - )
NVEL DE SIGNIFICNCIA
PODER DO TESTE
87
Introduo Estatstica
88
Unidade 3
Fluxograma
no
A Populao
normal?
Utilizar Estatstica
No-Paramtrica
sim
sim
sim
sim
conhecido
o desvio Padro?
Quer se
testar a mdia?
no
no
H somente
um parmetro
no
H exatamente
dois parmetros
sim
Ento deve-se
ter interesse de
variabilidade
de dados
Quer se
testar as
mdias(x e y)?
sim
H0: =0
Z=
H0: =02=?
(X-0)n
t=
(X-0)n
s
Utilizar Anlise
de Varincia
no
H0:02=2
2=
(n-1) s2
2
sim
no
So conhecidos
x e y?
Testar se so iguais:
H0:x = y
F=
*
=
( sn 2 + sn 2 )
( sn 2 )2 ( sn 2 )2
x
x
x
x
nx+1
y
y
y
y
x-y
x2 + y2
ny
nx
sx2
sy2
no
x = y?
ny+1
sim
t* =
H0: x=y
t=
1 + 1
nx ny
x-y
(nx-1)sx2+(ny-1)sx2
nx+ny-2
][
FIM
Figura 3.2 Fluxograma da estatstica do teste
Fonte: Elaorado pelo Autor
89
x-y
sx2 + sy2
ny
nx
Introduo Estatstica
Atividade de Aprendizagem 1
Orientao: Este um exerccio individual e deve ser encaminhado para o tutor da
disciplina.
Atividade 3.2.1: Tarefa individual: No Exemplo 3.2.1, identifique os erros tipo I e tipo
II. Qual dos erros voc considera mais grave de ocorrer e por qu?
Problemas a resolver:
Atividade 3.2.2: Testes mdicos so desenvolvidos para minimizar a probabilidade
de que produzir um resultado falso positivo ou um resultado falso negativo. Um
resultado falso positivo refere-se a um teste positivo para um indivduo que no tem
a doena, e um falso negativo um teste que deu negativo para um indivduo que
realmente est doente.
a) Se um teste mdico analisado como um teste de hipteses, qual a hiptese
nula e qual a hiptese alternativa?
b) Identifique os erros tipo I e II, relacionando-os com o falso positivo e o falso
negativo.
c) Identifique qual dos erros o mais grave. Justifique a sua resposta.
d) Considerando-se o erro anterior, mais importante minimizar o erro tipo I ou II?
Justifique,
Atividade 3.2.3: Identifique o tipo de erro relatado na seguinte notcia do Jornal do
Brasil de 09/02/1998: Na ocasio, escapou da operao de ponte de safena, j na mesa
de cirurgia, porque os mdicos descobriram que ele havia cado nos 5% de possibilidade
de erro do exame. Pode-se considerar razovel essa porcentagem de 5% para esse
tipo de erro?
Atividade 3.2.4: Programa dominical de grande audincia na TV brasileira divulga
resultados de testes realizados com diversos produtos no sentido de alertar a populao quanto qualidade deles. Na realidade, realiza-se um teste de hipteses para
verificar a veracidade de determinada informao. Estes resultados divulgados geram protestos dos fabricantes, os quais apresentam seus argumentos, como na seguinte carta publicada no Painel Leitor do Jornal Folha de So Paulo de 13/12/1999:
Em relao reportagem Oito marcas oferecem grande risco [...] cumpre-nos informar que o produto citado pela reportagem foi coletado [...] fora de nossas dependncias industriais. Foi realizado teste apenas e exclusivamente em um litro de leite, entre os
mais de 5 milhes que a empresa produz e coloca diariamente no mercado. A empresa
no teve o direito de realizar contraprova ou acompanhar a compra e posterior anlise
da amostra pelo Instituto.
a) A empresa refutou a metodologia de coleta da amostra e os resultados do laudo.
Identifique os pontos em que possivelmente se baseou a empresa na sua defesa.
b) A veiculao de notcias semelhantes a essa justificada? Por qu?
90
Unidade 3
Atividade 3.2.5: Identifique o termo confiana na notcia veiculada na coluna de
Ricardo Boechat no jornal O Globo de 17/01/1999: A sondagem dir se os fatos e a
forma como evoluitam abalaram a crena nacional na capacidade do Governo de enfrentar crises. H dez meses o nvel dessa confiana supera 60%.
Saiba Mais
Para aprofundar os conceitos estudados nesta seo, exercite-se no SEstanet
http://www.sestatnet.ufsc.br/area_excl.php
Resumo da unidade:
Nesta seo voc aprendeu os fundamentos de um teste estatstico de hipteses, bem como as etapas bsicas para a sua realizao na tomada de deciso sob
incerteza.
Atravs da anlise de cada situao, pode ser utilizado o fluxograma na escolha
do teste adequado para aplicar a frmula que permite o clculo da estatistica com
base na amostra e comparar com o valor tabelado para decidir pela corrobarao ou no da hiptese nula
91
Introduo Estatstica
Referncias
ANDERSON, D.R.; SWEENEY, D.J.; WILLIAMS, T.A. Estatstica aplicada administrao e economia. 2 ed. So Paulo: Thomson Learning,
2007. o
BABBIE, Earl. Mtodos de pesquisas de Survey/ Earl Babie; traduo de
Guilherme Cezarino. Belo Horizonte: Ed.UFMG, 2005.
BARBETTA,P. A. Estatstica aplicada s cincias sociais. 7. ed. Florianpolis: Ed. da UFSC, 2008.
BRAULE, Ricardo. Estatstica aplicada com Excel: para cursos de administrao e economia. Rio de Janeiro: Campus, 2001.
FOX, J. A.; LEVIN, J. Estatstica para cincias humanas. 9. ed. So Paulo:
Pearson Prentice Hall, 2004.
HOFFMANN, R. Estatstica para economistas. 4. ed. So Paulo: Editora
Thomson, 2006.
LEVINE, D. M.; STEPHAN, D.; KREHBIEL, T. C.;BERENSON, M. L.
Estatstica: teoria e aplicaes usando Microsoft Excel em portugus.
5. ed. Rio de Janeiro: LTC, 2005.
LOPES, P. A. Probabilidades e estatstica. Rio de Janeiro: Reichmann &
Affonso Editores, 1999.
MORETTIN, P. A.; BUSSAB, W.O. Estatstica bsica, 5, ed. So Paulo:
Editora Saraiva, 2003.
SOARES, J. F.; FARIAS, A. A; CESAR, C. C. Introduo estatstica. Rio
de Janeiro: LTC, 1991.
TRIOLA, M. F. Introduo estatstica. 7 ed. Rio de Janeiro: LTC, 1999.
WONNACOTT, T. H.; WONNACOTT, R. J. Estatstica aplicada economia e administrao. Rio de Janeiro: LTC, 1981.
92
Unidade 3
Encerramento da disciplina
Como ressaltamos no incio, a disciplina INTRODUO ESTATSTICA
tem por objetivo estudar os conceitos que a norteiam como instrumento na
tomada de deciso sob incerteza. A aplicao dos princpios da estatstica,
hoje em dia, tem uma imensa gama de situaes reais que permite afirmar
que o indivduo que no dominar as tcnicas de anlise de dados, bem como
a utilizao de ferramental informtico, est fadado ao insucesso na sua vida
profissional.
Vimos que a Estatstica no se resume a uma tcnica de coleta e apresentao
de dados, mas uma disciplina cientfica com a qual se procura extrair concluses a partir de dados numricos originados de observaes. Frisamos que
o objetivo da Estatstica o de fazer inferncias a respeito de determinada
populao-alvo, a partir de uma ou mais amostras dessa populao, como um
instrumento auxiliar na tomada de deciso e condies de incerteza.
No momento em que finalizamos a disciplina, tendo abordado os tpicos nas trs
unidades inter-relacionadas, espero que voc, caro acadmico, tenha percebido
a importncia do contedo na sua formao pessoal, intelectual e profissional,
perseverando no esprito crtico e criativo, mantendo uma postura tica e lembrando que Estatstica nada mais do que o bom senso expresso em nmeros.
(Pierre Simon, marqus de Laplace, matemtico francs do sculo XVII).
93
Anotaes
importante