Sei sulla pagina 1di 638

GIOVANI GLAUCIO DE OLIVEIRA COSTA

Curso de Estatstica Inferencial e Probabilidades


Teoria e Prtica
2 Edio

EDITORA ATLAS

SO PAULO, 2013

Agradecimentos:

minha mezinha querida, Oneida Barreto de Campos


Costa; Aos meus irmos amigos e companheiros Andr
Luiz de Oliveira Costa e Andra Viviane de Oliveira Costa;
minha afilhadinha e sobrinha amada Juliana Paula Costa
Lima e a Editora Atlas pela confiana que depositou em
meu trabalho.

Prefcio

Este livro o resultado de experincias vividas a partir de 1991, quando


iniciei a minha vida acadmica como docente de graduao das Faculdades
Cndido Mendes em Campus do Goitacazes no Estado do Rio de Janeiro. A
partir da o material didtico que utilizava para lecionar Estatstica foi se
aperfeioando com a prtica adquirida em outras instituies de ensino
superior, tais como a Universidade Salgado de Oliveira, a Universidade Federal
do Rio de Janeiro, a Universidade da Cidade, a Universidade Federal
Fluminense, dentre muitas outras, at terminar nos ltimos quatro anos com a
Universidade Federal Rural do Rio de Janeiro. Foi tambm testado em cursos
de especializao e mestrado em economia e administrao, sendo
apresentado como texto para contemplar diversos programas.
Essa soma de cursos e experincias mostrou que a melhor maneira de
apresentar a matria a de expor os assuntos de maneira objetiva, prtica e
instrumental, onde os conceitos so contextualizados dentro da rea de
formao de cada curso ou estudante. Este recurso didtico importante
porque motiva e impulsiona o gosto pela disciplina pelos estudantes.
Procuro, na maioria dos casos, apresentar os conceitos sucintamente de
maneira a ser usado imediatamente na empresa ou em situaes de
pesquisas, sem grandes demonstraes matemticas ou formalismos. Logo em
seguida, os exemplifico atravs de cases prticos, reais em diversas reas de
negcios, sade e engenharias. So disponibilizados exerccios propostos no
final de cada unidade.
O presente livro se destina a cursos de estatstica em nvel intermedirio
ou avanado, como parte do programa de reas de cincias humanas e
sociais, mas tambm de exatas. O seu contedo objetiva dar uma viso geral e
instrumental de inferncia estatstica e suas aplicaes. Para tanto, versa sobre
introduo ao clculo de probabilidades, variveis aleatrias, modelos
probabilsticos,

distribuies

por

amostragem,

estimao,

testes

de

significncia, anlise da varincia, correlao de variveis e regresso e


correlao linear simples.
No final do livro, em anexos, so apresentadas as tabelas da Normal, TStudent, Qui-quadrado, F-Snedecor, Tukei, Durbin-Watson e a de KolmogorovSmirnov.
As reas e os cursos de aplicao deste livro so amplos e muito
diversificados em cursos de estatstica de nvel intermedirio e avanado, mas
podemos destacar a adoo deste compndio em disciplinas de estatstica
aplicada dos cursos de Administrao, Economia, Sade, Engenharias, e
tambm em programas de mestrado e doutorado de reas anlogas.
Gostaria muito de contar com a ajuda de todos os leitores, alunos e
colegas para avaliao crtica positiva deste exemplar, de modo que possamos
evoluir em qualidade, superando os erros e aperfeioando os acertos. Ser
muito gratificante para mim se meu livro tiver sido de alguma forma til para o
leitor, nem que tenha sido em somente um pargrafo e/ou em somente uma
pgina, mas espero de verdade que ele seja relevante em todo o seu contedo.
Obrigado a todos e boa leitura.
O autor.

Sumrio

Unidade I: Introduo ao Clculo de Probabilidades............................. .


Conceitos de Probabilidades...........................................................................
Experimentos Aleatrios..................................................................................
Espao Amostral(S).........................................................................................
Eventos(E).......................................................................................................
Conceitos de Probabilidades em Funo da Noo de Eventos.....................
Definio Frequncial(Intuitiva) de Probabilidade- A Posteriori.....................
Tipos e Associaes de Eventos.....................................................................
Definio Matemtica de Probabilidades- A Priori........................................
Eventos Mutuamente Exclusivos.....................................................................
Axiomas do Clculo das Probabilidades..........................................................
Eventos Complementares................................................................................
Eventos Independentes...................................................................................
Regra do Produto para Eventos Independentes..............................................
Eventos Condicionados...................................................................................
Probabilidade Condicionada............................................................................
Regra do Produto para Eventos Condicionados..............................................
Teorema da Probabilidade Total......................................................................
Teorema de Bayes...........................................................................................
Exerccios Propostos.......................................................................................
Unidade II: Variveis Aleatrias...................................................................
Conceitos de Variveis Aleatrias...................................................................
Variveis Aleatrias Discretas.........................................................................
Distribuio de Probabilidades........................................................................
Funo Repartio de Probabilidades.............................................................
Esperana Matemtica ou Mdia: E(X)...........................................................
Varincia: V(X)................................................................................................
Propriedades da Esperana Matemtica.........................................................
Propriedades da Varincia..............................................................................
Variveis Aleatrias Contnuas........................................................................
Distribuio de Probabilidades........................................................................
Funo Repartio de Probabilidades.............................................................
Esperana Matemtica....................................................................................
Varincia..........................................................................................................
Propriedades da Esperana Matemtica e da Varincia................................
Exerccios Propostos.......................................................................................

Unidade III: Modelos Probabilsticos...........................................................


Conceito de Modelos Probabilsticos...............................................................
Modelo de Bernoulli.........................................................................................
Modelo Binomial..............................................................................................
Modelo Hipergeomtrico..................................................................................
Modelo Poisson...............................................................................................
Modelo Uniforme..............................................................................................
Modelo Exponencial.........................................................................................
Modelo Normal ou Curva de Gauss.................................................................
Modelo T-STudent ..........................................................................................
Teorema Central do Limite .............................................................................
Teorema das Combinaes Lineares..............................................................
Modelo do Qui-quadrado ( 2).........................................................................
Modelo F de Snedecor.....................................................................................
Exerccios Propostos.......................................................................................
Unidade I V : Distribuies por Amostragem.......................................................
Conceito de Distribuio por Amostragem............................................................
Distribuio por Amostragem da Mdia................................................................
Distribuio por Amostragem da Proporo.........................................................
Distribuio

por

Amostragem das Somas ou Diferenas de Duas Mdias Amostrais,

Conhecidos os Desvios-padro Populacionais...................................


Distribuio por Amostragem das Somas ou Diferenas de Duas Mdias Amostrais, No
sendo Conhecidos os Desvios-padro Populacionais, mas Supostamente Iguais...................
Distribuio por Amostragem das Somas ou Diferenas de Duas Mdias Amostrais, No
Sendo Conhecidos os Desvios-padro Populacionais, mas Supostamente Desiguais.................
Distribuio por Amostragem da Soma ou Diferena de Mdias quando as Amostras so
Emparelhadas................................................................................
Distribuio por Amostragem da Soma ou Diferena de Duas Propores.....................................
Distribuio por Amostragem da Varincia(S2).....................................................
Distribuio por Amostragem do Quociente de Duas Varincias(S 21/S22)...........
Exerccios Propostos............................................................................................

Unidade V: Estimao.........................................................................................
Estatstica Inferencial............................................................................................
Diviso da Inferncia Estatstica...........................................................................
Estimao.............................................................................................................
Estimador..............................................................................................................
Estimativa.............................................................................................................
Tipos de Estimao.............................................................................................
Estimao Pontual................................................................................................
Estimao por Intervalo........................................................................................
Qualidades de um Estimador................................................................................
Erro Mdio Quadrtico..........................................................................................
Conceitos de Intervalos de Confiana...................................................................
Expresso do Intervalo de Confiana....................................................................
Intervalo de Confiana para a Mdia , quando conhecido............................
Intervalo de Confiana para a Mdia ,quando Desconhecido, mas o Tamanho da Amostra
Grande, n 30.................................................................
Intervalo de Confiana para a Mdia ,quando Desconhecido, mas o Tamanho da Amostra
Pequeno, n <30................................................................
Intervalo de Confiana para a Proporo ...........................................................
Intervalo de confiana para a Soma ou Diferena de Mdias, quando os Desvios-padro
Populacionais so conhecidos....................................................
Intervalo de Confiana para a Soma ou Diferena de Mdias, quando os Desvios-padro
Populacionais so desconhecidos, mas supostamente iguais.............................................
Intervalo de Confiana para a Soma ou Diferena de Mdias, quando os Desvios-padro
Populacionais so desconhecidos, mas supostamente desiguais........................................
Intervalo de Confiana da Soma ou Diferena de Mdias quando a as Amostras so
Emparelhadas.....................................
Intervalo de Confiana da Soma ou Diferena de Duas Propores...................
Intervalo de Confiana da Varincia(2) de uma Populao Normal....................
Intervalo de Confiana para o Desvio-Padro de uma Populao Normal......
Intervalo de Confiana para o Quociente das Varincias Populacionais(22/21)
Exerccios Propostos.............................................................................................

Unidade VI : Testes de Significncia..................................................................


Conceitos de Testes de Significncia....................................................................
Fundamentos dos Testes de Significncia............................................................
Raciocnio de Teste de Significncia....................................................................
Formas de Apresentar as Hipteses.......................................................................
Tipos de Testes de Significncia...........................................................................
Tcnicas de Realizar Testes de Significncia.......................................................
Estatstica de Teste...............................................................................................
Conceito de Valor-p...............................................................................................
Clculo do Valor-p.................................................................................................
Significncia Estatstica.........................................................................................
Estatstica Significante...........................................................................................
Teste de Significncia Utilizando o Intervalo de Confiana...................................
Teste de Significncia para Mdia da Amostra,

quando a Varincia Populacional

Conhecida.........................................................................
Teste de Significncia para Mdia da Amostra, quando a Varincia Populacional Desconhecida e
o Tamanho da Amostra Suficientemente Grande..........................................................
Teste de Significncia para Mdia da Amostra, quando a Varincia Populacional Desconhecida e
o Tamanho da Amostra No Suficientemente Grande.................................................
Teste de Significncia para a Proporo da Amostra............................................................
Teste de Significncia para a Diferena de Mdias das Amostras quando as Varincias
Populacionais so Conhecidas...................................................................................................
Teste de Significncia para a Diferena de Mdias das Amostras quando as Varincias
Populacionais so Desconhecidas, mas Supostamente Iguais...........................................
Teste de Significncia para a Diferena de Mdias das Amostras quando as Varincias
Populacionais so Desconhecidas, mas Supostamente Desiguais....................................
Teste de Significncia para a Diferena de Propores das Amostras..............................
Teste de Significncia para Mdia da Amostra,

quando a Varincia Populacional

Conhecida............................
Teste de Significncia para Mdia da Amostra, quando a Varincia Populacional Desconhecida e
o Tamanho da Amostra Suficientemente Grande........................................................
Teste de Significncia para Mdia da Amostra, quando a Varincia Populacional Desconhecida e
o Tamanho da Amostra No Suficientemente Grande.................................................
Teste de Significncia para a Proporo da Amostra...............................................................
Teste de Significncia para a Diferena de Mdias das Amostras quando as Varincias
Populacionais so Conhecidas...............................................................................................
Teste de Significncia para a Diferena de Mdias das Amostras quando as Varincias
Populacionais so Desconhecidas, mas Supostamente Iguais........................................
Teste de Significncia para a Diferena de Mdias das Amostras quando as Varincias
Populacionais so Desconhecidas, mas Supostamente Desiguais...................................
Teste de Significncia para a Diferena de Propores das Amostras............................

Teste de Significncia para a Varincia da Amostra (S 2)........................................


Teste de Significncia para Igualdade de Duas Varincias de Amostras S21 e S22 ...........
Potncia de um Teste de Hiptese...........................................................................
Erros do Tipo I e do Tipo II.......................................................................................
Esquema de Decises em Testes de Hipteses....................................................
Exerccios Propostos.............................................................................................
Unidade VII : Anlise da Varincia......................................................................
Conceitos de Anlise da Varincia........................................................................
Modelo de Classificao nica..............................................................................
Modelo de Classificao Dupla..............................................................................
Validao das Pressuposies Bsicas................................................................
Anlise de Resduos..............................................................................................
Dados Discrepantes(Outlier)..................................................................................
Independncia ou Autocorrelao Residual..........................................................
Teste de Durbin-Watson........................................................................................
Varincia Constante(Homocedascidade)..............................................................
Teste de Levene....................................................................................................
Heterocedascidade................................................................................................
Normalidade..........................................................................................................
Conseqncias da No validao dos Pressupostos..........................................
ANOVAS sobre Postos........................................................................................
Mtodo da Anlise da Anlise da Varincia........................................................
Exerccios Propostos.............................................................................................

Unidade VIII: Correlao de Variveis..................................................................


Conceito de Correlao(r)......................................................................................
Correlao de Variveis Contnuas-Correlao Linear.........................................
Coeficiente de Correlao Linear de Pearson(r)...................................................
Teste de Significncia de r ....................................................................................
Pressupostos para Correlao Linear de Pearson...................................................
Correlao de Variveis Ordinais((rs)....................................................................
Coeficiente de Correlao de Spearman(rs)..........................................................
Teste de Significncia de rs...................................................................................
Correlao de Variveis Nominais(C)....................................................................
Coeficiente de Contingncia(C).............................................................................
Teste de Significncia de C...................................................................................
Correlao entre Variveis Nominal e Ordinal(r NO)...............................................
Coeficiente de Correlao Nominal/Ordinal(rNO)...................................................
Teste de Significncia de rNO.................................................................................
Correlao entre Variveis Ordinal/Contnua(rOC).................................................
Coeficiente de Correlao Ordinal/Contnua(rOC)..................................................
Teste de Significncia de rOC.................................................................................
Exerccios Propostos.............................................................................................
Unidade IX: Regresso Linear Simples.............................................................
Conceito de Regresso Linear..............................................................................
Conceito de Regresso Linear Simples.................................................................
Varivel Independente(X)......................................................................................
Varivel Dependente(Y).........................................................................................
Equao de Regresso Linear Simples.................................................................
Fases da Regresso Linear Simples.....................................................................
Estimao dos Parmetros de Regresso Linear Simples....................................
Coeficiente de Explicao ou de Determinao(R 2)..............................................
Testes de Significncia da Existncia de Regresso Linear Simples ou Teste da Significncia do
Coeficiente de Explicao(R2)................................................ ......
Teste de Significncia do Coeficiente de Regresso(b)-Teste de Wald..................
Validao das Pressuposies Bsicas................................................................
Anlise dos Resduos............................................................................................
Dados Discrepantes(Outlier)..................................................................................
Independncia ou Autocorrelao Residual..........................................................
Teste de Durbin-Watson........................................................................................
Varincia Constante(Homocedasticidade).............................................................
Teste de Pesaran-Pesaran....................................................................................
Heterocedasticidade..............................................................................................
Normalidade...........................................................................................................

10

Importncia da Anlise dos Resduos...................................................................


Exerccios Propostos.............................................................................................
Anexo : Tabelas...................................................................................................
Bibliografia...........................................................................................................

11

Unidade I
Introduo ao Clculo das Probabilidades

Conceito de Probabilidades:
o campo do conhecimento que estuda os fenmenos ou experimentos
aleatrios.
Experimentos Aleatrios:
So aqueles cujos resultados no so sempre os mesmos, apresentam
variaes, mesmo quando repetidos indefinidamente em condies uniformes.
Exemplos:

A experincia que consiste no lanamento de uma moeda um


fenmeno aleatrio;

A experincia que consiste no lanamento de um dado um


fenmeno aleatrio;

Uma promoo de preos que feita para toda a linha de


produtos de uma empresa traz um aumento variado e imprevisvel
no volume de vendas;

Quando selecionamos um cliente para fazer uma pesquisa sobre


satisfao, a sua avaliao sobre um determinado quesito
considerado um fenmeno aleatrio.

12

Espao Amostral (S):


o conjunto de todos os resultados possveis de uma experincia
aleatria.
Exemplos:

Seja a experincia que consiste no lanamento de uma moeda, o


espao amostral associado :
{Cara, Coroa}

Seja a experincia que consiste no lanamento de um dado, o


espao amostral associado :
{1,2,3,4,5,6}

Quando uma pessoa sorteada para avaliar como timo, bom,


regular, ruim ou pssimo um determinado governo federal, o
espao amostral associado :
{timo, bom, regular, ruim, pssimo}

Quando uma pessoa sorteada para escolher, quando de olhos


vedados e pelo sabor, entre duas marcas, A ou B, concorrentes
de um refrigerante, o espao amostral :
{Marca A, Marca B}

13

Eventos (E):
todo subconjunto finito de um espao amostral. um conjunto de
resultados de interesse em uma experincia aleatria.
Exemplos:

Seja a experincia que consiste no lanamento de uma moeda,


podemos ter os seguintes eventos de interesse:
{Cara}, {Coroa}, {Cara, Coroa}

Seja a experincia que consiste no lanamento de um dado,


podemos ter os seguintes eventos de interesse:
{1}, {2}, {3}, {4}, {5}, {6}, {1, 2, 3}

Quando uma pessoa sorteada para avaliar como timo, bom,


regular, ruim, pssimo um determinado governo federal, podemos
ter os seguintes eventos de interesse, se formos o poltico
analisado em questo:
{timo}, {bom}, {timo, bom}

14

Conceito de Probabilidades em Funo da Noo de Eventos:


uma medida numrica, em termos relativos/ percentuais, que expressa
a chance que um evento de interesse ocorra. a quantificao de incertezas.
Exemplo:
Seja a experincia que consiste no lanamento de uma moeda. A
medida numrica que expressa a chance de ocorrer o evento cara, em um
dado lanamento, 50%.
Definio Frequncial (Intuitiva) de Probabilidades- A Posteriori

Trata-se da probabilidade avaliada, emprica;

Ela tem por objetivo estabelecer um modelo adequado


interpretao de certa classe de fenmenos observados (no
todos);

A experincia a base para se montar o modelo ou para ajust-lo


ao modelo ideal (terico).

15

Exemplo:
Consideremos um grupo de mquinas de uma fbrica, operadas de certa
forma, tendo um determinada capacidade de produo. Vamos caracterizar a
qualidade do produto manufaturado por essas mquinas, com um critrio prestabelecido para se decidir se a pea produzida perfeita (P) ou defeituosa
(D). Tomemos 6 amostras de peas produzidas pelas mquinas, sendo cada
amostra constituda de 25 peas. Aps a anlise de qualidade, contemos as
peas defeituosas e calculemos a porcentagem de peas defeituosas, para
cada amostra. Repitamos a experincia, mas aumentando o tamanho da
amostra para 250 peas inicialmente e depois para 2500 peas. Suponhamos
que tenhamos encontrado os valores anotados na tabela a seguir:

n = 25
D
4
1
0
2
1
0

N de Peas Tomadas para Amostra (n)


n= 250
n = 2500
%D
D
%D
D
%D
16
12
4,8
157
6,28
4
14
5,6
151
6,08
0
22
8,8
136
5,44
8
15
6,0
160
6,40
4
8
3,3
153
6,12
0
15
6,0
157
6,28

Onde: %D = (D/n) . 100

16

Concluso:
Notemos que, em cada caso, as quantidades de peas defeituosas
encontradas constituem as frequncias absolutas, enquanto as porcentagens
de peas defeituosas constituem as freqncias relativas. Verificamos que,
quando o tamanho da amostra pequeno, as freqncias relativas apresentam
oscilaes irregulares grandes, porm, medida que o tamanho da amostra
cresce, as oscilaes tendem a ser menores e elas oscilam em torno de um
valor constante hipottico.
Assim, para amostras suficientemente grandes as freqncias relativas
pouco diferem entre si. o que chamamos de Regularidade Estatstica dos
Resultados.
O valor hipottico fixo no qual tende a haver uma estabilizao da
frequncia

relativa,

denomina-se

probabilidade.

No

exemplo,

seria

probabilidade de ocorrncia de peas defeituosas daquele grupo de mquinas.


A frequncia relativa portanto considerada um medio experimental do valor
da probabilidade.
Diramos:
P (E) = lim {F(E)/n)]
n

Onde:
P (E) = probabilidade de ocorrer o evento E
F (E) = frequncia absoluta do evento ocorrer E
n = tamanho da amostra

17

Do ponto de vista matemtico, essa definio de probabilidade


apresenta dificuldades, porque um nmero limite real pode no existir. Assim, a
formalizao da definio no obedece rigorosamente teoria matemtica de
limite. Isso traz como consequncia que existem dificuldades em demonstrar os
teoremas de probabilidades, muito embora essa definio seja bastante
intuitiva.
A denominao a posteriori resulta do fato de termos que repetir a
experincia vrias vezes para podermos calcular a probabilidade.
Tipos e Associaes de Eventos:
Evento Simples:
o evento formado por um nico elemento do espao amostral
associado.
Exemplos:

Seja a experincia que consiste no lanamento de uma moeda,


podemos ter os seguintes eventos simples de interesse;
{ Cara},{ Coroa}

Seja a experincia que consiste no lanamento de um dado,


podemos ter os seguintes eventos simples de interesse:
{ 1}, { 2}, { 3}, { 4}, { 5}, { 6}

Quando uma pessoa sorteada para avaliar como timo, bom,


regular ou pssimo um determinado governo federal, podemos ter
os seguintes eventos simples de interesse, se formos o poltico
analisado em questo:
{ timo}, {bom}

18

Evento Composto:
o evento formado por dois ou mais elementos do espao amostral S
associado.
Exemplos:

Seja a experincia que consiste no lanamento de uma moeda,


podemos ter o seguinte evento composto de interesse:
{ Cara, Coroa}

Seja a experincia que consiste no lanamento de um dado,


podemos ter os seguintes eventos compostos de interesse:
{ 1, 2}, {3, 4, 5} , { 1, 2, 3, 4, 5, 6}

Quando uma pessoa sorteada para avaliar como timo, bom,


regular, ruim ou pssimo um determinado governo federal,
podemos ter o seguinte evento composto de interesse, se formos
o poltico analisado em questo:
{ timo, bom}

19

Evento Certo (C):


aquele que sempre ocorre, em qualquer realizao da experincia
aleatria.

aquele

que

coincide

com

prprio

espao

amostral.

Consequentemente, a probabilidade de ocorrer o evento certo sempre P (C)


= 1 ou P (C) = 100%, isto , a certeza.
Exemplos:

Seja a experincia que consiste no lanamento de uma moeda, o


evento certo associado :
C = { Cara, Coroa} P (C) = 1

Seja a experincia que consiste no lanamento de um dado, o


evento certo associado :
C = { 1, 2, 3, 4, 5, 6} P (C) = 1

Quando uma pessoa sorteada para avaliar como timo, bom,


regular, ruim ou pssimo um determinado governo federal, o
evento certo associado :
C = { timo, bom, regular, ruim, pssimo} P (C) = 1

20

Evento Impossvel (I):


aquele que nunca ocorre, em nenhuma realizao do experimento
aleatrio. A probabilidade de um evento impossvel sempre igual a zero, isto
, P (I) = 0.
Exemplos:

Seja a experincia que consiste no lanamento de um dado, o


evento impossvel associado :
I = { face > 6} P (I) = 0

Quando uma pessoa sorteada para avaliar como timo, bom,


regular, ruim ou pssimo um determinado governo federal, o
evento certo associado :
I = {outra} P (I) = 0

21

Definio Matemtica de Probabilidades- A Priori


Seja uma experincia aleatria onde todos os elementos de um espao
amostral S associado a uma experincia aleatria tenham a mesma chance de
ocorrer e seja E um evento de interesse do espao amostral S, ento a
probabilidade de ocorrer o evento E pode ser assim definida:

, onde
P (E) = n (E)
n (S)

n (E) o nmero de elementos do evento de interesse E,


n (S) o nmero de elementos do espao amostral S.
Exemplos:
1)Uma pessoa tem 3 notas de R$ 2,00 e 1 nota de R$ 5,00 no bolso.
Esta pessoa entra apressadamente no nibus e retira uma nota do seu
bolso. Qual a probabilidade de ter retirado uma nota de R$ 2,00?
E = retirar uma nota de R$ 2,00 do bolso
n (E) = 3
n(S) = 4, ento:
P (E) =

= 0,75 ou 75% chance

22

2)Um banco de dados de clientes cadastrados de uma loja possui 40


pessoas do sexo masculino e 60 pessoas do sexo feminino. Seja a
experincia de selecionar uma pessoa do cadastro aleatoriamente. Qual
a probabilidade dessa pessoa ser homem?
E = pessoa selecionada do cadastro de clientes ser homem.
n (E) = 40
n (s) = 100
P (E) = 40 = 0,40 ou 40% chance
100
3) Em uma loja de departamento existem 70 calas de couro vermelho e
90 de couro preto. Selecionanda uma cala aleatoriamente dentre as
160 existentes, qual a probabilidade da cala selecionada ser de couro
preta?
E = cala selecionada ser de couro preto
n (E) = 90
n (S) = 160
P(E) = 90 = 56,25% de probabilidade
160
4)Quando uma pessoa sorteada para avaliar como timo, bom,
regular, ruim ou pssimo um determinado governo federal, qual a
probabilidade da pessoa avaliar positivamente o referido governo?
E = a pessoa avaliar positivamente o referido governo.
E = {timo, bom}

23

n (E) = 2
n (S) = 5
Portanto:
P(E) = 2 = 40% de probabilidade
5
Eventos Mutuamente Exclusivos:
So aqueles que nunca podem ocorrer simultaneamente em uma
mesma realizao de um experincia aleatria.
Exemplos:
o No lanamento de uma moeda, os eventos cara e coroa so
mutuamente exclusivos;
o No lanamento de um dado, os eventos 1 e 4 so mutuamente
exclusivos.
Lembrando da Teoria dos Conjuntos, podemos dizer que eventos
mutuamente exclusivos constituem conjuntos disjuntos, isto , a interseo o
conjunto vazio.

E = E1 E2 = P ( E1 E2) = 0

24

Axiomas do Clculo das Probabilidades:


Pelos conceitos que acabamos de ver at agora; podemos concluir que:
1. 0 P (E) 1
2. P (S) = 1
3. Se E1 e E2 forem eventos mutuamente exclusivos, ento:

P (E1 + E2) = P (E1) + P (E2)

OBS: Se E1 E2 , ento P (E) = P (E1 + E2) = P (E1) + P (E2) P (E1 E2)

Exemplos:
1)No lanamento de um dado, qual a probabilidade de sair face 1 ou
face 4?
E1 = sair face 1 P (E1) = 1/6
E2 = sair face 4 P (E2) = 1/6
E = sair face 1 ou face 4.
Em probabilidade, a chance de sair um evento ou outro igual soma
das probabilidades dos eventos envolvidos, ento a probabilidade pedida
:
P (E) = P (E1 + E2)

Como E1 e E2 so mutuamente exclusivos, ento:


P (E) = P (E1 + E2) = P (E1) + P (E2) = 1/6 +1/6 = 2/6 = 1/3

25

2)Uma populao formada de 20 pessoas que consomem o produto A


e, 30 pessoas que consomem o produto B e 50 pessoas que consomem
o produto C. Um pesquisador de mercado seleciona uma pessoa desta
populao. Sabendo que uma pessoa no consome mais de um produto
ao mesmo tempo, qual a probabilidade de ter sido selecionada uma
pessoa que consome o produto A ou C?
E1 = consumir o produto A P (E1) = 20/100 =0,2
E2 = consumir o produto C P (E2) = 50/100 = 0,5
E = consumir o produto A ou C
Como E1 e E2 so mutuamente exclusivos, ento:
P (E) = P (E1 + E2) = P (E1) + P (E2) = 0,2 + 0,5 = 0,7 ou 70%
3)Em uma empresa, o departamento de recursos humanos ofereceu
a oportunidade de seus analistas de sistemas aceitarem realizar
pelo menos 2 cursos de lngua estrangeira para aperfeioamento:
ingls ou espanhol. A probabilidade de aceitarem fazer um curso de
ingls de 30%, aceitarem fazer um curso de espanhol de 40% e
ambos 10%. Qual a probabilidade de um analista de sistemas
selecionado aleatoriamente do banco de dados da empresa, aceitar
fazer um curso de lnguas?
E = analista de sistemas selecionado aleatoriamente do banco de
dados da empresa, aceitar fazer um curso de lnguas.
P (E) = 0,30 + 0,40 0,10 = 0,60 ou 60%

26

4)Uma pesquisa foi realizada por um instituto para traar o perfil dos que
compram DVDs e vdeos no Brasil. Numa amostra aleatria de 2000
pessoas, foi constatado que entre pessoas das classes sociais A e B, 100
compram s filmes piratas, 80 s filmes originais e 120 compras piratas e
originais. Seleciona-se aleatoriamente da planilha Excel, onde a base de
dados est salva, uma pessoa. Responda:
a)

Qual a probabilidade da pessoa ser da classe social A ou B?

b)

Qual a probabilidade da pessoa ter o hbito de comprar filmes


originais e tambm piratas?

Soluo:
O diagrama abaixo nos revela a configurao da amostra segundo
os resultados da pesquisa:

27

Ento:

a)

Qual a probabilidade da pessoa ser da classe social A ou B?

E = a pessoa ser da classe social A ou B


300
P(E) = = 0,15 ou 15%
2000
b)

Qual a probabilidade da pessoa ter o hbito de comprar filmes


originais e tambm piratas?

O P = pessoa ter o hbito de comprar filmes originais e tambm piratas


120
P(O P) = = 0,06 ou 6%
2000

28

Eventos Complementares:

Um evento E

complementar ao evento E , se ele somente

ocorrer se o evento E deixar de ocorrer. So todos os elementos do


espao amostral S, que no pertencem ao evento E.
Visualizando:

Portanto:

E+E

= S

E E

= 0

Assim, eventos complementares so mutuamente exclusivos.

29

Podemos escrever:

S=E+E
P(S) = 1

P(E + E) = 1, como so eventos mutuamente exclusivos vem que

P(E) + P( E ) = 1 P( E ) = 1 P(E)

Sabemos que um evento pode ocorrer ou no ocorrer. Sendo p a


probabilidade de que ele ocorra (sucesso) e q a probabilidade de que ele
no ocorra (insucesso).

Chamando E o evento ocorrer o sucesso e E o insucesso, temos:

P(E) = p

P(E)= q

Vem que:
p+q=1q=1-p

30

Exemplos:
1)A probabilidade de se realizar um evento p = 1/5, a probabilidade de
que ele no ocorra :
q = 1 p = 1 - 1/5 = 4/5
2)A probabilidade de tirar 4 no lanamento de um dado p= 1/6, logo, a
probabilidade de no tirar 4 no lanamento de um dado :
q = 1 p = 1- 1/6 = 5/6
3)A probabilidade de uma dona de casa escolher uma determinada
marca de caf em p num supermercado de 65%. Qual a
probabilidade que em um dado dia ela escolha outra marca?
q = 1 p = 1 0,65 = 0,35 ou 35%

31

4)Uma pesquisa foi realizada por um instituto para traar o perfil dos que
compram DVDs e vdeos no Brasil. Numa amostra aleatria de 2000
pessoas, foi constatado que entre pessoas das classes sociais A e B e de
nvel educacional alto, 100 compram s filmes piratas, 80 s filmes
originais e 120 compras piratas e nacionais. Seleciona-se aleatoriamente
da planilha Excel, onde a base de dados est salva, uma pessoa. Qual a
probabilidade da pessoa no ser das sociais A ou B?
Soluo:
O diagrama abaixo nos revela a configurao da amostra segundo
os resultados da pesquisa:

32

Ento:
Qual a probabilidade da pessoa no ser da classe social A ou B?
E = a pessoa no ser da classe social A ou B
1700
P(E) = = 0,85 ou 85%
2000
Ou pelo complementar:
E = pessoa ser da classe social A ou B

P(E) = p P(E) = q , logo:


q = 1-0,15 = 0,85 ou 85%

33

Eventos Independentes:
Dizemos que dois eventos so independentes quando a realizao
ou no-realizao de um dos eventos no afeta a probabilidade da
realizao do outro e vice-versa. A ocorrncia de um deles, no aumenta
ou diminui a ocorrncia do outro. A realizao de um deles no modifica a
chance de realizao do outro.
Exemplos:

o Quando lanamos dois dados, o resultado obtido em um deles no


afeta o resultado obtido no outro;
o O eventos pane no seu computador e aumento dos preos de
computadores desktops no pas;
o Uma pessoa no ir trabalhar e queda do edifcio em que trabalha;
o Uma pessoa ser despejada do imvel que alugou e aumento de
temperatura no dia;
o A satisfao de uma pessoa com o emprego e aumento do ndice
de criminalidade no pas.

34

Regra do Produto para Eventos Independentes:


Se dois eventos so independentes, a probabilidade de que eles se
realizem simultaneamente igual ao produto das probabilidades de
realizao dos dois eventos.
Sejam E1 e E2 dois eventos independentes. Suponha que
tenhamos o interesse que numa experincia aleatria de quantificar a
ocorrncia dos eventos E1 e E2 simultaneamente, ento, desejamos:
P(E1 E2)=

P ( E1 E2) = P (E1) x P (E2)

Sendo p1 a probabilidade de realizao do primeiro evento(E 1) e p2 a


probabilidade de realizao do segundo evento(E 2), a probabilidade de que tais
eventos se realizem simultaneamente dada por:

p1 x p2

Exemplos:

1)Lanamentos dois dados:


.
A probabilidade de obtermos 1 no primeiro dado :
p1 = 1/6
A probabilidade de obtermos 5 no segundo dado :
p2 = 1/6
Logo, a probabilidade de obtermos, simultaneamente, 1 no primeiro e 5
no segundo :
P = 1/6 x 1/6 = 1/36

35

2)A probabilidade de um consumidor ficar satisfeito com o desempenho


de certa marca de um produto de 25%. A probabilidade de outro
consumidor ficar satisfeito com a mesma marca do produto 40%.
Suponhamos que os dois consumidores vo consumir o produto num
mesmo momento e de forma independente, qual a probabilidade dos dois
consumidores ficarem satisfeitos simultaneamente:
A probabilidade do consumidor 1 ficar satisfeito :
p1 = 0,25
A probabilidade do consumidor 2 ficar satisfeito :
p2 = 0,40
Logo, a probabilidade de simultaneamente os dois consumidores ficarem
satisfeitos :

P = 0,25 x 0,40 = 0,10 ou 10%

36

Eventos Condicionados (E1/E2):


Dois eventos associados a uma mesma experincia aleatria so
ditos condicionados, quando a ocorrncia prvia de um deles aumenta ou
diminui a ocorrncia do outro. A j ocorrncia de um deles modifica a
ocorrncia do outro.
Exemplos:

Suponhamos que uma pessoa que est saindo para trabalhar de


manh tem dvida se leva guarda-chuva ou no ao sair. Ele vai
janela ver o tempo. A chance de sair com guarda-chuva depende
da informao que obtiver ao olhar o tempo: se o tempo estiver
ruim, a probabilidade de sair com guarda-chuva aumenta, ou
seja, os eventos tempo ruim e sair com guarda-chuva so
condicionados.

Seja o evento E1 = a letra u ocorre na palavra e evento E 2 = a


letra q ocorre na palavra. Certamente o evento E 1 tem uma
probabilidade, mas ao saber que o evento E 2 ocorre, fica mais
certo de que E1 deve tambm ocorrer, uma vez que q raramente
ocorre em uma palavra sem vir seguido de u.

Se for sabido que os nibus de certa linha passam em um ponto


em intervalos de, aproximadamente, 10 minutos, a probabilidade
de passar um nibus dessa linha no prximo minuto ser
fortemente influenciada pelo conhecimento que se tem da
passagem de um nibus da linha nos ltimos 5 minutos.

37

(ta em outro lugar agora no livro)


3)Suponhamos que um setor de uma empresa tenha 5 operacionais e 2
gerentes, e que a diretoria ir selecionar dois funcionrios deste setor, um
aps o outro, para obteno de um prmio de final de ano: uma
passagem de ida e volta para os EUA para cada um. Suponha que o
primeiro funcionrio selecionado aleatoriamente seja operacional. Ser
que a probabilidade que o segundo funcionrio selecionado tambm seja
um operacional influenciada pela retirada do primeiro funcionrio que j
era do mesmo cargo?
Temos dois casos a considerar:

Se houver reposio do primeiro funcionrio, o setor vai ter a


mesma configurao inicial, e ento a 1 retirada em nada
influenciar

retirada,

ou

seja,

temos

eventos

independentes;

Se no houver a reposio da 1 retirada, o setor conter um


funcionrio a menos, isto , diminui a probabilidade de sair um
segundo funcionrio operacional na 2 retirada, ou seja, temos
eventos condicionados.

38

Exemplo:
Uma urna contm 4 bolas brancas e 8 bolas pretas. Seja a experincia
aleatria de retiramos trs bolas desta urna. Qual a probabilidade das trs
serem pretas?
a)Numa extrao Com reposio;
b)Numa extrao Sem reposio.
Soluo:
a)Com reposio:
E = extrair trs bolas sucessivas pretas.
8
P(E) = X
12

X = 0,30 ou 30%
12

12

Eventos independentes: reparem que as probabilidades sucessivas


permanecem constantes
b)Sem reposio:
E = extrair trs bolas sucessivas pretas.
8
P(E) = X
12

X = 0,25 ou 25%
11

10

39

Eventos condicionados: reparem que as probabilidades sucessivas


vo diminuindo.
Probabilidade Condicionada:

o percentual da ocorrncia de E 2 no universo de E1 ou vice-versa.


a probabilidade de ocorrer E2, mas no espao de E1 ou vice-versa. O
que se quantifica a chance de ocorrer E 2 , mas atrelada a j ocorrncia
de E1, isto , condicionada a E1 e vice-versa.
Baseando-se na definio intuitiva da probabilidade, pode-se
calcular a probabilidade condicionada de E 2 dado que E1 j ocorreu (ou
que j se tenha conhecimento) pela frmula:

n(E1E2)
P(E2/E1) =
n(E1)
Esta expresso calcula a probabilidade de ocorrncia de E 2, nas
ocorrncias de E1, isto , somente quando E1 ocorre. Este procedimento
condiciona a ocorrncia de E1 ocorrncia de E2.
Se dividirmos o numerador e o denominador da expresso acima,
pela mesma quantidade n(s), teremos:

40

n(E1E2)

n(S)
P(E2/E1) =
n(E1)

n(S)
A expresso de probabilidade fica ento:
PE1E2)
P(E2/E1) =
P(E1)
Com P(E1) 0
Exemplos:
1)Observou-se em 10 dias a freqncia com que uma dada pessoa foi
praia e se fez sol:
Dia

10

Foi a
Praia?

Fez
Sol?

41

Tomando por base as informaes acima, responda:


a) Qual a probabilidade da pessoa em geral ir praia?
b) Sabendo que fez sol, qual a probabilidade da pessoa ir em geral
praia?
c) Os eventos a pessoa ir praia e fazer sol so independentes ou
condicionados?
Soluo:
a)Qual a probabilidade da pessoa em geral ir praia?
IP = evento a pessoa em geral ir praia
6
P( IP ) = = 0, 60 ou 60%
10
b)Sabendo que fez sol, qual a probabilidade da pessoa ir em geral
praia?
FS = evento fazer sol
IP = evento ir praia
5
P( IP / FS ) = = 0, 83 ou 83%
6
c)Os eventos a pessoa ir praia e fazer sol so independentes ou
condicionados?

Os eventos a pessoa ir praia e fazer sol so condicionados, pois a


probabilidade da pessoa ir praia aumenta de 60% para 83% quando se inclui
em seu clculo a informao adicional de que fez sol:

P( IP ) P( IP/FS ).

42

2)Em uma cidade existem 15.000 usurios de telefonia, dos quais 10.000
possuem telefones fixos, 8000 telefones mveis e 3000 tm telefones
fixos e mveis. Seja a experincia aleatria de uma operadora de telefone
mvel selecionar uma pessoa da cidade para oferecer uma promoo do
tipo Fale Grtis de seu Mvel para seu Fixo. Pergunta-se:
a)J sabendo que ela tem telefone mvel, qual a probabilidade dela ter
telefone fixo tambm?
b)J sabendo que ela tem telefone fixo, qual a probabilidade dela ter
telefone mvel tambm?
Soluo:
Espao Amostral S:

MF
3000

F = pessoa com telefone fixo.


M = pessoa com telefone mvel.
MF = pessoa com telefone fixo e mvel.

43

a) P (F/M) = n ( MF) =
n (M)
b) P (M/F) = n ( MF) =
n (M)

3000

= 3/8 = 0,375

8000
3000

= 3/10= 0,300

10000

3)Seja a probabilidade do Brasil endurecer nas exigncias de


entrada de espanhis no pas de 60%. A probabilidade prevista
da entrada de espanhis no Brasil em 2013 de 80%. A
probabilidade simultnea de o Brasil endurecer ainda mais em
2013 as exigncias para a entrada de espanhis no Brasil e
haver entrada de espanhis no Brasil de 45%. Dado que o
Brasil endureceu na entrada de espanhis no Brasil em 2013,
como fica o percentual de entrada de espanhis no Brasil?

Soluo:
E= evento entrada de espanhis no Brasil
B= evento Brasil endurecer nas exigncias de entrada de
espanhis no pas
BE=Brasil endurecer nas exigncias de entrada de espanhis
no pas e haver entrada de espanhis no Brasil.
0,45
P(E/B)= = 0,75 ou 75%
0,60

P(E)= 0,80

44

Com a informao adicional que o Brasil endureceu nas


exigncias, a medio da probabilidade da visita de espanhis
ao pas diminui, em 10%(NI= 80/75=93,75% =-6,25%).

4)A probabilidade dos Estados Unidos facilitarem ainda mais a


concesso de vistos aos brasileiros em 2013 de 40%.
Atualmente, a probabilidade da entrada de brasileiros nos
Estados Unidos fica em torno de 72%. A probabilidade dos EUA
facilitar ainda mais a concesso de vistos a brasileiros e haver
a entrada de brasileiros na Amrica de 32%. Dado que os
Estados Unidos facilitaram ainda mais a concesso de vistos
americanos a brasileiros em 2013, como fica a probabilidade
da entrada de brasileiros na Terra do Tio San?
Soluo:

V= evento os EUA facilitarem ainda mais a concesso de


vistos ao brasileiros em 2013.
E= evento entrada de brasileiros nos Estados Unidos.
VE= evento os EUA facilitarem ainda mais a concesso de
vistos a brasileiros em 2013 e haver a entrada de brasileiros
na Amrica.

45

0,32
P(E/V)= = 0,80 ou 80%
0,40

P(E)= 0,72

Com a informao adicional que os Estados Unidos facilitaram de


fato ainda mais a concesso de vistos a brasileiros, a medio da
probabilidade da visita de brasileiros Amrica aumentou, em 11%
(NI=80/72=60% =+11%).

46

5)Uma pesquisa de perfil demogrfico feito junto a 20 consumidores


adultos da mercadoria X revelou a base de dados abaixo:
Consumidor

Sexo

Idade

Nvel
Escolar

N de
Filhos

Classe
Social

35

25

40

25

32

22

37

28

25

10

39

11

35

12

21

13

27

14

45

15

57

16

33

17

36

18

35

19

33

20

22

47

Os cdigos usados para montar a base de dados foram:

Varivel Sexo: M masculino e F feminino;


Varivel Idade: idade em anos, em dois dgitos;
Varivel Nvel Escolar: 0 ausncia de nvel escolar, 1 ensino
fundamental, 2 ensino mdio, 3 ensino superior e 4 psgraduao;
Varivel N Filhos: nmero de filhos do morador;
Varivel Classe Social: A Alta; B Mdia e C Baixa

Qual a probabilidade de ao selecionar aleatoriamente um consumidor


desta base de dados?
a)Dado que mulher, ter menos de 2 filhos.
b)Dado que homem, ser da classe social C.
c)Dado que da classe social B, ter menos que 3 filhos.
d)Seja um homem, sabendo que tem nvel de escolaridade mdio e
classe social mdia.
e)Seja um consumidor de ensino mdio, com 2 ou menos filhos, sabendo
que tm 30 anos ou mais.
Soluo:
a ) P (<2 filhos//F) = 6/9
b) P(C/H) = 3/11
c) P (<3 filhos/B) = 8/9
d) P (H/2 B) = 5/6
e) P (2 2/ 30 anos) = 6/12

48

6)Numa escola com 100 alunos, 40 estudam s biologia, 30 estudam s


alemo e 20 estudam biologia e alemo. Qual a probabilidade de um
aluno que j estuda biologia, estudar tambm alemo?
Espao Amostral S

20
10

E1 = aluno estudar biologia.


E2 = aluno estudar alemo
P (E2/E1) = P( E2 E1) =
P (E1)

20/100

= 20/60 = 33%

60/100

7)Suponha que o seguinte quadro represente uma possvel diviso dos


alunos matriculados em um dado instituto de matemtica, num dado ano:
Curso
Matemtica Pura
Matemtica Aplicada
Estatstica
Computao
Total

M
70
15
10
20
115

F
40
15
20
10
85

Total
110
30
30
30
200

Seleciona-se aleatoriamente um estudante deste instituto. Foi


constatado que ele do curso de estatstica. Qual a probabilidade
dele ser homem?

49

Soluo:
E1 = aluno do curso de estatstica
E2 = aluno do sexo masculino
P (E2/E1) = P( E2 E1) =
P (E1)

10/200

= 10/30 = 33%

30/200

8)Considere o lanamento de um dado e a observao da face superior:


Sendo:
a) E1 = { 2, 3, 4, 5} e E2 = {1, 3, 4}
b) E1 = { 1, 3, 5, 6} e E2 = {1, 3, 6}
c) E1 = { 2, 3, 5, 6} e E2 = {1, 2}
Em cada caso obtenha P (E2/E1) e indique se os eventos E 1 e E2 so
independentes ou condicionados.
a) E1 = { 2, 3, 4, 5} e E2 = { 1, 3, 4}
E2 E1 = { 3, 4} P (E2 E1) = 2/6 e P(E1) = 4/6
P (E2/E1) = P( E2 E1) =
P (E1)

2/6 = 1/2 = 50%


4/6

P (E2) = 3/6 = 50%

50

Concluso:
A informao adicional de que E1 j ocorreu, no altera a ocorrncia de
E2, portanto so independentes.
b)E1 = { 1 3, 5, 6} e E2 = { 1, 3, 6}
E2 E1 = {1, 3, 6} P (E2 E1) = 3/6 e P(E1) = 4/6
P (E2/E1) = P( E2 E1) =
P (E1)

3/6 = 3/4= 75%


4/6

P (E2) = 3/6 = 50%


Concluso:
A informao adicional de que E 1 j ocorreu, altera a ocorrncia de E 2. A
chance de ocorrer E2 fica mais certa, portanto, so condicionados.
c)E1 = { 2, 3, 5, 6} e E2 = { 1, 2}
E2 E1 = { 2} P (E2 E1) = 1/6 e P(E1) = 4/6
P (E2/E1) = P( E2 E1) =
P (E1)

1/6 = 1/4 = 25%


4/6

P (E2) = 2/6 = 33%


Concluso:

51

A informao adicional de que E 1 j ocorreu, altera a ocorrncia de E 2. A


chance de ocorrer E2 fica menos certa, portanto so condicionados.
8)Uma pesquisa foi realizada por um instituto para traar o perfil dos que
compram DVDs e vdeos no Brasil. Numa amostra aleatria de 2000
pessoas, foi constatado que entre pessoas das classes sociais A e B e de
nvel educacional alto, 100 compram s filmes piratas, 80 s filmes
originais e 120 compras piratas e nacionais. Seleciona-se aleatoriamente
da planilha Excel, onde a base de dados est salva, uma pessoa das
classes sociais A ou B. Sabendo que ela tem o hbito de comprar DVDs e
vdeos originais, qual a probabilidade dela comprar tambm filmes
piratas?
Soluo:
O diagrama abaixo nos revela a configurao da amostra segundo
os resultados da pesquisa:

52

Sejam os eventos:
P= a pessoa comprar filmes piratas.
O = a pessoa comprar filmes originais
O P = a pessoa comprar filmes originais e piratas
Logo a probabilidade pedida :
n(O P)

120

P( P/O) = = = 0,40 ou 40%


n(O)

300

Regra do Produto para Eventos Condicionados:


Se dois eventos so condicionados, ento, tirando das
expresses de probabilidades condicionadas:
P( E2 E1) = P (E1) . P (E2/E1)
Exemplo:
Num setor de uma corporao, existem 4 engenheiros e 5
administradores de empresas. Seja a experincia aleatria de
selecionar quatro destes profissionais, sem reposio, para
formar uma comisso de fiscalizao de obras de um prdio.
Qual a probabilidade do evento?
{ engenheiro administrador engenheiro administrador }

53

Soluo:
Trata-se da aplicao da Regra do Produto para eventos
condicionados:
Vamos chamar:
ENG o evento selecionar um engenheiro
ADM o evento selecionar um administrador
Logo a probabilidade pedida :
P (ENG ADM ENG ADM) =
4 x 5 x 3 x 4 = 240 /3024 = 0,08
9

54

Teorema da Probabilidade Total:


Sejam os eventos E1, E2,.., En eventos complementares do
espao amostral S e B um evento qualquer em S. Ento, pode-se
ter a seguinte visualizao em diagrama:

P(B) = P(E1B) + P(E2B) + P(E3B) + ... + P(EnB) = P(EiB)


i=1

Aplicado a Regra do Produto ltima igualdade descrita


acima para eventos condicionados:
n

P(B) = [P((Ei) . P(B/Ei)] (1)


I=1

55

A expresso (1) chamada de Teorema da Probabilidade


Total, que a probabilidade da conseqncia ou efeito.

Teorema de Bayes:
O

reverendo

matemtico

ingls

Thomas

Bayes

desenvolveu, no sculo 18, uma opo para o clculo de


probabilidades a qual gerou um importante artigo publicado,
postumamente, pela Royal Society. Esta teoria ficou conhecida
como Teorema de Bayes, e atualmente tem aplicaes em
diferentes reas do conhecimento.

Conceito de Teorema de Bayes:

a participao relativa, percentual, de uma dada causa E i na


formao do espao do evento B, que s pode ocorrer como efeito
de uma das causas complementares Ei,isto :

P(EiB)
P(Ei/B) = (2)
P(B)

P(B) 0

56

O que Significa a Expresso Acima na Prtica?

Suponhamos um evento B que s pode ocorrer devido a uma


das causas complementares E1, E2, E3,..., En, eventos de um mesmo
espao amostral S. Dado que o evento B tenha ocorrido, a
probabilidade que tenha se manifestado devido a uma das causas E 1
ou E2 ou E3,..., ou En pode ser calculada pela frmula (2),
denominada

frmula

da

probabilidade

das

causas

ou

dos

antecedentes.
Desenvolvendo a frmula 2, aplicando a regra do produto no
numerador e inserido a frmula 1 no denominador, temos:

Demonstrao:

P(EiB)
P (Ei/B) = =

P(Ei).P(B/Ei)
=
n

P(B)

[P (Ei) . P (B/ Ei)]


i=1

Temos, ento, o Teorema de Bayes:

P (Ei) . P (B/ Ei)


P (Ei/B) =
n

[P (Ei) . P (B/ Ei)]


i=1

57

Ele relaciona uma das parcelas da probabilidade total


com a prpria probabilidade total.
Ela nos d a probabilidade de um particular E i ocorrer(isto ,
uma causa), desde que B j tenha ocorrido, o efeito. A se
questiona at que ponto a causa E i teve participao nesta
ocorrncia.
O

Teorema

de

Bayes

importante

porque

inverte

probabilidades condicionais. s vezes fcil calcular P(B/E i), mas o


que se deseja conhecer P(Ei/B). O Teorema de Bayes permite
calcular P(Ei/B) em termos de P(B/EI). O Teorema de Bayes nada
mais do que a mistura da Regra do Produto e do Teorema da
Probabilidade Total.

Exemplo 1:
Em uma cidade, durante um perodo de observao, verificou-se que
o trnsito ficou engarrafado no horrio do rush da manh 30% das
vezes. Nos dias em que o trnsito ficou engarrafado, um funcionrio
chegou atrasado 10% das vezes e nos dias de trnsito bom, ele
chegou atrasado com uma freqncia de 1%. Certo dia o funcionrio
chegou atrasado. Qual a probabilidade de ter sido em um dia de
trnsito engarrafado?
Soluo:
Evento efeito B: chegar atrasado.
Eventos causais (Ei): trnsito engarrafado(E1) e trnsito no
engarrafado(E2) .

58

Elementos da frmula (modelagem):


P(E1)=0,3

P(B|E1)=0,10

P(E2)=0,7

P(B|E2)=0,01

P(Ei) . P(B|Ei)
P(E1|B)=

=
n

[P(Ei) . P(B|Ei)]
i=1

0,3 . 0,10
P(E1|B)=

= 0,81
[( 0,3.0,10) + (0,7.0,01)]

59

Exemplo 2:
Do exemplo da observou-se em 10 dias a freqncia com que uma dada
pessoa foi praia e se fez sol. Dado que a pessoa foi praia, qual a
probabilidade de ter sido um dia de sol?
Dia

10

Foi a
Praia?

Fez
Sol?

Soluo:
P(FS)=0,6

P(IP/FS)= 0,83

P(NFS)=0,4

P(IP/NFS)=0,25
0,6 x 0,83

0,498

P(FS/IP)= = = 0,83 ou 83%


0,6x0,83 + 0,4x0,25

0,598

60

Exemplo 3:
Um indivduo pode chegar atrasado ao emprego utilizando-se
apenas de um desses meios de locomoo: bicicleta, motocicleta ou
carro. Sabe-se que por experincia, que a probabilidade de ele
utilizar do carro de 0,6; bicicleta 0,1 e de motocicleta 0,3. A
probabilidade de chegar atrasado, dado que se utilizou do carro
0,05; de bicicleta 0,02 e de motocicleta 0,08. Certo dia ele chegou
atrasado, qual a probabilidade de ter sido devido ao uso do carro?

Soluo:
Inicialmente, voc deve considerar os eventos de interesse que
so:
Evento efeito B: chegar atrasado.
Eventos

causais

(Ei):

utilizar

carro(E1),

bicicleta(E2)

ou

motocicleta(E3);

Assim, voc pode agora partir para os elementos requeridos


pela frmula para a modelagem, que so as probabilidades dos
eventos de interesse e as probabilidades condicionais, dadas por:

P(E1)=0,6

P(B|E1)=0,05

P(E2)=0,1

P(B|E2)=0,02

P(E3)=0,3

P(B|E3)=0,08

Isto posto voc tem, agora, elementos suficientes para alocar as


probabilidades na frmula de Bayes que fica:

61

P(Ei) . P(B|Ei)
P(E1|B)=

=
n

[P(Ei) . P(B|Ei)]
i=1

0,6 . 0,05
P(E1|B)=

=
[( 0,6.0,05) + (0,1.0,02) + (0,3 .0,08)]

0,03
P(E1|B)=

= 54 %
(0,03+ 0,002+ 0,024)

Com este resultado voc pode concluir que a probabilidade do


indivduo ter ido de carro, sabendo-se que ele chegou atrasado ao
emprego, de 0,54.

62

Exemplo 4:

Ficou constatado que o aumento nas vendas de certo produto


comercializado por certa empresa num certo ms pode ocorrer
somente por uma das causas mutuamente exclusivas: ao de
marketing, publicidade/propaganda, oscilaes econmicas do pas
e sazonalidade. A probabilidade de haver uma ao de marketing
eficaz no ms de 40%, de publicidade/propaganda 30%,
oscilaes econmicas 20% e sazonalidade 10%. Uma pesquisa
mostrou que a probabilidade de haver aumento nas vendas do
produto devido a uma ao de marketing eficaz de 7%, de
publicidade/propaganda de 7,5%, de oscilaes econmicas no
pas de 3% e de sazonalidade 2%. Em um dado ms o incremento
nas vendas foi considervel. Indique a causa mais provvel. Qual a
probabilidade de aumento nas vendas em dado ms?

Soluo:
Inicialmente, voc deve considerar os eventos de interesse que
so:
Evento efeito B: aumento nas vendas:
Eventos

causais

(Ei):

ao

de

marketing

(E1),

publicidade/propaganda (E2), oscilaes econmicas no pas


(E3) e sazonalidade (E4).

63

Assim, voc pode agora partir para os elementos requeridos


pela frmula para a modelagem, que so as probabilidades dos
eventos de interesse e as probabilidades condicionais, dadas por:

P(E1)=0,4

P(B/E1)=0,070

P(E2)=0,3

P(B/E2)=0,075

P(E3)=0,2

P(B/E3)=0,030

P(E4)=0,1

P(B/E4)=0,020

Agora voc tem elementos suficientes para alocar as


probabilidades na frmula de Bayes, que fica:

P(Ei) . P(B/Ei)
P(Ei|B)=

=
n

[P(Ei) . P(B/Ei)]
i=1

64

Dado que ocorreu um aumento das vendas, a probabilidade


deste aumento ter sido devido ao de marketing dada
por:

0,4 . 0,07
P(E1|B)=
[(0,4.0,07)+(0,3.0,075)+(0,2 .0,03)+(0,1.0,02)]

0,028
P(E1|B)=

= 47,8%

(0,028+ 0,0225+ 0,006+0,002)

Dado que ocorreu um aumento das vendas, a probabilidade


deste aumento ter sido devido a publicidade/propaganda
dada por:
0,3.0,075
P(E1|B)=
[(0,4.0,07)+(0,3.0,075)+(0,2 .0,03)+(0,1.0,02)]

0,0225
P(E1|B)=

= 38,5%

(0,028+ 0,0225+ 0,006+0,002)

65

Dado que ocorreu um aumento das vendas, a probabilidade


deste aumento ter sido devido s oscilaes econmicas
dada por:

0,2.0,03
P(E1|B)=
[(0,4.0,07)+(0,3.0,075)+(0,2 .0,03)+(0,1.0,02)]

0,006
P(E1|B)=

= 10,3%

(0,028+ 0,00225+ 0,006+0,002)

Dado que ocorreu um aumento das vendas, a probabilidade


deste aumento ter sido devido sazonalidade dada por:

0,1.0,02
P(E1|B)=
[(0,4.0,07)+(0,3.0,075)+(0,2 .0,03)+(0,1.0,02)]

0,002
P(E1|B)=

= 3,4%

(0,028+ 0,0225+ 0,006+0,002)

66

Pelas probabilidades calculadas anteriormente, voc tem elementos


para concluir que a causa mais provvel para o aumento das vendas naquele
ms foi a ao de marketing.
Qual a probabilidade de aumento nas vendas em dado ms?
A probabilidade de aumento nas vendas em dado ms dada pelo
denominador do Teorema de Bayes, portanto 5,8%.
Exemplo 5:
No Brasil, dos 365 dias do ano, em geral, 146 constituem o perodo
de horrio de vero. Neste perodo constatada uma taxa de 10% de
baixo consumo de energia no horrio considerado de pico, que vai do fim
da tarde e incio da noite. Em dias de horrio convencional, esta taxa cai
para 4%. Considere um dia do ano em que no horrio de pico houve um
baixo consumo de energia. Qual a probabilidade de ter sido em um dia
em que estivesse vigorando o horrio de vero no Brasil?
Soluo:
Elementos da frmula (modelagem):

P(HV)=0,4

P(HV)=0,6

P(BCE/HV)=0,10

P(BCE/HV)=0,04

P(HV) . P(BCE/HV)
P(HV/BCE)=

[P(HV) . P(BCE|HV) + P(HV) . P(BCE|HV)]

67

P(HV/BCE) =

0,4 . 0,10
= 0,625 ou 62,5%
[( 0,4.0,10) + (0,6.0,04)]

Exemplo 6:

Solicitaes de amizade no facebook tm mais probabilidade de


serem aceitas se voc envi-las a pessoas que voc j conhece, como
colegas de classe, amigos, familiares e colegas de trabalho. Sabe-se por
pesquisa que probabilidade da pessoa, que adiciona, conhecer a pessoa
na solicitao de amizade no facebook de 70%. Conhecendo a pessoa,
a probabilidade de ela ser aceita no convite de 60% e no conhecendo
a pessoa, esta probabilidade cai para 20%.
a)Sabe-se que uma pessoa foi aceita no facebook de um usurio que
adicionou, qual a probabilidade de ser de um desconhecido?
b)Qual a probabilidade de um usurio ser aceito no facebook por uma
pessoa que adicionou?
Soluo:
P(CO)=0,70

P(A/CO)= 0,60

P(NCO)=0,30

P(A/NCO)=0,20
(0,3 X 0,2)

a)P(NCO/A)= = 0,125 ou 12,5%


(0,7X0,6) + (0,3X0,2)

68

b)P(A)= (0,7X0,6) + (0,3X0,2)= 0,48 ou 48%

Exemplo 7:
Ao usar o carto bancrio numa grande loja de departamento, a
probabilidade de um cliente optar pela funo dbito de 80% e pela
funo crdito de 20%. Nesta loja s existem disponveis estas duas
formas de pagamento com carto bancrio. Dado que optou pela funo
dbito, probabilidade da transao ser autorizado de 60% e pela funo
crdito, 80%. Um cliente est no caixa da referida loja e a sua transao
acaba de ser autorizada, qual a probabilidade de ter optado pela funo
dbito?

Soluo:

P(D)=0,80

P(A/D)= 0,60

P(C)=0,20

P(A/C)=0,80
(0,8 X 0,6)

P(D/A)= = 0,75 ou 75%


(0,8X0,6) + (0,2X0,8)

69

Exemplo 8:
Seja a probabilidade do Brasil endurecer nas exigncias de entrada
de espanhis no pas de 60%. Dado que o Brasil endureceu na entrada
de espanhis no Brasil em 2013, o percentual de entrada de espanhis no
Brasil de 75% e esse percentual de 80%, se no houver
endurecimento brasileiro nas exigncias de entrada de espanhis no
Brasil. Sabendo que um espanhol entrou no Brasil em 2013, qual a
probabilidade de ter no ter havido endurecimento braseiro nos entraves
de entrada de espanhis no Brasil neste ano?
Soluo:
P(Endurecimento)= 0,60

P(Entrada/Endurecimento)=0,75

P(No-endurecimento)=0,40

P(Entrada/No-endurecimento)=0,80
0,40x0,80

P(No-edurecimento/entrada)=
0,60x0,75+0,40x0,80
0,32
P(No-edurecimento/entrada)=
0,45+0,32
0,32
P(No-edurecimento/entrada)= = 0,42 ou 42%
0,77

70

Exemplo 9:

A probabilidade dos Estados Unidos facilitarem ainda mais a


concesso de vistos aos brasileiros em 2013 de 80%. Dado que os
Estados Unidos facilitaram ainda mais a concesso de vistos americanos
a brasileiros em 2013, a probabilidade da entrada de brasileiros na Terra
do Tio San fica em 90%. Em caso de no facilitao, esse percentual
cai para 36%. Um brasileiro conseguiu visto para entrada nos Estados
Unidos em 2013, qual a probabilidade da Amrica ter facilitado ainda mais
a consseo de vistos?

Soluo:

P(FV)= 0,80

P(E/FV)=0,90

P(NFV)= 0,20

P(E/NFV)=0,36

0,80x0,90
P(FV/E)= = 0,9191
0,80x0,90+0,20x0,36

P(FV/E)= 91,91%

71

Exemplo 10:
Numa pesquisa sobre hbitos de comprar de filmes, sabe-se que 15% da
amostra da pesquisa so de pessoas de classe social alta. Das pessoas
de classe social alta, 25% compram filmes piratas. Dos que no so da
classe desta classe, 45% compram filmes piratas. Responda as perguntas
abaixo.
a)Qual a proporo de pessoas da classe alta que no compram piratas
de jeito nenhum?
b)Selecionando uma pessoa da amostra, constata-se que ela compra
filmes piratas, qual a probabilidade dela ter provindo da classe alta?
c)Selecionando uma pessoa da amostra, qual a probabilidade dela ter o
mau hbito de comprar filmes piratas?

Soluo:
P(Alta)= 0,15

P(Pirata/Alta) = 0,25

P(Alta)= 0,85

P(Pirata/Alta) = 0,45

72

a)Qual a proporo de pessoas da classe alta que no compram piratas


de jeito nenhum?
E = proporo de pessoas da classe alta que no compram piratas de
jeito nenhum

P(E) = P(Pirata/Alta) = 1- 0,25 = 0,75 ou 75%


b)Selecionando uma pessoa da amostra, constata-se que ela compra
filmes piratas, qual a probabilidade dela ter provindo da classe alta?
Probabilidade de Bayes:
(0,15 X 0,25)
P(Alta/Piratas) =
(0,15 X 0,25) + (0,85 X 0,45)
0,0375
P(Alta/Piratas) =
0,0375 + 0,3825

0,0375
P(Alta/Piratas)= =0,089 ou 8,9%
0,42

73

c)Selecionando uma pessoa da amostra, qual a probabilidade dela ter o


mau hbito de comprar filmes piratas?
Teorema da probabilidade Total:
o denominador de Bayes:
P(Pirata) = 0,42 ou 42%

74

Exerccios Propostos:

1) Uma populao de funcionrios da seo de pessoal de uma empresa


formada por 5 pessoas casadas e 7 solteiras. Seleciona-se uma pessoa
aleatoriamente desta populao. Qual a probabilidade desta pessoa ser
solteira?
2) Em uma bolsa tm-se 2 canetas azuis e 1 vermelha. Suponha que uma
pessoa apanhe de forma aleatria uma caneta da bolsa, qual a
probabilidade dela ser azul?
3) Uma empresa de brinquedos tem no estoque 8 bolas brancas, 7 pretas
e 4 verdes. O gerente de vendas seleciona aleatoriamente do estoque
uma bola para ir para o giro. calcule as probabilidades:
a) Selecionar uma bola branca;
b) Selecionar uma bola preta;
c) Selecionar uma bola que no seja verde.
4) Em um conjunto de consumidores, 30% compram um produto da
marca A, 20% da B, 30% da C e 15% da D e 5% da E. Seleciona-se de
um banco de dados, um consumidor deste grupo. Qual a probabilidade de
consumir o produto A ou D?
5) De 300 estudantes de administrao, 100 esto matriculados em
Contabilidade e 80 em Estatstica. Estes dados incluem 30 estudantes
que esto matriculados em ambas as disciplinas. Qual a probabilidade de
que um estudante escolhido aleatoriamente esteja matriculado em
Contabilidade ou em Estatstica?

75

6) Um teste de marketing revelou que a probabilidade de um produto ser


bem recebido pelo mercado de 20% e a probabilidade do mesmo
produto da concorrente 10%. Se os dois eventos so independentes,
qual a probabilidade de ambos serem aceitos pelo mercado consumidor?
7) Em geral, a probabilidade de que um possvel cliente faa uma compra
quando procurado por um vendedor de 40%. Se um vendedor seleciona
do arquivo, aleatoriamente, trs clientes e faz contato com os mesmos,
qual a probabilidade de que os trs faam compras?
8) Uma dona de casa tem 30% de chance de identificar o sabor, quando
vedada, de um tipo de refrigerante. Uma outra dona de casa de casa tem
35%. As duas donas de casa em uma pesquisa qualitativa de entrevista
em profundidade em suas respectivas residncias foram chamadas a
identificar de forma independente o sabor do refrigerante para identificar o
seu tipo. Qual a probabilidade do sabor do refrigerante ser identificado?
9) Em um grupo focal sobre lembrana da marca de certa linha de um
produto, Joo tem 50% de probabilidade de lembrar-se da marca e Pedro,
outro consumidor, tem 60%. Qual a probabilidade da marca da certa linha
do produto ser lembrada?
10) Em uma pesquisa de mercado, probabilidade de um homem lembrar
quantas vezes foi ao cinema no ano passado de 1/4 e a probabilidade
de sua esposa lembrar quantas vezes foi ao cinema no ano passado de
1/3. Encontre as probabilidades:
a) Ambos lembrarem quantas vezes foi ao cinema no ano passado;
b) Nenhum lembrar quantas vezes foi ao cinema no ano passado;
c) Somente a esposa lembrar quantas vezes foi ao cinema no ano
passado;

76

d) Somente o homem lembrar quantas vezes foi ao cinema no ano


passado.
11) A probabilidade de um produto satisfazer as necessidades do cliente
de 25%. A probabilidade de satisfazer as necessidades do cliente e
tambm fidelizar o consumidor de 20%. Supondo que o pesquisador
atravs de pesquisa de mercado constatou que o produto satisfez as
necessidades dos clientes, qual a probabilidade de fidelizar tambm o
mercado alvo?
12) Em uma pesquisa, constatou-se que 50% dos clientes cadastrados
tm somente carto de crdito Visa; 30% Mastercard e, 20% Visa e
Mastercard. Qual a probabilidade de um cliente que j tenha carto de
crdito Visa, ter tambm o Mastercard?
13) Uma pesquisa feita junto aos vestibulandos com opes para o curso
de economia revelou que 30% dos candidatos fizeram contabilidade, 23%
fizeram o curso cientfico e 47% outros cursos no ensino mdio. Dos que
estudaram no ensino mdio contabilidade, 35% conseguiram a vaga, no
cientfico 65% e em outros cursos, 18%. Aps as aprovaes, escolheuse uma prova de um candidato aprovado, qual a probabilidade de ter feito
o curso cientfico?
14) Entre os clientes cadastrados que possuem carto de crdito de uma
loja, constatou-se que 60% tm somente o Visa e 40% somente o
Mastercard. Nenhum dos clientes da loja tm os dois cartes ao mesmo
tempo. Dado que cliente Visa, 15% so inadimplentes e dado que
Mastercard, 5% so inadimplentes. Uma pessoa selecionada
aleatoriamente do banco de dados de clientes cadastrados e constata-se
que inadimplente, qual probabilidade de ser um cliente Visa?

77

15) De acordo com dados coletados em uma pesquisa, apresentado o


quadro abaixo:
Indivduo
1
2
3
4
5

Nacionalidade (A)
Americana (AME)
Brasileiro (BRA)
Argentino (ARG)
Brasileiro (BRA)
Argentino (ARG)

Idade (B)
38
34
41
43
37

Gasto c/ alimentao (C)


R$ 2900,0
R$ 3100,00
R$ 3200,00
R$ 2900,00
R$ 3000,00

Calcule a probabilidade dos eventos indicados:


a) D = {BRA e C> 3000} P (D) = ?
b) E = {B< 40}, F = {ARG e C 3000} P(E F) = ?
c) Dos itens (a) e (b) P (D/E) = ?
16) Em uma agncia bancria, 30% das contas so de clientes que
possuem cheque especial. O histrico do banco mostra que 3% dos
cheques apresentados so devolvidos por insuficincia de fundos e que
dos cheques especiais, 1% so devolvidos por insuficincia de fundos.
Calcule a probabilidade de que:
a) Um cheque no especial que acaba de ser apresentado ao caixa seja
devolvido.
b) Um cheque seja especial, sabendo-se que acaba de ser devolvido.
17) A associao das seguradoras de veculos afirma que 40% dos
veculos em circulao possuem seguro e que dos veculos sinistrados
45% possuem seguro. O Departamento de Trnsito informa que 8% dos
veculos sofrem algum tipo de sinistro durante um ano. Calcule a
probabilidade de que um veculo segurado no sofra sinistro durante um
ano.

78

18) Um pesquisador desenvolve sementes de quatro tipos de plantas, P 1,


P2, P3 e P4. Plantados canteiros-pilotos destas sementes, a probabilidade
de todas germinarem de 40% para P 1, 30% para P2, 25% para P3 e 50%
para P4.
a) Escolhido um canteiro ao acaso, verificou-se que nem todas as
sementes haviam germinado. Calcule a probabilidade de que o canteiro
escolhido seja o de semente de P3.
b) Escolhido um canteiro ao acaso, verificou-se que todas as sementes
haviam germinado. Calcule a probabilidade de que o canteiro escolhido
seja o de sementes de P1.
19) Um candidato e seus correligionrios tm uma expectativa de 90% de
que ganharo as prximas eleies. Um auxiliar de campanha resolveu
por conta prpria fazer uma pesquisa sobre o fato, entrevistando
indivduos do comit do candidato e de pessoas que l compareciam para
pedir favores em troca de votos. Se o resultado desta pesquisa confirmar
o fato, nada se altera ou seja, a probabilidade de a pesquisa acertar o
resultado de 90%. Se o resultado no confirmar a expectativa, o
ambiente se modifica, j que nestas circunstncias, a pesquisa tem
credibilidade quase total. Considerando estes fatos, ele atribui pesquisa
uma probabilidade de 98% de acertar, se concluir pela derrota nas
eleies. Se este fato ocorrer, qual a nova expectativa do candidato?
20) O encarregado de uma agncia de detetives comenta com uma
cliente: Se chegarmos a concluso de que seu marido infiel, pode
acreditar, pois nossa margem de erro de apenas 5%. Entretanto, se as
provas que conseguirmos no forem convincentes, diremos que ele fiel.
Neste caso, nossa margem de erro 30%. A cliente diz ter quase certeza
de que o marido infiel, isto , acha que a probabilidade disto ocorrer
de 90%.

79

a) Se a investigao concluir que o marido infiel, qual a nova


expectativa da cliente?
b) E se a investigao concluir que no?
21) Os funcionrios de uma empresa foram classificados de acordo com
seu grau de escolaridade e nvel salarial segundo o quadro abaixo:
Nvel Salarial
Nvel I
Nvel II
Nvel III
Nvel IV

E. FUND.
120
40
1
0

Grau de Escolaridade
E. MDIO
20
10
5
1

E. SUPER.
0
2
4
5

Um funcionrio escolhido ao acaso. Determine a probabilidade de que:


a) Tenha somente o ensino fundamental.
b) Tenha o ensino mdio.
c) Tenha somente o ensino mdio.
d) Tenha nvel salarial II e ensino mdio.
e) Tenha nvel salarial III sabendo-se que tem ensino superior.
f) Tenha ensino mdio sabendo-se que tem nvel salarial III.
g) Tenha ensino superior e nvel salarial I.
h) Tenha nvel salarial III ou ensino mdio.
i) Tenha nvel salarial menor que III.
j) Tenha ensino fundamental ou ensino mdio sabendo-se que tem nvel
salarial maior que II.
22) Uma empresa produz 4% de peas defeituosas. O controle de
qualidade da empresa realizado em duas etapas independentes. A
primeira etapa acusa um pea defeituosa com 80% de probabilidade de
acerto. A segunda etapa acusa uma pea defeituosa com 90% de
probabilidade.

80

Calcule a probabilidade de que:


a) Uma pea defeituosa passe pelo controle de qualidade.
b) Ao adquirir uma pea produzida por esta empresa, ela seja defeituosa.
23) Uma pesquisa realizada sobre a preferncia dos consumidores por
categorias de veculos A, B e C de uma indstria automobilstica revelou
que dos 500 entrevistados:
210 preferiam o veculo A
230 preferiam o veculo B
160 preferiam o veculo C
90 preferiam os veculos A e B
90 preferiam os veculos A e C
70 preferiam os veculos B e C
120 dos entrevistados no preferiam nenhuma das trs categorias.
Um consumidor selecionado ao acaso entre os entrevistados. Calcule a
probabilidade de que:
a) Ele prefira as trs categorias.
b) Ele prefira somente uma das categorias.
c) Ele prefira pelo menos duas categorias.

81

24) As fbricas A, B e C so responsveis por 50%, 30% e 20% do total


de peas produzidas por uma companhia. Os percentuais de peas
defeituosas na produo destas fbricas valem respectivamente 1%, 2%
e 5%. Uma pea produzida por esta companhia adquirida em um ponto
de venda. Determine a probabilidade de que:
a) A pea seja defeituosa.
b) A pea tenha sido produzida pela fbrica C, sabendo-se que
defeituosa.
c) No tenha sido produzida pela fbrica A se ela boa.
25) Uma mquina produz parafusos e sabe-se que o percentual de
parafusos defeituosos produzidos de 0,5%. Sabendo-se que a
fabricao constitui um processo independente, calcule a probabilidade
de:
a) Aparecer dois parafusos defeituosos em sequncia.
b) Aparecer um parafuso defeituoso e um parafuso perfeito, em sequncia
nesta ordem.
c) Aparecer um parafuso perfeito e um parafuso defeituoso em sequncia.
d) Aparecer trs parafusos perfeitos em sequncia.

82

26) Uma junta aparadora de votos recebe 50 urnas, dos quais 5 vindas de
bairro classe A, 15 de bairros classe B e 30 de bairros classe C. A ltima
pesquisa realizada mostrou o quadro de intenes de votos:
Candidato
H.C.
LAL
Vetarola

Bairro A
40
20
10

Inteno de Votos por Bairro (%)


Bairro B
Bairro C
30
25
25
25
5
5

O primeiro voto anunciado foi do candidato H.C. Um partidrio de LAL


disse que o voto de um indivduo da classe A. Qual a probabilidade de
ele estar certo?
27) Uma pesquisa realizada entre 200 clientes de uma agncia de
automveis mostrou que 150 preferem carros nacionais, 100 preferem
carros populares e 80 preferem carros populares nacionais. Calcule a
probabilidade de que o prximo cliente a ser atendido nesta agncia:
a) Solicite um carro nacional
b) No solicite um carro popular
c) Solicite um carro popular ou nacional

83

28) No departamento de mtodos quantitativos de uma Faculdade, 60%


dos professores lecionam Matemtica, 30% lecionam Estatstica e 20%
dos professores de Matemtica tambm lecionam Estatstica. Calcule a
probabilidade

de

que

um

professor

selecionado

ao

acaso

no

Departamento:
a) Lecione Matemtica e Estatstica
b) Lecione matemtica e no lecione Estatstica
c) Lecione Estatstica e no lecione Matemtica
d) Lecione Matemtica ou Estatstica
e) No lecione Matemtica, sabendo-se que leciona Estatstica.
29) A probabilidade de que um carro apresente problemas de carburao
de 40%, e de distribuio de 30%. Se o problema for de carburao, a
probabilidade de conserto no local de 80%. Se o problema for de
distribuio, a probabilidade de conserto no local de 60%. Se o
problema for de outro natureza, a probabilidade de conserto no local de
10%. Um carro acaba de apresentar problemas. Calcule a probabilidade
de que seja consertado.
30) Uma pessoa deseja fazer sua barba de manh. Ele possui para isto
apenas um barbeador eltrico que funciona com um conversor ligado
rede eltrica, ou com duas pilhas. A probabilidade de que no haja
problemas de energia eltrica no momento de 90%. Caso haja
problemas de energia eltrica, ele possui duas pilhas usadas, cuja
probabilidade individual de funcionamento de 40%. Calcule a
probabilidade de que esta pessoa consiga fazer sua barba de manh.

84

31) Uma empresa est desenvolvendo trs projetos. Uma avaliao no


estgio atual de desenvolvimento dos projetos resultou na tabela abaixo:
Avaliador
Probabilidade de terminar no prazo- Otimista
Probabilidade de no terminar no prazo- Pessimista

A
80%
40%

B
70%
20%

C
50%
5%

Qual a probabilidade de a empresa terminar pelo menos dois projetos


no prazo, se:
a) O avaliador otimista
b) O avaliador pessimista
32) Uma pea processada em trs mquinas A, B e C. A probabilidade
de cada uma delas acarretar defeitos na pea de 1%, 2% e 3%
independentemente. Calcule a probabilidade de que uma pea seja
processada sem defeitos.
33) Uma fbrica de bonecas tem trs linhas de produo. Um
levantamento no final do dia forneceu as informaes:
Linha

Produo

No de Peas

A
B
C

24
38
18

Defeituosas
6
2
2

Calcule a probabilidade de que uma boneca escolhida ao acaso:


a) No apresente defeitos.
b) Apresentando defeitos, seja proveniente da linha A.

85

34) Os jogadores A e B jogam 12 partidas de xadrez. A vence seis, B


vence quatro e duas terminam empatadas. Eles iro disputar mais trs
partidas constantes de um torneio. Qual a probabilidade de:
a) A vencer as trs partidas.
b) Duas partidas terminarem empatadas.
c) B vencer pelo menos uma partida.
35) Uma pessoa foi contactada por uma agncia de turismo afirmando
que ela havia sido sorteada e ganho uma viagem de graa para a cidade
de Natal. A pessoa acredita que haja uma probabilidade de 70% de a
proposta ser sria. Consultando um amigo familiarizado com estas
promoes, ele afirmou que a proposta era sria. A expectativa de que o
amigo acerte um caso afirmativo de 90% e em caso negativo de 50%.
Qual a nova confiana da pessoa na lisura da proposta?
36) Uma empresa de consultoria, especialista em solucionar problemas
relativos

lanamentos

de

produtos,

classifica

os

problemas

apresentados em trs categorias A, B e C. 50% dos problemas so


classificados na categoria A, 40% na categoria B e o restante na categoria
C. A capacidade histrica de resolver problemas das diversas categorias
de 80% se o problema for da categoria A, 90% se for da B e 10% se for
da C. Calcule a probabilidade de que:
a) A empresa consiga solucionar o primeiro problema a dar entrada no dia
de hoje.
b) A empresa consiga solucionar os trs problemas que entraram no dia
de hoje.
c) Um dos problemas que entraram hoje, acaba de ser resolvido. Qual a
probabilidade que seja da categoria C?

86

37) Uma imobiliria trabalha com vendedores A e B. A probabilidade de A


vender um imvel de 5% e a de B vender de 8%. Operando
normalmente, qual a probabilidade de que:
a) Um deles venda um imvel
b) Apenas um deles venda um imvel
c) Nenhum deles venda
38) Se os eventos A e B so tais que: P(A) = 0,3, P (B) = 0,6, calcule:
a) P(A B) se A e B so independentes.
b) P(A B) se A e B so mutuamente exclusivos.
c) P (A/B) se P (A B) = 0,2
d) P (A B) se P (A B) = 0,2.
39) No lanamento de um dado e na observao do nmero de pontos da
face superior, os eventos:
A = {2, 3, 4, 5} e B = {3, 6}
a) So mutuamente exclusivos?
b) So independentes?

87

40)Suponhamos que 80% dos compradores de carros sejam bons


pagadores. Suponhamos, alm disso, que haja uma probabilidade de 0,7
de que um bom pagador obtenha carto de crdito e que esta
probabilidade passe a ser de apenas 0,4 para um mau pagador. Calcule a
probabilidade de que:
a)Um comprador de carro selecionado ao acaso tenha um carto de
crdito;
b)Um comprador de carro selecionado ao acaso e que tenha um carto
de crdito seja um bom pagador;
c)Um comprador de carro escolhido ao acaso e que no tenha carto de
crdito seja um bom pagador.
41) Observou-se em 10 dias a freqncia com que uma dada pessoa foi
praia e se fez sol:
Dia

10

Foi a
Praia?

Fez
Sol?

Tomando por base as informaes acima, responda:


d) Qual a probabilidade da pessoa em geral ir praia?
e) Sabendo que fez sol, qual a probabilidade da pessoa ir em geral
praia?
f) Os eventos a pessoa ir praia e fazer sol so independentes ou
condicionados?

88

Unidade II
Variveis Aleatrias
Conceitos de Variveis Aleatrias:
Toda vez que uma varivel quantitativa influenciada pelo acaso, diz-se
que uma varivel aleatria. Seus resultados so imprevisveis, pois cada um
deles resulta de fatores no-controlados.
Exemplo:
Imagine uma empresa que em cada ms do ano existe sempre a
mesma

poltica.

No

entanto,

mesmo

com

todas

estas

caractersticas administrativas controladas, as vendas do produto


em cada ms tm valor diferente. Essa variabilidade ocorre ao
acaso, pois resulta de uma soma de fatores no-controlados
tambm.
Apesar de todo um esforo por parte do governo para controlar o
consumo de uma sociedade, em cada momento o consumo ou a
demanda por produtos varia, de forma aleatria, imprevisvel, pois
existem outros fatores que tambm influenciam a demanda por
produtos que no podem ou no foram controlados.
Muitos resultados de experincias aleatrias apresentam resultados que
no so numricos, so qualitativos. Mas variveis aleatrias devem ser
necessariamente quantitativas. Quando no forem a princpio, precisam ser,
ento, codificadas em valores.

89

Portanto, varivel aleatria X pode ser matematicamente definida como


uma funo que associa a cada ponto do espao amostral um nmero real.

.S

X(S)

E: lanamento de duas moedas


X: Nmero de caras obtidas nas duas moedas, onde k = cara e c = coroa
S : {(c,c) ; (c,k) ; (k,c) ; (K,k)}
x = 0 corresponde ao evento (c, c) com probabilidade 1/4
x = 1 correspondem ao evento (k, c) ou (c,k) com probabilidade 2/4
x = 2 corresponde ao evento (k, k) com probabilidade 1/4

Variveis Aleatrias Discretas:


Uma varivel aleatria X ser discreta se um dado valor que puder
assumir se originar de um processo de contagem. Seus valores podem ser
associados aos nmeros naturais (0,1, 2, 3, 4, etc).

90

Exemplos:

Num banco, um determinado caixa pode atender no horrio


comercial 0, 1, 2, 3 ... clientes.

O nmero de filhos de uma famlia consultada em uma pesquisa


de mercado uma varivel aleatria discreta.

O nmero de acidentes de carro na linha vermelha em certo dia


na Linha Vermelha.

Atirando-se 6 vezes uma moeda podemos definir como varivel


aleatria discreta o nmero de vezes que ocorre cara nas 6
provas. Esta varivel pode assumir os valores:

X1 = 0 X2 = 1 X3 = 2 X4 = 3 X5 = 4 X6 = 5 X7 = 6

Numa fbrica o nmero mensal de acidentes uma varivel


aleatria discreta. Num dado ms, podemos ter nenhum caso de
acidente, ou 1 caso, ou 2 casos, etc.

91

Distribuio de Probabilidade:

Entende-se por distribuio de probabilidades o conjunto de todos


os valores que podem ser assumidos por uma varivel aleatria
discreta, com as respectivas probabilidades.

Quando os resultados da varivel aleatria X so apresentados


em termos de suas probabilidades de ocorrncia (ou em termos
de

frequncias

relativas

com

amostras

ou

experincias

suficientemente grandes), tm-se, ento, uma distribuio de


probabilidades.

A probabilidade de que cada varivel aleatria X assuma o valor x


descrito em uma tabela ou por um modelo matemtico e se
chama distribuio de probabilidade de X, que podemos
representar por P (X=x) ou simplesmente P(x).

Se os resultados da varivel aleatria so resultantes de


contagem, do conjunto dos nmeros naturais, ento nas
condies acima, temos uma distribuio de probabilidade
discreta.

92

Exemplo 1:
Ento, os resultados que podem ocorrer no lanamento de um dado,
com as respectivas probabilidades, constituem uma distribuio discreta de
probabilidades.
X
1
2
3
4
5
6
Total

P (x)
1/6
1/6
1/6
1/6
1/6
1/6
1

Exemplo 2:
E: lanamento de duas moedas
X: nmero de caras obtidas
As expresses mais comuns para P (X) so:

93

Tabela:
x
P (x)

0
1/4

1
2/4

2
1/4

Modelo Matemtico:
x

P (x) = 1/4 C2
Funo Repartio de Probabilidades:
A funo de repartio da varivel aleatria X, no ponto x, a
probabilidade de que X assuma um valor menor ou igual a x, isto :
F (x) = P ( X x)

Algumas propriedades:
1) F (- ) = 0
2) F (+) = 1
3) F (x) contnua direita
4) F (x) descontnua esquerda
5) F (x) no decrescente

94

Esperana Matemtica ou Mdia: E (X):


A esperana matemtica de uma varivel aleatria X a soma de todos
os produtos possveis da varivel aleatria pela respectiva probabilidade:

E (X) = x = = xi . P (xi)

Conceitos Prticos do Parmetro Esperana Matemtica:


o Numa sequncia muito longa da experincia aleatria ou numa
amostra suficientemente grande, se espera que os resultados da
varivel aleatria se concentrem em torno de sua esperana.
o De um modo geral, o valor esperado pode ser interpretado como
o valor mdio da varivel aleatria em uma longa sequncia de
experincias aleatrias.
o o valor em torno do qual esto concentrados os resultados da
varivel aleatria.
o Os resultados da varivel aleatria giram em torno deste valor.
o uma medida do nvel geral da varivel aleatria ou do padro
regular dos resultados da varivel aleatria.

95

Exemplos:

Seja uma varivel aleatria definida como o ponto obtido no


lanamento de um dado. Calcular E(X).

x
1

P(x)
1/6

x . P(x)
1/6

1/6

2/6

1/6

3/6

1/6

4/6

1/6

5/6

1/6

6/6

21/6 = 3,5

E(X) = 21/6 = 3,5

As chamadas dirias do corpo de bombeiros apresentam a


seguinte distribuio de probabilidades. Calcular E(X)
X= nmero de chamadas/dia.
x

P(x)

x.P(x)

0,10

0,15

0,15

0,30

0,60

0,25

0,75

0,15

0,60

0,05

0,25

1,00

2,35

96

E(X) = 2,35 chamadas/dia

Uma empresa tem 4 caminhes de aluguel. Sabe-se que o


aluguel feito por dia e que a distribuio diria do nmero de
caminhes alugados especificada abaixo. Calcular E(X).
X
0

P(x)
0,10

x. P(x)
0

0,20

0,20

0,30

0,60

0,30

0,90

0,10

0,40

1,00

2,10

E (X) = 2,1 caminhes/dia

97

Varincia: V(x):
Fornece o grau de disperso dos valores da varivel aleatria em torno
da mdia. uma medida do grau de heterogeneidade dos resultados da
varivel aleatria. uma medida de disperso ou variabilidade dos resultados
da varivel aleatria.

V (x) = 2 = x2i . P (xi) [E (X)]2

Observaes:

Quanto mais alto o valor da varincia, mais dispersos ou


afastados os valores da varivel aleatria esto de seu valor
mdio.

A raiz quadrada da varincia o desvio-padro da varivel


aleatria:

S (X) = V(X).

O coeficiente de variao da varivel aleatria uma medida em


termos percentuais definido : CV(X) = [S(X)/E(X)] . 100.

98

Exemplos:

Seja uma varivel aleatria definida como o ponto obtido no


lanamento de um dado. Calcular V(X).
X

P(x)

X . P(x)

X2 . P(x)

1/6

1/6

1/6

1/6

2/6

4/6

1/6

3/6

9/6

1/6

4/6

16/6

1/6

5/6

25/6

1/6

6/6

36/6

3,5

91/6 = 15,2

V(X) = 15,2 (3,5)2 = 15,2 12,2 = 3,0

As chamadas dirias do corpo de bombeiros apresentam a


seguinte distribuio de probabilidades. Calcular V(X)
X= nmero de chamadas/dia.
X

P(x)

X.P(x)

X2 P(x)

0,10

0,00

0,15

0,15

0,15

0,30

0,60

1,20

0,25

0,75

2,25

0,15

0,60

2,40

0,05

0,25

1,25

1,00

2,35

7,25

V(X) = 7,25 (2,35)2 = 7,25 5,52 = 1,73

99

Uma empresa tem 4 caminhes de aluguel. Sabe-se que o


aluguel feito por dia e que a distribuio diria do nmero de
caminhes alugados especificada abaixo. Calcular V(X).
X
0

P(x)
0,10

x. P(x)
0

x2 P(x)
0,00

0,20

0,20

0,20

0,30

0,60

2,40

0,30

0,90

2,70

0,10

0,40

1,60

1,00

2,10

6,90

V(X) =6,90 (2,1)2 = 6,90 4,41 = 2,49

100

Joo e Paulo esto numa boate e tem uma menina extremamente


bonita, porm muito difcil de ser conquistada. Joo diz que est
com muita vontade de beij-la, mas Paulo o desencoraja,
alegando que das inmeras vezes que foi boate s presenciou
que 10% dos garotos que sem aproximaram da menina
conseguiram beij-la. Joo, ento, muito autoconfiante, faz uma
aposta com Paulo, afirmando que vai tentar beijar a menina e se
conseguir beij-la, ele ganha R$ 1000,00 de Paulo e se no
conseguir, ter que pagar a Paulo R$ 100,00. Se Joo tentar um
nmero suficientemente grande de vezes e a menina aceita ou
no os beijos de forma independente, qual o ganho esperado de
Joo? Este um jogo justo?
Soluo:
E(X) = 0,10 . (+1000) + 0,90 . (-100) = 0,10 . 1000 0,90 . 100 = R$
10,00.
Um jogo justo quando sua esperana de ganho nula,
favorvel ao apostador quando positiva e desfavorvel quando
negativa. Neste caso favorvel ao apostador (Joo).

101

Propriedades da Esperana Matemtica:


Com certo esforo matemtico pode-se demonstrar que:
1)A esperana de uma constante prpria constante;

E(k) = k

2)Multiplicando uma varivel aleatria por uma constante,


sua esperana ficar multiplicada por essa constante:

E(kX) = kE(X)

3)A esperana da soma ou diferena de duas variveis


aleatrias a soma ou diferena das esperanas:

E(X Y) = E(X) E(Y)

4)Somando-se ou subtraindo-se uma constante a uma


varivel aleatria, sua mdia fica somada ou subtrada da
mesma constante:
E(X K) = E(X) K

5)A esperana dos desvios da varivel em relao


prpria esperana Zero:
E((X E(X))

102

6)A esperana do produto de duas variveis aleatrias


independentes o produto das esperanas:

E(XY) = E(X) . E(Y)

Propriedades da Varincia:
Com certo esforo matemtico pode-se mostrar que:
1)A varincia de uma constante ZERO:

V (K) = 0

2)Multiplicando-se

uma

varivel

aleatria

por

uma

constante, sua varincia fica multiplicada pelo quadrado


da constante:

V (KX) = K2 V (X)

3)Somando-se ou subtraindo-se uma varivel por uma


constante, sua varincia no se altera:

V (X K) = V (X)

103

4)A varincia da soma ou diferena de duas variveis


aleatrias independentes a soma das respectivas
varincias:

V (X Y) = V (X) + V (Y)

Exemplo:
Numa indstria de produtos alimentcios, um determinado
material

acondicionado

em

pacotes

numa

mquina

automtica. A empacotadeira est regulada para pesar em


mdia 200g de material, porm, dado o grau de preciso da
mquina, o peso real obtido se distribui em torno dessa mdia
com desvio-padro 3 gramas. Supondo que a embalagem tem
um peso constate de 25 gramas, qual a mdia e o desviopadro do peso bruto do pacote?
Soluo:
Seja X o peso do material. Este peso uma varivel aleatria
em que:
E(X) = 200 g
V(X) = 9 g2
S(X) = 3 g
O peso bruto do pacote ser:
Z = X + 25

104

Portanto:
E(Z) = E(X +25) = E(X) +25 = 200 +25 = 225 g
V(Z) = V(X + 25) = V(X) = 9 g2 S(Z) = 9 = 3 g

105

Variveis Aleatrias Contnuas:


O pesquisador estuda variveis. O estatstico diz que essas
variveis so aleatrias porque tm uma componente que varia ao
acaso. Variveis aleatrias contnuas so todas as variveis
aleatrias que resultam de processo de medio.
Exemplos:

Altura de uma CPUS de computadores de uma


empresa;

Peso de clientes de um SPA;

Grau de satisfao de consumidores com certo


servio;

Variao de consumo de uma populao;

Extenso, em metros, de formulrio contnuo produzido


pelo output de um programa computacional;

Produto interno bruto de um pas;

Tempo que um banco de dados demora em finalizar


uma pesquisa relacional.

ndice de inflao de um pas em dado ms;

Juros brasileiros ao longo dos meses;

Tempo para execuo do download de um programa


computacional;

ndice de exportao e importao ao longo dos


meses;

Tempo que um programa demora na realizao de


uma tarefa;

Tempo de vida de lmpadas produzidas em uma


indstria;

106

Dimetros das cabeas de parafusos comercializados


por uma empresa;

Taxa de cmbio ao longo dos meses.

Peso de CPUS de computadores de uma empresa;

Taxa Selic a cada dia;

Tempo que um analista demora para finalizar um


programa computacional;

Altura de estudantes consultados em uma pesquisa de


mercado;

Tempo que um programa leva para verificar se um


computador tem vrus;

Tempo que um perito leva para identificar hackers que


vem atacando os computadores de empresas de uma
cidade.

Tempo em que os sinais de trnsito ficam fechados.

Clculo de Probabilidades Envolvendo Variveis Aleatrias


Contnuas:
A tabela de distribuio de probabilidades de uma varivel
aleatria contnua apresenta uma infinidade de pontos muito
prximos e distintos, cada uma, ento, com probabilidades
desprezveis. No tem sentido, o clculo de probabilidade no ponto,
P(X = x), porque igual praticamente zero.

107

Exemplo:

Tabela: Alturas de Alunos de uma Academia

Alturas
1,70
1,71
1,72
1,73
1,74
1,75
1,76
1,77
1,78
1,79
1,80
1,81
1,82
1,83
1,84
1,85
1,86
1,87
1,88
Total

P(X)
0.0
0.0
0.0
0.1
0.0
0.1
0.0
0.1
0.0
0.1
0.0
0.0
0.1
0.1
0.0
0.0
0.0
0.1
0.0
1.0

108

Concluses:

o Por ser uma varivel contnua, as ocorrncias das


variveis so muito prximas: um centsimo j
diferencia uma realizao da outra, gerando uma nova
frequncia absoluta;
o Isso faz com que as freqncias absolutas sejam
desprezveis em comparao com o tamanho da
amostra, gerando freqncias relativas prximas de
zero. Observe que cada altura tem valores muito
prximos e probabilidades tendendo zero.
o Probabilidades no ponto no tem sentido: P(X=
1,70)P(X=1,71)P(X=1,72)P(X=1,73)0
o Mas a probabilidade de P(X1,75)= 0,20, no to
desprezvel; o mesmo ocorrendo com P(X1,79)= 0,40.
o Para sermos mais racionais, no campo contnuo, as
variveis sempre sero consideradas em termos de
intervalos

para

clculo

de

probabilidades:

X<x,

x1<X<x2; e X>x.

Portanto, a probabilidade de um dado valor (ponto)


zero. No campo contnuo, no existe probabilidade num ponto:
P(X=x) = 0.
Podemos estender todas as definies de variveis
aleatrias discretas para variveis contnuas.

109

Distribuio de Probabilidades ou Funo Densidade de


Probabilidade

Uma varivel aleatria X contnua se existir uma funo f(x),


tal que;
1) f(x) 0 (no negativa)
2)

funo

f(x)

chamada

Funo

Densidade

de

Probabilidade (F.D.P).
Observamos que:

P(a<X<b) =

Funo Repartio de Probabilidades:

P(X < x) = F(x) =

Esperana Matemtica:

E(X) =

Varincia:

110

V(X) = E(X2) [E(X)]2 =

111

Propriedades da Esperana e da Varincia:


Todas as propriedades vlidas para a varivel aleatria
discretas so vlidas para as variveis aleatrias contnuas.
Exemplos:
1)Uma varivel aleatria X pode ser definida pela seguinte
funo densidade de probabilidade:

f(x) = kx

para 0 < x < 2

f(x) = 0

caso contrrio

Pede-se:
a) O valor de k;
b) F(1);
c) E(X);
d) V(x).
a) O valor de k:
2

K. X dx = 1
0

K = 1/2

112

b) F(1):
F(1) = P(x 1) =

F(1) = (1/2). X dx = 1/4


0

c) E(x):

E( X )= X. (1/2). X dx = 4/3
0

d) V(x):

E( X2 )= X2. (1/2). X dx = 2
0

V(X)= 2 (4/3)2 = 2/9

113

2)Seja X uma varivel aleatria contnua com a seguinte funo de


densidade de probabilidade:

1
x para 0 x 2
f ( x) 2

0 para x
Calcular: P(0X1)
Soluo:
P(0X1) = 01 1/2xdx
P(0X1) = 1/2 01 xdx
P(0X1) = 1/2 01 x2/2dx
P(0X1) = 1/2 [ x2/2]01
P(0X1) = 1/2 [1/2 0/2] = 1/2 . 1/2 = 0,25

3) Uma varivel aleatria X tem a seguinte funo densidade de


probabilidade:

f(x) =

KX3
0

para 0 X 2
para X fora desse intervalo

Determinar:
a)A constante K
b)P(X 1)

114

Soluo:
a)
2

KX3 dx = 1
0

K X3 dx = 1
0

K[ X4 / 4] = 1
0

K[ 24/4 04/4] = 1
K[16/4] = 1
4K = 1
K = 1/4
b)
P(X 1)
P(X 1) = F( 1 ) =
1

1/4 X3 dx =
0

1/4 X3 dx =
0

1/4[ X4 / 4] =
0

115

1/4[ 14/4 04/4] = 1/4 . 1/4 = 1/16 = 0,0625 ou 6,25%

4)Achar a mdia e o desvio-padro da seguinte distribuio de


probabilidade:

f(x) = 3X2

para 0 X 1

a)
Mdia:
1

E( X )= X. 3. X2 dx
0

E( X )= 3. X3 dx
0

3[ X4 / 4] = 3[ 1/4 ] = 3/4
0

Desvio-padro:
1

E( X2 )= X2. 3. X2 dx
0

E( X2 )= 3. X4 dx = 3[X5/5] = 3[1/5] = 3/5


0

V( X ) = 3/5 ( 3/4 )2 = 3/5 9/16 = 3/80 = 0,0375

116

_______ ___

S( X ) = 0,0375 = 0,1936

5)Uma varivel aleatria contnua tem funo densidade de probabilidade


como dada abaixo:

f(X) =

KX

0 < X< 1

caso contrrio

a)Encontre o valor de K;
b)Encontre a mdia da distribuio.

a)

0 KX dx =1

0 KX dx =1

117

K 0 X dx =1
1

K[ X2/2]0 = 1
1

K[1/2]0 = 1
K
=1
2
K= 2
b)

f(X) =

2X

0 < X< 1

caso contrrio

E(X)= 0 X. 2X dx =
1

E(X)= 0 2X2 dx =
1

E(X)= 2 0 X2 dx =
1

E(X)= 2[ X3/3]0 =
E(X)= 2[ 1/3 - 0] = 2/3

118

6)Um profissional de computao observou que seu sistema leva de 0 a 2


segundos

para

realizar

download

com

funo

densidade

de

probabilidade abaixo:

K(2+X)

0x2

caso contrrio

Pede-se:

a)Descubra o valor de K
b)Calcule E(X)

Soluo:
a)
2

0 K(2+X) dx =1

0 2Kdx + 0 KXdx =1

2K0 dx +K 0 Xdx =1

119

2K[X]0 + K [X2/2]0 = 1
2K[2-0] + K[4/2 - 0] =1
4K + 2K=1
6K=1
1
K=
6
b)

0 X(1/6)(2+X) dx =

0 (1/6)(2X+X2) dx=
2

(1/6)0 (2X+X2) dx=

(1/6)0 (2X)dx+(1/6)0 X2 dx=

(1/6) x 20 (X)dx+(1/6)0 X2 dx=

(1/3)0 (X)dx+(1/6)0 X2 dx=

120

(1/3) [X2/2]dx+(1/6)[ X3/3] dx=


0

(1/3)[(4/2 0) + (1/6)[8/3] =
(1/3)[(2 0) + (1/6)[8/3] =
(1/3)[(2) + (1/6)[8/3] = (2/3)+(4/9) = 20/18 = 10/9

121

Exerccios Propostos:
1)Suponhamos que apostamos em um jogo simples de atirar uma moeda,
na qual recebemos R$ 3.000,00, quando a face cara cai para cima e
perdemos R$ 2.000,00, quando a face para cima for coroa. O jogo
favorvel para o apostador?
2)Um homem deseja segurar a sua casa contra incndio. O valor da casa
R$30.000. O prmio anual que deve pagar para o seguro de sua casa
R$ 4.000. Se a probabilidade de que o fogo destrua a casa de 1/10.000,
o seu contrato de seguro um jogo justo.
3)Um fabricante de pneus de automveis conservou os registros da
qualidade de seu produto e obteve o seguinte quadro de valores baseado
nos ltimos seis meses de produo.
0
60

N defeitos
Porcentagens

1
22

2
8

3
5

4
3

5
2

6
0

Calcular a mdia e o desvio padro do nmero de defeitos.


4)Um banco pretende aumentar a eficincia de seu caixa. Oferece um
prmio de R$ 150,00 para mais de 42 clientes atendidos. O banco tem um
ganho operacional de R$ 100,00 para cada cliente atendido alm de 41.
As probabilidades de atendimento so:
N de clientes
Probabilidade

41
0,88

42
0,06

43
0,04

44
0,01

45
0,006

46
0,004

Qual a esperana de ganho, se este novo sistema for implantado?

122

5)Os empregados A, B, C e D ganham 1, 2, 2 e 4 salrios mnimos


respectivamente. Retiram-se amostras com reposio de 2 indivduos e
mede-se o salrio mdio da amostra retirada. Qual a mdia e desvio
padro do salrio mdio amostral?
6)As probabilidades de que haja em cada carro que vo a Santos num
sbado 1, 2, 3, 4, 5 ou 6 pessoas so respectivamente: 0,05; 0,20; 0,40;
0,15; 0,12; 0,08. Qual o nmero mdio de pessoas por carro? Chega-se a
Santos 4.000 carros por hora, qual o nmero esperado de pessoas na
cidade, em 10 horas de contagem?
7)Um processo de fabricao produz peas com peso mdio de 30g e
desvio padro de 0,7 g. Essas peas so acondicionadas em pacotes de
uma dzia cada. A embalagem pesa em mdia 40g com varincia 2,25g 2.
Qual a mdia e o desvio padro do peso total do pacote?
8)O lucro unitrio L de um produto dado por L = 1,2 V 0,8C 3,5.
Sabendo-se que o preo unitrio de venda (V) tem mdia R$ 60,00 e
desvio padro R$ 5,00 e que o preo do custo unitrio C tem uma
distribuio de mdia R$ 50,00 e desvio padro R$ 2,00, qual a mdia e o
desvio padro do lucro unitrio?

123

9)Uma varivel aleatria X tem a seguinte funo densidade de


probabilidade:
f(x) =

KX3
0

para 0 X 2
para X fora desse intervalo

Determinar:
a)A constante K
b)P(X 1)

10)Achar a mdia e o desvio-padro da seguinte distribuio de


probabilidade:
f(x) = 3X2

para 0 X 1

124

Unidade III
Modelos Probabilsticos

Conceito de Modelos Probabilsticos:

Existem variveis aleatrias que apresentam certos padres de


comportamento. Para estas variveis, e com base nestes comportamentos
tpicos, foram estruturados funes, modelos ou distribuies de probabilidade
e tambm desenvolvidas frmulas para expresses de suas esperanas
matemticas e varincias. o que iremos estudar nesta unidade.
Modelos de Distribuies Discretas:
Modelos de Bernoulli:
Suponhamos a realizao de um nico experimento e, cujo resultado
pode ser um sucesso (se acontecer o evento que nos interessa) ou um
fracasso (o evento no se realiza).
Definimos a varivel aleatria discreta como X e a distribuio de
probabilidade de X :
X
1
0

Eventos
Sucesso
Fracasso
___

P(X)
p
1p=q
1

P(X) = px . q1 - x

125

Exemplo:
Seja uma experincia aleatria que consiste no lanamento de um dado
uma nica vez. Suponhamos que o lanador tem interesse que ocorra
face 5.

A varivel aleatria assim definida de Bernoulli e sua

distribuio de probabilidade :
X
1
0

Eventos
Sucesso
Fracasso
_________

P(X)
1/6
5/6
1

Parmetros Caractersticas:
E(x) = p
V(x) = p.q
Exemplo:
No exemplo anterior temos os seguintes parmetros caractersticos:
E(X)= 1/6
V(X)= 1/6 x 5/6 = 5/36

126

Modelo Binomial:

uma

distribuio

de

probabilidade

adequada

aos

experimentos que apresentam apenas dois resultados: Sucesso ou


Fracasso. Portanto, deriva da distribuio de Bernoulli.

Exemplos:
o Vender(sucesso) ou no vender(fracasso) pacotes
matemticos para empresas;
o Cancelar(sucesso) ou no cancelar(fracasso) uma
reserva num show;
o Ocorrncia(sucesso) ou no ocorrncia(fracasso) de
vrus a computadores numa empresa;
o Ter ocorrido(sucesso) ou no ter ocorrido(fracasso)
ataque de hackers a computadores de uma empresa;
o Conceder(sucesso) ou no conceder(fracasso) licena
para uso de programas computacionais a uma empresa.
o Conseguir

emprego(sucesso)

ou

no

conseguir(emprego) quando um ps-graduado volta da


realizao de um MBA;
o O Banco Central pode manter(sucesso) ou no
manter(fracasso) a taxa Selic de juros;
o Um

novo

produto

lanado

no

mercado

pode

ter(sucesso) ou no ter(fracasso) xito de venda.

A varivel aleatria que tem distribuio binomial o


nmero de sucessos(X) em n oportunidades de ocorrncias de
sucessos e fracassos.

127

, portanto, o nmero de tentativas bem sucedidas. o


nmero

total

de

sucessos

ocorridos

em

provas

independentes observadas.
Exemplos:

o Verificar o nmero de clientes satisfeitos com a


operadora

OI

numa

amostra

selecionada

aleatoriamente.
o Verificar

nmero

de

clientes

de

um

banco

inadimplentes com cheque especial;


o Verificar o nmero de clientes de um banco que
optaram pela portabilidade para outro banco numa
amostra aleatria;
o Verificar numa amostra de empresas o nmero de
corporaes com bom clima organizacional;
o Verificar o nmero de processadores ativos, num
sistema com multiprocessadores;
o Verificar o nmero de bits que no esto afetados por
rudos, em um pacote com n bits.

128

Probabilidade Binomial
Sejam a experincia de se observar 5 programas
distintos computacionais consecutivos na realizao de uma
tarefa. Seja a situao de conseguir realizar a tarefa(sucesso)
ou no realizar a tarefa(fracasso). Se o programa realizar com
sucesso a tarefa vai atribuir valor 1, caso contrrio, o valor 0,
ento seja que o resultado da observao seja a situao
abaixo:

Observado a situao acima temos: somente o segundo


e o quinto programas fracassaram na realizao da tarefa: os
programas no realizariam a tarefa. Neste caso, ocorreriam 3
sucessos

em

oportunidades,

em

cinco

experincias

independentes de Bernoulli: X=3.


A distribuio binomial calcula a probabilidade de em 5
programas distintos na realizao de uma tarefa, 3 programas
a realizarem com sucesso: P(X=3).
Para calcular esta probabilidade algumas consideraes
tm que ser garantidas e alguns dados tm que ser
conhecidos:

129

Pressuposies para o Ajuste ao Modelo Binomial:

1)O nmero de n oportunidades de ocorrncias dos sucessos e


fracassos tem que ser conhecidos a priori, isto , o nmero de
experincias aleatrias para observao da ocorrncia ou no do sucesso
tem que ser conhecidos e fixos.
2)Estas n experincias de Bernoulli tm que ser independentes umas
das outras;
3)Em cada experincia independente, a probabilidade de ocorrer o
sucesso(p) deve ser constante.
No caso discutido acima, vamos supor que por histrico a
probabilidade de um programa nas linguagens computacionais utilizadas
realizar a tarefa abordada de 75%: p = 0,75
Assim, a distribuio de probabilidades da varivel aleatria que
conta o nmero de sucessos ou de tentativas bem sucedidas em n
experimentos aleatrios independentes de Bernoulli dada por:

P(X=x) = C px . q(n-x)
n

Com parmetros n e p:
X~B(n;p)

Onde:
X = nmero de sucessos ou de tentativas bem sucedidas em n repeties
independentes do experimento aleatrio;
n = nmero de experimentos aleatrios (nmero de tentativas);

130

p = probabilidade de ocorrer sucesso em um experimento aleatrio;


q=1-p = probabilidade de ocorrer fracasso em um experimento aleatrio.
n!
x
Cn =
x! (n x)!

A varivel aleatria que tem distribuio binomial o nmero de


sucessos(X) em n oportunidades de ocorrncias de sucessos e fracassos.
, portanto, o nmero de tentativas bem sucedidas. o nmero total de
sucessos ocorridos em n provas independentes observadas.
Exemplo:
No nosso caso, vamos enfim calcular a P(X=3):
X = nmero de programas em 5 considerados que executaram com
sucesso a tarefa.
X~B(5;0,75)
Logo:
x

P(X=x) = C px . q(n-x)
n
3

P(X=3) = C (0,75)3. (0,25)(5-3)


5
3

P(X=3) = C (0,75)3. (0,25)2


5

P(X=3) = 0,2637 ou 26,37%

131

Parmetros Caractersticos da Binomial:


Vamos considerar a mdia(esperana matemtica) e a varincia como os
parmetros caractersticos da binomial.
A mdia de uma varivel aleatria binomial a mdia do nmero de
sucessos se pudssemos realizar as n experincias um nmero
suficientemente grande de vezes e a varincia o grau de variao do
nmero de sucessos ao realizar as n experincias um nmero
suficientemente grande de vezes.
Pode-se demonstrar luz das propriedades da mdia e da varincia, que
o valor esperado e a varincia de X so respectivamente:

E(X) = n.p
V(X) = n.p.q

Lembrando que a varivel aleatria binomial uma soma de n variveis


aleatrias independentes de Bernoulli fica fcil e intuitivo entender as
expresses acima.

Exemplo 1:
No exemplo trabalhado acima, temos o seguinte clculo da mdia:
E(X) = n x p = 5 x 0,75 = 3,75

132

Interpretao:
Se pudssemos observar 5 programas distintos na realizao da tarefa, a
mdia do nmero de programas que realizariam a tarefa seria de 3,75.
No exemplo trabalhado acima, temos o seguinte clculo da varincia:
V(X) = n x p x q = 5 x 0,75 x 0,25 = 0,938
S(X) = 0,938 = 0,968 1 programa

Interpretao:
Este o grau de disperso que teramos do nmero de programas que
realizariam a tarefa com sucesso em 5 chamadas verses distintas, se
pudssemos repeti-las um nmero grande de vezes.

Exemplo 2:
Sabe-se que 10% dos pacotes estatsticos vendidos para universidades
brasileiras so da Europa. Determine as probabilidades de que, dentre
trs pacotes vendidos para universidades brasileiras:

a)Dois sejam da Europa;


b)Nenhum seja da Europa.

133

Soluo:
Vamos identificar qual a varivel aleatria em estudo e quais so o
sucesso e o fracasso associados a esta varivel:
X: varivel aleatria nmero de pacotes vendidos para universidades
brasileiras.
Assim, voc pode agora identificar os elementos da expresso da
distribuio Binomial.

a)
x= nmero de sucessos, x=2
n= nmero de experimentos aleatrios, n=3
p=probabilidade de sucesso, p=0,10 e q=0,90
Com estes elementos podemos calcular a probabilidade:

P(X=x) = C px . q(n-x)
n
2

P(X=2) = C (0,10)2 . (0,90)(3-2) = 0,027


3

Pode-se concluir que, dentre trs pacotes vendidos, a probabilidade de


dois serem da Europa de 0,027 ou aproximadamente 2,7%.

134

b)

x= nmero de sucessos, x=0


n=nmero de experimentos aleatrios, n=3
p=probabilidade de sucesso, p=0,10 e 1-p=0,90

Com estes elementos podemos calcular a probabilidade:


0

P(X=0) = C (0,10)0 . (0,90)(3-0) = 0,7290


3

Pode-se

concluir

que,

dentre

trs

pacotes

vendidos,

probabilidade de nenhum ser da Europa de 0,7290 ou 72,90%.

Parmetros Caractersticos:

E(X) = 3 x 0,10 = 0,3


V(X) = 3 x 0,10 x 0,90 = 0,27

S(X) = 0,27 = 0,52

135

Exemplo 3:
Se 20% dos alunos de um curso pr-vestibular so aprovados para
universidades federais, determine a probabilidade de que, em 4 alunos
escolhidos aleatoriamente:

a)Um seja aprovado em universidades federais.


b)Nenhum seja aprovado em universidades federais.
c)Menos que dois sejam aprovados em universidades federais.

Soluo:
Primeiramente voc ir identificar qual a varivel aleatria em
estudo e quais so o sucesso e o fracasso associados a esta varivel:
X: varivel aleatria aprovao em universidades federais
Assim, voc pode agora identificar os elementos da expresso da
distribuio Binomial.

136

a)
x= nmero de sucessos, x=1
n = nmero de experimentos aleatrios, n=4
p = probabilidade de sucesso, p=0,20 e 1-p=0,80
Com estes elementos podemos calcular a probabilidade:

P(X=1) = C (0,20)1 . (0,80)(4-1) = 0,4096


4

Pode-se concluir que, dentre quatro alunos deste cursinho, a


probabilidade de um ser aprovado em universidade federal de 0,4096
ou 40,96%, aproximadamente.
b)
x= nmero de sucessos, x=0
n = nmero de experimentos aleatrios, n=4
p = probabilidade de sucesso, p=0,20 e 1-p=0,80
Com estes elementos podemos calcular a probabilidade:

P(X=0) = C (0,20)0 . (0,80)(4-0) = 0,4096


4

Pode-se concluir que, dentre quatro alunos deste cursinho, a


probabilidade de nenhum ser aprovado em universidade federal
tambm de 0,4096 ou 40,96%.

137

c)
x= nmero de sucessos, x= 0 ou 1
n = nmero de experimentos aleatrios, n=4
p = probabilidade de sucesso, p=0,20 e 1-p=0,80
Com estes elementos podemos calcular a probabilidade:
P(X<2) = P(X=0) + P(X=1) = 0,4096 + 0,4096 = 0,8192
Pode-se concluir que, dentre quatro alunos deste cursinho, a
probabilidade de menos de dois, ou seja, nenhum ou um, serem
aprovados em universidade federal de 0,8192 ou 81,92%.
Parmetros Caractersticos:
E(X) = 4 x 0,20 = 0,80
V(X) = 4 x 0,20 x 0,80 = 0,64

138

Exemplo 4:
A probabilidade que um aluno acerte cada questo de uma prova de 6
questes 0,3.

Se o aluno tentar resolver todas elas de forma

independente, qual a probabilidade de acertar 4 questes?


Soluo:

P(X=4) = C (0,30)4 . (0,70)(6-4) =


6

P(4) 0,0595 ou 5,95%


Exemplo 5:
Uma pessoa trabalha em 3 empregos onde desenvolve atividades iguais,
sendo remunerada tambm igualmente nos trs lugares. A probabilidade
de que o pagamento saia at o 2 dia til nos trs empregos de 0,85.
Qual a probabilidade de apenas um salrio sair at o 2 dia til?
Soluo:

P(X=1) = C (0,85)1 . (0,15)(3-1) =


3

P(1) 0,0574 ou 5,74%

139

Modelo Hipergeomtrico:
Seja uma populao N dividida em 2 subgrupos (r e N-r). Retira-se uma
amostra, sem reposio, de tamanho n. Tem-se o interesse em verificar a
ocorrncia de x elementos de r na amostra selecionada.
A probabilidade do evento de interesse dada pela expresso
matemtica:
x

n-x

Cr

CN-r

P(X=x) =
n

CN

X a varivel aleatria definida como o nmero de elementos de r na


amostra selecionada aleatoriamente, sem reposio.
Parmetros Caractersticas:
E(x) = np
V(x) = npq . [ (N n)/(N 1)]
fator de correo de populao finita.
Observao:
Uma conveniente regra de bolso que se pode usar a distribuio
binomial, como uma aproximao hipergeomtrica quando n 0,05N, isto ,
quando o n for menor ou igual do que 5% do tamanho da populao.

140

Exemplo:
1) Um lote de 10 peas de uma indstria possui 6 peas boas e 4 peas
defeituosas. Retira-se uma amostra, sem reposio, de tamanho 5. Qual
a probabilidade de encontrarmos 3 peas defeituosas na amostra
selecionada?
Soluo:

C4

C6

P(X=x) = = 0,2381
5

C 10

2) Seja o seguinte problema: uma urna contm 100 boas, sendo 60


brancas e 40 pretas. Tirando-se 5 bolas sem reposio, qual a
probabilidade de sarem 2 pretas?
Soluo:
n 0,05N
5 0,05 . 100 (Verdadeiro)
Podemos, ento, utilizar a binomial como uma aproximao da
hipergeomtrica.
p = 40/100 = 0,4
q = 0,6

141

P(X=1) = C (0,40)2 . (0,60)3) =


5

P(2) 0,3458
Pela Hipergeomtrica:

C 40

C60

P(X=x) = = 0,3545
5

C 100

Modelo de Poisson:
A varivel aleatria de Poisson definida como o nmero de
sucessos em certo intervalo contnuo fixo considerado.
Correspondem s situaes em que se avalia o nmero de
ocorrncias de um tipo de evento por unidade de tempo, de comprimento,
de rea, ou de volume.
Exemplos:
o Nmero de consultas a uma base de dados em um minuto;
o Nmero de pedidos a um servidor num intervalo de tempo
o Nmero de erros de tipografia em um formulrio
o Numero de vezes em que o corpo de bombeiros chamado por
dia para combater incndios numa cidade grande;
o Nmero de defeitos na impresso de certo livro;
o Nmero de pessoas que chegam ao caixa de um supermercado
nos primeiros 5 minutos em que aberto;

142

o Nmero de carros que passam por um pedgio no intervalo de


tempo de 30 minutos.
Suposies Bsicas:
o Independncia entre as ocorrncias do evento considerado;
o Os eventos ocorrem de forma aleatria, de tal forma que no haja
tendncia de aumentar ou reduzir as ocorrncias do evento, no
intervalo considerado.
Indicaes para Construo do Modelo:
o Selecione um intervalo de tempo fixo de observao;
o Observe o nmero de ocorrncias de certo evento de interesse
neste intervalo. Este nmero de ocorrncias uma varivel
discreta com valores possveis 0, 1, 2 ...;
o Se a probabilidade da ocorrncia do evento de Poisson rara ou
nula num intervalo relativamente pequeno e s passa a ser
considervel quando o intervalo de observao cresce, ento o
evento pode ser na prtica modelado pela distribuio de Poisson.

Lei dos Fenmenos Raros:


Uma distribuio de Poisson modela bem eventos raros. Fenmenos
raros so aqueles que no acontecem com grande frequncia para qualquer
intervalo de tempo de observao.

143

Exemplo:
O estacionamento de um automvel da linha Gol num estacionamento
na A.V. Presidente Vargas no Rio de Janeiro num intervalo de 1 hora
certamente no um evento de Poisson, mas o evento chegada de um
BMW no mesmo estacionamento e no mesmo perodo de tempo deve
ser uma ocorrncia de Poisson.
Formulao do Modelo:
Trata-se de uma distribuio Binomial em que:
nep0
= np = t
Pode-se demonstrar que:
x

lim P(X=x) = C px . q(n-x) =


n

-
x
e .
P(X=x) =
x!

Parmetros Caractersticos:

144

E(X) =
V(X) =
Exemplos:
1)Em um dado posto de pedgio, passam em mdia 5 carros por minuto.
Qual a probabilidade de passarem exatamente 3 carros por minuto?
Soluo:
= t = 1.5 = 5
e-5 . 53
P(X = 3) = = 0,1404 ou 14,04%
3!
2) Certo posto de bombeiros recebe em mdia 3 chamadas por dia. Qual
a probabilidade de receber 4 chamadas em dois dias?
Soluo:
= 3/dia
= t = 2. 3 = 6
Logo:
e-5 . 64
P(X = 4) = = 0,1339 ou 13,39%
4!

3)Supondo que as consultas num banco de dados ocorrem de forma


independente e aleatria, com uma taxa mdia de trs consultas por

145

minuto. Qual a probabilidade de que no prximo minuto ocorram menos


do que trs consultas?
Soluo:
Seja X o nmero de consultas por minuto.
Ento:
P(X < 3 ) = P(0) + P(1) + P(2) =

e-3 . 30

e-3 . 31

e-3 . 32

+ + = 0,4232
0!

1!

2!

146

4)Qual seria a probabilidade do exemplo acima de que no prximo minuto


ocorram mais do que 5 consultas?
Soluo:
P( X > 5 ) = 1 P( X 5 ) = 1 F(5)

Vamos calcular primeiramente a F(5):

P(X 5 ) = P(0) + P(1) + P(2) + P(3) + P(4) + P(5) =

e-3 . 30

e-3 . 31

e-3 . 32

+ + +
0!

e-3 . 33

1!

e-3 . 34

2!

e-3 . 35

+ + = 0,9160
3!

4!

5!

P( X > 5 ) = 1 P( X 5 ) = 1 0,9160 = 0,0840

147

Modelos de Distribuies Contnuas:

1)Modelo Uniforme:
Quando uma varivel aleatria X s pode assumir valores dentro de um
intervalo contnuo de variao [ a , b ], com funo densidade de probabilidade
como a descrita abaixo e assumir valor zero em caso contrrio, ento ela tem
distribuio uniforme.

1
f(x) =

para a X b

b-a

em caso contrrio

O que caracteriza a distribuio uniforme que todo subintervalo de


mesma amplitude em [a , b] tem a mesma probabilidade.

148

Seu grfico :

1/(b a)

Parmetros Caractersticos:

(a + b)
E(X) =
2

(b - a)2
V(X) =
12

Diz-se que X~U[ a, b ]

149

Exemplos:
1)Um profissional de Computao observou que seu sistema gasta entre
20 e 24 segundos para realizar determinada tarefa. Considere a
probabilidade uniforme em [ 20, 24 ] , isto , todo subintervalo de mesma
amplitude em [ 20, 24 ] tem a mesma probabilidade.

a)P(20<X<21)
b)P(21<X<22)
c)P(20<X<22)
d)P(22<X<24)
e)P(X>23)
f)E(X)
g)V(X)

Soluo:

Tem-se que X~U[ 20, 24 ] . Logo a funo densidade de probabilidade de


X :

1
f(x) =

para 20 X 24

4
0

em caso contrrio

150

Portanto podemos calcular as probabilidade sob essa densidade:

a)P(20<X<21)
21

21

P(20<X<21) = (1/4) dx

= 1/4 [X]

20

20

= (21-20)/ 4 = 0,25 ou 25%

b)P(21<X<22)
22

22

P(21<X<22) = (1/4) dx

= 1/4 [X]

21

21

= (22-21)/ 4 = 0,25 ou 25%

c)P(20<X<22)
22

22

P(20<X<22) = (1/4) dx
20

= 1/4 [X]
20

= (22-20)/ 4 = 0,5 ou 50%

151

d)P(22<X<24)
24

24

P(22<X<24) = (1/4) dx

= 1/4 [X]

22

22

= (24-22)/ 4 = 0,5 ou 50%

e)P(X>23)
24

24

P(23<X<24) = (1/4) dx

= 1/4 [X]

23

23

= (24-21)/ 4 = 0,25 ou 25%

f)

20 + 24
E(X) = = (44/2) = 22
2
g)

( 24 20 )2
V(X) = = (16/12) = 0,73
12

2)Um

pequeno

desenho

foi

planejado

para

estar

distribudo

aleatoriamente de maneira uniforme no intervalo de [0, 2] metros de um

152

Cartaz Publicitrio. Qual a probabilidade de que o pequeno desenho


esteja no intervalo entre 1 e 1,5 metros do cartaz?

Soluo:

f(x) = 1/2 se 0 x 2
0

se

c/c

1,5

1,5

P(1<X<1,5) = (1/2) dx = 1/2 [X]


1
1

= 0,25

3)A dureza de uma pea de ao pode ser pensada como sendo uma
varivel aleatria uniforme no intervalo [ 50, 70 ] da escala de Rockwel.
Calcular a probabilidade de que uma pea tenha dureza entre 55 e 60.

Soluo:

f(h) = 1/20 se 50 h 70
0

se

c/c

60

60

P(55<h<60) = (1/20) dh = 1/20 [h]


55

= 0,25

55

153

4)Considere um crculo, com medidas de ngulos, em graus, a partir de


determinada origem. Nesse crculo, h um ponteiro que colocado a
girar.Seja a varivel aleatria X contnua definida pelo ngulo formado
entre a posio que o ponteiro pra e a linha horizontal do lado direito.
Assuma que no existe regio de preferncia para o ponteiro parar. A
distribuio de probabilidades de X pode ser representada por uma
funo que assume um valor constante e positivo em todo intervalo [ 0 o ,
360 ), de tal forma as probabilidades possam ser vistas por reas sob a
curva dessa funo. Como certamente vai ocorrer um resultado em [ 0 o ,
360 ), ento a rea sob a funo neste intervalo deve ser igual a 1, e nula
fora deste intervalo. Nessas condies, podemos considerar que todo
intervalo de mesma amplitude, contido em [ 0 o , 360 ), tem a mesma
probabilidade de ocorrncia. Qual a probabilidade do ponteiro no
intervalo [ 30 , 60 ]?

Soluo:
Tem-se que X~U[ 0, 360 ]. Logo a funo densidade de probabilidade de
X :

1
f(x) =

para 0 X 360

360
0

em caso contrrio

Portanto podemos calcular a probabilidade sob essa densidade:

154

Soluo:

P(30<X<60) =
60

60

P(30<X<60) = (1/360) dx

= 1/360 [X]

30

30

= (60-30)/ 360 = 30/360 = 1/12

155

Modelo Exponencial:

O modelo exponencial tem forte relao com o modelo discreto de


Poisson. Enquanto a distribuio de Poisson pode ser usada para modelar o
nmero de ocorrncias em um perodo contnuo(tempo ou de comprimento), a
distribuio exponencial pode modelar a varivel aleatria contnua que
representa o intervalo( de tempo ou de comprimento) entre duas ocorrncias
sucessivas de Poisson.
, portanto, a distribuio de probabilidades do intervalo T entre dois
sucessos consecutivos de Poisson. O intervalo T a varivel aleatria.

Exemplos:

o Tempo (em minutos) at a prxima consulta a uma base de dados;


o Tempo (em segundos) entre dois pedidos a um servidor;
o Distncia (em metros) entre dois defeitos de uma fita;
o Tempo de vida de lmpadas;
o Tempo entre chegadas de clientes numa fila de banco.

A distribuio exponencial pode ser usada quando as suposies de


Poisson(independncia entre as ocorrncias e taxa mdia de ocorrncias
constante no intervalo considerado) estiverem satisfeitas.

156

A figura abaixo ilustra a relao entre as duas distribuies :

157

Sua funo densidade de probabilidade :

f(T) = e-t

para T 0

f(T) = 0

para T < 0

Onde a frequncia mdia de sucessos por unidade de observao.

A Funo Repartio :

F(t) = P( T t ) = 1 e-t

t0

F(t) = 0

c/c

Portanto: P(T > t) = e-t

158

Parmetros Caractersticos:

E(T) = 1/
V(T) = 1/2
Grfico de f(t) (o grfico est diferente)

Logo se diz que T ~ E ()

159

Observaes:

1)A probabilidade exponencial de que o primeiro evento ocorra dentro do


intervalo considerado de tempo ou espao :

P( T t) = 1 e t

2)A probabilidade exponencial de que o primeiro evento ocorra fora do


intervalo considerado de tempo ou espao:

P( T > t) = e-t
Exemplos:

1)Os defeitos de um tecido seguem a distribuio de Poisson com mdia


de um defeito a cada 400 m. Qual a probabilidade de que o intervalo entre
dois defeitos consecutivos seja:

a) No mnimo de 1000 m;
b) No mximo de 1000 m;
c) Entre 800 e 1000 m.

160

Soluo:

a)

= 1/400 defeitos/metros

P(T 1000) = e-1/4000. 1000 = e-2,5 = 0,0820

b) P(T 1000) = 1 e t = 1 e-2,5 = 1 0,0820 = 0,9180

c) P (800 < T < 1000) = e(-1/400) . 800 e(-1/400) . 1000


= 0,1353 0,0820 = 0,0533 (o grfico est diferente)

f(t)

800

1000

161

2)Em mdia, um navio atraca em certo posto a cada dois dias. Qual a
probabilidade de que, a partir da partida de um navio, se passem mais de
4 dias antes da chegada do prximo navio?

Soluo:

P(T 4) = e-1/2 . 4 = e-2 = 0,1353

3)Cada rolo de lmina de ao de 500 metros contm, em mdia, duas


imperfeies. Qual a probabilidade de que, medida que se desenrole
um rolo, a primeira imperfeio aparea no primeiro segmento de 50
metros?

Soluo:

= 2/500 = 0,004

P(T 50) = 1 e-2/500 . 50 = 1 e-0,2 = 1 0,8187 = 0,1813

162

4) Um departamento de conserto de mquinas recebe, em


mdia, 5 chamadas por hora. Iniciando em um ponto de tempo
aleatoriamente escolhido, qual a probabilidade de que a
primeira chamada chegue dentro de meia hora?

Soluo:

=5

P( T 0,5 ) = 1- e-5 . 0,5 = 1 e-2,5 = 1- 0,0821 = 0,9179

5)Suponhamos que o manuscrito de um livro-texto tem um total


de 50 erros nas 500 pginas de material, sendo os erros
distribudos

aleatoriamente

atravs

do

texto,

qual

probabilidade de que, quando o revisor comece a ler um


captulo, o primeiro erro se encontre:

a) Dentro das cinco primeiras pginas.


b) Depois das quinze primeiras pgina.

163

Soluo:

a)

= 50/500 = 0,1

P (T 5) = 1 e-0,1 . 5 = 1 e-0,5 = 1 0,6065 = 0,3935

b)

= 0,1

P(T > 15) = e-0,1 . 15 = e-1,5 = 0,2231

164

Modelo Normal ou Curva de Gauss:


A normal considerada a distribuio de probabilidade mais importante,
pois permite modelar uma infinidade de fenmenos naturais e, alm disso,
possibilita realizar aproximaes para calcular probabilidades de muitas
variveis aleatrias que tm outras distribuies. muito importante tambm
na inferncia estatstica, como ser observado nos captulos seguintes.
Esta distribuio chamada de curva normal porque a sua mdia
representa uma norma, um modelo de comportamento para a varivel na
populao. Os valores que se desviam da mdia considerado erro, da o
conceito de desvio-padro.
A distribuio normal caracterizada por uma funo de probabilidade,
cujo grfico descreve uma curva em forma de sino, unimodal e simtrica, como
mostra a figura abaixo:

Essa forma de distribuio evidencia que h maior probabilidade de a


varivel aleatria assumir valores prximos do centro.

165

Dados os parmetros R e > 0, a funo densidade de


probabilidades da normal dada por:

-< X <+

Com certo esforo matemtico, possvel mostrar que o valor esperado


e a varincia da distribuio normal so dados por:

E(X) = e V(X) = 2
Aplicaes da Curva Normal
Quanto estudamos os grficos de anlise e as medidas da forma da
distribuio, aprendemos a detectar se uma distribuio de freqncia tinha a
forma da Curva Normal.
Uma vez detectada que a distribuio se ajusta Curva Normal,
podemos realizar duas aplicaes com esta informao:

1. Clculo de probabilidades da varivel em estudo pertencer a


determinados intervalos;
2. Modelagem da distribuio de estimativas de parmetros para
inferncia estatstica.
Neste captulo, aprenderemos a realizar a primeira aplicao.

166

Propriedades:

A varivel aleatria X pode assumir todo e qualquer valor real;


A representao grfica da distribuio normal uma curva em
forma de sino, unimodal e simtrica em torno da mdia , que

recebe o nome de Curva Normal ou de Gauss;


A rea total limitada pela curva e pelo eixo das abscissas igual a
1, j que essa rea corresponde probabilidade de a varivel

aleatria X assumir qualquer valor real;


A curva normal assinttica em relao ao eixo das abscissas

sem, contudo, alcan-la;


Como a curva simtrica em torno de , a probabilidade de
ocorrer valor maior do que a mdia igual probabilidade de
ocorrer valor menor do que a mdia, isto , ambas as
probabilidades so iguais a 0,5. Escrevemos:

P( X > ) = P( X < ) = 0,5

Quando temos em mos uma varivel aleatria com distribuio normal,


nosso principal interesse obter a probabilidade de essa varivel aleatria
assumir um valor em um determinado intervalo.

167

Passos Gerais:
o Identificar no problema dados da relao:

X ~ N( ; 2 )

o Transformar a varivel aleatria original X na varivel aleatria


padronizada Z, pela frmula:

A transformao assim obtida uma varivel aleatria que tem


distribuio normal reduzida ou distribuio normal padro com mdia 0 e
desvio padro 1 para qualquer natureza da varivel original X simtrica: Z ~ N (
0; 1 ). A Curva Normal padro distribuio simtrica e mesocrtica.
Sua densidade de probabilidades fica ento:

o Localizar

na

figura

da

normal

rea

correspondente

probabilidade pedida;
o Consultar a tabela da normal padro e localizar a probabilidade
necessria para o clculo da probabilidade pedida;
o Realizar o clculo da probabilidade.

168

Exemplos:

1)Uma populao de entrevistadores, aps um perodo de treinamento, foi


submetida a um teste padronizado de avaliao de conhecimentos
adquiridos, obtendo mdia 100 e desvio-padro 10. Se presumirmos que
as notas so distribudas normalmente, calcule as probabilidades:
a)
b)
c)
d)
e)

P(100 < X < 120)


P(X > 120)
P(X > 80)
P(85 < X < 115)
P(X < 125)

Soluo:

a) P(100 < X < 120)


X ~N ( ; 2 ) X ~ N ( 100; 100 )

2,0

P((0 < Z < 2,0) = 0,4772 ou 47,72%

169

b) P(X>120)

2,0

P( Z > 2,0 ) = 0,5 0,4772 = 0,0228 ou 2,28%


c) P( X >80 )

FECHAR O PARENTESES DA EXPRESSO


A FIGURA TA MODIFICADA:

-2,0

P( Z > -2,0 ) = 0,4772 + 0,5 = 0,9772 ou 97,72%.

170

d) P(85 < X < 115)

-1,5

1,5

P( - 1,5 < Z < 1,5) = 0,4332 + 0,4332 = 0,8664 ou 86,64%


e) P(X < 125)

2,5

P ( Z < 2,5 ) = 0,5 + 0,4938 = 0,9938 ou 99,38%

171

2)O volume de correspondncia recebido por uma firma quinzenalmente


tem distribuio normal com mdia de 4.000 cartas e desvio padro de
200 cartas. Qual a probabilidade de numa dada quinzena a firma receber?
a)P( 3600 < X < 4250)
X ~N ( ; 2 ) X ~ N ( 4000; 2002 )

P ( - 2,00 < Z < 1,25) =

-2,0

1,25

P ( - 2,00 < Z < 1,25) = 0,4771 + 0,3944 = 0,8716 ou 87,16%


b) P( x < 3400)

-3,0

P( Z < -3,0 ) = 0,5 0,4987 = 0,0013 ou 0,13%

172

Modelo T-Student:
Suponhamos que a partir de uma amostra aleatria de n valores
retirados de uma populao normal de desvio padro conhecido , se desejem
estimar a mdia a partir da estatstica:
_
X -
Z =
/n
Suponha, agora que no conheamos o desvio-padro populacional e
que para estimar utilizaremos na frmula acima o desvio-padro da
amostra(S). Entretanto, se usarmos na estatstica acima o desvio padro da
amostra (S), ao invs do desvio-padro da populao , obteremos uma
estatstica cuja distribuio no mais a normal reduzida. A distribuio da
estatstica no teria uma forma constante, como a normal reduzida, pois
depende da estatstica S, que uma varivel aleatria (a normal reduzida
depende de , que uma constante fixa ). Como mostrou Student, a estatstica
abaixo tem distribuio T-Student.
Assim:
_
X -
t =
S/n

173

Caractersticas:
Esta distribuio simtrica com mdia 0, mas no a normal
reduzida(Z), pois S/n uma varivel aleatria, o que no ocorre com (Xbarra)//n, em que o denominador uma constante.
Para grandes amostras, o desvio padro amostral S deve ser prximo de
e as correspondentes distribuies t devem estar prximas da normal
reduzida Z.
Existe uma famlia de distribuies cuja forma tende distribuio
normal reduzida quando n cresce indefinidamente. Para trabalharmos com uma
distribuio t- Student precisamos saber qual a sua forma especfica e isso
informado por uma estatstica denominada grau de liberdade.
Graus de Liberdade ():
O nmero de informaes independentes ou livres da amostra d o
nmero de graus de liberdade da distribuio t.
Genericamente, podemos dizer que o nmero de graus de liberdade
igual ao nmero de elementos da amostra (n) menos o nmero (K) de
parmetros da populao a serem estimados, alm do parmetro inerente ao
estudo:
=nK
Toda estatstica de teste que dependa de uma varivel aleatria tem
graus de liberdade associada.
O presente estudo visa naturalmente estimar a mdia populacional ,
atravs da mdia da amostra. Porm, para estimarmos , teremos que
adicionalmente estimar tambm 2, atravs de S2. Isto significa que a
estatstica t tem n 1 graus de liberdade:
=n1
Para cada valor de temos uma curva diferente de t e quando n ,
tende a Z.

174

Observao:
Suponha que se deseje estimar a varincia populacional atravs
da varincia da amostra. A expresso no tendenciosa do estimador
fica ento:

( X X )2
S2 =
n-1
A diviso por ( n 1) ao invs de n devido ao fato de S 2 ter
= n 1 graus de liberdade, pois para obter a estimativa referida tem-se
que adicionalmente obter a estimativa da mdia da amostra.
A figura abaixo ilustra comparativamente uma distribuio t e a
distribuio normal reduzida (Z):

Vemos que uma distribuio t genrica mais achatada e


alongada que a normal reduzida (Z). Quanto maior o valor de , mais
elevada a curva. A curva t simtrica com relao mdia .

175

Parmetros Caractersticos:
E(t) = 0

V(t) =
-2
Utilizao da Distribuio t-Student:
A distribuio t-Student vai ser utilizada em nosso curso para, dado um
valor de probabilidade de interesse( probabilidade notvel ), obter junto tabela
T-Student o seu ponto crtico. Esse processo importante na construo de
intervalos de confiana e testes de significncia com pesquisas com pequenas
amostras.
Exemplos:
a)Qual o valor de t bicaudal para um grau de liberdade = 10 e nvel de
significncia = 5%?
t = 2,228
b)Qual o valor de t monocaudal para uma amostra n = 26 e nvel de
significncia = 10%?
= 26 -1 = 25
t = 1,316

176

Teorema Central do Limite:


Seja X1; X2; X3; X4; ...; Xn uma sequncia de variveis independentes
com

E(Xi) = i e V(Xi) = 2i, i = 1, 2, 3, 4, ...,n.


Faamos:
Yn = X1 + X2 + X3 + X4 + ... + Xn

Ento, sob condies bastantes gerais, Yn tem no limite, n , uma


grande amostra, distribuio normal de mdia e varincia:
E(Yn) = i
V(Yn) = 2i
Teorema:
Seja uma sucesso de variveis aleatrias independentes com mesma
mdia e varincia e 2.
Faamos:
Yn = X1 + X2 + X3 + X4 + ... + Xn

X= ( X1 + X2 + X3 + X4 + ... + Xn ) / n
Pelo Teorema Central do Limite:

Yn ~ N ( n ; n2 ) e

~N ( ; 2 /n )

177

Interpretao do Teorema:
O Teorema Central do Limite garante que se estivermos trabalhando
com uma amostra muito grande ( n 30 ) e podemos obter uma quantidade
exaustiva dessas amostras de uma populao e calculamos a mdia dos
valores em cada amostra selecionada, o resultado ser uma distribuio de
frequncia de mdias. Esta distribuio de mdias ser uma Curva Normal.
O mesmo raciocnio vale para a distribuio de somas.
Consequncias:

O fato de que os valores da amostra possam ter qualquer


distribuio e a soma e mdia das amostras possam ser
aproximadamente normais torna possvel a Inferncia Estatstica

Paramtrica.
O Teorema Central do Limite torna possvel o clculo de
probabilidades de variveis aleatrias que sejam totais e mdias
sob a Curva Normal. Vejamos um exemplo.

178

Observao:
Como j estudamos, assumir a distribuio normal em pesquisa est
baseado em dois fundamentos:
1- Quando a distribuio da varivel de interesse na populao
normal;
2- Quando a distribuio da varivel de interesse na populao no for
normal, mas o tamanho da amostra for grande, pelo Teorema do
Limite Central.
Qualquer que seja a distribuio dos dados do pesquisador, se tiver uma
grande amostra(n), se pode utilizar com tranqilidade a curva normal como
uma aproximao adequada para anlise dos dados. Um tamanho de
amostra(n) igual a 30 j considerado um grande nmero se a distribuio da
populao for prxima da normal. Um tamanho de amostra bem maior ser
necessrio se a distribuio da populao no for normal.

Exemplo:
O QI de engenheiros: sujeitos com QI mediano ou baixo dificilmente
sero encontrados entre os engenheiros. Ento, para um estudo por
amostragem de QIS de engenheiros ser necessrio uma amostra muito bem
maior do que 30.

179

Exemplo:
Determinada pea, produzida em uma fbrica encaixotada em lotes de
250 peas. Os pesos das peas so aleatrios com mdia de 0,5 kg e
desvio-padro 0,1 kg . Containeres so carregados com 20 caixotes cada.
Qual a probabilidade de container ter peas pesando mais de 2510 kg?
Soluo:
= 0,5 kg e = 0,1 kg
Mdia total das peas por caixa T:
T = 250 . 0,5 = 125
Mdia total das peas por container TC:
TC = 125 . 20 = 2500
Varincia total das peas por caixa 2T:
2T = 250 . 0,01 = 2,5
Varincia total das peas por container 2TC:
2TC = 2,5 . 20 = 50

180

Definindo a varivel aleatria T como a soma dos pesos das peas de um


container, temos que pelo Teorema do Limite Central:

T ~N ( 2500; 50)
Pede-se:
P(T > 2510) =]
P[Z > (2510 2500/7,070] = P(Z > 1,41) = 0,5 0,4207 = 0,0793

181

Teorema das Combinaes Lineares:


A combinao linear de variveis aleatrias normais independentes
tambm uma varivel normal independente.
Se X e Y so variveis aleatrias normais independentes, ento:
Z = aX + bY + C tambm uma varivel aleatria normal independente
com
E(Z) = E(aX + bY + C) = aE(X) + bE(Y) + C
V(Z) = V(aX + bY + C) = a2V(X) + b2V(Y)
Concluso:
Z ~N[ E(Z); V(Z)]

Exemplo:
Um administrador de transportes estuda o fluxo de trfego no metr de
uma dada estao no Rio de Janeiro. Indica com Z o nmero de passageiros
que chegam a dado instante na estao. X, o nmero de passageiros que
chegam estao no trem. Registra o nmero Y de passageiros que
desembarcam na referida estao. O metr segue com N passageiros. As
variveis X, Y e Z so variveis aleatrias normais independentes, com tais
parmetros:
Z ~N[ 100; 81 ]
X ~ N [50; 144]
Y ~N [40; 400]
Especifique o modelo N, a distribuio de probabilidade de N e P(N > 70).

182

Soluo:
Modelo N:
N=Z+XY
Baseando-se no Teorema das Combinaes Lineares,

E(N) = E(Z+ X Y) = E(Z) + E(X) E(Y) = 100 + 50 40 = 110


V(N) = V(Z + X Y) = V(Z) + V(X) + V(Y) = 81 + 144 + 440 = 625
A distribuio de probabilidade de N:
N ~N [ 110; 625 ]
P( N > 70 ):
P( N > 70 ) = P( Z > 70 110/25) = P(Z> -1,6) = 0,5 + 0,4452 = 0,9452 ou
94,52%

-1,6

183

Modelo do Qui-quadrado ( 2):

Faz parte de uma famlia de distribuio de grande importncia em


diversos problemas da Inferncia Estatstica.
Seja a estatstica:

Se Xi so valores aleatrios independentes retirados de uma populao


normal de mdia e desvio-padro , dizemos, ento, que 2 tem distribuio
do qui-quadrado com graus de liberdade.
Portanto, uma qui-quadrado uma soma dos quadrados de n variveis
aleatrias normais padres.
Parmetros Caractersticos:

E(

2) =

V(

2) = 2

Propriedades:

o Como a varivel

2, uma soma de variveis aleatrias independentes

e igualmente distribudas, invocando-se o Teorema Central do Limite,


tem-se que a famlia de distribuies do tipo

2 tende a distribuio

normal, quando o nmero de graus de liberdade tende ao infinito.


o A soma de duas variveis independentes com distribuio do quiquadrado com 1 e 2 graus de liberdade respectivamente ter tambm

184

distribuio do qui-quadrado com 1 + 2 graus de liberdade. Esta a


chamada propriedade aditiva da qui-quadrado.
o Dependendo do grau de liberdade, a distribuio do qui-quadrado
assume as seguintes formas grficas:

A distribuio do qui-quadrado constitui uma famlia de curvas, cada qual


caracterizada pelos graus de liberdade e ela est tabelada em funo do
parmetro . O tipo mais comum a tabela unicaudal direita:

185

Observao:
Para uma dada probabilidade e para um dado , o corpo da tabela
fornece o valor de

2 0

tal que P(

>

2 0)

= , probabilidade esta

representada, na figura acima, pela rea hachurada.


Convm ressaltar que a distribuio do qui-quadrado tem as seguintes
diferenas em relao normal:

sempre positiva.
assimtrica.

A tabela fornece o valor do

2 a partir de uma probabilidade e

de certo nmero de graus de liberdade.


Exemplo:

Calcular o valor de

02, com = 20, tal que:

a) P(

2 > 02) = 5%

b) P(

2 > 02) = 95%

a)

= 0,05

02 = 31,4
= 20

186

b)
= 0,95

02 = 10,8
= 20
Modelo F de Snedecor:
Define-se a varivel F com 1 graus de liberdade no numerador e 2
graus de liberdade no denominador ou F(1, 2) por:

1
F =
2

Observao: A varivel sempre positiva.

187

A varivel F com 1 graus de liberdade no numerador e 2 graus de


liberdade no denominador tem a seguinte funo densidade de probabilidades:

22/2 . 11/2 X(1/2) - 1


F(1;2) =
(2 + 1X)(1+2)/2 . (1/21 ; 1/22)

Onde (1/21 ; 1/22) a funo beta:

(1/21 1)! . (1/22 1)!


(1/21 ; 1/22) =
(1/21 +1/22 1)!
Define-se a varivel F com 1 graus de liberdade no numerador e 2
graus de liberdade no denominador ao modelo de distribuio de probabilidades
que tem a seguinte funo densidade de probabilidades:

22/2 . 11/2 X(1/2) - 1


F(1;2) =
(2 + 1X)(1+2)/2 . (1/21 ; 1/22)

Onde (1/21 ; 1/22) a funo beta:

188

(1/21 1)! . (1/22 1)!


(1/21 ; 1/22) =
(1/21 +1/22 1)!

Parmetros Caractersticos:

2
E(F) = , 2>2
2 -2
222(1 + 2 2 )
V(F) = , 2 > 4
1(2 2 )2 (2 4)

Essa definio engloba, na verdade, uma famlia de distribuies de


probabilidades para cada par de valores (1, 2).
A distribuio encontra-se tabelada. Como ela depende de dois
parmetros (1, 2), so construdas vrias tabelas, cada uma delas
correspondentes a uma dada probabilidade (10%, 5%, 1%, etc), situada na
cauda direita da curva, como mostra a figura abaixo:

A tabela fornece o valor de F0, tal que:

189

P[ F(1, 2) F0 ] =
Exemplo:
Calcular o valor de F 0, com 1=10 e 2 = 15 graus de liberdade, que
superado com probabilidade de 5%.
Soluo:
Tabela F para 0,05 :

1 = 10

F0 = 2,54

2 = 15

Logo: P[ F0,05(10, 15) 2,54] = 0,05

190

Exerccios Propostos:
1)Uma moeda lanada 5 vezes seguidas e independentes. Calcule a
probabilidade de serem obtidas 3 caras nessas 5 provas?
2)Jogando-se um dado 3vezes, determine a probabilidade de se obter 4
no mximo 2 vezes.
3)A probabilidade de um atirador acertar o alvo 2/3. Se ele atirar5 qual a
probabilidade de acertar pelo menos 4 tiros?
4)A probabilidade de um consumidor acertar a marca de um determinado
refrigerante 1/3. Se o referido consumidor for consultado 5 vezes, qual a
probabilidade dele acertar 3 vezes?
5)Um grupo de clientes de uma Fast- food foram consultados para
responder (sim) ou (no) se esto satisfeitos com os servios da casa.
Sabe-se que 30% dos entrevistados responderam sim pergunta. Seis
pessoas so escolhidas ao acaso deste grupo. Qual a probabilidade de
terem sido escolhidas 3 pessoas que disseram (no) satisfao com o
servio?
6)No departamento de engenharia, a probabilidade de um funcionrio
chegar atrasado sempre constante e igual a 1/3. Em um ms corrido de
30 dias, qual a probabilidade deste funcionrio chegar atrasado 10 dias,
nenhum dia, no mximo quatro dias, e pelo menos 5 dias. Se ele perde a
cada dia que chega atrasado R$ 5,00 de seu salrio, qual o valor
esperado de sua perda no ms?

191

7)Figos maduros so embalados em caixas com 15 unidades cada.


Escolheu-se uma caixa ao acaso e verificou-se que havia 4 unidades
estragadas. Retirando-se da caixa 5 unidades, sem reposio, qual a
probabilidade de que:
a) contenham 3 figos estragados;
b) mais de 2 figos estragados;
c) pelo menos 1 figo estragado.
8)O grupo de um departamento composto por 5 engenheiros e 9
tcnicos. Se 5 indivduos forem aleatoriamente, e se lhes atribui um
projeto, qual a probabilidade de que o grupo do projeto inclua exatamente
2 engenheiros?
9)De 20 estudantes em uma classe, 15 no esto satisfeitos com o texto
utilizado. Se a uma amostra aleatria de 4 estudantes se perguntaram
sobre

texto,

determinar

probabilidade

de

que

estivessem

descontentes:
a) Exatamente 3;
b) No mnimo 3 estudantes.
10)Uma loja atende em mdia 2 clientes por hora. Calcular a
probabilidade em uma hora:
a) Atender exatamente 2 clientes;
b) Atender 3 clientes.

192

11) Suponha que haja em mdia 2 suicdios por ano numa


populao de 50.000 habitantes. Encontre a probabilidade de que
em um dado ano tenha havido:
a) 0
b) 1
c) 2
12) Suponha 400 erros de impresso distribudos aleatoriamente
em um livro de 500 pginas. Encontre a probabilidade que em
uma dada pgina contenha:
a) Nenhum erro;
b) Exatamente 2 erros;
13) Uma empresa deseja empacotar e amarrar com barbante
bem resistente pacotes de caf modo. Estuda a viabilidade de
usar certo tipo de barbante, cuja resistncia R uma varivel
aleatria distribuda sobre o intervalo fechado [ 50, 70 ].
Estabelecer a probabilidade P( R < 65 ).
14) As

interrupes no funcionamento de energia eltrica

ocorrem segundo um Poisson com mdia de uma interrupo por


ms (quatro semanas). Qual a probabilidade de que entre duas
interrupes consecutivas haja um intervalo de:
a) Menos de uma semana;
b) Entre dez a doze semanas;
c) Exatamente um ms;
d) Mais de trs semanas.

193

15) Uma mdia de 0,5 clientes por minuto chega a um balco.


Depois que o funcionrio abre o balco, qual a probabilidade de
que ele tenha que esperar pelo menos 3 minutos antes que
aparea o primeiro cliente?
16) Em mdia seis pessoas por hora se utilizam de uma caixaautomtica de um banco em uma loja de departamentos:
a) Qual a probabilidade de que se passem pelo menos 10
minutos entre a chegada de dois clientes?
b) Qual a probabilidade de que, depois da sada de um cliente,
no se apresente outro em pelo menos 20 minutos?
c) Qual a probabilidade de que chegue um segundo cliente dentro
de 1 minuto, aps a chegada do primeiro?
17) A idade dos respondentes a uma pesquisa de marketing
normalmente distribuda com mdia 35 anos e desvio padro 5
anos. Calcule a probabilidade de selecionar ao acaso deste grupo
um respondente com:
a) Mais de 40 anos;
b) Entre 40 e 45 anos;
c) Com menos de 40 anos;
d) Entre 30 e 45 anos.
18) Um grupo de donas de casa foram selecionadas a darem
notas sua satisfao quanto ao funcionamento de uma
determinada marca de cafeteira. As notas so normalmente
distribudas com mdia 5 e desvio padro 1. Calcule a
probabilidade de uma dona de casa selecionada ao acaso deste
grupo, tenha dado nota:
a) Maior que 3;
b) Menor que 4,5.
194

19) O tempo necessrio para o atendimento de uma pessoa em


um grande banco tem aproximadamente distribuio normal com
mdia 130 segundos e desvio padro 45 segundos. Qual a
probabilidade de um indivduo aleatoriamente selecionado
requerer

menos

de

100

segundos

para

terminar

suas

transaes?
20) Uma pessoa tem 20 minutos para chegar ao escritrio. Para
tal pode escolher entre 2 caminhos (X ou Y). Sabendo-se que o
tempo para percorrer o caminho X ~ N(18 ; 25) min e que o
tempo para percorrer o caminho Y~ N (19 ; 4) min. Qual a melhor
escolha?
21) Determinar os valores de t 1 para a Distribuio de Student
que satisfaam cada uma das condies:
a) rea entre tc e tc de 90% com = 25;
b) rea esquerda de tc de 2,5% com = 20;
c) Soma das reas direita de t c e esquerda de tc de 1% com
= 5;
d) rea direita de tc de 55%, com = 16.
22) Para uma distribuio de qui-quadrado com = 12 graus de
liberdade, determinar o valor de 02 de modo que:
a) P( 2 > 02) = 5%
b) P( 2 < 02) = 99%

195

23) Calcular o valor de F0, com 1 = 20 e 2 = 25 graus de


liberdade, que superado com probabilidade as seguintes
probabilidades:
a) 5%
b) 10%
c) 1%
24) Um computador ao adicionar nmeros, arredonda zero para o
inteiro mais prximo. Admita-se que todos os erros de
arredondamento sejam independentes e uniforme em [ -0,5 ;
0,5 ]. Se 1500 nmeros foram arredondados, qual a probabilidade
do erro total em mdulo ultrapasse a 15?
25) Uma urna contm 3 bolas numeradas com inteiros 1, 2, 3.
Sero sacadas n bolas uma a uma com reposio. Determine a
probabilidade de P { Xi < 200 }, onde Xi o nmero que
aparecer na i-sima extrao e 100 o nmero de extraes.
26)Certo produto tem peso mdio de 10g e desvio padro 0,5g.
embalado em caixas de 120 unidades que pesam em mdia 150g
e desvio padro 8g. Qual a probabilidade que uma caixa cheia
pese mais que 1370g?
27)Determinada mquina enche latas baseada no peso bruto
com mdia 1 kg e desvio padro 25 g. As latas tm peso mdio
de 90g com desvio padro 8g
Pede-se:
a) A probabilidade de uma lata conter menos de 870g de peso
lquido;
b) A probabilidade de uma lata conter mais de 900g de peso
lquido.

196

28) Um avio de turismo de 4 lugares pode levar uma carga til


de 350 kg. Supondo que os passageiros tm peso mdio de 70
kg com distribuio normal de peso e desvio padro 20 kg e que
a bagagem de cada passageiro pese em mdia 12 kg, com
desvio padro 5 kg e distribuio normal de peso. Calcular a
probabilidade de haver sobre carga se o piloto no pesar os 4
passageiros e respectiva bagagem?
29) Seja Y uma funo que Y = X 1 + X2 + X3 e as variveis so
independentes com as seguintes distribuies:
X1 ~N(10; 9)
X2 ~ N (-2 ; 4)
X3 ~N (5 ; 25)
Calcule P[Y > 15], E(Y) e V(Y).

197

Unidade IV
Distribuies por Amostragem
Conceitos de Distribuio por Amostragem:
Seja uma populao de N elementos da qual se quer extrair
todas as possveis amostras de tamanho n. Em cada amostra,
pode-se calcular uma mesma medida descritiva, como por exemplo,
mdia e proporo, da caracterstica investigada. O conjunto de
valores resultantes dessa operao nos d uma distribuio de
estimativas, que denominamos de Distribuio por Amostragem.
Exemplo:
Suponhamos

que

de

uma

populao

de

tamanho

possamos retirar um nmero mximo de n* amostras de tamanho n.


Em cada n* amostras calculemos

mdia

da

caracterstica

investigada. Teremos esto n* mdias, que forma a distribuio por


amostragem da mdia.
Observao:
n
N amostras, se o processo for com reposio;

CN, se o processo for sem reposio.

198

Distribuio por Amostragem da Mdia:


Seja a experincia:
De uma populao de mdia e varincia 2 de tamanho N,
vamos extrair todas as amostras possveis de tamanho n dessa
populao.
De cada amostra iremos calcular a mdia da caracterstica
investigada. Esta distribuio de mdias denomina-se:

Distribuio por Amostragem da X


Qual o modelo de probabilidade dessa distribuio? Qual a
mdia e o desvio-padro desta distribuio?
Se conhecermos o modelo de probabilidade assumido pela
distribuio amostral da estimativa, bem como o seu desvio-padro
poderemos

realizar

inferncias

para

parmetros

populacionais

desconhecidos.
Pelo

Teorema

das

Combinaes

Lineares,

pode-se

demonstrar que se a distribuio da populao for normal, a


distribuio obtida segundo a experincia acima tambm normal
com mdia e varincia 2/n, portanto:
_

X ~ N ( ; 2/n )
_
S(X)=2/n =/n denominado erro padro(EP) da mdia,
que fornece a base principal para a inferncia estatstica no que diz
respeito a uma populao com mdia desconhecida. Ento, o erro
padro da mdia pode ser assim expresso:
EP= 2/n = /n

Observao:
Se a distribuio da populao no for normal, mas a amostra
for suficientemente grande, resultar que a distribuio amostral da
mdia ser aproximadamente normal pelo Teorema Central do
Limite, tambm com mdia e varincia 2/n.
Exemplo:
Seja uma

populao

normal

constituda

dos

seguintes

elementos 2,3,4,5. Extrair todas as amostras de 2 elementos dessa


populao com reposio e determinar:
a)Mdia e varincia populacional;
b)Mdia e varincia da distribuio amostral das mdias.
Resoluo:

a) =( 2+3+4+5 ) / 4 = 3,5
2 = [(2-3,5)2+(3-3,5)2+(4-3,5)2+(5-3,5)2] / 4 = 1,25

b) E(X) = 3,5 e

V(X)=2/n= 1,25/2= 0,625

O erro-padro ser, ento: EP= 0,625 = 0,79


Pode-se

facilmente

verificar

validade

dos

resultados

obtidos acima. Para isso, basta levantar todas as amostras de


tamanho 2, com reposio. A seguir calcular a mdia da cada
amostra
amostrais:

e finalmente calcular a mdia e a varincia das mdias

Amostras Possveis:
2e2
2e3
2e4

3e2
3e3
3e4

4e2
4e3
4e4

5e2
5e3
5e4

2e5

3e5

4e5

5e 5

Mdias Amostrais
2,0 2,5 3,0 3,5
2,5 3,0 3,5 4,0
3,0 3,5 4,0
3,5 4,0 4,5

4,5
5,0

Nn = 42 = 16 amostras possveis.

Distribuio Amostral das Mdias:


Mdias

Freqncias

2,0
2,5
3,0
3,5
4,0
4,5
5,0

1
2
3
4
3
2
1

Total

16

O modelo de probabilidade da distribuio por amostragem da


mdia a curva normal, como comprova o histograma e polgono de
freqncia abaixo e como j havamos adiantado:

_
_
Calculemos E(X) e V(X) da distribuio amostral das mdias:
Mdias

Freqncias

Xi . f i

2,0
2,5
3,0
3,5
4,0
4,5
5,0

1
2
3
4
3
2
1

2,0
5,0
9,0
14,0
12,0
9,0
5,0

Total

16

56

X ifi
4,0
12,5
27,0
49,0
48,0
40,5
25,0
206,0

_
E( X) = 56/16 = 3,5=
_

206 (56)2/16

V(X) = = 10/16 = 0,625 =2/n


16
EP=0,625= 0,79=/n

Resolver

item

(b)

do

exemplo

amostragem
sem reposio:

Amostras Possveis:
2e3
2e4
2e5

3e4
3e5
4e5

anterior,

supondo

Mdias Amostrais:

2,5

3,5

3,0

4,0

3,5

4,5

Distribuio Amostral das Mdias:


Mdias

Freqncias

2,5
3,0
3,5
4,0
4,5

1
1
2
1
1

Total

_
_
Calculemos E(X) e V(X) da distribuio amostral das mdias:
Mdias

Freqncias

Xi . f i

2
X i .fi

2,5
3,0
3,5
4,0
4,5

1
1
2
1
1

2,5
3,0
7,0
4,0
4,5

6,25
9,00
24,50
16,00
20,25

Total

21

76

Neste caso:
_
E(X) =
_
V(X)

=2/n . [(N n)/(N 1)] fator de correo de

populao finita.

Ento:
_
E( X)= 21/6 = 3,5=
76 (21)2/6
_
V(X) =
6

= 2,5/6 = 0,417

Este resultado,ento, pode ser obtido diretamente pela


frmula abaixo:
2/n[(N n ) / (N 1)]
EP=0,417 = 0,65

Distribuio por Amostragem da Proporo:

Seja uma populao da qual se investiga a proporo ou


a freqncia relativa de uma determinada caracterstica de interesse.
Suponha que seja possvel selecionar desta populao todas
as amostras possveis de tamanho n, n 30.
Para

cada

amostra

obtida

verifica-se

proporo

da

realizao da caracterstica de interesse.


Se as propores observadas nas amostras colhidas
apuradas e

descritas

em

uma

distribuio

forem

de freqncia, o

resultado de tal operao a Distribuio por Amostragem da


Proporo.
Chamando de a proporo da caracterstica na populao e
p a proporo da caracterstica na amostra, pode-se demonstrar que :
p ~N[; (1 -)/n ]

S(p)=EP=( 1 -)/nerro padro da proporo.


Exemplo:
Seja uma populao formada hipoteticamente por 5 pessoas.
Se a pessoa fuma damos valor 1 a ela, se no fuma o valor 0. Ento
suponhamos o seguinte quadro populacional aps a observao: 0, 1
, 1 , 0 , 1. Extrair todas as amostras de 2 elementos dessa populao
com reposio e determinar:
a)A proporo populacional de fumantes e a varincia da
varivel fumante;
b)A mdia e a varincia da distribuio amostral da proporo.

Soluo:

a)=3/5 = 0,6
(00,6)2+(1- 0,6)2+(1 0,6)2+(0 0,6)2+(1- 0,6)2
2

= = 0,24
5

b)E(p) = = 0,6
V(p)= (1- )/n = (0,6 . 0,4)/2 = 0,12
EP=0,12= 0,35
Verificao:

Amostras Possveis:

0e0
0e1
0e1
0e0
0e1

1e1
1e0
1e1
1e0
1e1

1e1
1e0
1e1
1e0
1e1

0e0
0e0
0e1
0e1
0e1

1e1
1e0
1e1
1e1
1e0

Propores Amostrais:
0,0

1,0

1,0

0,0

1,0

0,5

0,5

0,5

0,0

0,5

0,5

1,0

1,0

0,5

1,0

0,0

0,5

0,5

0,5

1,0

0,5

1,0

1,0

0,5

0,5

Distribuio Amostral da Proporo:


Propores(p)

Clc
Valor
E(p)

Freqncias(fi)

0,0

0,5

12

1,0

Total

25

ulo do
Esperado
e da

Varincia V(p):

pi
0,0
0,5
1,0

fi
4
12
9

Total

pi . fi
0,0
6,0
9,0

25

pi2fi
0,0
3,0
9,0

15

12

E(P) = 15/25=0,6

12 ( 15)2/ 25
V(p)=
25

EP= 0,12= 0,35

= (12 9 ) /25 = 0,12

Distribuio por Amostragem das Somas ou Diferenas


de Duas Mdias Amostrais, Conhecidos os Desvios-padro
Populacionais:
_
Suponhamos

que

X1~N(1;

21)

X2~N(2;

22)

so

independentes, com:
__
__
X1~N(1; 21/n1) e X2~N(2; 22/n2)

Teremos, pois, que a distribuio

amostral das somas ou

diferenas ser uma normal com:


_
_
E[ X1 X2 ] = 1 2

1

V[X X ] = ( /n ) + ( /n )

O Erro-padro das diferenas de mdias :


_
1

_
2

S[X X ] = EP = ( /n ) + ( /n )
Observao:
Quando se sabe que 1 e 2 tm o mesmo valor, conhecido, o
erro padro da soma ou diferenas de mdias fica:
_
_
S[X1 X2 ] = EP= (1/n1)+ (1/n2 )

Exemplo:
Uma empresa tem duas filiais(A e B), para as quais os
desvios- padro das vendas dirias so 5 e

3, respectivamente.

Uma amostra de 20 dias forneceu uma venda mdia diria de 40


peas para a filial A e 30 peas para a filial B. Q ual o erropadro da distribuio por amostragem da diferena de mdias das
vendas nas duas filiais?
Soluo:
_
_
S[X1 - X2 ] =( 21/n1) + ( 22/n2 ) = ( 25/20) + ( 9/20)=
= 1,7=1,30.
Distribuio por Amostragem das Somas ou Diferenas
de Duas Mdias Amostrais, No sendo Conhecidos os
Desvios-padro Populacionais, mas Supostamente Iguais:

Suponhamos agora que no conhecemos os desvio-padro


das duas populaes, mas podemos admitir que esses desviospadro so iguais, ou seja, 1= 2= .
Nesse caso, devemos substituir, na expresso do erro-padro
do caso anterior, o desvio-padro desconhecido por uma estimativa
S. Como temos duas amostras, devemos utilizar os resultados de
ambas ao realizar essa estimao. Logo a estimativa da varincia 2:

S2p=

(n1-1)S21 + (n2-1)S22

n1+ n2 - 2

Esta a mdia ponderada das varincias amostrais.


2

Devemos usar a t-student relacionada com a estimativa S , a


qual tem =( n1 + n2 - 2 ) graus de liberdade.
A distribuio por amostragem da soma ou diferena de
mdias uma t-student, com =( n1+ n2 2).
Observao:
Se o grau de liberdade da estatstica t for suficientemente
grande,

podemos

utilizar

distribuio

normal

associada

distribuio por amostragem da soma ou diferena de mdias,


quando os desvios

padro so desconhecidos e supostamente

iguais.
_

E[ X1 X2 ] = 12
_ _
V[X1 X2 ] = (S2p / n1) + (S2P/n2 )
O erro-padro ento:
__ __
S[X1 X2 ] = EP= (S2p / n1) + (S2P/n2 ) = Sp(1 / n1)+ (1/n2)

Exemplo:
De uma grande turma extraiu-se uma amostra de quatro notas:
64, 66, 89 e 77. Uma amostra independente de trs notas de uma
segunda turma foi: 56, 71 e 53. Se

razovel admitir que as

varincias das duas turmas sejam aproximadamente iguais, qual o


erro padro da distribuio por amostragem da diferena de
mdias?

Soluo:
Os resultados dos clculos da mdia e dos desvios-padro
das notas para cada amostra so:
__
X1= 74
S1= 11,52
__
X2= 60
S2= 9,64
(n1-1)S21 + (n2-1)S22

S p=
2

n1+n2-2

S2p=

(4 1 ).132,71 + (3-1)92,93

4+3-2
S2p= 583,99 / 5 = 116,80
Sp = 116,80 = 10,81

O erro-padro da distribuio por amostragem da diferena :


_
_
S[X1 - X2 ] = EP= Sp(1/n1)+(1/n2 ) =10,811/4+1/3 = 8,26.

Distribuio por Amostragem das Somas ou Diferenas


de Duas Mdias Amostrais, No Sendo Conhecidos os
Desvios-padro

Populacionais,

mas

Supostamente

Desiguais:
Suponhamos agora que no conhecemos os desvio-padro
das duas populaes, mas no podemos

admitir que esses

desvios- padro so iguais, ou seja,1 2


Nesse caso, devemos substituir, na expresso do erro-padro
da soma ou diferena de

mdias,

os

respectivos

erros-padro

amostrais.
A expresso do erro-padro no caso em questo fica:
_
_
S[X1 X2 ] =EP= (S21 / n1) + (S22/n2 )
A distribuio por amostragem da soma ou diferenas de
mdias no caso em que as varincias so desconhecidas e
supostamente distintas ter distribuio aproximadamente normal se o
grau de liberdade da estatstica t for suficientemente grande ou tstudent, em caso contrrio.
Se usarmos a t-student, o nmero de graus de liberdade
calculado por:

( V 1 + V 2 )2
= - 2
V12/(n1+1) + V22/(n2+1)
Onde:
V1 = S12/n1
V2= S22/n2

Exemplo:

De uma pequena classe do curso do ensino mdio pegou-se


uma amostra de

4 provas de matemtica e obteve: mdia=81,

varincia=2. Outra amostra, de 6 provas de


mdia=77,varincia=14,4.

Suponhamos

biologia,
que

as

forneceu:
varincias

populacionais so supostamente diferentes, qual o erro-padro


desta estimativa?
Soluo:
O erro-padro, ento fica:
_ _
S[X1 - X2 ] = EP=(2 / 4)+(14,4/6 )= 1,70

Distribuio

por Amostragem da Diferena de Mdias

quando as Amostras so Emparelhadas:


Dizemos

que

os

resultados

considerados dados emparelhados,

de

quando

duas

amostras

esto

so

relacionados

dois a dois, segundo algum critrio. O referido critrio, embora


possa ter influencia igual sobre os valores de cada par, pode
influenciar bastante sobre os diversos pares.
O emparelhamento fere um dos pressupostos bsicos de uma
anlise de diferena de mdias entre amostras: a independncia das
observaes, comprometendo a credibilidade do resultado do teste
realizado.
Para isolar o efeito do emparelhamento ou dependncia das
amostras utilizado o processo de transformar as duas amostras em
uma, calculando a diferena entre o valor observado da medida antes
menos o valor da medida depois, isso para cada observao. Com a
estimativa do erro-padro da mdia das diferenas calculadas
possvel construir intervalos de confiana e realizar testes de

significncia.

Exemplo:
Imaginemos que estamos de posse de 15 peas usinadas, as quais
so inicialmente pesadas. Em seguida

tais peas so colocadas num

tanque que contm um agente erosivo, por um tempo prolongado, e,


ao final, elas so novamente pesadas. Desejando obter concluses sobre a
diminuio de peso das peas, devida ao ataque da eroso, as peas
devem ser identificadas(por exemplo, por uma codificao) e teremos, pois,
ao final do experimento, duas amostras de valores do tipo antes e depois
e os dados so considerados emparelhados, pois cada valor da 1 amostra
estar perfeitamente associado ao respectivo valor da 2 amostra.
Observao:
Sempre que possvel e justificvel devemos sempre promover a
transformao das duas amostras em uma, quando os dados so
emparelhados, pois teremos uma informao adicional, que levar a
resultados estatisticamente mais fortes.
Exemplo:
Se quisermos saber o quanto o agente tem poder erosivo, no
devemos somente interpretar o quanto os pesos dos dados da 2 amostra
em mdia so pequenos, mas sim, relacion-los com os pesos que tinham
na 1 amostra.
Havendo emparelhamento, calculamos a diferena di, para cada par
de valores, recaindo assim numa nica amostra de n diferenas.

claro

que, neste caso, as duas amostras so de mesmo tamanho, ou seja,


n1=n2=n.
Definindo a mdia de di por:
__

d=di /n

Ento, se as amostras so emparelhadas, a distribuio por


amostragem tem os seguintes parmetros:
__
E(d)= d
__
S[d] = EP= Sd / n
onde:
__
S2d=( di d )2 / (n- 1)

A distribuio por amostragem da diferena de mdias


para amostras emparelhadas tem distribuio t-student com =(n-1).
Exemplo:
A tabela abaixo indica as vendas de um produto em 2 pocas
do ano( I e II ) em cinco supermercados. Qual o erro-padro para a
diferena de mdias?

Supermercados

Vendas na poca 1

14

20

11

12

10

Vendas na poca 2

16

16

10

Soluo:
A partir dos dados, obtemos:
Supermercados

di

(di-d)

(di-d)2

10

7,6

57,76

1,6

2,56

-0,4

0,16

-4

-6,4

40,96

-2,4

5,76

12

107,2

d = 12/5 = 2,4

Sd = 107,2/4 = 26,8 = 5,18


_ _
S[X1 - X2 ] = EP= 5,18 /5 = 2,31

Distribuio por Amostragem para a Soma ou Diferena de


Duas Propores:
Se a proporo amostral p1~N[p1; (p1q1)/n1] e p2~N[p2; (p2q2)/n2],
vlidas quando n30, ento a distribuio amostral das diferenas ou
somas ser aproximadamente normal com:
E[p1 p2] =1 2

V[p1 p2]= (p1q1)/n1+ (p2q2)/n2

S[p1 p2]=EP=(p1q1)/n1 + (p2q2)/n2


Dessa forma,
p1 p2~ N[12; (p1q1)/n1+(p2q2)/n2]

Observao:
Quando no conhecemos os valores de 1 e 2, que so
parmetros populacionais e n 30, substitumos 1 por p1 e 2 por
p2.

Exemplo:
Num levantamento de opinio pblica para previso de uma
eleio, foram ouvidos 500 eleitores escolhidos ao acaso na cidade
A, onde 236 declararam que iriam votar num certo

candidato.

Na

cidade B, foram ouvidos outros 500 eleitores onde 200 declararam


que iriam votar no candidato em questo. Qual a estimativa do
erro- padro da diferena de propores?
Soluo:
Como as propores populacionais so desconhecidas, vamos
substitu-las pelas respectivas propores amostrais e o erro- padro
da estimativa das diferenas de proporo fica:
V[p1-p2]=(0,47.0,53)/500+(0,40.0,60)/500=0,0004982+0,00048=
0,0009782
S[p1 - p2]= EP=0,0009782 = 0,031

Distribuio por Amostragem da Varincia(S2):

O conhecimento das distribuies

2 nos

leva determinao

da distribuio por amostragem da estatstica S2:

i=1

Xi -

( Xi -) 2
=
2

Substituindo por

_
X

na expresso acima, temos que a

estatstica tem distribuio 2 com = n-1 graus de liberdade.

Podemos escrever:

Xi X

i=1

(X i -X)2
=
2

Podemos escrever:

( Xi -X)2
i=1

2n-1

=
2
Multiplicando e dividindo por (n-1) a expresso no se altera,

ento:

( Xi -X)

i=1

n-1

=
2
Donde deduzimos:

( n-1) S2
2n-1 =
2
Tirando o valor de S2:
2
S2 =

2n-1

( n-1)

(n-1)
.
(n-1)

Vemos, pois, a menos de uma constante, a estatstica S 2,


varincia de uma amostra extrada da populao normalmente
distribuda se comporta conforme uma distribuio do qui-quadrado
( 2n-1) com =n-1 graus de liberdade.
Pode-se provar que seus parmetros caractersticos so:
E(S2)=2
2. 4
V(S2)=
n-1

EP = S[S] = (2. 4)/n-1

Distribuio

por

Amostragem

do

Quociente

de

Duas

Varincias(S21/S22):
Suponhamos que duas amostras independentes retiradas de
populaes normais com mesma varincia 2 forneam varincias
amostrais S21 e S22 com, respectivamente, n1 e n2 elementos e que
desejamos conhecer a distribuio amostral do quociente S21/S22.
Temos que:

2n-1

( n1-1)

S21/S22 =

2n-1

( n2-1)

n1-1

( n1-1)

S21/S22 =
1
2
n2-1
( n2-1)
Lembrando que uma varivel aleatria tem distribuio F com
1 graus de liberdade no numerador e 2 graus de liberdade no
denominador se for dada por:

21/1
F 1 2 =
22/2

Constatamos, portanto, que a distribuio por amostragem do


quociente de duas varincias segue a distribuio F com 1 graus de
liberdade no numerador e 2 graus de liberdade no denominador. A
expresso uma F(n1-1), (n2-1).
Alm da normal(Z), as distribuies

, t e F so de grande

importncia para a soluo dos problemas da Estatstica Inferencial.

Exerccios Propostos:

1)Uma populao consiste de cinco nmeros: 2 , 3 , 6, 8, e 11.


Consideremos todas as amostras possveis de 2 elementos que
dela podemos retirar, com reposio:
Determinar:
a)A mdia e o desvio padro da populao;
b)A mdia e o desvio padro da distribuio amostral das mdias;
c)Verificar as relaes numricas entre a mdia , a varincia e o
desvio padro populacional e amostrais .
2) Seja uma populao formada hipoteticamente por 4 pessoas. Se a
pessoa tem a inteno de votar no candidato A damos valor 1 a ela,
se no, o valor 0. Ento, obtivemos

os

seguintes

quadro

populacional aps a o bservao: 1,1,0,1. Extrair todas as amostras


de 2 elementos dessa populao com reposio e determinar:
a)A mdia e o desvio padro da populao;
b)A mdia e o desvio padro da distribuio amostral das propores;
c)Verificar as relaes numricas entre a mdia , a varincia e o
desvio padro populacional e amostrais .
3)Suponha que a mdia de uma populao bastante grande seja
=50,0 e o desvio padro =12,0. Determinar a distribuio amostral
das mdias das amostras de tamanho n=36 em termos de valor
esperado e de erro padro da distribuio em
reposio.

amostragem com

4)No exerccio anterior, considere agora amostragem


sem reposio e N=1000, obtenha o valor preciso do erro padro da
mdia.
5)Um auditor toma uma amostra aleatria de tamanho n=16 de um
conjunto de N=100 contas a receber. No se conhece o desvio
padro dos valores das 100 contas a receber. Contudo, o desvio
padro da

amostra S= R$ 57,00. Determinar o valor do erro

padro da distribuio de amostragem da mdia .


6)Um auditor toma uma amostra de n=36 de uma populao de
1.000 contas a receber. O desvio padro desconhecido, mas o
desvio padro da amostra S= R$ 43 ,00. Se o verdadeiro valor da
mdia da populao de contas a receber = R$ 260,00, qual a
probabilidade de que a mdia da amostra seja menor ou igual a R$
250 ,00 ?
7)O valor mdio das vendas de um determinado produto durante o
ltimo ano foi de = R$ 3400,00 por varejista que trabalha com o
produto, com um desvio padro de = R$ 200,00. Se um grande
nmero de

varejistas trabalha com o produto, determinar o erro

padro da mdia para uma amostra de tamanho n=25.


8)Uma empresa de pesquisa de mercado faz contato com uma
amostra de 100 homens em uma grande comunidade e verifica que
uma proporo de 0,40 na amostra prefere lmina de barbear
fabricadas por seu cliente em vez de qualquer outra marca.
Determinar a distribuio amostral da proporo em termos de valor
esperado e de erro padro .

9)Um administrador de uma universidade coleta dados sobre uma


amostra aleatria de mbito nacional de 230 alunos de cursos de
administrao de empresas e encontra que 54 de tais estudantes
tm diploma de Tcnico

de

Contabilidade.

Determinar

distribuio amostral da proporo em termos de valor esperado e de


erro padro.
10)Em uma grande rea metropolitana em que esto localizados
800 postos de gasolina, para uma amostra aleatria de 30 postos, 20
comercializam um determinado leo lubrificante que tem publicidade
nacional. Determinar a distribuio amostral da proporo em termos
de valor esperado e de erro padro.
11)Uma indstria fabrica dois tipos de pneus. Numa pista de teste, os
desvios-padro das distncias percorridas, para produzir certo
desgaste, so de 2500 km e 3000 km. Tomou-se uma amostra de
50 pneus do 1 tipo e 40 do 2 tipo, obtendo mdias de 24.000km e
26.000km, respectivamente. Qual o erro-padro da estimativa da
diferena de mdias?
12)Uma mquina automtica enche latas, com base no peso lquido,
com um desvio-padro de 5 kg. Duas amostras independentes,
retiradas em

dois perodos

de trabalhos consecutivos, de 10 e 20

latas, forneceram pesos lquidos mdios de

184,6 e 188,9 g,

respectivamente. Qual o erro-padro para a diferena de mdias


entre as duas amostras?
13)Duas amostras de barras de ao, ambas de tamanho n=5, foram
ensaiadas e obteve-se que as resistncias mdias foram de 55
kgf/mm2 e 53 kgf/mm2 e as varincias das resistncias foram de 7,5
e 5,0kgf/mm2, respectivamente. As varincias so desconhecidas,
mas supostamente iguais. Para testar a hiptese de que as

mdias

populacionais so iguais, qual o modelo de distribuio por


amostragem da estimativa da diferena de mdias assumido e qual o

erro-padro desta estimativa?


14)A mdia de salrios semanais para uma amostra de n=30
empregados em uma grande firma

R$ 1800,00, com desvio-

padro R$ 140,00. Em uma outra grande empresa, uma amostra


aleatria de n=40 empregados apresentou um salrio mdio semanal
de R$1700, 00, com um desvio-padro de R$ 100,00. As varincias
populacionais so desconhecidas, mas supostamente desiguais.
Qual o erro-padro para se estimar a diferena entre os salrios
mdios das duas firmas?
15)De uma populao animal escolheu-se uma amostra de 10
cobaias. Tais cobaias foram submetidas ao tratamento com uma
rao especial por um ms. Na tabela a seguir, esto mostradas os
pesos antes(Xi) e depois(Yi) do tratamento, em Kg. Qual o erropadro da diferena de mdias?

Cobaias

10

Xi

635

704

662

560

603

745

698

575

633

669

Yi

640

712

681

558

610

740

707

585

635

682

16)Num inqurito com os telespectadores de televiso de uma


cidade, 60 de 200 homens desaprovam certo programa, acontecendo
o mesmo com 75 de 300 mulheres. Qual o erro- padro da
diferena das propores para testar se h uma diferena real entre
as opinies de homens e mulheres?

Unidade V
Estimao
Estatstica Inferencial:
a parte da Estatstica que tem o objetivo de estabelecer nveis
de confiana da tomada de deciso de associar uma estimativa
amostral a um parmetro populacional de interesse.
A inferncia estatstica paramtrica utiliza processos estatsticos
e probabilsticos para testar a significncia de estimativas calculadas
em uma amostra aleatria.
Exemplo 1:
Suponha que tivssemos interesse na renda mdia dos
habitantes de uma cidade. Para investigar o seu valor, optou-se por um
estudo por amostragem. Na amostra colhida, verificou-se uma
estimativa de R$ 800,00 para a renda mdia dos habitantes da cidade.
Com base nesta estimativa, o que se pode dizer do parmetro
populacional correspondente?
Exemplo 2:
Suponha

que

tivssemos

colhido

uma

amostra

de

50

contracheques de um total de 2000 funcionrios de uma grande


empresa, e obtivssemos a porcentagem de pessoas que tiveram
descontos por falta ou atrasos num ms considerado. funo da
estatstica inferencial determinar se este resultado encontrado em 50
trabalhadores estatisticamente significante, isto , no fruto de uma
amostra ingrata e, um valor prximo do que se encontraria se
tivssemos usado a populao toda para realizar o clculo.

A Estatstica Inferencial realiza, portanto, concluses sobre


parmetros populacionais de interesse atravs da informao da
amostra desta populao. um processo de induo, porque atravs
do particular (amostra) tiram-se generalizaes sobre o todo
populacional.

Diviso da Inferncia Estatstica:


A Inferncia Estatstica tem dois problemas bsicos :
o A Estimao.
o O Teste de Significncia.
Estimao:
Processo inferencial pela qual se toma o valor de um
parmetro populacional de interesse pelo valor de uma estimativa
ou um intervalo de estimativas amostrais considerados. lgico,
que o que se obtm um valor ou um intervalo de valores que
so aproximaes do parmetro populacional desconhecido.
A estimao muito usada como estgio inicial para a
realizao de testes de significncia.
Estimador:
uma frmula, funo dos elementos amostrais, usada para
a estimao de um parmetro populacional desconhecido e de
interesse. qualquer funo das observaes amostrais.
Exemplo:
_
X = Xi / n um estimador da mdia populacional . .

Estimativa:
o valor numrico obtido pela aplicao do estimador a uma
amostra selecionada.
Exemplo:
_
X=Xi/n um estimador utilizado para estimar uma mdia
populacional

desconhecida.

Dessa

populao

retirou-se

aleatoriamente uma amostra cujos resultados foram estes:


5 , 6 , 6, 7
Clculo da estimativa:
_
x= (5+6+6+7)/4 = 6 uma estimativa da mdia populacional
desconhecida.
Tipos de Estimao:
oEstimao Pontual
oEstimao por Intervalo(Intervalos de Confiana).
Estimao Pontual:
Quando a partir de uma amostra, procura-se tomar o valor do
parmetro

populacional

desconhecido

por

um

geralmente a correspondente estatstica amostral.

nico

nmero,

Exemplo:
Deseja-se tomar a porcentagem de negros em uma dada
universidade() pela porcentagem de negros calculada em uma
amostra convenientemente selecionada(p).
Estimao por Intervalo:
Quando a partir de uma amostra, procura-se tomar o valor
do parmetro populacional desconhecido por um conjunto ou intervalo
de estimativas,

intervalo este com alta probabilidade de conter o

parmetro populacional desconhecido.


Exemplo:
Deseja-se tomar a porcentagem de negros em uma dada
universidade por um intervalo de porcentagens de negros obtido
com base na informao de uma amostra

aleatria.

Assim

porcentagem de negros deve est no intervalo de 1% 5% na


universidade, com 95% de certeza.

Qualidades de um Estimador:
^
^
Vamos supor dois estimadores 1 e 2 do mesmo parmetro
populacional.
Qual o melhor?
Para essa resposta surgem dois problemas a saber:

1)Nunca poderemos conhecer o verdadeiro valor de , sendo


assim no poderemos afirmar que:
^

2 mais correto que 1 e vice-versa


2)Se tivermos os dois estimadores acima, uma forma de
decidir qual deles o melhor estimador pontual para , utilizar
o critrio das qualidades de um estimador: aquele que reunir o
maior nmero dessas qualidades deve ser o escolhido.
Vejamos:
1) Estimador no-tendncioso, Justo ou Acurado:
aquele cujo valor esperado da sua distribuio amostral
o prprio valor do parmetro populacional desconhecido:

^
E( )=

Exemplo:
_
X=X/n um estimador justo de , como j havamos
mostrado na unidade anterior, em distribuio por amostragem da
mdia, pois :
_
E(X) =
2)Consistente ou Convergente:
^
um estimador consistente ou coerente se a seguinte regra
for verificada:
^
Se E( ) =

Se lim V() = 0
n

Ento, um estimador consistente para . Esta qualidade


tambm chamada de Lei dos

Grandes

Nmeros/Regularidade Estatstica dos Resultados.

3 ) Eficiente ou Preciso:

Sejam 1 e 2 dois estimadores justos de um parmetro


populacional . Ser mais eficiente aquele cuja varincia de sua
distribuio amostral for menor.

Exemplo:
Observando o grfico abaixo:

Responda:
a)Quais os estimadores justos de ?

b)Qual(is) o(s) estimador(es) viezado(s) de ?

c)Qual o estimador eficiente de ?

Erro Mdio Quadrtico (EMQ):


Com certo esforo matemtico possvel mostrar que o erro mdio
quadrtico a expresso abaixo:

^
^
EMQ = {V( ) + [ E( ) -]2 }

Onde:
^
^
V( ) varincia da distribuio amostral de .
^
^
E( ) esperana da distribuio amostral de .
valor hipottico do parmetro populacional .

Observao:

^
V( )mede a eficincia ou preciso do estimador.

^
[ E( ) -] mede a tendncia ou acurcia do estimador.

Interpretao e uso do EMQ:


o Um estimador preciso aquele que tem varincia pequena,
tendendo zero.
o Um estimador acurado aquele que tem tendncia indo zero.
Um estimador acurado e preciso implica em um EMQ pequeno.
o Quanto menor o valor do EMQ de um estimador, maior ser a
qualidade do estimador em estudo.
Exemplo:
Tm-se duas frmulas distintas

para

populacional. Para ajudar a escolher

estimar

um

parmetro

o melhor, simulou-se uma

situao onde =100. Desta populao, retiraram-se 1.000 amostras de


10

unidades cada uma e aplicaram-se ambas as frmulas s 10

unidades da cada amostra. Desse modo, obtm-se 1.000 valores para


a primeira frmula(t1) e outros 1.000 valores para a
frmula(t2), cujos estudos descritivos
Qual

das duas

estimar ? Por qu?

segunda

esto resumidos abaixo.

frmulas voc acha mais conveniente para

Valores descritivos
Mdia
Varincia
Mediana
Moda

Frmula 1 (t1)
102
5
100
98

Frmula 2 (t2)
100
10
100
100

Soluo:
EMQ(t1) = 5 +( 102-100)2 = 9
EMQ(t2) = 10 +( 100 100 )2 = 10
Concluso:
A frmula 1 oferece o melhor estimador, pois tem EMQ
menor, apesar do estimador ser tendencioso.

Conceitos de Intervalos de Confiana:


Intervalo de Confiana, ao contrrio da estimativa pontual,
estabelece um conjunto de estimativas para o parmetro e objetiva
informar sobre o valor do mesmo.
Portanto,

estimao

pontual

estabelece

apenas

uma

estimativa para o parmetro populacional. J a estimao intervalar


indica para o valor do parmetro populacional um intervalo, um
conjunto de estimativas. Este conjunto de estimativas estabelece
vrias alternativas para o valor alvo desconhecido e apresenta cada
vez mais estimativa medida que a confiana requerida aumenta.
Cada estimativa includa no intervalo de confiana uma informao a
mais a respeito do valor do parmetro.
A confiana da estimao intervalar tem a ver com o nmero de
estimativas que ser quer disponibilizar para se conhecer ou se ter
informao sobre o parmetro. Quanto maior a confiana arbitrada,
mais largo ento ser o intervalo de confiana, fornecendo assim um
leque maior para valores aceitveis, possveis para o parmetro, isto
, um conjunto maior de estimativas que informe o valor provvel do
parmetro.
Uma estimao intervalar que envolva um erro padro grande
precisar de um nmero maior de estimativas para o parmetro do que
um estudo intervalar que envolva estimativas para o erro padro
menor.
A distncia mdia das estimativas ao parmetro medida pelo
erro padro. Portanto, a amplitude do intervalo de confiana tambm
depende do erro padro. Um intervalo de confiana com um erro
padro pequeno para as estimativas ter uma amplitude menor do que
um intervalo de confiana com erro padro grande, com mesma
confiana estabelecida. Quer dizer, um intervalo de confiana com um
erro padro pequeno ter um conjunto de estimativas aceitveis para o
parmetro menor que um intervalo de confiana que envolva
estimativas com um erro padro maior, ambos com mesmo nvel de
confiana arbitrado.

Concluso: a amplitude do intervalo de confiana, isto , o


conjunto de estimativas que informam sobre o parmetro,
diretamente proporcional confiana estabelecida e ao erro padro
das estimativas do parmetro.
Vem que um intervalo construdo em torno de uma estimativa
pontual, com base no erro padro e na teoria da probabilidade, que
informa com grande certeza o domnio em que deve est o
parmetro populacional desconhecido.
Esta certeza quantificada em termos de probabilidades e,
chamada de confiana do intervalo().
J a probabilidade do intervalo no conter o parmetro
populacional desconhecido chamado nvel de significncia (), que
igual a 1- .
As confianas mais utilizadas so 68%, 90%, 95% e 99%, e so
chamadas de intervalos de confiana notveis. Consequentemente
os nveis de significncia mais utilizados so: 32%, 10%, 5% e 1%.
Nos exemplos e exerccios propostos neste livro, quando no se
indicar, o nvel de significncia a ser adotado de 5%.

Expresso dos Intervalos de Confiana:

A expresso de intervalo de confiana origina das leis das


probabilidades que configuram as curvas das distribuies por
amostragem das estimativas envolvidas na construo da estimao
intervalar. Neste momento, necessrio assumir uma distribuio de
probabilidade terica para a distribuio de estimativas de parmetros
para inferncia estatstica.
Exemplo:
Para estimar a mdia populacional podem-se retirar vrias
amostras diferentes que podem gerar vrias estimativas pontuais
diferentes.
Se a amostra for representativa da populao, ela tende gerar
valor prximo do parmetro populacional, mas no igual.
A estimativa pontual baseada em uma nica amostra. Ento o
quo prximo o valor encontrado est prximo do parmetro
populacional? No h como saber se a amostra coletada foi extrada
da cauda inferior ou superior da curva de frequncia.
Logo, para se ter confiana de estimar o verdadeiro parmetro
populacional, gera-se um intervalo de possveis valores para o
parmetro populacional, a partir do valor encontrado da amostra.
Quanto

maior

amplitude

do

intervalo,

maior

confiana(probabilidade) de estimar corretamente o verdadeiro valor


do parmetro.

Na estimao da mdia populacional desconhecida, temos que


o modelo de probabilidades da distribuio amostral das mdias segue
via de regra Curva Normal.
Vejamos:

X -
Z =
mdia

X - = Zmdia

Tirando o valor de X , vem:

X = + Zmdia

A distncia + Zmdia simtrica distncia - Zmdia .


Por exemplo, na distribuio por amostragem da mdia, fato,
lei, que 95% destas estimativas caiam no intervalo de 1,96mdia a
+ 1,96mdia .

95%

xbarra
-1,96mdia +1,96mdia

Temos que:

1,96mdia X + 1,96mdia .
Vem que:
1 )

1,96mdia X + 1,96mdia .

1,96mdia X, tirando o valor de :

X + 1,96mdia
2 )

1,96mdia X + 1,96mdia .

X + 1,96mdia, tirando o valor de :

X 1,96mdia

Concluso:
O conjunto das 95% das estimativas da distribuio por
amostragem da mdia amostral que estimaro a mdia populacional
deve estar neste intervalo:

X 1,96mdia X + 1,96mdia .
Como Achar o Valor de Z para cada Confiana Arbitrada?

Se o analista deseja, ento, construir um intervalo de confiana


que tome para a mdia populacional 95% das estimativas geradas por
sua distribuio por amostragem, o pesquisador ter que descobrir
quem Z na expresso acima e isso facilmente informado pela
tabela da curva normal padro e tambm calcular mdia, que o
valor do erro-padro da mdia, dado por /n.
Para descobrir quem o valor de Z que deixa 95% das mdias
amostrais em tornu de , basta dividir 0,95/2=0,475 e procurar no
miolo da tabela da curva normal qual resultar no valor informado de
1,96.
A expresso do intervalo de confiana para fica ento:

X 1,96mdia
Que decorre,

P[X 1,96mdia X + 1,96mdia] = 95%

Para 68% fcil constatar que o valor de Z=1,0; para 90%,


Z=1,65 e para 99% de confiana o valor Z=2,58.

Logo, o intervalo de confiana para mdia segue a expresso


geral:
_
X Zmdia
_
X Z(n)
_

X - Z(n) X + Z(n)

Portanto, as expresses dos intervalos de confiana se baseiam


na relao dos ponto crticos das distribuies de probabilidades das
estatsticas e dos erros padres das estimativas.

Intervalo de Confiana para a Mdia , quando


Conhecido:
Quando a varivel populacional for normal, pelo Teorema
das Combinaes Lineares, a distribuio amostral da mdia
ser normal e o intervalo de confiana para mdia, como j havamos
demonstrado em pargrafos acima, ser:

_
X z (/n) X + z ( /n)
Exemplo:
Em uma pesquisa de mercado, feita junto a16

pessoas

selecionadas aleatoriamente, revelou que o salrio mdio dos


entrevistados de R$ 1.200,00.

desvio padro histrico da

populao R$ 200,00. Qual o intervalo de confiana de 95% para


a mdia de salrios de todo o mercado considerado?
Soluo: Obteno de Z:
95% tabela da normal padro procurar no miolo da tabela
a rea de 0,95/2= 0,4750, logo Z = 1,96
Intervalo de Confiana:
1200 1,96 .( 200/16) 1200 + 1,96 .( 200/16)
1200 981200 + 98
R$ 1102 R$ 1298

Concluso:
O salrio de todo o mercado deve est entre R$ 1.102,00 <<
R$1298,00 com 95% de certeza.

Intervalo de Confiana para a Mdia ,quando


Desconhecido, mas o Tamanho da Amostra Grande, n
30:
Quando o desvio padro populacional for

desconhecido

no podemos garantir a utilizao da normal padro, pois o que se


tem

disponvel, associado distribuio amostral da mdia,

desvio padro amostral S. Contudo, ainda neste caso, podemos


aceitar a hiptese da normalidade da distribuio amostral da mdia,
recorrendo-se ao Teorema Central do Limite.
Assim:
_
_
X z (S/n) X +z (S/n)
Exemplo:
Em uma pesquisa de mercado, feita junto a 100 pessoas
selecionadas aleatoriamente, revelou que o

salrio

mdio dos

entrevistados de R$ 1.200,00 e o desvio padro R$ 200,00. Qual


o intervalo de confiana de 95% para a mdia de salrios de todo o
mercado considerado?
Soluo: Obteno de Z:
95% tabela da normal padro procurar no miolo da tabela a
rea de 0,95/2= 0,4750, logo Z = 1,96

Intervalo de Confiana:
1200 1,96 .( 200/100) 1200 + 1,96 .( 200/100)

1200 39,2 1200 + 39,2


R$ 1160,80 R$ 1239,20
Concluso:
O salrio de todo o mercado deve est entre R$ 1.160,80 <<
R$1239,20, com 95% de certeza.

Intervalo de Confiana para a Mdia ,quando


Desconhecido, mas o Tamanho da Amostra Pequeno,n <
30:
Quando o desvio padro populacional for desconhecido no
podemos garantir a utilizao da normal padro, pois o que se tem
disponvel o desvio padro amostral S.

Como podemos

constatar, a distribuio neste caso a t-student, e assim:


_

X t(S/n) X + t (S/n)

Exemplo:
Em uma pesquisa de mercado, feita junto a

16

pessoas

selecionadas aleatoriamente, revelou que o salrio mdio dos


entrevistados de R$ 1.200,00 e o desvio padro R$ 200,00. Qual
o intervalo de confiana de 95% para a mdia de salrios de todo o
mercado?
Soluo: Obteno de t:
95% = 5%tabela da t com = n 1 = 16 1 = 15t =
2,13
Intervalo de Confiana:
1200 2,13 .( 200/ 16) 1200 + 2,13 .( 200/ 16)
1200 106,5< < 1200 + 106,5
R$ 1093,50 R$ 1306,5
Concluso:
O salrio de todo o mercado deve est entre R$ 1.093,50 <<
R$1306,50; com 95% de certeza.

Intervalo de Confiana para a Proporo :


Neste caso a distribuio amostral original de p no normal
e sim binomial. Isso porque uma proporo uma soma de bernoullis
dividida por uma constante, que o tamanho da amostra. Para garantir
a normalidade desta distribuio amostral

necessrio

que

utilizemos amostras aleatrias grandes, n 30, pois podemos


recorrer ao Teorema Central do Limite e assim:

P - Zpq/n P + Zpq/n
Exemplo:
Em uma amostra aleatria de 2.000

eleitores

de

um

pas

constataram-se uma inteno de voto de 43% para um candidato


presidncia, na poca das eleies. Depois das eleies, qual o
intervalo de variao da proporo de votos do candidato, com uma
confiana de 99%?
Soluo: Obteno de Z:
99%tabela da normal padroprocurar no miolo da tabela
a rea de 0,99/2= 0,4950, logo Z = 2,58
0,43-2,580,43.0,57/2000 0,43+2,580,43.0,57/2000
0,43-0,01 0,43+0,01
0,42 0,44

Concluso:
Aps as eleies, as urnas revelaro um percentual de 42% a
44% para o candidato em questo, com 99% de probabilidade.
Intervalo de Confiana para a Soma ou Diferena de
Mdias

quando

os

Desvios-padro

Populacionais

so

Conhecidos:
O intervalo referido, baseada na distribuio por amostragem
da soma ou diferena quando os desvios-padro populacionais so
conhecidos :
_
_
_ _
(X1 X2) Z.(21/n1)+(22/n2 )1 2 (X1 X2)+Z.(21/n1)+(22/n2)

Observao:
Quando se sabe que 1 e 2 tm o mesmo valor, conhecido , o
erro-padro da soma ou diferenas de mdias fica:
EP = (1/n1)+(1/n2)

E o intervalo de confiana toma a seguinte forma:


_
_
_ _
(X1 X2) Z. (1/n1)+(1/n2 )1 2 (X1 X2)+Z. (1/n1)+(1/n2)

Exemplo:
Uma empresa tem duas filiais(A e B), para as quais os
desvios- padres das vendas dirias so de 5 e 3, respectivamente.
Uma amostra de 20 dias forneceu uma venda mdia diria de 40
peas para a filial A e 30 peas para a filial B. Supondo que
a distribuio diria de vendas seja normal, qual o intervalo de
confiana para a diferena de mdias das vendas nas duas filiais
com uma confiana de 95%?
Soluo:
_ _
(X1- X2) = 40 30 = 10
_ _
S[X1 - X2 ] = EP = 1,30
Obteno de Z :
95%tabela da normal padroprocurar no miolo da tabela
a rea de 0,95/2= 0,4750, logo Z = 1,96
Intervalo de Confiana :
_ _
_ _
(X1 X2) Z.(21/n1)+(22/n2 )1 2 (X1 X2)+Z.(21/n1)+(22/n2)
10-1, 96.1,301 2 10 + 1,96. 130
7,451212,55
Concluso:
Existe uma probabilidade de 95% da diferena de mdias
de vendas entre as duas filiais est contida no intervalo acima.

Intervalo de Confiana para a Soma ou Diferena de


Mdias quando os Desvios-padro

Populacionais so

Desconhecidos, mas Supostamente Iguais:


Nesse caso, devemos substituir, na expresso do erro-padro
do caso anterior, o desvio-padro desconhecido, por uma estimativa.
Como temos duas amostras, devemos utilizar os resultados de ambas
ao realizar essa estimao. Logo a estimativa da varincia 2 :

(n1-1)S21 + (n2-1)S22
S2p=
n1+ n2 2
Esta a mdia ponderada das varincias amostrais.
Devemos usar a t-student relacionada mdia ponderada das
varincias amostrais. O erro-padro fica, ento:
_

S[X1 X2 ] =EP= (S2p / n1) + (S2P/n2 )= Sp(1 / n1)+(1/n2 )


O intervalo referido, baseada na distribuio por amostragem
da soma ou diferena, quando os desvios-padro populacionais so
desconhecidos, mas supostamente iguais, :
_

(X1 X2) t.Sp(1/n1) +(1/n2 )1

+(1/n2)

(X1 X2) + t.Sp(1/n1)

Observao:
Se o grau de liberdade da estatstica t for suficientemente
grande,

podemos utilizar

distribuio

normal associada

expresso do intervalo de confiana acima. Ento:

(X1 X2) Z.Sp(1/n1) +(1/n2 )1 2(X1 X2)+Z.Sp(1/n1) +(1/n2)


Exemplo:
De uma grande turma extraiu-se uma amostra de quatro notas:

64,66,89 e 77. Uma amostra independente de trs notas de uma


segunda turma foi: 56, 71 e 53. Se for

razovel admitir que as

varincias das duas turmas sejam aproximadamente iguais, qual o


intervalo de confiana de 95% para a diferena de mdias?
Soluo:
Os resultados dos clculos da mdia, dos desvios-padro
das notas para cada amostra e do erro-padro so:
_
X1= 74
S1= 11,52
_
X2= 60
S2= 9,64
_ _
[X1 - X2 ] = 74 60=14
_ _
S[X1 - X2 ] =EP= 8,26.

Obteno de t:
95% = 5%tabela da t com = n1 + n2 -2= 4+3 -2= 5t =
2,57
Intervalo de Confiana:

14 2,57.8,261 214+2,57.8,26
-7,231 235,23
Concluso:
Existe uma probabilidade de 95% de que a diferena de
mdias entre as duas turmas esteja neste intervalo.
Intervalo de Confiana para a Soma ou Diferena de
Mdias quando os Desvios-padro

Populacionais so

Desconhecidos, mas Supostamente Desiguais:


Suponhamos agora que no conhecemos os desvios-padro
das duas populaes, mas no podemos

admitir que esses

desvios- padro so iguais, ou seja,12.


Nesse caso, devemos substituir, na expresso do erro-padro
da soma ou diferena de

mdias

os

respectivos

erros-padro

amostrais.
A expresso do erro-padro no caso em questo fica:
_
_
S[X1 X2 ] = EP=(S21 / n1) + (S22/n2)

A distribuio por amostragem da soma ou diferenas de


mdias no caso em que as varincias so desconhecidas e
supostamente distintas ter distribuio aproximadamente normal se o
grau de liberdade da estatstica t for suficientemente grande ou tstudent, em caso contrrio.
Se usarmos a t-student, o nmero de graus de liberdade
calculado por:

( V 1 + V 2 )2
= -2
V12/(n1+1) + V22/(n2+1)

Onde:
V1 = S12/n1
V2= S22/n2

O intervalo referido, baseada na distribuio por amostragem


da soma ou diferena quando os desvios-padro populacionais so
desconhecidos, mas supostamente desiguais :
a)Se as amostras forem suficientemente grandes(n 30):

_ _
2
1

X1 X2 - Z(S /n1)+(S 2/n2)12X1X2 +Z(S21/n1)+(S22/n2)

b)Se as amostras no forem suficientemnte grandes(n<30):


_ _
_ _
X1 X2 - t(S21/n1)+(S22/n2)12X1X2 +t(S21/n1)+(S22/n2)

Exemplo:
De uma pequena classe do curso do ensino mdio pegou-se
uma amostra de 4 provas de matemtica e obteve:mdia=81,
varincia=2. Outra amostra, de 6 provas de

biologia,

forneceu:

mdia=77, varincia=14,4. Para testar a hiptese de que as mdias


populacionais so iguais, qual o intervalo de confiana de 99% para
a diferena de mdias, supondo os desvios-padro populacionais
desiguais?
Soluo:
_

X1 - X2 = 81 77 = 4
V1= 2/4= 0,5
V2= 14,4/6=2,4
(0,5 + 2,4)2
= - 2 = 8
0,52
2,42
+
4 +1
6 +1
_

S[X1 - X2 ] =EP=(2 / 4) + (14,4/6 )= 1,70

Como o grau de liberdade no suficientemente grande(<30),


o intervalo de confiana dever ser baseado na t-student, com 8
graus de liberdade:
Obteno de t:
99%= 1%tabela da t com = 8t = 3,36

Intervalo de Confiana:
4 -3,36.1,701 24 + 3,36.1,70
-1,711 29,71
Concluso:
O intervalo acima tem uma probabilidade de 99% de conter a
diferena entre a mdia da nota de matemtica e a mdia da nota
de biologia.
Intervalo de Confiana para a Diferena de Mdias quando
as Amostras so Emparelhadas:
Havendo emparelhamento, calculamos a diferena di para
cada par de valores, recaindo assim numa nica amostra de n
diferenas.
As duas amostras so de mesmo tamanho, ou seja, n1=n2=n.
Definindo a mdia de di por:

d =di /n
Se as amostras so emparelhadas, o erro-padro da diferena de
mdias :
_
S[d] =EP= Sd /n , onde:

S2d=( di d )2 / (n- 1)

O intervalo de confiana para a diferena de mdias para


amostras emparelhadas baseado na distribuio t-student, com
=(n-1) e sua expresso :
_
_
d - t. (Sd /n)dd + t. (Sd /n)

Exemplo:
A tabela abaixo indica as vendas de um produto em 2
pocas do ano( I e II ) em cinco supermercados. Construir um
intervalo de confiana de 90% para a diferena de mdias.
Supermercados

Vendas na poca 1

14

20

11

12

10

Vendas na poca 2

16

16

10

Soluo:
A partir dos dados, obtemos:

_
(di-d)

_
(di-d)2

10

7,6

57,76

1,6

2,56

B
C

-0,4

0,16

-4

-6,4

40,96

-2,4

5,76

12

107,2

Supermercados

_
d = 12/5 = 2,4
Sd =107,2/4 =26,8 = 5,18
_
S[d ] =EP= 5,18 /5 = 2,31
Obteno de t :

di

90%= 10%tabela da t com = 5 -1 = 4t = 2,13


Intervalo de Confiana:
_
_
d - t. (Sd /n)dd+ t. (Sd /n)
2,4- 2,13. 2,31d2,4+ 2,13. 2,31
2,4-4,9d 2,4+4,9
-2,5d 7,3
Concluso:
O intervalo construdo tem chance de 90% de conter a
diferena de mdias de vendas nas duas pocas do ano( I e II ) do
produto.

Intervalo de Confiana para a Soma ou Diferena de Duas


Propores:
Se a proporo amostral p1~N[p1; (p1q1)/n1] e p2~N[p2; (p2q2)/n2],
vlidas quando n30, ento a distribuio amostral das diferenas ou
somas ser aproximadamente normal.
Observao:
Quando no conhecemos os valores de 1 e2,

que

so

parmetros populacionais, e n30, substitumos 1 por p1 e 2 por


p 2.
A expresso do intervalo de confiana fica, ento:

[p1 p2] - Z(p1q1)/n1 + (p2q2)/n212[p1 p2] + Z(p1q1)/n1+ (p2q2)/n2

Exemplo:
Num levantamento de

opinio

pblica

para

previso

de

uma eleio, foram ouvidos 500 eleitores escolhidos ao acaso


na cidade A onde 236 declararam

que

iriam

votar

num

certo

candidato. Na cidade B, foram ouvidos outros 500 eleitores onde 200


declararam que iriam votar no candidato em questo. Para verificar,
com base nesta previso, se o desempenho do candidato difere nas
duas cidades, qual a estimativa intervalar com um nvel de
significncia de 5% para a diferena de propores?

Soluo:
[p1 - p2]=0,47 0,40 = 0,07

S[p1 - p2]= EP= 0,0009782 = 0,031

95%= 5% tabela da normal padroprocurar no miolo


da tabela a rea de 0,95/2= 0,4750, logo Z = 1,96
Intervalo de Confiana:
[p1 - p2] - Z(p1q1)/n1 + (p2q2)/n212 [p1 - p2] + Z(p1q1)/n1+ (p2q2)/n2
0,07- 1,96. 0,031120,07+ 1,96. 0,031
0,01120,13
Concluso:
O intervalo acima tem uma probabilidade de 95% de conter a
diferena de inteno de voto do candidato nas duas cidades.

Intervalo de Confiana para a Varincia 2


de uma Populao
Normal:

Seja X uma populao normal com distribuio normal


de mdia e varincia 2.
Sabe-se, pelo Teorema de Fisher, que:
S2 . (n-1)
2(n-1) =
2
Deste teorema, resulta por demonstrao, a expresso
do intervalo de confiana para varincia:

S2 . (n-1)

S 2 . (n-1)

2
2sup

2inf

Onde:
2inf = 2( 1 /2)
2sup = 2(/2)
Ambos os qui-quadrados com = n-1.

262

Exemplos:
1 ) Uma amostra formada pelos seguintes valores:
6, 6, 7, 8, 9, 9, 9, 10, 11, 12
Calcular o intervalo de confiana para 2, ao nvel de
90%.
Soluo:
Temos que:
S2 = 4
n= 10

/2 = (1-0,90)/2 = 0,05

2sup =

16,919
= 10 -1 = 9
Tabela

1- /2 = 1- (1-0,90)/2 = 1- 0,05 = 0,95

2inf =

3,325
= 10 -1 = 9

263

O Intervalo de confiana para a varincia 2, fica


ento:

S2 . (n-1)

S 2 . (n-1)

2
2sup

2inf

4 . (10-1)

4 . (10-1)

2
16,919

3,325

4 . (9)

4 . (9)

2
16,919

3,325
2,13 2 10,83

2 )De uma populao normal foi retirada uma


amostra de 15 elementos e calculou-se Xi=8,7 ,

X2i=

27,3. Determinar um intervalo de confiana de 80% para a


varincia dessa populao:

264

Soluo:
Temos que:
27,3 (8,7)2

15
S2 = = 1,59
14

n= 15

/2 = (1-0,80)/2 = 0,10

2sup = 21,064
= 15 -1 = 14
Tabela

1- /2 = 1- (1-0,80)/2 = 1- 0,10 = 0,90

inf

= 7,790
= 15 -1 = 14

265

O Intervalo de confiana para a varincia 2, fica


ento:

S2 . (n-1)

S 2 . (n-1)

2
2sup

2inf

1,59 . (15-1)

1,59 . (15-1)

2
21,604

7,790

1,59 . (14)

1,59 . (14)

2
21,604

7,790

1,03 2 2,86

266

Intervalo de Confiana para o Desvio Padro de uma


Populao Normal:

Calcular-se- apenas um intervalo aproximado para o desvio


padro atravs da raiz quadrada do intervalo de confiana da
varincia, uma vez que se pode verificar que o desvio padro S no
um estimador justo de :

Exemplo:
Calcular os intervalos de confiana para o desvio padro dos
exemplos anteriores(da varincia):
1 )2,13 10,83=1,46 3,29
2 ) 1,03 2,86=1,01 1,69

Intervalo de Confiana para o Quociente das Varincias


Populacionais(22/21):

Para duas populaes normais de varincias


desconhecidas, sabe-se:
21 / 1
F(1,2) =
22 / 2
Pelo Teorema de Fisher:
S2 . (n-1)
2(n-1) =
2

267

Pode-se
confiana

demonstrar

para

que

quociente

intervalo

das

de

varincias

populacionais :

S2 2

S 22

. 22/21 .
F/2(1,2)
S21

F/2(2,1)

S2 1

Ou:

S21
S

2
1

. 21/22 .
F/2(2,1)
S22

F/2(1,2)

S2 2

Exemplo:
Construir o intervalo de confiana, para =2%,
para o quociente de varincias de duas populaes
normais, das quais foram extradas as amostras
seguintes: 41 elementos da 1, obtendo S 21=43,2 e
31 elementos da 2 , obtendo-se S22= 29,5.

268

Soluo:
/2 = 0,02/2 = 0,01
1 = 41 -1 = 40
F0,01(40,30)=
2,30
2 = 31 -1 = 30

/2 = 0,01/2 = 0,01
1 = 41 -1 = 40
F0,01(30,40)=
2,20
2 = 31 -1 = 30

O Intervalo de confiana para o quociente das


duas varincias, fica ento:
S21

S 21

. 21/22 .
F/2(2,1)
S2 2

F/2(1,2)

43,2

S2 2

43,2
. 21/22
. 2,20
29,5

2,30

29,5

269

0,64 21/22 3,22

270

Exerccios Propostos:
1)Em uma populao em que N=6, tal que X={1, 3, 4, 7, 8,11},
calcular a mdia amostral para todas as amostras de tamanho 2.
Mostrar que X um estimador no tendencioso de . Use o
processo com reposio.
2)Seja X uma populao normal com mdia e varincia 2, de que
so extradas todas as amostras possveis de tamanho 2. Dos
estimadores abaixo:
_
I) X= 1/2X1 + 1/2X2
_
II) X * = 1/4X1 + 3/4X2
Responda:
a)Qual ou quais os estimadores justos de ?

b)Qual o estimador mais eficiente?

271

3)Tm-se

duas frmulas distintas para

populacional . Para ajudar a escolher

estimar um parmetro

o melhor, simulou-se uma

situao onde =500. Desta populao retirou-se 2.500 amostras de


25 unidades cada uma e aplicaram-se ambas as frmulas s 25
unidades da cada amostra. Desse modo, obtm-se 2.500 valores para
a primeira frmula(t1) e outros 2.500 valores para a segunda frmula(t2),
cujos estudos descritivos esto resumidos abaixo. Qual das duas
frmulas voc acha mais conveniente para estimar? Por qu?
Valores
Mdia
descritivos

Frmula

Frmula

Varincia

500
(t1)
20

500
(t2)
50

Moda

501

500

Mediana

502

501

4)O Automvel Clube de So Paulo realizou uma pesquisa de


consumo de combustvel

entre

seus

obtido indicou que eles consumiam,

em

associados.
mdia,

resultado

9,75

litros de

combustvel por quilmetro rodado. Qual a estimativa pontual da mdia


de consumo do motorista paulista?
5)O Vaticano achou por bem conhecer melhor as caractersticas dos
alunos da PUC-Brasil. Uma das medidas levantadas foi o peso mdio
deles. Tomando-se uma amostra de 121 dos alunos pesquisados,
obteve um peso mdio de 72 kg Admitindo-se que o desvio padro
dessa medida populacional seja 20 kg, construa um intervalo de 95%
para a mdia dos pesos de todos os alunos da PUC-Brasil.

272

6)O secretrio de sade do Imprio Romano props-se a melhorar o


atendimento

mdico

plebe.

Como

no

dinheiro

para

contratar mais mdicos, ele decidiu tornar o atendimento mais


eficiente. Para estimar o tempo mdio gasto em cada consulta ele
sorteou 64 acidentes de um hospital
escolhido: essa amostra indicou

que

pblico
o

tempo

aleatoriamente
mdio

de

atendimento era de 10 minutos, com um desvio padro de 3


minutos. Com base nisso, determine um intervalo de confiana de
90% para o tempo mdio de atendimento no hospital.
7)Em uma pesquisa de mercado, foram solicitadas a 10 clientes que
entravam em uma loja que desse nota de 1 a 5 para a
decorao do ambiente e vitrine. A mdia dos resultados foi 2,5 e
desvio padro 0,1. Em que intervalo deve est a mdia das notas se
todos os clientes tivessem respondido pesquisa, com 90% de
probabilidade?
8)Uma pesquisa em 36 teatros do Rio de Janeiro indicou que 65%
deles apresentavam peas de autores nacionais. Determine a
estimativa intervalar da proporo de peas nacionais nos teatros do
Rio, a um nvel de confiana de 95%.
9)Uma rdio tocou durante certo dia 250 msicas, das quais 50
eram msicas nacionais. Determine um intervalo de 95% para a
proporo de msicas nacionais que ela normalmente programa.
10)Em uma pesquisa de mercado com 200 pessoas, 25% dos
entrevistados concordaram que seria muito bom que uma nova rede
de lojas de departamento fosse aberta em um shopping local.
Construir um intervalo de confiana de 99% para a porcentagem
real de clientes que concordaram que seria muito bom que uma
nova rede de lojas de departamento fosse aberta em um shopping
local.

273

11)Uma indstria fabrica dois tipos de pneus. Numa pista de teste, os


desvios-padro das distncias percorridas, para produzir certo
desgaste, so de 2500 km e 3000 km. Tomou-se uma amostra de
50 pneus do 1 tipo e 40 do 2 tipo, obtendo mdias de 24.000km e
26.000km, respectivamente. Qual o intervalo de confiana de 95%
para a diferena de mdias?
12)Uma mquina automtica enche latas,

com

base

no

peso

lquido, com um desvio-padro de 5g. Duas amostras independentes,


retiradas em

dois perodos de trabalhos consecutivos, de 10 e 20

latas, forneceram pesos lquidos mdios de 184,6g e 188,9g,


respectivamente. Qual o intervalo de confiana de 95% para a
diferena de mdias?
13)Duas amostras de barras de ao, ambas de tamanho n=5, foram
ensaiadas e obteve-se que as resistncias mdias foram de 55
kgf/mm2 e 53 kgf/mm2 e as varincias da resistncias foram de 7,5 e
5,0 kgf/mm 2, respectivamente. As varincias so desconhecidas, mas
supostamente iguais. Qual o intervalo de confiana de 99% para a
diferena de mdias?
14)A mdia de salrios semanais para uma amostra de n=30
empregados em uma grande firma

R$ 1800,00, com desvio-

padro R$ 140,00. Em uma outra grande empresa, uma amostra


aleatria de n=40 empregados apresentou um salrio mdio semanal
de R$1700, 00, com um desvio-padro de R$ 100,00. As varincias
populacionais so desconhecidas, mas supostamente desiguais.
Qual o intervalo de confiana de 95% para a diferena de mdias?

274

15)De uma populao animal escolheu-se uma amostra de 10


cobaias. Tais cobaias foram submetidas ao tratamento com uma
rao especial por um ms. Na tabela a seguir, esto mostradas os
pesos antes(Xi) e depois(Yi) do tratamento, em Kg. Qual

intervalo de confiana de 95% para a diferena de mdias?

Cobaias

10

Xi

635

704

662

560

603

745

698

575

633

669

Yi

640

712

681

558

610

740

707

585

635

682

16)Num inqurito com os telespectadores de televiso de uma


cidade, 60

de

200 homens desaprovam certo programa,

acontecendo o mesmo com 75 de 300 mulheres. Qual o intervalo


de confiana de 95% para a diferena de propores?

17)Calcular um intervalo de confiana de 96% para a varincia da


distribuio abaixo(suposta como normal).
Classes

Frequncias

2,2 6,2

6,2 10,2

10,2 14,2

14,2 18,2

18)Calcular um intervalo de confiana para o desvio padro do


exerccio 17.

275

19)Com n1=25 elementos de uma populao obtivemos:


_
X1=8, S1=1,58.
E com n2=31 elementos de uma populao obtivemos:
_
X2=7, S2=1,24 .

Determinar os intervalos de confiana para:


a)1, com = 10%
b)1/2, com =2%
c) 2/1, com =2%

276

Unidade VI
Testes de Significncia

Conceitos de Testes de Significncia:


a parte mais importante de um processo inferencial. Todo
estudo com levantamento por amostragem que merea crdito deve
realizar testes de significncia de estimativas geradas.
Quando

quisermos

avaliar

um

parmetro

populacional,

sobre o qual no possumos nenhuma informao com respeito a


seu valor, no resta alternativa a no ser estim-lo atravs do
intervalo de confiana.
No entanto, se tivermos alguma informao com respeito ao
valor do parmetro que desejamos avaliar, podemos testar esta
informao no sentido de aceit-la

como verdadeira ou rejeit-la.

Teste de Significncia uma regra de deciso que permite


aceitar ou rejeitar como verdadeira uma hiptese com base na
evidncia amostral.
Isto significa que utilizaremos uma amostra desta populao
para verificar se ela confirma ou no o valor do parmetro informado
pela hiptese formulada.
Teste de Significncia uma tcnica de aceitar ou rejeitar
determinada afirmao, baseando-se em um conjunto de evidncias.
Teste de Significncia simplesmente uma afirmao acerca de
um parmetro da populao, que pode ser testada atravs de uma
amostra aleatria.
O Teste de Significncia avalia a evidncia fornecida pelos
dados sobre alguma afirmao relativa populao;
Teste de Significncia uma prova de hiptese que testa a
aceitao de

uma afirmao

sobre a populao

luz das

informaes da amostra e do clculo das probabilidades.

277

Teste de Significncia um processo inferencial em que se


tem uma idia a cerca do valor do parmetro populacional
desconhecido e testa-se a aceitao ou a rejeio desta afirmao
luz da informao amostral e da teoria das probabilidades.

Exemplo de um Problema de Teste de Significncia:


Um pesquisador de mercado desconfia que a satisfao
mdia dos clientes da empresa em que trabalha no mais 3,0,
numa escala de 0 a 5. Ele selecionou aleatoriamente do cadastro da
empresa 10.000 clientes, na qual calculou a mdia de satisfao que
resultou em 3,2, com desvio padro 10. O pesquisador suspeita,
ento, que o nvel mdio de satisfao possa ter aumentado. Ele
credita a uma nova estratgia de marketing mais agressiva
adotada o possvel aumento no nvel mdio de

satisfao. Para

confirmar suas suspeitas ele realiza um teste de significncia do


resultado 3,2 de satisfao.
Fundamentos dos Testes de Significncia:
As condies ou pressupostos bsicos para realizao de
testes de significncia paramtricos so:
o Amostragem aleatria simples(AAS);
o Populao normal com desvio padro conhecido;
o Um

modelo

de

probabilidade

assumido

para

distribuio por amostragem da estatstica em estudo.

278

Raciocnio de Testes de Significncia:

o A estimativa fornecida pela amostra apia a


formulada

ou

realmente

confirma

hiptese

uma

hiptese

alternativa?
o Suponha, para raciocinar, que uma afirmao ou
hiptese sobre um parmetro seja verdadeira. Se
repetssemos nossa produo de dados muitasvezes,
obteramos freqentemente estimativas como a fornecida
pela amostra disponvel?
o Se a estimativa amostral improvvel de ser obtida
quando a afirmao formulada verdadeira, ela fornece
evidncia contrria hiptese formulada.

Formas de Apresentar as Hipteses:


Quando

pesquisador

realiza

uma

prova

estatstica,

inicialmente formula 2 hipteses:


H0: hiptese nula ou hiptese bsica, que ser
aceita ou rejeitada.
H1:

hiptese

automaticamente

alternativa,
aceita

caso

que
H0

ser
seja

rejeitada.

279

Exemplo:
H0 : =0
H1 : 0

parmetro populacional desconhecido(,,)


0 um valor atribudo a por hiptese. Tambm chamado
simplesmente de hiptese nula.
Exemplo:
O valor de mercado do salrio de uma categoria profissional
nos ltimos dez anos era de R$ 2500,00 reais. Uma amostra de 500
empresas do mercado atual revelou um salrio mdio de 3500,00. O
salrio desta categorial profissional maior hoje no mercado?
As hipteses do problema, ento seriam:
H0 : =2500
H1 : >2500

O valor da hiptese nula R$2500,00. O valor da hiptese


alternativa de 3500,00.

280

Observao:

Na prtica, a hiptese alternativa formulada com base


na evidncia da estimativa obtida junto amostra, ou seja, no geral, a
informao amostral

parece,

inicialmente,

apoiar

hiptese

alternativa. Caso a hiptese nula seja aceita, isto implica que o


resultado encontrado na amostra em particular fruto de erro
amostral, ou em termos tcnicos, no significante. Caso a
hiptese nula seja rejeitada, isto implica na confirmao do apoio da
informao amostral

hiptese

alternativa

se

diz

que

resultado encontrado na amostra significante.


Portanto, s tem sentido realizar testes de significncia se o
resultado amostral, contrariar a hiptese nula. Os testes de
significncias so realizados para se comprovar se a oposio
hiptese nula fruto de erro amostral ou uma nova realidade que se
apresenta.

281

Tipos de Testes de Significncia:

1 )Teste Bilateral

H0 : = 0
H1 : 0
Exemplo:
H0 : = 1200
H1 : 1200

2 )Teste Unilateral Direita

H0 : = 0
H1 : > 0
Exemplo:
H0 : = 1200
H1 : > 1200

3 )Teste Unilateral Esquerda

H0 : = 0
H1 : < 0
Exemplo:
H0 : = 1200
H1 : < 1200
282

Tcnicas de se Realizar Testes de Significncia:


Para testar significncia existem as alternativas do intervalo
confiana e do valor-p. Os testes de significncia pelo valor-p e pelo
intervalo de confiana so os mais usuais atualmente na rea da
pesquisa estatstica.

Estatstica de Teste:
o Um teste de significncia usa dados na forma de uma
estatstica de teste;
o Esta

estatstica

compara

valor

do

parmetro

estabelecido pela hiptese nula com uma estimativa do


parmetro a partir da amostra;
o A estimativa normalmente a mesma usada em um
intervalo de confiana para o parmetro;
o Valores grandes da estatstica de teste indicam que a
estimativa

est

afastada

do

valor

do

parmetro

especfico para H0;


o A hiptese alternativa determina que direes importam
para contrariar H0.

283

Exemplo:
A estatstica de teste sobre teste de significncia para
hipteses em torno da mdia de uma distribuio normal a
verso padronizada de Xbarra:

X - 0
Z=
/n

A estatstica Z diz a que distncia a mdia da amostra est


da mdia da populao em unidades de desvio padro. Para
o exemplo:
3,2 - 3,0
Z== 0,2/0,1 = 2,0
10/10000
A estimativa est a 2,0 desvios-padro acima da mdia
admitida por hiptese nula.
Conceito de Valor-p:
o valor da probabilidade de ser possvel uma estimativa
pontual, obtida de uma amostra aleatria, ter sido selecionada de
uma populao com o valor da hiptese nula.
o grau de confiana que a informao amostral d a
hiptese formulada. uma medida de credibilidade de H0.

284

Clculo do Valor-p:
Basta calcular a probabilidade de uma dada estimativa ter
provindo de uma populao com valor descritivo indicado na
hiptese nula.
a probabilidade da estimativa obtida junto amostra ser to
grande ou to pequena quanto o valor

efetivamente observado,

considerando o valor estipulado para a hiptese nula verdadeiro.


Exemplo:
Vamos testar as seguintes hipteses pelo valor-p:
H0 : = 0
H1 : > 0
Isto significa que queremos saber: Qual a probabilidade de uma
estimativa igual a xbarrazero ou maior que xbarrazero ter provindo de uma
populao de mdia igual a 0?
Esta probabilidade toma, ento a forma abaixo:
_
_ _
x - 0
Valor-p = P( x x0 / 0) = P( Z )
/ n
Logo, o valor-p toma a forma para teste de significncia de :
Estimativa hiptese nula
P( Z )
Erro-padro da estimativa

285

Os testes de significncia de outras estimativas seguem


raciocnio anlogo de clculo.
Exemplo:
Do exemplo anterior da satisfao de clientes...:
Valor-p= P[ Z>(3,2-3,0)/0,1)] = P[z>2,0] = 0,5 0,4772 = 0,0228
ou 2,28%.
Significncia Estatstica:
o Podemos comparar o valor-p com um valor fixo que
consideramos decisivo;
o Este valor decisivo do valor-p o nvel de significncia();
o Se o valor-p igual ou menor do que , dizemos que a
estimativa significante no nvel de ;
o At este limite, o valor-p pode ser considerado como
pequeno, indicando baixa credibilidade da hiptese
nula.

286

Estatstica Significante:

o Significante

em linguagem estatstica no

significativa importante;
o Significante quer dizer simplesmente no provvel
de ocorrer apenas ao acaso, no fruto de erro amostral;
o O valor da estimativa

no

fruto de

erro

amostral, corresponde a uma estimativa de qualidade


do parmetro populacional;
o O nvel

de significncia torna mais exato o no

provvel;
o Significncia no nvel 0,01 freqentemente enunciado
pela afirmao: os resultados foram significantes(p<
0,01);
o O valor-p mais informativo do que uma afirmao de
significncia(probabilidade

de

erro

de

estimao),

porque foi calculado e fruto da observao emprica.


J o nvel de significncia arbitrado pelo pesquisador;
o Por

exemplo:

um

resultado

com

valor-p=0,03

significante no nvel =0,05, mas no significante no


nvel de =0,01.

287

Teste de Significncia Utilizando o Intervalo de Confiana:


o Calculando o intervalo de confiana, ele pode ser usado
imediatamente, sem qualquer outro clculo, para testar
qualquer hiptese.
o O intervalo de confiana pode ser encarado como um
conjunto de hipteses aceitveis.
o Qualquer hiptese H0 que esteja fora do intervalo de
confiana deve ser rejeitada. Por outro lado, qualquer
hiptese que esteja dentro do intervalo de confiana
deve ser aceita.
Exemplo:
Um pesquisador de mercado desconfia que a satisfao
mdia dos clientes da empresa em que trabalha no mais 3,0,
numa escala de 0 a 5. Ele selecionou aleatoriamente do cadastro da
empresa 10.000 clientes, na qual calculou a mdia de satisfao que
resultou em 3,2, com desvio padro 10. O pesquisador suspeita,
ento, que o nvel mdio de satisfao possa ter aumentado. Ele
credita a uma nova estratgia de marketing mais agressiva
adotada o possvel aumento no nvel mdio de

satisfao. Para

confirmar suas suspeitas ele realiza um teste de significncia do


resultado 3,2 de satisfao.

Formulao das Hipteses:


H0: = 3,0
H1: 3,0

288

Intervalo de Confiana:
3,2 1,96. 0,1 3,2 +1,96. 0,1
3,2- 0,196 3,2+ 0,196
3,004 3,396
Deciso:
3,0 est fora do intervalo de confiana, portanto a hiptese
nula deve ser

rejeitada, isto , a estratgia de marketing mais

agressiva surtiu efeito, como indicava inicialmente a informao


amostral.

nvel

mdio de

satisfao aumentou com uma

probabilidade de 95%. A mdia de satisfao 3,2 significante a 5%


de significncia(p<0,05).

Teste de Significncia para Mdia da Amostra, quando a


Varincia Populacional Conhecida:
O valor-p ser calculado atravs da estatstica :

X - 0
Z=
/n

X- 0
Valor-p=P( Z ou )
/n

289

Teste Unilateral Esquerda:


_
X- 0
Valor-p=P( Z )
/n
Teste Unilateral Direita:

_
X- 0
Valor-p=P( Z)
/n
Exemplo:
Um exemplo de valor-p unilateral direita pode ser o da
satisfao de cliente, cujo valor foi de 2,28%.
Teste Bilateral:
O valor-p bilateral ser duas vezes o valor-p unilateral.
Exemplo:
Do exemplo da satisfao de clientes... :
O valor-p unilateral calculado foi de 0,0228 ou 2,28%. O dobro
deste valor 0,0456 ou 4,56%.

290

Critrio de Deciso ou Regra de Significncia Estatstica:


Se o valor-p for menor do que , rejeita-se H0 e o resultado
significante para a estimativa colhida na amostra.
Exemplo:
A deciso do exemplo de satisfao do cliente pelo valor-p
considerando o teste bilateral:
Deciso:
Como o valor-p(4,56%) menor que 5,00%, rejeita-se a
hiptese nula e toma-se a estimativa encontrada na amostra como
significante.
Vejamos outros exemplos de testes de significncia para a
mdia populacional

Exemplo:
Uma empresa tem constatado um volume mdio de vendas
de seus produtos comercializados no varejo na ordem de 200 mil
reais mensais. Contudo, o pesquisador selecionou uma amostra de 16
estabelecimentos

onde

so

comercializados

seus

produtos

constatou um volume mdio de vendas de 198 mil reais mensais. O


pesquisador suspeita , ento, que o volume mdio de vendas possa
ter cado. Os fatores podem ser

o aumento do dlar e a mudana

poltica no pas. O desvio padro das vendas em todos os


estabelecimentos em que so comercializados os produtos da
empresa de 4 mil reais. Teste as suspeitas dos executivos da
empresa a um nvel de significncia de 1% .

291

Formulao das Hipteses:


H0: = 200
H1:< 200
Valor-p:
_
X- 0
Valor-p=P( Z )
/n
198- 200
Valor-p=P( Z )
4/16
Valor-p = P ( Z-2,0 ) = 0,5 0,4772 = 0,0228 ou 2,28%
Deciso:
2,28%>1%, H0 no pode ser rejeitada a este nvel de
significncia. A credibilidade de H0 alta. As suspeitas dos
executivos so infindveis: o volume mdio de vendas continua o
mesmo, no h indcios suficientes de que queda apesar do contexto
negativo. O volume mdio de vendas de 198 mil reais mensais
no significante.

292

Teste de Significncia para Mdia da Amostra, quando a


Varincia Populacional Desconhecida e o Tamanho da
Amostra Suficientemente Grande:

Pelo Teorema Central do Limite o valor p continua sendo


calculado pela curva normal , somente no lugar de usa-se S .
Exemplo:
Uma empresa tem constatado um volume mdio de vendas
de seus produtos comercializados no varejo na ordem de 200 mil
reais mensais. Contudo, o pesquisador selecionou uma amostra de
36 estabelecimentos onde so comercializados seus produtos e
constatou um volume mdio de vendas de 198 mil reais mensais
com desvio padro de 12 mil reais. O pesquisador suspeita , ento,
que o volume mdio de vendas possa ter cado. Os fatores podem
ser o aumento do dlar e a mudana poltica no pas. Teste as
suspeitas dos executivos da empresa a um nvel de significncia
de 1% .
Formulao das Hipteses:
H0: = 200
H1:< 200
Valor-p:
_
X- 0
Valor-p=P( Z )
S/n
198- 200
Valor-p=P( Z )
12/36
Valor-p = P ( Z-1,0 ) = 0,5 0,3413 = 0,1587 ou 15,87%
293

Deciso :
15,85%>1% , H0 no pode ser rejeitada a este nvel de
significncia. A credibilidade de H0

alta. As suspeitas dos

executivos so infundveis: o volume mdio de vendas continua o


mesmo, no h indcios suficientes de houve queda, apesar do
contexto negativo. O volume mdio de

vendas de 198 mil reais

mensais no significante.

Teste de Significncia para Mdia da Amostra, quando a


Varincia Populacional Desconhecida e o Tamanho da
Amostra No Suficientemente Grande:
Neste caso a distribuio utilizada deve ser a t -Student .

O valor-p ser calculado atravs da estatstica :

X - 0
t=
S/n
_
X- 0
Valor-p=P( t ou )
S/n

294

Teste Unilateral Esquerda:


_
X- 0
Valor-p=P( t )
S/n
Teste Unilateral Direita:

_
X- 0
Valor-p=P( t)
S/n

Exemplo:
Uma empresa tem constatado um volume mdio de vendas
de seus produtos comercializados no varejo na ordem de 200 mil
reais mensais. Contudo, o pesquisador selecionou uma amostra de 16
estabelecimentos
constatou

onde

so

comercializados

seus

produtos

um volume mdio de vendas de 198 mil reais mensais

com desvio padro de 4 mil reais. O pesquisador suspeita , ento,


que o volume mdio de vendas possa ter cado. Os fatores podem
ser o aumento do dlar e a mudana poltica no pas. Teste as
suspeitas dos executivos da empresa a um nvel de significncia de
1% .
Formulao das Hipteses:
H0: = 200
H1:< 200

295

Valor-p:
_
X- 0
Valor-p=P( t )
S/n
198- 200
Valor-p=P( t )
4/16
= 16- 1 = 15
Valor-p = P ( t -2,0 ) tabela t 0,025 ou 2,5%

Deciso :
2,5%>1% , H0

no pode ser rejeitada a este nvel de

significncia. A credibilidade de H0

alta. As suspeitas dos

executivos so infundveis: o volume mdio de vendas continua o


mesmo, no h indcios suficientes de houve queda, apesar do
contexto negativo. O volume mdio de

vendas de 198 mil reais

mensais no significante.

296

Teste de Significncia para a Proporo da Amostra:


O valor-p ser obtido atravs da seguinte expresso:

p 0
Valor-p=P( Z > ou < )
[ 0 (1 0)]/n

Exemplo:
Um estatstico selecionou uma amostra aleatria de 2.000
eleitores, constatando uma inteno de voto de 43% para um
candidato presidncia na poca das eleies. O poltico desconfia,
ento, que sua inteno de voto se alterou, no est mais em torno
de 52%. Pede ao estatstico que teste a hiptese. Ao nvel de 99%
de confiana, utilizando o intervalo de confiana e o valor-p, o teste
requerido :
Soluo:
Formulao da Hiptese:
H0 := 0,52
H1: 0,52
Pelo Intervalo de confiana: Obteno de Z:
99%tabela da normal padroprocurar no miolo da tabela a rea
de 0,99/2= 0,4950, logo Z = 2,58

297

0,43-2,580,52.0,48/2000<< 0,43+2,580,52.0,48/2000
0,43-0,03< <0,43+0,03
0,40< <0,46

Deciso:
0,52 est fora do intervalo de confiana, portanto rejeita-se
H0, isto , as suspeitas do poltico parecem ter sentido: sua inteno
de voto no mais de 52%. A inteno de voto de 43% para o
candidato presidncia na poca das eleies significante ao
nvel de 1% de significncia(p<0,01).
Pelo valor-p:
p 0
Valor-p=P( Z < )
[ 0 (1 0)]/n
0,43 0,52
Valor-p=P( Z < )
[(0 , 5 2 . 0,48)/2000]

Valor-p = P[ Z< -8,18 ] = 0,5 0,5 = 0,0000


Valor-p bilateral = 2. 0,000 = 0,0000
Deciso:
A credibilidade de H0 nula, rejeita-se a hiptese de que
o percentual continua sendo de 52% . A inteno de voto se alterou. A
proporo de 43% para o candidato presidncia na poca das
eleies significante ao nvel de 1% de significncia(p<0,01).

298

Teste de Significncia para a Diferenas de Mdias das


Amostras

quando

as

Varincias

Populacionais

so

Conhecidas

Formulao das Hipteses:


Teste Bilateral:
H0 : ( 1 2 ) = ( 01 02 )
H1 : ( 1 2 ) ( 01 02 )

Teste Unilateral Direita:


H0 : ( 1 2 ) = ( 01 02 )
H1 : ( 1 2 ) > ( 01 02 )

Teste Unilateral Esquerda:


H0 : ( 1 2 ) = ( 01 02 )
H1 : ( 1 2 ) < ( 01 02 )

O valor-p ser obtido atravs da seguinte estatstica de teste:


Valor- p= P[ Z> ou < (estimativa da diferena- valor da hiptese nula)]

erro-padro da estimativa
Lembrando, que neste caso o erro-padro da estimativa :
EP = (21/n1) + (22/n2)

299

Exemplo:
Uma empresa tem duas filiais(A e B), para as quais os
desvios- padro das vendas dirias so de 5 e 3, respectivamente.
Uma amostra de 20 dias forneceu uma venda mdia diria de 40
peas para a filial A e 30 peas para a filial B. Supondo que
a distribuio diria de vendas seja normal, teste a hiptese nula de
que a diferena de mdia das vendas entre as filiais seja de 8
peas contra a alternativa de ser maior do que 8 peas,com uma
confiana de 95%?
Estimativa da diferena:
_

X1 X2 = 40 30 = 10
Erro-padro da Estimativa:
EP = 1,30
Formulao das Hipteses:
H0 : ( 1 - 2 ) = 8
H1 : ( 1 - 2 ) > 8

Valor-p = P[Z > (10 8) /1,30]=P[Z >1,53]=0,5 0,4370=0,063 ou


6,3%.
Deciso:
6,3%>5%, H0

no pode ser rejeitada a este nvel de

significncia. A credibilidade de H0 alta. A diferena de 8 peas para


a venda mdia entre as duas filiais deve ser aceita a este nvel
de significncia. A estimativa de diferena mdia de vendas entre as
filiais de 10 peas no significante.
300

Teste de Significncia para a Diferenas de Mdias das


Amostras

quando

as

Varincias

Populacionais

so

Desconhecidas, mas Supostamente Iguais

O valor-p ser obtido atravs da seguinte estatstica de teste:


Valor- p= P[ t> ou < (estimativa da diferena- valor da hiptese nula)]

erro-padro da estimativa
Lembrando que neste caso o erro-padro da estimativa :
EP = Sp (1/n1) + (1/n2)
Exemplo:
De uma grande turma extraiu-se uma amostra de quatro notas:
64,66, 89 e 77. Uma amostra independente de trs notas de uma
segunda turma foi: 56, 71 e 53. Se for

razovel admitir que as

varincias das duas turmas sejam aproximadamente iguais, teste a


hiptese de que a diferena entre as mdias das notas entre as
duas turmas seja de 30 pontos contra a alternativa ser menor que 30
pontos, ao nvel de 1% de significncia?
Soluo:
Estimativa da diferena:
_

X1 X2 = 74 60 = 14

301

Erro-padro da Estimativa:
EP = 8,26
Formulao das Hipteses:
H0 : ( 1 - 2 ) = 30
H1 : ( 1 - 2 ) < 30

=4+32=5
Valor-p = P[ t < (14 30) /8,26]=P[t <-1,94] tabela 0,05 ou 5%
Deciso:
5%>1% , H0 no pode ser rejeitada a este nvel de significncia.
A credibilidade de H0 alta. A diferena de 14 pontos para a
diferena entre as notas mdias das duas turmas no significante a
este nvel(P<0,01).

302

Teste de Significncia para a Diferenas de Mdias das


Amostras

quando

as

Varincias

Populacionais

so

Desconhecidas, mas Supostamente Desiguais


O valor-p ser obtido atravs da seguinte estatstica de teste:
Valor- p= P[ t> ou < (estimativa da diferena- valor da hiptese nula)]

erro-padro da estimativa
Lembrando que neste caso o erro-padro da estimativa :
EP = (S21/n1) + (S22/n2)
Exemplo:
De uma pequena classe do curso do ensino mdio pegou-se
uma amostra de 4 provas de matemtica e obteve: mdia=81,
varincia=2. Outra amostra, de 6 provas de

biologia,

forneceu:

mdia=77, varincia=14,4. Testar a hiptese de que as mdias


populacionais so

iguais contra a alternativa de serem diferentes,

supondo as varincia populacionais desiguais:


a)Pelo Intervalo de confiana de 99%.
b)Pelo valor-p ao nvel de 1% de significncia.

303

Soluo:
Estimativa da Diferena:
_

X1 - X2 = 81 77 = 4

Erro-padro da Estimativa:
EP = 1,70
Formulao das Hipteses:
H0 : ( 1 - 2 ) = 0
H1 : ( 1 - 2 ) 0

a)Pelo Intervalo de Confiana:


Como o grau de liberdade da estatstica t no grande(<30),
o intervalo de confiana dever ser baseado na t-student, com 8
graus de liberdade:
Obteno de t:
99%= 1%tabela da t com = 8t = 3,36
Como o grau de liberdade da estatstica t menor do que 30, o
intervalo de confiana dever ser baseado na t Student, com =8
graus de liberdade:

304

Intervalo de Confiana:

4 -3,36.1,701 - 2 4 + 3,36.1,70
-1,711 - 2 9,71
Deciso:
Como o zero est dentro do intervalo de confiana, no
podemos rejeitar a hiptese nula a este nvel de significncia. H
evidncias suficientes para se afirmar que a diferena entre as
mdias de matemtica e biologia seja zero. A diferena de 4 pontos
entre as mdias no significante.

b) Pelo O valor-p deve ser bilateral:


=8
Valor-p=P[t>( 4 0/ 1,70)] = P[ t> 2,35]= 0,025
Valor-p bilateral = 2 . 0,025 = 0,05 ou 5%
Deciso:

Como 5%>1%, no podemos rejeitar a hiptese nula a este


nvel de significncia. H evidncias suficientes para se afirmar que
a diferena entre as mdias de matemtica e biologia seja zero. A
diferena de 4 pontos entre as mdias no significante.

305

Teste de Significncia para a Diferena de Mdias das


Amostras quando as Amostras so Emparelhadas:
O valor-p ser obtido atravs da seguinte estatstica de teste:
Valor- p= P[ t> ou < (estimativa da diferena- valor da hiptese nula)]

erro-padro da estimativa
Lembrando, que neste caso o erro-padro da estimativa :
EP = S2d/n
Exemplo:
A tabela abaixo indica as vendas de um produto em 2 pocas
do ano( I e II ) em cinco supermercados. Testar a hiptese de que a
diferena de mdias seja nula, contra a alternativa de ser maior do
que zero, pelo valor-p, ao nvel de 10% de significncia.

Supermercados
Vendas na poca 1
Vendas na poca 2

A
14
4

B
20
16

C
11
9

D
12
16

E
10
10

Soluo:
Estimativa da diferena:
_
d = 2,4
Erro-padro da Estimativa:
EP = 2,31
Formulao das Hipteses:
H0 : d = 0
H1 : d > 0

= 5-1 = 4
Valor-p = P[t >( 2,4 0) /2,31]=P[t >1,04] tabela 0,25 ou 25%
Deciso:
25%>10%, no podemos rejeitar a hiptese nula neste nvel
de significncia. No existe evidncia de diferena de mdias de
vendas entre as duas filiais. O resultado de diferena de mdias
igual a 2,4 no significante. fruto de erro amostral.

Teste de Significncia para a Diferena de Propores das


Amostras
Para efetuar o teste para a diferena de mdias envolvendo
propores necessrio de antemo trabalharmos com amostras
suficientemente grandes(n 30).

O valor-p ser obtido atravs da seguinte estatstica de teste:


Valor- p= P[ Z> ou < (estimativa da diferena- valor da hiptese nula)]

erro-padro da estimativa
Lembrando que neste caso, o erro-padro da estimativa :

EP = (p q /n1) + (p q /n2 )

Onde:
p = (n1p1 + n2p2 ) / n1 + n2

Exemplo:
Num levantamento de

opinio

pblica

para

previso

de

uma eleio, foram ouvidos 500 eleitores escolhidos ao acaso


na cidade A onde 236 declararam que iriam

votar num certo

candidato.Na cidade B,foram ouvidos outros 500 eleitores onde 200


declararam que iriam votar no candidato em questo.

Teste a

hiptese de que a inteno de votos do candidato nas duas cidades


igual zero, contra a hiptese alternativa de ser maior que zero,
com uma confiana de 95% , pelo valor-p.
Estimativa da diferena:
[p1 - p2]=0,47 0,40 = 0,07
Erro-padro da Estimativa:
p = (500.0,47 + 500.0,40 ) / 500 + 500 = 0,44
EP=(0,44 . 0,56 /500) + (0,44 . 0,56 /500) = 0,03
Formulao das Hipteses:
H0 : ( 1 - 2 ) = 0
H1 : ( 1 - 2 ) > 0

Valor-p = P[Z > (0,07 0) /0,03]=P[Z >2,33]=0,5 0,4901=0,0099


ou 0,99%.
Deciso:
0,99%<5%, rejeita-se a hiptese nula. Existe diferena entre
as intenes de votos nas duas cidades ao nvel de significncia de
5%. A diferena de inteno de voto de 7% significativa.

Teste

de

Significncia

para

Varincia

da

Amostra(S2):
Formulao das Hipteses:
H 0 : 2 = 20
H 1 : 2 20
H 1 : 2 > 20
H 1 : 2 < 20
Deve-se fixar o nvel de significncia . A varivel
escolhida 2, com = n-1 graus de liberdade.
Clculo do Valor-p:
S2(n-1)
Valor-P= P (2(n-1) > ou < )
20
O valor do sinal da expresso do valor-p depende do
sinal da hiptese alternativa.

310

Onde:
n=tamanho da amostra
S2= varincia amostral
20= valor da hiptese nula
Deciso:
Se o valor-p , rejeita-se H0 , rejeita-se a hiptese
nula e o resultado significante para a estimativa colhida
na amostra.
Exemplo 1:
Numa amostra aleatria de 20 elementos, obteve-se S 2
= 64. Testar a hiptese que 2 = 36 , ao nvel de
significncia de 10%.

311

Soluo:
Formulao das Hipteses:
H0 : 2 = 36
H1 : 2 > 36
Nvel de Significncia:
= 0,10
Graus de Liberdade:
= 20 1 = 19
Clculo do Valor-p:
64(20-1)
Valor-P= P (2(20-1) > )=
36

312

64(19)
Valor-P= P (2(19) > )=
36
1216
Valor-P= P (2(19) > )=
36

Valor-P= P (2(19) > 33,778)


= 20 1 = 19

Tabela da Qui-quadrado

valor-p = 0,0250.
Deciso:
Valor-p < 0,10; rejeita-se H0. S2 = 64 significante.

313

Exemplo 2:
Uma amostra de 10 elementos de uma populao
forneceu varincia igual a 24,8. Pergunta-se: esse resultado
suficiente para se concluir, ao nvel de = 5% que a
varincia dessa populao inferior a 50?
Soluo:
Formulao das Hipteses:
H0 : 2 = 50
H1 : 2 < 50
Nvel de Significncia:
= 0, 05
Graus de Liberdade:
= 10 1 = 9

314

Clculo do Valor-p:
24,8(10-1)
Valor-P= P (2(10-1) < )=
50
24,8(9)
Valor-P= P (2(9) > )=
50
223,2
Valor-P= P (2(19) > )=
50
Valor-P= P (2(9) < 4,464)
= 10 1 = 9

Tabela da Qui-quadrado

valor-p = 0,9000.
Valor-p > 0,05; aceita-se H0. S2 = 24,8 no
significante. fruto de erro amostral.

315

Teste de Significncia para Igualdade de Duas


Varincias de Amostras S21 e S22 :
Formulao das Hipteses:
H0 : 21 = 22
H1 : 21 22
H1 : 21 > 22
H1 : 21 < 22

Deve-se fixar o nvel de significncia . A varivel


escolhida

F de Snedecor, com 1= n1-1

graus de

liberdade no numerador e 2= n2-1 graus de liberdade no


denominador.
Clculo do Valor-p:
S2 1
Valor-P= P (F > ou < )
S22
O valor do sinal da expresso do valor-p depende do
sinal da hiptese alternativa.

316

Onde:
n1=tamanho da amostra 1
n2=tamanho da amostra 2
S21= varincia amostral da amostra 1
S22= varincia amostral da amostra 2
Deciso:
Se o valor-p , rejeita-se H0 , rejeita-se a hiptese
nula e o resultado significante para a estimativa colhida
na amostra.
Exemplo:
Dois programas de treinamento de funcionrios foram
efetuados. Os 21 funcionrios treinados no programa antigo
apresentaram uma varincia 146 em suas taxas de erro. No
novo

programa,

13

funcionrios

apresentaram

uma

varincia de 200. Sendo =5%, pode-se concluir que a


varincia diferente para os dois programas?

317

Soluo:
Formulao das Hipteses:
H0 : 21 = 22
H1 : 21 < 22
Nvel de Significncia:
= 0,05 .
Graus de Liberdade:
1= 21-1= 20
2= 13-1 = 12
Clculo do Valor-p:
146
Valor-P= P (F < ) =
200

318

Valor-P= P (F < 0,73) =


1= 20

Tabela F Valor-P

= 0,2500
2= 12
Deciso:
Se o valor-p > 0,05 , aceita-se H 0 . O quociente
de 0,73 no significante, fruto de erro amostral. As
varincias so iguais, ao nvel de 5% de significncia.

319

Potncia de um Teste de Significncia:


o Uma maneira de avaliarmos o desempenho de um teste
de significncia;
o A Potncia de um teste de

significncia

probabilidade de rejeitar H0, quando realmente ela for


falsa e por isto mesmo deve ser rejeitada;
o A Potncia de um teste , ento, a probabilidade de um
teste de significncia de nvel fixo rejeitar H0, quando um
valor alternativo especfico do parmetro verdadeiro;
o Quanto maior a potncia mais sensvel o teste;
o Devemos apontar a alternativa especfica que temos em
mente antes de questionar se o teste rejeita usualmente
H0.
Exemplos de Clculo de Potncia do Teste:
Exemplo 1:
Um fabricante de refrigerante determina que uma perda de
doura seja muito grande para ser aceita se a resposta mdia para
todos os provadores =1,1. Um teste de significncia de 5% das
hipteses abaixo, baseado em uma amostra de 10 provadores e
sabendo que o desvio padro populacional =1, ir usualmente
detectar uma mudana desse tamanho?
H0 : =0
H1 : >0
Qual a potncia do teste contra a alternativa = 1,1? Esta representa a
probabilidade do teste rejeitar H0, quando =1,1 verdadeira.

320

Soluo do Exemplo:
Passo 1: Escreva a regra para rejeitar H0

em termos

de Xbarra. Sabemos que =1. Logo, o teste Z rejeita H0 no nvel


=0,05 quando:
_
Z= (X 0) /(1/ 10)1,645
Fazendo os clculos:
_
Rejeitar H0 quando X0,520.
Passo 2: A potncia a probabilidade desse evento sob
a condio de que a alternativa =1,1 seja verdadeira. Para calcular
essa probabilidade, padronize a mdia amostral usando =1,1.
_
Potncia=P(X0,520/=1,1)=P[Z(0,520-1,1)/(1/10)]=
=P[Z-1,83]=0,5+0,4664= 0,9664
Concluso:
O teste ir indicar que o refrigerante perde doura 96,64% das
vezes quando a verdadeira mdia de perda de doura for
=1,1(potncia = 96,64%).

321

Exemplo 2:
Um administrador de empresas formulou as seguintes
hipteses a cerca do faturamento mensal de sua empresa nos
prximos meses:

H0: =300 mil reais mensais


H1: :>300 mil reais mensais
Baseando-se numa amostra de tamanho 16, e sabendo
que o desvio-padro histrico dos rendimentos em todas as
lojas da corporao por ms de 8 mil reais e com uma confiana
de 99%, qual a potncia deste teste para uma hiptese alternativa
de =308 mil reais de faturamento?
Soluo do Exemplo:
Passo 1: Escreva a regra para rejeitar H0

em termos

de Xbarra. Sabemos que =8. Logo, o teste Z rejeita H0 no nvel


=0,01 quando:
_
Z= (X 300) /(8/16)2,33
Fazendo os clculos:
_
Rejeitar H0 quando X305.

322

Passo 2: A potncia a probabilidade desse evento


sob a condio de que a alternativa =308 seja verdadeira. Para
calcular essa probabilidade, padronize a mdia amostral usando
=308.
_
Potncia=P(X305/=308)=P[Z(305-308)/(8/16)]=
=P[Z-1,5]=0,5 + 0,4332= 0,9332
Concluso:
O teste ir indicar que o faturamento mensal no ser de
300 mil reais mensais 93,32% das vezes quando a verdadeira mdia
de faturamento mensal for =308 mil reais mensais(potncia =
93,32%).

Exemplo 3:
Um professor de estatstica formulou as seguintes hipteses
a cerca do desempenho de seus alunos nos ltimos semestres:

H0: =8,0
H1: :>8
Baseando-se numa amostra de tamanho 100, e sabendo
que o desvio-padro histrico das notas dos alunos do professor
na disciplina 2 e com uma confiana de 90%, qual a potncia
deste teste para uma hiptese alternativa de =8,5?

323

Soluo do Exemplo:
Passo 1: Escreva a regra para rejeitar H0

em termos

de Xbarra. Sabemos que =2. Logo, o teste Z rejeita H0 no nvel


=0,10 quando:
_
Z= (X 8) /(2/100)1,29
Fazendo os clculos:
_
Rejeitar H0 quando X8,26.
Passo 2: A potncia a probabilidade desse evento
sob

a condio de que a alternativa =8,5 seja verdadeira. Para

calcular essa probabilidade, padronize a mdia amostral usando


=8,5.
_
Potncia=P(X8,26/=8,5)=P[Z(8,26-8,5)/(2/100)]=
=P[Z-1,2]=0,5 + 0,3849= 0,8849
Concluso:
A probabilidade do teste rejeitar a hiptese nula 8,0, quando a nova mdia para
o parmetro for 8,5, de 88,49%.

324

Erros do Tipo I e do Tipo II:


o Podemos descrever o desempenho de um teste em
um nvel fixo fornecendo as probabilidades dos dois
tipos de erro: Tipo I e Tipo II ;
o Um erro do Tipo I ocorre se rejeitarmos H0, quando ela
verdadeira;
o Um erro do Tipo II ocorre se aceitarmos H0 quando
ela falsa( igual a 1 Potncia);
o Em um teste de significncia de nvel fixo, o nvel de
significncia a probabilidade de um erro do Tipo I;
o No

exemplo

anterior,do

teor

de

doura

do

refrigerante,o teste ir indicar que o refrigerante


perde doura apenas 5% das vezes

quando na

verdade no perde(Erro do Tipo I : =0,05)


o A potncia contra uma alternativa especfica 1,
menos a probabilidade de um erro do Tipo II, para
aquela alternativa;
o Aumentar o tamanho da amostra(n) aumenta a
potncia (reduz a probabilidade de um erro de Tipo II),
quando o nvel de significncia permanece fixo.
o Nos casos precedentes, nos preocupamos apenas
com o controle do erro Tipo I. Os testes realizados
com este objetivo so chamados de Testes de
Significncia.
o Quando nos preocupamos tambm com o erro do
Tipo II e seu controle, os testes passam a se chamar
Testes de Hipteses.

325

Esquemas de Decises em Testes de Hipteses:

Deciso com

Verdade acerca da

base

populao

na amostra
H0

H0 falsa

verdadeira

Rejeitar

Erro do

H0

Tipo I

Aceitar
H0

Deciso
correta

Potncia do
teste

Erro do
Tipo II

326

Observao:
Todos os valores-p calculados neste captulo e no restante
do livro, relativos s distribuies t , 2

e F, so valores

aproximados, porque foram indicados em funo de


pontos crticos prximos.

327

Exerccios Propostos:

1)A Good Times mediu o tempo de durao de 50 fitas cassetes


DKW, modelo A60 . O tempo mdio obtido foi de 61,8 min, com
desvio padro 3,5 min. Contudo, h uma suspeita de que a
amostra encontrada constitui uma estimativa

enganosa,

pois durante muitos anos o tempo de vida mdia das fitas do


modelo referido foi de 70 min . Teste a suspeita da Good Times ao
nvel de que tempo de durao da fitas no mudou, utilizando
o intervalo de confiana de 90% .
2)A Automvel Clube de So Paulo acredita que a proporo de
seus associados que possuem carro a lcool seja de 40 %. Para
tanto realizou uma

pesquisa,

perguntando

aos

associados

se

possuam carro a lcool ou gasolina. Dos 3570 motoristas


consultados, 2.285 responderam ter carro a lcool e os demais
gasolina. Com base nestes dados, teste a hiptese da Automvel
Clube de So Paulo pelo intervalo de confiana , ao nvel de 99% de
confiana.
3)Um processo de fabricao produziu milhes de vlvulas de TV com
vida mdia = 1200 e

= 300 horas. Experimentou-se um novo

processo em uma amostra aleatria de100 vlvulas, obtendo-se uma


mdia xbarra = 1265 horas. Teste a hiptese de que a mdia
populacional continuaa mesma, contra a

hiptese

alternativa

que

aumentou, com 95% de confiana. Teste pelo Valor-p.

328

4)Uma cadeia de lanchonetes se instalar em um local proposto se


passarem pelo local mais de 200 carros

por hora durante certos

perodos do dia. Para 36 horas aleatoriamente selecionadas durante


tais perodos do dia, o nmero mdio de carros que passaram
pelo local foi xbarra= 208,5 com desvio padro s = 30,0. Supe-se
que a

populao estatstica seja aproximadamente normal. O

gerente da cadeia de lanchonetes

adota conservadoramente a

hiptese nula de que o volume de trfego no satisfaz a exigncia,


isto , H0 = 200 carros, contra a hiptese alternativa H1 : 200 carros.
Teste pelo Valor-p.

5)Escolheram-se aleatoriamente 16 notas de uma turma muito


grande e na amostra o desvio padro 12. Se a mdia amostral
58, testar a hiptese nula de = 60 , contra a alternativa 60. Teste
pelo:
a) Intervalo de Confiana;
b) Valor-p.
6)Em Boston em 1968, o Dr. Benjamin Spock, famoso pediatra e
ativista contra a guerra do Vietn, foram

julgados por conspirao

por violar a lei de recrutamento. O juiz que julgou o Dr.Spock tinha


uma folha corrida interessante: das 700 pessoas que o

juiz

tinha

selecionado para jri em seus ltimos julgamentos, apenas 15% eram


mulheres. No entanto, na cidade como um todo, cerca de 29%

da

sociedade formada por mulheres. Para julgar a imparcialidade do


juiz na escolha de mulheres para o jri, formule a hiptese nula e a
teste ao nvel de 5% de significncia. Teste pelo valor-p:

329

7)Uma indstria fabrica dois tipos de pneus. Numa pista de teste, os


desvios-padro das distncias percorridas, para produzir certo
desgaste, so de 2500 km e 3000 km. Tomou-se uma amostra de
50 pneus do 1 tipo e 40 do 2 tipo, obtendo mdias de 24.000km e
26.000km, respectivamente. Teste a hiptese nula de que a diferena
de mdias -10.000km, contra a hiptese alternativa de ser menor
que -10.000km, pelo valor-p, com uma confiana de 95%?
8)Uma mquina automtica enche latas, com base no peso lquido,
com um desvio-padro de 5 kg. Duas amostras independentes,
retiradas em

dois perodos de trabalhos consecutivos, de 10 e 20

latas, forneceram pesos lquidos mdios de 184,6 e 188,9g,


respectivamente. Teste a hiptese nula de que a diferena de mdias
-5 kg, contra a hiptese alternativa de ser maior que -5 kg, pelo
valor-p, com uma confiana de 95%?
9)Duas amostras de barras de ao, ambas de tamanho n=5, foram
ensaiadas e obteve-se que as resistncias mdias foram de 55
kgf/mm2 e 53 kgf/mm2 e as varincias das resistncias foram de 7,5 e
5,0 kgf/mm 2, respectivamente. As varincias so desconhecidas, mas
supostamente iguais. Teste a hiptese nula de que a diferena de
mdias zero, contra a hiptese alternativa de ser diferente de zero,
pelo intervalo de confiana e pelo valor-p, com uma confiana de
99%?

330

10)A mdia de salrios semanais para uma amostra de n=30


empregados em uma grande firma

R$ 1800,00, com desvio-

padro R$ 140,00. Em uma outra grande empresa, uma amostra


aleatria de n=40 empregados apresentou um salrio mdio semanal
de R$1700, 00, com um desvio-padro de R$ 100,00. As varincias
populacionais so desconhecidas, mas supostamente desiguais.
Teste a hiptese nula de que a diferena de mdias entre as firmas
seja de R$150,00, contra a hiptese alternativa de ser menor de
R$150,00, pelo valor-p , com uma confiana de
95%?
11)De uma populao animal escolheu-se uma amostra de 10
cobaias. Tais cobaias foram submetidas ao tratamento com uma
rao especial por um ms. Na tabela a seguir, esto mostradas os
pesos antes(Xi) e depois(Yi) do tratamento, em Kg. Teste

hiptese nula de que a diferena de mdias zero, contra a


hiptese alternativa de ser diferente de zero, pelo intervalo de
confiana e pelo valor-p, com uma confiana de 99%?

Cobaias

10

Xi

635

704

662

560

603

745

698

575

633

669

Yi

640

712

681

558

610

740

707

585

635

682

12)Num inqurito com os telespectadores de televiso de uma


cidade, 60 de 200 homens desaprovam certo programa, acontecendo
o mesmo com 75 de 300 mulheres. Teste a hiptese nula de que a
diferena de propores de 10%, contra a hiptese alternativa de
ser menor de 10%,pelo valor-p, com uma confiana de 99%?

13)Voc tem os escores quantitativos do NAEP de uma AAS de 840


331

homens jovens. Voc planejou testar hipteses sobre o escore mdio


da populao no nvel de significncia de 1%:
H0: =275
H1: <275
Sabemos que o desvio-padro da populao =60. A estatstica de
teste Z :
_
X 275
Z=
60/840
Pergunta-se:
a)Qual a regra para rejeitar H0 em termos de Z?
B)Qual a regra para rejeitar H0 reenunciada em termos de Xbarra?
c)Voc

deseja saber se esse teste ir usualmente

rejeitar

H0,

quando a verdadeira mdia populacional 5 pontos abaixo do que


afirma a hiptese nula. Responda a esta pergunta calculando a
potncia quando =270.

332

14)As garrafas de um refrigerante popular devem conter 300


mililitros (ml) de refrigerante. H uma certa variao de garrafa para
garrafa, porque as mquinas usadas no enchimento no so
perfeitamente precisas. A distribuio dos contedos normal,
com desvio-padro =3 ml. Ainspeo de 6 garrafas possibilitar que
se descubra o preenchimento incompleto? As hipteses so:
H0:=300
H1:<300
Um teste de significncia de 5% rejeita H0 se z - 1,645, em que a
estatstica de teste Z :
_
X 300
Z=
3/6
Clculos da potncia nos ajudam a ver quanto a menos no
contedo das garrafas podemos esperar que o teste detecte.
a)Ache a potncia desse teste contra a alternativa =299
b)Ache a potncia desse teste contra a alternativa =295
c)A potncia contra =290 maior ou menor do que o valor que
voc encontrou em(b)? No calcule realmente essa potncia. Explique
sua resposta.

15)Aumentar o tamanho da amostra aumenta a potncia de um teste


de

hiptese quando o nvel permanece o mesmo. No exerccio

anterior, n=6.Suponha que tenha sido medida uma amostra com


n garrafas.O teste de significncia de 5% ainda rejeita H0 quando
z-1,645, mas a estatstica Z agora:
_
X 300
Z=
3/n
a)Ache a potncia desse teste contra a alternativa =299 quando
n=25
b)Ache a potncia desse teste contra a alternativa =299 quando
n=100
16)Sua empresa comercializa um programa de diagnstico mdico
computadorizado. O programa examina os resultados de testes
mdicos de rotina(pulsao, testes sangneos, entre outros) e
elucida o paciente ou encaminha o caso para um mdico. O
programa feito para examinar milhares de pessoas que no
apresentam reclamaes especficas de sade. O programa toma
uma deciso acerca de cada pessoa.
a)Quais so as duas hipteses e os dois tipos de erros que o
programa pode cometer? Descreva os dois tipos de erro em
termos de resultados de teste falso-positivo e falso-negativo?
b)O programa pode ser ajustado para diminuir uma probabilidade de
erro,

custa de, entretanto, aumentar outro tipo de probabilidade de

erro. Qual probabilidade de erro voc escolheria tornar menor e por


qu?

17)Voc tem os escores quantitativos do NAEP de uma AAS de 840


homens jovens. Voc planejou testar hipteses sobre o escore mdio
da populao no nvel de significncia de 1%:
H0:=275
H1:<275
Sabemos que o desvio-padro da populao = 60. A estatstica de
teste Z :
_
X 275
Z=
60/ 840
Pergunta-se:
a)Qual a regra para rejeitar H0 em termos de Z?
b)Qual a probabilidade do erro do Tipo I ?
c)Voc deseja saber se esse teste ir usualmente rejeitar H0,
quando a verdadeira mdia populacional 5 pontos abaixo do que
afirma a hiptese nula. Responda a esta pergunta calculando a
probabilidade do erro Tipo II quando =270.

18)Voc tem uma

AAS de tamanho n=9

partir

de

uma

distribuio normal com = 1 Voc deseja testar:


H0:=0
H1:<0
Voc deseja rejeitar H0 se xbarra > 0 e aceitar H0 em caso contrrio.

a)Ache a probabilidade do erro do Tipo I, ou seja, a probabilidade de


rejeitar H0 quando na verdade =0.
b)Ache a probabilidade do erro do Tipo I I quando =0,3. Essa a
probabilidade de aceitar H0( =0), quando na verdade =0,3.
c)Ache a probabilidade do erro do Tipo I I quando = 1.
19)Numa amostra de 20 elementos de uma populao normal obtevese varincia de 25. Ao nvel de 10% , testar: 2 = 16 contra 2 >16.
20)Se n1 = 12, n2=10 , S1 = 6, S2 = 5, provindas de duas populaes
normais independentes, testar a hiptese de igualdade das varincias
populacionais, ao nvel de 5%n de significncia.

Unidade VII
Anlise da Varincia

Conceitos de Anlise da Varincia:


A anlise de varincia um teste estatstico amplamente
difundido entre os analistas, e visa fundamentalmente verificar se
existe uma diferena significante entre as mdias e se os fatores
exercem influncia nesta diferena.
Os fatores propostos podem ser de origem qualitativa ou
quantitativa, mas a varivel dependente necessariamente dever ser
contnua.
Em ingls, anlise da varincia analysis of variance. Ento,
em ingls e muitas vezes em portugus, se usa a sigla ANOVA(AN
da analysis, O de of e VA de variance) para significar anlise da
varincia.
um teste de diferena de mdias envolvendo varincias. O
teste informa se existe diferena de mdias significante, que no
fruto de erro amostral, quando comparadas duas a duas, entre as
possveis combinaes de um conjunto de mdias. Contudo, a prova
no informa onde est, entre as combinaes duas a duas, a
diferena significante estatisticamente. Ai teremos que realizar um
teste de comparao mltipla para verificar em que par( ou pares) de
mdias est (o) a(s) diferena(s) significante(s).
Se o teste indicar que as mdias so iguais, isto significa
que qualquer diferena entre suas estimativas fruto de erro
amostral e no pode ser associado ao fator ou fatores em estudo.
Na ANOVA, testamos duas hipteses: a Hiptese Nula(H 0) de
que as mdias so iguais e a Hiptese Alternativa, de que existe pelo
menos um par de mdias da combinao duas a duas com diferena
significante.

Uma anlise da varincia s deve ser feita se forem satisfeitas


algumas suposies bsicas, que sero discutidas mais tarde.
Modelo de Classificao nica
a anlise da varincia que serve para testar a diferena
entre mdias levando em conta somente um fator, que se supe
influenciar a varivel dependente ou resposta, e os seus nveis,
chamados tratamentos, inseridos nas colunas. Ento, existe uma
hiptese alternativa de que a diferena de mdias comparadas duas
a duas pode ser predominantemente influncia do fator e seus
tratamentos.
As hipteses da ANOVA portanto so:
H0: estatisticamente, as vrias mdias so iguais.
H1: existe pelo menos uma mdia com efeito diferente das
outras.
Num caso geral, a pergunta a que a ANOVA responde :
Ser que o tratamento influncia a varivel resposta?
A ANOVA diz:
Sim, estatisticamente, h diferena entre diferentes
mdias devido aos tratamentos, ou...
No, estatisticamente, no h diferenas significativas
entre as mdias devido aos tratamentos

Uma anlise da varincia embora exija o clculo de varincias, na realidade


compara mdias de tratamentos. A comparao feita por meio do Teste F.
Na anlise da varincia de um fator, os dados obtidos, ou seja, as respostas das
unidades aos tratamentos podem se escritos na forma de um modelo:
Resposta = mdia do tratamento + erro
o erro que d carter aleatrio Resposta e que impede ver a olho nu se
h diferena entre os tratamentos.
O modelo indica que a resposta de uma observao ao tratamento dada pela
mdia verdadeira do tratamento, acrescida de uma quantidade, que os estatsticos
chamam de erro.
A anlise da varincia de um conjunto de dados exige que sejam feitas algumas
pressuposies sobres os erros, sem as quais os resultados da anlise no so vlidos.
As pressuposies so:
o Ausncia de dados discrepantes;
o Erros so independentes(sem autocorrelao);
o Varincia constante(Homocedasticidade);
o Distribuio dos erros normal.
Vamos falar dos pressupostos bsicos da ANOVA com mais detalhes na sesso
Pressupostos Bsicos.
A variabilidade total dos dados pode ser escrita como a soma de dois termos, um
devido ao erro(QMR) e o outro devido ao tratamento(QMTr).

A anlise da varincia feita, ento, decompondo a varincia total das


observaes em duas componentes: varincia dos tratamentos(QMTr) e a varincia do
resduo(QMR) ou do erro .
Se a varincia calculada usando o tratamento (QMTr) for maior do que a calculada
usando o fator acaso(QMR), isso pode indicar que existe uma diferena significativa entre
as mdias e, devido ao tratamento em estudo.
Segundo a filosofia da ANOVA, a disperso das observaes pode acontecer
por duas razes: o erro e o tratamento. A ANOVA tenta ver se por detrs da
disperso causada pelos erros, se consegue reconhecer um padro de diferena
entre os tratamentos. A ANOVA testa se estatisticamente plausvel que a varincia
total das observaes possa vir apenas pelos erros, ou se, por outro lado, h
sinais claros que a varincia total no pode ser completamente explicada sem uma
contribuio adicional do fator e seus tratamentos.
A principal atrao da ANOVA (analise of variance) a comparao de mdias
oriundas de grupos diferentes, podendo atribuir essa diferena a uma causa especfica,
que justamente o tratamento: mdias de vendas de vendedores diferentes, mdias
histricas de questes de satisfao, empresas que operam simultaneamente com
diferentes rendimentos, entre muitas outras aplicaes.
O diferencial da ANOVA para o t de diferenas de mdias que a possvel
diferena significante existente entre duas mdias comparadas duas a duas pode ser
explicada por um fator em considerao: o tratamento. Da o teste de diferena de
mdias poder ser utilizados para testar novas tecnologias, novos procedimentos, etc.
associados a diferentes amostras.
A anlise da varincia , portanto, uma extenso do teste t de Student que
compara duas e s duas mdias. A anlise da varincia permite que o pesquisador
compare qualquer nmero de mdias. No caso particular de um estudo com apenas dois
tratamentos, tanto se pode aplicar um teste t como a ANOVA, que se chega mesma
concluso: prova-se teoricamente que o valor calculado de t igual raiz quadrada de F,
calculado na anlise da varincia.
Para anlise da varincia compara a variao devido aos tratamentos( por
exemplo, mtodos de treinamentos de funcionrios) com a variao devido ao acaso ou
resduo preciso proceder a uma srie de clculos. Mas a aplicao das frmulas exige
conhecimento da notao. Veja a tabela abaixo.
Nessa tabela est apresentado uma anlise com k tratamentos: cada tratamento

tem r repeties. A soma dos resultados das r repeties de um mesmo tratamento


constitui o total desse tratamento.
As mdias dos tratamentos foram indicadas por
_ _ _
_
y1, y2, y3, ...,yn.
O total geral dado pela soma dos totais de tratamentos.
Uma ANOVA com um Fator

Total

1
y11

2
y21

y12

y22

...

Tratamento
3
y31

...
...

K
yk1

y32

...

yk2

...

...

...

...

y1r1

y2r2

Y3r3

...

ykrk

T1

T2

T3

...

Tk

T= y

n = kr

Nmero de

...

repeties

Mdia

y1

y2

y3

...

_
yk

Para fazer a anlise da varincia de um fator preciso calcular as seguintes


quantidades:

a)Os graus de liberdade:


de tratamentos: k 1
do resduo: n k
do total: (k 1) + ( n k ) = n-1
b)O valor de C, dado pelo total geral elevado ao quadrado e dividido pelo nmero
de observaes. O valor de C conhecido como correo:
C = ( y )2
n
c)A soma de quadrado total:
SQT = y2 C
d)A soma dos quadrados de tratamentos:
SQTr = T2 C
r
e)A soma dos quadrados de resduos:
SQR = SQT SQTr
f)O quadrado mdio de tratamentos:
QMTr = SQTr
k-1

g) O quadrado mdio de resduos:


QMR = SQR
nk
h) O valor F:
F= QMTr
QMR
Onde:
o SQT= SQTr + SQR (mede a variao geral de todas as observaes);
o SQT a soma dos quadrados totais, decomposta em: SQTr e SQR;
o SQTr a soma dos quadrados dos grupos (tratamentos), associada
exclusivamente a um efeito dos grupos;;
o SQR a soma dos quadrados dos resduos, devidos exclusivamente ao erro
aleatrio, medida dentro dos grupos.
o QMTr = Mdia quadrada dos grupos;
o QMR = Mdia quadrada dos resduos (entre os grupos);
o SQTr e QMTr: medem a variao total entre as mdias;
o SQR e QMR: medem a variao das observaes dentro de cada grupo.
Note que os quadrados mdios so obtidos dividindo as somas de quadrados
pelos respectivos graus de liberdade().
Todas as quantidades calculadas so apresentadas numa tabela de anlise da
varincia. Veja o Quadro da ANOVA apresentado a seguir.

Quadro da ANOVA de um Fator

Fonte de Variao

SQ

QM

Tratamentos

SQTr

k -1

QMTr

Resduo
Total

SQR
SQT

nk
n -1

QMR

F
QMTr/QMR

Deciso da ANOVA:
Calcular o Valor-p com base na Tabela 6 - V a l o r - p p o r v a l o r e s d e F ,
que est anexa.
Deciso: se o valor-p , rejeitar H0.
Observao:
Os clculos e grficos deste captulo so realizados na planilha eletrnica Excel.
fortemente recomendado que o leitor se familiarize com o referido software para que
possa refazer os exemplos e realizar os exerccios.

Exemplos de Aplicao:
Exemplo 1:
Em uma faculdade, existem 3 professores de economia. Na primeira avaliao,
foram selecionados aleatoriamente trs alunos de cada professor e anotada as notas
obtidas. Os resultados constam da tabela abaixo.

Professor A

Professor B

Professor C

6,0

1,0

10,0

5,0

1,0

9,0

4,0

1,0

8,0

15

27

5,0

1,0

9,0

O desempenho dos alunos influenciado pela maneira de ensinar de cada


professor? A diferena de mdias de desempenho dos alunos devida ao carter
didtico de cada mestre ou por fruto de erro amostral?
Para responder estas perguntas temos a tcnica da ANOVA.
Clculos Necessrios:
C = ( 15+3+27 )2/ 9 = ( 45 )2/ 9 = 2025/9 = 225
X2 = 77 + 3 + 245 = 325
SQT = 325 225 = 100
SQTr = [ 152/3 + 32/3 +272/3] 225 = 321 225 = 96
SQR = 100 96 = 4
Quadro da ANOVA
FV

SQ

QM

Tratamento

96

48

Residual

2/3

48
F=

= 48. 2/3 = 72
2/3

Total

100

1 = 2 e 2 = 6 valor-p 0, 001

Deciso:
O valor-p < 0,05, rejeita-se a hiptese nula de que as mdias so iguais. A
diferena de mdias de desempenhos significante. O desempenho dos alunos
influenciado pela maneira de ensinar de cada professor. A diferena de mdias de
desempenho dos alunos devida ao carter didtico de cada mestre.

Exemplo 2:
Um pesquisador realizou um estudo para verificar qual posto de trabalho gerava
mais satisfao para o funcionrio. Para isso, durante um ms, 10 funcionrios foram
entrevistados. Ao final de um ms os funcionrios responderam um questionrio gerando
uma nota para o bem estar do funcionrio( grau de satisfao).

Postos
Funcionrios

10

10

Total

73

59

86

a)Os graus de liberdade:


de tratamentos: 3 1 = 2
do resduo: 30 3 = 27
do total: (k 1) + ( n k ) = 29
b)O valor de C, dado pelo total geral elevado ao quadrado e dividido pelo nmero
de observaes. O valor de C conhecido como correo:
C = ( y )2
n
C = ( 73 + 59 + 86 )2 = (218)2 / 30 = 1584
c)A soma de quadrado total:
SQT = y2 C = [541+353+744] 1584 = 1638 1584 = 54
d)A soma dos quadrados de tratamentos:
SQTr = T2 C
r
SQTr = [(73)2/10 + (59)2/10 + (86)2/10] 1584 =[533+348+740] 1584=1621 1584
= 37
e)A soma dos quadrados de resduos:
SQR = SQT SQTr
SQR = 54 37 = 17

f)O quadrado mdio de tratamentos:


QMTr = SQTr
k-1
QMTr = 37/2 = 18
g) O quadrado mdio de resduos:
QMR = SQR
nk
QMR = 17/ 27 = 0,63
h) O valor F:
F= QMTr
QMR
F = 18/0, 63 = 29
Quadro da ANOVA
Fonte de Variao

SQ

QM

Tratamentos

37

18

Resduo
Total

17
54

27
29

0,63

F
29

Deciso da ANOVA:
Utilizando um nvel de significncia igual a 5%, temos:
Com 1 graus de liberdade no numerador(grau de liberdade do tratamento) e 2
graus de liberdade do denominador(grau de liberdade do resduo), da Tabela da ANOVA
tem-se: 1 = 2 e 2 = 27 Tabela 6 valor-p 0,001
Deciso:
0,001 0,05, rejeitar H0. H diferenas significativas entre os grupos. Observa-se
que QMTr muito superior a QMR, indicando uma forte varincia entre os grupos.
Exemplo 3:
Verificando os ndices de produo segundo os postos de trabalho, durante
certo perodo, analisar se as diferenas se devem aos postos de trabalho, isto ,
se os postos de trabalho diferem quanto produtividade.
Posto A : 90,8 100,0 81,1
Posto B : 85,5 83,0 73,7
Posto C: 65,5 77,1 68,5
Posto A
90,8
100,0
81,1
271,9

Posto B
85,5
83,0
73,7
242,2

Posto C
65,5
77,1
68,5
211,1

a)Os graus de liberdade:


de tratamentos: 3 1 = 2
do resduo: 9 3 = 6
do total: (K 1) + ( n k )= n-1 = 8
b)O valor de C, dado pelo total geral elevado ao quadrado e
dividido pelo nmero de observaes. O valor de C conhecido
como correo:
C = ( y )2
n
C = (271,9+242,2+211,1)2 = 58.435
9
c)A soma de quadrado total:
SQT=y2C= 59380-58435 = 944
d)A soma dos quadrados de tratamentos:
SQTr = T2 C
r
SQTr =[(271,9)2/3+(242,2)2/3+ (211,1)2/3] 58.435=
=616
e)A soma dos quadrados de resduos:
SQR = SQT SQTr
SQR = 944 616 = 328

f)O quadrado mdio de tratamentos:


QMTr = SQTr
k-1
QMTr = 944/2 = 308
g) O quadrado mdio de resduos:
QMR = SQR
nk
QMR = 328/ 6 = 55
h) O valor F:
F= QMTr
QMR
F = 308/55 = 6
Quadro da ANOVA
Fonte de Variao
Tratamentos
Resduo
Total

SQ

QM

616
328
944

2
6
8

308
55

Clculo do valor-p:
Consultando a tabela com 1=2 no numerador e 2=6 no
denominador o valor p0,05
Deciso:
Valor-p 0,05 = , rejeita-se a hiptese nula. A credibilidade
de H0 baixa. Os postos diferem quanto produtividade. Parece
plausvel considerar que os postos produzam efeito sobre os
ndices de produo.

Modelo de Classificao Dupla:

anlise

da

varincia

que

serve

para

testar,

simultaneamente, a diferena entre mdias levando em conta 2


fatores( os tratamentos, nas colunas e os blocos, nas linhas ).
A anlise feita para verificar se h diferena de mdias entre
os tratamentos e paralelamente, de forma independente, se h
diferena de mdias devido aos blocos.
Blocos geralmente so variveis de perfil influentes nas medidas
do estudo e cujas categorias se comportam de forma heterognea na
populao e por isso devem ser consideradas subpopulaes, de onde
se devem selecionar correspondentes subamostras e a cada
subamostra so, ento, aplicados todos os tratamentos.
O experimento, portanto, deve estratificar por essas categorias
para que a anlise seja realizada com uma amostra representativa em
relao varivel de estratificao. Todas as observaes de um bloco
recebem todos os tratamentos.
Para entender como se faz a anlise da varincia com
classificao dupla, primeiro observe a tabela a seguir. Nessa tabela,
esto indicados os dados de uma anlise da varincia com dois
fatores, com k tratamentos e r blocos. O total de cada tratamento
dado pela soma das r observaes submetidas a esse tratamento. O
total de blocos dado pela soma das k unidades do bloco.

Uma ANOVA com dois Fatores


Bloco

Tratamento
Total

1
y11

2
y21

3
y31

...
...

K
yk1

B1

y12

y22

y32

...

yk2

B2

...

...

...

...

...

B3

...

...

...

...

...

...

...

y1r1

y2r2

y3r3

...

ykrk

Br

Total

T1

T2

T3

...

Tk

T= T =y

Nmero de

...

repeties
Mdia

y1

y2

y3

n=r

_
...

yk

Para fazer a anlise da varincia de dois fatores preciso


calcular as seguintes quantidades:

a)Os graus de liberdade:


de tratamentos: k 1
de blocos: r - 1
do resduo: ( k 1) . ( r 1 )
do total: kr -1 = n - 1
b)O valor de C, dado pelo total geral elevado ao quadrado e
dividido pelo nmero de observaes. O valor de C conhecido
como correo:
C = ( y )2
n
c)A soma de quadrado total:
SQT = y2 C
d)A soma dos quadrados de tratamentos:
SQTr = T2 C
r
e)A soma dos quadrados de blocos:
SQB = B2 C
k
f)A soma dos quadrados de resduos:
SQR = SQT SQTr - SQB

g) O quadrado mdio dos tratamentos:


QMTr = SQTr
k-1

h) O quadrado mdio dos blocos:


QMB = SQB
r-1

i) O quadrado mdio dos resduos:

QMR =

SQR

(k 1)(r 1)

j) Os valores de F:

FTr= QMTr
QMR
FB= QMB
QMR

As somas de quadrados so apresentados na tabela da anlise da varincia.


Para calcular os quadrados mdios basta dividir cada soma de quadrados pelos
respectivos graus de liberdade. O valor de F para tratamentos dado pelo
quociente entre o quadrado mdio de tratamentos e o quadrado mdio do resduo.
O valor de F para blocos dado pelo quociente entre o quadrado mdio de blocos
e o quadrado mdio do resduo.
Observando a tabela da ANOVA para dois fatores, note que a soma de
quadrado total(SQT), que d a variabilidade dos dados em torno da mdia geral, foi
dividia em trs componentes: SQTr, que a variabilidade devida aos tratamentos,
SQB, que a variabilidade devida heterogeneidade do bloco, e SQR, que a
variabilidade prpria do fenmeno em estudo, aquela devido ao acaso.

Quadro da ANOVA de dois Fatores


SQ

QM

Tratamentos

SQTr

k -1

QMTr

FTr

Blocos
Resduo
Total

SQB
SQR
SQT

r-1
(k 1)(r 1)
kr -1

QMB
QMR

FB

Fonte de Variao

Valor-p do Tratamento:
Com o grau de liberdade do tratamento(1) e o grau de liberdade do
resduo(2), consultar a Tabela 6(anexa) e obter o valor-p aproximado.
Deciso: se o valor-p , rejeitar H0. com relao aos tratamentos.

Valor-p do Bloco:
Com o grau de liberdade do bloco(1) e o grau de liberdade do resduo(2),
consultar a Tabela 6(anexa)e obter o valor-p aproximado.
Deciso: se o valor-p , rejeitar H0, com relao aos blocos

Exemplo 1:
Suponhamos agora que os alunos do Exemplo 1, de
classificao nica tenham, sido agrupados em blocos de faixa
etria.

Blocos

Tratamentos
Prof. A

Prof. B

Prof. C

Jovens

6,0

1,0

10,0

17

Adultos

5,0

1,0

9,0

15

Idosos

4,0

1,0

8,0

13

27

(Faixas

Total

Etrias)

Total

15

C = ( 15+3+27 )2/ 9 = ( 45 )2/ 9 = 2025/9 = 225


X2 = 77 + 3 + 245 = 325
SQT = 325 225 = 100
SQTr = [ 152/3 + 32/3 +272/3] 225 = 321 225 = 96
SQBr = [ 172/3 + 152/3 +132/3] 225 = 228 225 = 3
SQR = 100 96 3 = 1

359

Quadro da ANOVA
FV

SQ

QM

Tratamento

96

48

48

Bloco

3/2

FTR= = 48. 4 = 192


1/4
3/2

Residual

1/4

FB=

= 3/2. 4 = 6
1/4

Total

100

Tratamentos:
1 = 2 e 2 = 4 valor-p 0, 001
Deciso:
O valor-p < 0,05, rejeita-se a hiptese nula de que as mdias so iguais. A
diferena de mdias de desempenhos significante. O desempenho dos alunos
influenciado pela maneira de ensinar de cada professor. A diferena de mdias de
desempenho dos alunos devida ao carter didtico de cada mestre.

360

Blocos:
1 = 2 e 2 = 4 valor-p 0, 05
Deciso:
O valor-p = 0,05, rejeita-se a hiptese nula de que as mdias so iguais. A
diferena de mdias de faixa etria significante. O desempenho dos alunos
influenciado pela sua faixa etria. A diferena de mdias de desempenho dos alunos
pode ser atribuda tambm faixa etria dos estudantes.

361

Exemplo 2:
Os dados da tabela seguinte referem-se s quantidades produzidas de um
produto por determinado mtodo em diferentes postos de trabalho.Os quatros
nveis do fator A representam postos de trabalho.Os dois nveis do fator B
representam os supervisores de trabalho.Os resultados fornecidos correspondem
a produo de um dia para cada posto e supervisor.
Nvel Fator B
A
31
47
78

Supervisor 1
Supervisor 2
Total

Nvel Fator A
B
C
27
33
35
39
62
72

Total
D
30
46
66

121
157
278

Pede-se :
a) a quantidade afetada significativamente por diferenas nos postos de
trabalho para = 0,01?
b) indiferente que se use o supervisor 1 ou supervisor 2 , com
= 0,05?

362

Soluo:
a)Os graus de liberdade:
de tratamentos: 4 1 = 3
de blocos: 2 1 = 1
do resduo: ( 4 1) . ( 2 1 ) = 3
do total: 4.2 1 = 7 ou n-1 = 8-1 7
b)O valor de C, dado pelo total geral elevado ao quadrado e dividido pelo
nmero de observaes. O valor de C conhecido como correo:
C = ( x )2
n
C = (121+157)2 = 9.660,5
8
c)A soma de quadrado total:
SQT = y2 C
SQT = 10750 9660,5 = 1089,5
d)A soma dos quadrados de tratamentos:
SQTr = T2 C
r
SQTr = [(78)2/2 + (62)2/2 + (72)2/2 + (66)2/2] 9660,5 = 73,5

363

e)A soma dos quadrados de blocos:


SQB = B2 C
k
SQB = [(121)2/4 + (157)2/4] 9660,5 = 162
f)A soma dos quadrados de resduos:
SQR = SQT SQTr - SQB

SQR = 1089,5-162-73,5=854

As estatsticas de g a j foram calculadas no prprio quadro da


ANOVA.
Quadro da ANOVA de dois Fatores
SQ

QM

Tratamentos

73,5

24,5

FTr = 0,09

Blocos
Resduo
Total

162
854
1089,5

1
3
7

162
284,7

FB = 0,57

Fonte de Variao

Valor-p do Tratamento:
Com o grau de liberdade do tratamento( 1=3) e o grau de
liberdade do resduo(2= 3), consultar a Tabela 6(anexa) e o
valor-p 0,25
Deciso: O valor-p 0,25 > 0,01, aceitar H0. A qualidade
no afetada significativamente por diferenas nos postos de
trabalho, com nvel de significncia de 5%.
Valor-p do Bloco:
364

Com o grau de liberdade do tratamento( 1=1) e o grau de


liberdade do resduo(2= 3), consultar a Tabela 6(anexa) e o
valor-p 0,25
Deciso: O valor-p 0,25 > 0,05, aceitar H0. indiferente
que use o supervisor 1 ou o supervisor

2, com nvel de

significncia de 5%.

365

Exemplo 3:
Para um estudo de satisfao, um grupo painel de 6 pessoas foi
solicitado a usar por 4 semanas duas marcas de doce de leite(A e B).
O grupo foi dividido em crianas (I), adultos (II) e idosos (III). No final
da experincia, cada pessoa deu uma nota de 0 a 10 quanto
satisfao com as marcas do doce de leite. Faa a anlise da varincia
dos dados apresentados, com nvel de significncia de 5%.

Marcas de Doce de Leite


Grupos de Idades

10

10

II

III

366

Soluo:
a)Os graus de liberdade:
de tratamentos: 2 1 = 1
de blocos: 3 1 = 2
do resduo: ( 2 1) . ( 3 1 ) = 2
do total: 2.3 1 = 5 ou n -1 = 6 -1 = 5
b)O valor de C, dado pelo total geral elevado ao quadrado e dividido pelo
nmero de observaes. O valor de C conhecido como correo:
C = ( x )2
n
C = (21+15)2 = 362/6 = 1296/6 = 216
6
c)A soma de quadrado total:
SQT = y2 C
SQT = 278 216 = 62
d)A soma dos quadrados de tratamentos:
SQTr = T2 C
r
SQTr = [(21)2/3 + (15)2/3] 216 = 222 216 = 6

367

e)A soma dos quadrados de blocos:


SQB = B2 C
k
SQB = [(202/2 + (10)2/2+(6)2/2] 216 = 268 216 = 52
f)A soma dos quadrados de resduos:
SQR = SQT SQTr - SQB

SQR = 62 -6 52= 4
Quadro da ANOVA de dois Fatores
SQ

QM

Tratamentos

Blocos
Resduo
Total

52
4
62

2
2
5

26
2

Fonte de Variao

F
Ftr= 6/2=4
FB= 26/2=13

Valor-p do Tratamento:
Com o grau de liberdade do tratamento(1=1) e o grau de liberdade do
resduo(2= 2), consultar a Tabela 6(anexa) e o valor-p0,25
Deciso: O valor-p > 0,05, aceitar H0. No h diferena de mdias
quanto satisfao com as marcas de doce de leite.

368

Valor-p do Bloco:
Com o grau de liberdade do tratamento(1=2) e o grau de liberdade do
resduo(2= 2), consultar a Tabela 6(anexa) e o valor-p 0,05
Deciso: O valor-p= 0,05, rejeitar H0. H diferena de mdias quanto
satisfao com a faixa etria.
Concluso do estudo: Os clientes no diferem em satisfao quanto
s marcas de doce de leite, mas diferem quanto faixa etria.
Conceito de Resduos em Anlise da Varincia
Ningum conhece as mdias populacionais dos tratamentos
(1, 2, 4, 3, ..,.n) nem os erros e i. No entanto, o pesquisador faz um
estudo estatstico para obter as estimativas dessas mdias.
Ningum conhece os erros ei, porque eles so definidos em
funo das mdias verdadeiras 1, 2, 4, 3, ..,.n . Mas temos as
estimativas dessas mdias, pelas mdias amostrais. Podemos
estimar os erros fazendo a diferena entre cada dado e a mdia do
tratamento a que ele pertence:
_
eij = yij y
Exemplo: Seja uma observao que assuma no tratamento A
de uma ANOVA o valor 10 e que a mdia desse tratamento seja 15,
logo o resduo associado a esta observao ser:
eij = 10 15 = -5
O comportamento regular dos resduos fundamental para a
eficincia da anlise da varincia que estamos realizando.

369

Validao das Pressuposies Bsicas:


A anlise da varincia exige que sejam feitas a validao das
pressuposies sobre os resduos, sem as quais os resultados da
anlise no so vlidos.
Os pressupostos bsicos da anlise da varincia so:
o Ausncia de dados(erros) discrepantes;
o Os erros so variveis aleatrias independentes(no
autocorrelao);
o A variao constante(homocedasticidade);
o A distribuio dos erros normal.
Anlise dos Resduos
As estimativas dos erros recebem o nome de resduos. o
estudo dessas estimativas, ou seja, a anlise dos resduos que
ajuda verificar se a anlise da varincia feita aceitvel.
Para aprendermos a realizar a anlise dos resduos, vamos a
um exemplo prtico.

370

Exemplo 1:
Os dados abaixo se referem s vendas de um artigo( em mil
itens) em quatro filiais de uma loja de departamento(1, 2, 3 e 4). As
mdias esto no rodap da tabela.
1
25
26
20
23
21
23

2
31
25
28
27
24
27

3
22
26
28
25
29
26

4
33
29
31
34
28
31

Para aprender como feita a anlise de resduos, veja os


resduos calculados na tabela a seguir e apresentados em grfico
seguinte.
Tabela de Clculo dos Resduos do Exemplo 1
1
25-23=2
26-23=3
20-23=-3
23-23=0
21-23=-2
23

2
31-27=4
25-27=-2
28-27=1
27-27=0
24-27=-3
27

3
22-26=-4
26-26=0
28-26=2
25-26=-1
29-26=3
26

4
33-31=2
29-31=-2
31-31=0
34-31=3
28-31=-3
31

No grfico abaixo, os tratamentos esto no eixo das abscissas


e os resduos(valores calculados na tabela acima) esto no eixo das
ordenadas. O grfico dos resduos bsico: quando o modelo
adequado, os resduos exibem um padro aleatrio. No apresentam
tendncia.
Grfico dos Resduos do Exemplo 1

371

Para saber se as pressuposies de uma anlise de varincia


esto satisfeitas, basta verificar:
1- A presena de dados discrepantes;
2-Se

os

erros

so

independentes(ausncia

de

autocorrelao);
3- Se a varincia constante(homocedasticidade);
4- Se a distribuio dos erros normal.
Se, principalmente, o pressuposto da independncia dos erros
no puder ser admitido, as concluses do teste ANOVA podero ser
invlidas.
Uma alternativa para o caso dos pressupostos no serem
vlidos(principalmente a independncia dos erros) usar a ANOVA
sobre os Postos.
Ausncia de Dados Discrepantes(Outlier)
Dados discrepantes( outlier ) um valor muito maior ou muito
372

menor do que o valor esperado, do que a mdia. Pode-se verificar


outliers no prprio grfico de resduos.
O valor discrepante fica mais visvel se for desenhado um
grfico com resduos padronizados( epii ) em lugar dos resduos
propriamente ditos.
Para obter os resduos padronizados( epii ), basta dividir os
resduos pela raiz quadrada do quadrado mdio dos resduo(QMR) da
anlise da varincia.
A expresso dos resduos padronizados fica ento:
epi = ei /QMR
Realizada a anlise da varincia do Exemplo 1, que se refere
s vendas de um artigo( em mil itens) em quatro filiais de uma loja de
departamento(1, 2, 3 e 4), o valor do QMR 7:
Quadro da ANOVA do Exemplo 1
Fonte de Variao

SQ

QM

Valor-p

7,80

0,002

Tratamentos

163,75

54,58

Resduo

112,00

16

7,00

Total

275,75

19

Ento, o resduo padronizado para a primeira observao do


tratamento 1 ser:
epi = 2/7 = 0,756

373

Tabela dos Resduos do Exemplo 1


1
2
3
3
0
-2

2
4
-2
1
0
-3

3
-4
0
2
-1
3

4
2
-2
0
3
-3

Os demais resduos esto apresentados na tabela seguinte:


Tabela dos Resduos Padronizados do Exemplo 1
1
0,756
1,134
-1,134
0,000
-0,756

2
1,512
-0,756
0,378
0,000
-1,134

3
-1,512
0,000
0,756
-0,378
1,134

4
0,756
-0,756
0,000
1,134
-1,134

O grfico dos resduos padronizados o que segue:

374

Grfico dos Resduos Padronizados do Exemplo 1

Valores fora do intervalo de -3 e +3 devem ser considerados


suspeitos. Como todos os valores esto dentro do intervalo de -3 e +3,
logo no existe outlier neste estudo.
Independncia ou Ausncia de Autocorrelao
Para fazer uma anlise da varincia, preciso pressupor que
os erros so variveis aleatrias independentes. Mas o que significa
pressupor que os erros so variveis aleatrias independentes?
Exemplo:
Considere um experimento com voluntrios. Se for obtido uma
dado de cada voluntrio, razovel admitir que tais valores- e,
consequentemente, os erros- so independentes. No entanto, se o
pesquisador obtiver vrios dados do mesmo voluntrio, razovel
375

considerar que tais dados- e os erros- sejam dependente. Isto porque


qualquer medida obtida em uma pessoa em determinado momento
deve estar correlacionada com a medida obtida em momento anterior.
Unidades experimentais observadas em sequncia, no tempo
ou no espao, geralmente tm correlao. Medidas feitas na mesma
unidade experimental esto muitas frequentemente, correlacionadas.
A correlao- entre observaes seriadas ou tomadas em sequencia
chamada de correlao serial. Se isto acontecer, no razovel
pressupor independncia.
Se os erros forem dependentes- porque foram tomadas
observaes na mesma unidade ou em sries temporais, o resultado
da anlise da varincia fica totalmente comprometido. Alis, a noindependncia o mais grave problema para a anlise, porque o nvel
de significncia se torna muito maior do que informado. Mais ainda, a
dependncia difcil de ser corrigida.
Ento- diante de qualquer suspeita de no-independncia-,
essencial proceder anlise dos resduos. Desenha-se um grfico
dos resduos padronizados contra em funo dos tratamentos do
modelo ou em funo da ordem em que as observaes foram
coletadas. Se a pressuposio de independncia estiver satisfeita, os
resduos devem ficar dispersos em torno de zero, sem um padro
definido(aleatoriamente), como acontece no Grfico A, apresentado
abaixo. Se os resduos tiverem clara correlao com os tratamentos
ou contra a ordem de tomada de dados, como mostra o Grfico B
abaixo, no se pode pressupor independncia.
A anlise de resduos extremamente til, mas grfica. Isto
significa que no se pode associar um nvel de probabilidade
concluso de que os erros no so independentes. Mas a
pressuposio de independncia pode ser transformada em hiptese
e essa hiptese pode ser colocada em teste. Quando existe forte
suspeita de no-independncia(autocorrelao), pode-se aplicar o
Teste de Durbin-Watson, que veremos a seguir.

376

Grfico A

377

Grfico B

Teste de Durbin-Watson
378

Usando um grfico residual, as violaes dos pressupostos do


modelo no so sempre fceis de detectar e podem ocorrer apesar
dos grficos parecerem bem comportados. A anlise de resduos,
usando grficos residuais um mtodo subjetivo. Nesse sentido, a
verificao da independncia usualmente feita atravs do Teste de
Durbin-Watson correlao entre resduos sucessivos.
Se houver independncia, a magnitude de um resduo no
influencia a magnitude do resduo seguinte. Neste caso, a correlao
entre resduos sucessivos nula (autocorrelao = 0). As hipteses
do teste, para aferir se a relao entre dois resduos consecutivos
estatisticamente significativa, so ento:
H0: autocorrelao = 0 existe independncia
H1; autocorrelao 0 existe dependncia
Esse teste serve para detectar se h presena significativa de
autocorrelao entre os resduos em um modelo de anlise da
varincia. O coeficiente de Durbin-Watson mede a correlao entre
cada resduo e o resduo da observao imediatamente anterior. A
equao a seguinte:

( ei ei-1)2
i=1

D =
n

e i2
I=1

onde ei o resduo para o perodo de tempo i.

379

Os valores da estatstica D so interpretados da seguinte forma:


D 0 resduos positivamente autocorrelacionados.
D 2 resduos no so autocorrelacionados.
D 4 resduos negativamente autocorrelacionados.
Com a tabela de Durbi-Watson para o nvel de significncia ,
tamanho da amostra n e NVI(nmeros de variveis independentes do
modelo), obtm-se dU que o limite superior de variao e d L, o limite
inferior. Os valores de dU e dL encontram- se tabelados para os nveis
de significncia de 1% e 5% e tamanhos de amostras fixas esto
anexas ao livro.

Regra de Deciso para o Teste de Durbin-Watson


Valor de D
0 D < dL
dL D < dU
dU D < 4 - d U
4 - dU D < 4 - d L
4 - dL D 4

Interpretao
Evidncia de autocorrelao positiva
Zona de indeciso
Ausncia de autocorrelao
Zona de indeciso
Evidncia de autocorrelao negativa

Anlise de Resduos

380

Exemplo 1 de Teste de Durbi-Watson:


Vamos realizar o teste de autocorrelao do Exemplo 1 que se
refere s vendas de um artigo( em mil itens) em quatro filiais de uma
loja de departamento(1, 2, 3 e 4), j visto quando estudamos a anlise
de outlier:
1
25
26
20
23
21
23

2
31
25
28
27
24
27

3
22
26
28
25
29
26

4
33
29
31
34
28
31

Os resduos obtidos segundo a sequncia de tempo em que


foram coletados e o quadro de clculo para o teste se encontram na
tabela abaixo:

381

Sequncia de
tempo

ei

ei2

ei-1

ei - ei-1

(ei - ei-1)2

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Total

2
3
-3
0
-2
4
-2
1
0
-3
-4
0
2
-1
3
2
-2
0
3
-3

4
9
9
0
4
16
4
1
0
9
16
0
4
1
9
4
4
0
9
9
112

0
2
3
-3
0
-2
4
-2
1
0
-3
-4
0
2
-1
3
2
-2
0
3

2
1
-6
3
-2
6
-6
3
-1
-3
-1
4
2
-3
4
-1
-4
2
3
-6

4
1
36
9
4
36
36
9
1
9
1
16
4
9
16
1
16
4
9
36
257

Calculando ento o coeficiente:

( ei ei-1)2
i=1

D =
n

e i2
I=1

257
D = 2,29
112

negrito em toda a expresso e no s no numerador!

382

Interpretao:
Consultando a Tabela de Durbin-Watson para 5%, n=20 e NVI=
1(em ANOVA de um fator s temos uma varivel independente que so
os tratamentos), temos que dL = 1,20 e dU= 1,41.
Temos que:
d U D < 4 - dU
1,41<2,29<2,59(V)
Deciso:
Ausncia de autocorrelao.

383

Exemplo 2 de Teste de Durbi-Watson:


Os dados abaixo se referem aos resduos do Grfico A.
Sequncia de
tempo

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
Total

ei

ei2

ei-1

ei - ei-1

(ei - ei-1)2

4.0
-0.7
-5.3
5.5
3.9
6.9
3.6
-7.5
-0.8
4.4
-7.5
6.5
-3.0
1.5
-4.4
-5.0
-0.7
9.1
-0.5
1.5
-5.0
-0.8
-5.0
5.5
-4.4
3.3
5.8
-0.5
3.7
1.5
4.0

15.8
0.0
4.0
15.8
0.6
4.0
-4.7
22.3
28.0
-0.7
-4.5
20.6
30.7
-5.3
10.8
117.3
15.2
5.5
-1.6
2.7
48.0
3.9
3.0
9.2
12.7
6.9
-3.4
11.3
56.3
3.6
-11.1
122.5
0.6
-7.5
6.7
44.9
19.5
-0.8
5.2
27.2
56.3
4.4
-11.9
141.9
42.2
-7.5
14.0
195.9
8.8
6.5
-9.5
89.6
2.4
-3.0
4.5
20.3
19.0
1.5
-5.9
34.8
24.8
-4.4
-0.6
0.4
0.6
-5.0
4.2
17.9
82.1
-0.7
9.8
96.2
0.3
9.1
-9.6
91.4
2.4
-0.5
2.0
4.2
24.8
1.5
-6.5
42.5
0.6
-5.0
4.2
17.5
24.8
-0.8
-4.2
17.5
30.7
-5.0
10.5
110.7
19.0
5.5
-9.9
98.0
10.6
-4.4
7.6
58.0
33.5
3.3
2.5
6.4
0.3
5.8
-6.3
39.5
13.6
-0.5
4.2
17.6
2.4
3.7
-2.2
4.6
15.8
1.5
2.4
5.9
463.73
1082.19

Nota: Os valores dos resduos ao quadrado(ei2) foram calculados no Excel com todas as
casas as casas decimais consideradas na planilha.

384

Calculando ento o coeficiente:

( ei ei-1)2
i=1

D =
n

e i2
I=1

1082.19
D = 2,33
463.73

Interpretao:
Consultando a Tabela de Durbin-Watson para 5% , n=31 e NVI=
1, temos que dL = 1,36 e dU= 1,50. Logo o valor de D est no terceiro
intervalo da regra de deciso:
dU D < 4 - d U
1,50 2,33 < 4 1,50
1,50 2,33 < 4 1,50
1,50 2,33 < 2,50 (V)
Logo

conclumos

que

neste

caso,

existe

ausncia

de

autocorrelao, o que vai de encontro ao que verificamos graficamente


e a anlise da varincia pode ser feita sem maiores problemas.

385

Exemplo 3 de Teste de Durbi-Watson:


Os dados abaixo se referem aos resduos do Grfico B.
Sequncia de
tempo
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
Total

ei
-7,50
-5,29
-6,90
-4,94
-4,98
-5,54
-1,11
-2,97
-2,23
-5,80
-4,36
-0,80
-0,75
-0,50
1,54
0,82
3,26
3,69
4,13
3,57
5,70
5,54
3,98
4,41
4,85
5,79
5,82
9,06
6,50
6,93
3,90

ei2
56,25
27,98
47,61
24,40
24,80
30,69
1,23
8,82
4,97
33,64
19,01
0,64
0,56
0,25
2,37
0,67
10,63
13,62
17,06
12,74
32,49
30,69
15,84
19,45
23,52
33,52
33,87
82,08
42,25
48,02
15,21
714,91

ei-1
0
-7,50
-5,29
-6,90
-4,94
-4,98
-5,54
-1,11
-2,97
-2,23
-5,80
-4,36
-0,80
-0,75
-0,50
1,54
0,82
3,26
3,69
4,13
3,57
5,70
5,54
3,98
4,41
4,85
5,79
5,82
9,06
6,50
6,93

ei - ei-1
-7,50
2,21
-1,61
1,96
-0,04
-0,56
4,43
-1,86
0,74
-3,57
1,44
3,56
0,05
0,25
2,04
-0,72
2,44
0,43
0,44
-0,56
2,13
-0,16
-1,56
0,43
0,44
0,94
0,03
3,24
-2,56
0,43
-3,03

(ei - ei-1)2
56,25
4,88
2,59
3,84
0,00
0,31
19,62
3,46
0,55
12,74
2,07
12,67
0,00
0,06
4,16
0,52
5,95
0,18
0,19
0,31
4,54
0,03
2,43
0,18
0,19
0,88
0,00
10,50
6,55
0,18
9,18
165,07

386

Calculando ento o coeficiente:

( ei ei-1)2
i=1

D =
n

e i2
I=1

165,07
D = 0,23
714,91

Interpretao:
Consultando a Tabela de Durbin-Watson para 5% , n=31 e NVI=
1, temos que dL = 1,36 e dU= 1,50. Logo o valor de D est no primeiro
intervalo da regra de deciso:
0 D < dL
0<0,23<1,36(V)
Logo, conclumos que neste caso, existe evidncia de
autocorrelao positiva, o que vai de encontro ao que verificamos
graficamente e a anlise da varincia tradicional neste caso fica
seriamente comprometida.

Varincia Constante( Homocedasticidade )


387

Se for razovel admitir que os erros sejam independentes,


o passo seguinte consiste em verificar se as varincias so
constantes ou, como preferem dizer os estatsticos- se existe
homocedasticidade.
No caso do modelo de anlise da varincia de um nico
fator, convm verificar se as varincias dos tratamentos so
iguais. A violao

do pressuposto

da

homocedasticidade

compromete a credibilidade do Teste F.


Observao:
Se as varincias so heterogneas acentuadamente isto
significa que as diferenas de mdias podem ser devido a este
fato, do que propriamente devidos aos tratamentos. sabido que
as mdias so medidas de tendncia

central fortemente

influenciadas pelo grau de disperso da srie.


Os

grficos

ilustram

respectivamente

resduos

homocedsticos e heterocedsticos.

388

Grfico C

389

Grfico D

390

Regra Prtica de Verificao de Homocedasticidade:

Uma regra prtica defendida por quem estudou o assunto


sugere pressupor que os resultados de uma anlise da varincia
sejam considerados vlidos desde que a maior varincia no exceda
em trs vezes a menor.
Exemplo de Teste de Homocedasticidade pela Regra Prtica:
Vamos realizar o teste de homocedasicidade do Exemplo 1
que se refere s vendas de um artigo( em mil itens) em quatro filiais
de uma loja de departamento(1, 2, 3 e 4), j visto anteriormente.
Estatsticas
A
23
6,5

Mdia
Varincia

Tratamentos
B
C
27
26
7,5
7,5

D
31
6,5

No caso, como a maior varincia 7,5 e a menor 6,5, temos:


7,5
= 1,15 < 3
6,5
Interpretao:
Pelo exposto, ento, razovel pressupor varincias iguais.

391

Observao:
Existem situaes prticas que embora a maior varincia
exceda em trs vezes a menor, o pressuposto da igualdade de
varincia pode ser aceito. Por isso devemos tomar muito cuidado com
essas regras prticas. Para se ter maior segurana na concluso da
varincia constante convm realizar um teste de homogeneidade
baseado em prova de significncia.
Para testar a igualdade de varincias, foram propostos
diversos testes. Mas neste livro estudaremos o Teste de Levene.
O Teste de Levene usado para testar se k amostra tem a
mesma varincia. Alguns testes estatsticos, como por exemplo a
anlise de varincia, assumem que as varincias so iguais dentro das
categorias da varivel independente ou amostras. O teste de Levene
pode ser usado para verificar essa suposio.
Teste de Levene:
A lgica do Teste de Levene simples: quanto maiores so as
varincias, maiores sero os resduos(os resduos so calculados
em funo da distncia de cada observao de sua mdia dentro
de cada tratamento). Podemos, ento, pensar num modelo de
regresso em que o resduo a varivel dependente e a varincia, a
independente, e testar a existncia da associao atravs do Teste
F(F = variao explicada pelas varincias/variao explicada por
fatores aleatrios ou alheios ao modelo).
Se as varincias so homogneas, o resultado do Teste F para
comparar as mdias dos valores absolutos dos resduos ser no
significante, isto , os resduos so mais fortemente explicados por
fatores aleatrios do que pelas varincias tidas como variveis
explicativas. No grfico, isto resultar em erros dispersos, de forma
aleatria, com compacidade constante.

392

O Teste de Levene , portanto, a anlise da varincia dos


valores absolutos dos resduos. Quando dizemos que o teste deu
positivo,

no

significante,

conclui-se

que

os

erros

so

homocedsticos.
Exemplo 1 de Teste de Levene:
Vamos realizar o teste de homocedasicidade atravs do Teste
de Levene com os dados do Exemplo 1 que se refere s vendas de
um artigo( em mil itens) em quatro filiais de uma loja de
departamento(1, 2, 3 e 4), j visto anteriormente.
Tabela dos Resduos do Exemplo 1
1
2
3
3
0
-2

2
4
-2
1
0
-3

3
-4
0
2
-1
3

4
2
-2
0
3
-3

Valores Absolutos dos Resduos do Exemplo 1


1
2
3
3
0
2

2
4
2
1
0
3

3
4
0
2
1
3

4
2
2
0
3
3

393

Quadro da ANOVA

Fonte de Variao
Tratamentos
Resduo
Total

SQ

QM

Valor-p

0,00
32,00
32,00

3
16
19

0,00
2,00

0,00

1,00

Interpretao:
A credibilidade da hiptese nula de que as mdias so iguais
altssima, ou melhor, absoluta. As diferenas de mdias so no
significantes, fruto de erro amostral. Portanto, as varincias podem
ser consideradas homogneas. O Teste de Levene deu positivo.
Exemplo 2 do Teste de Levene:
Os dados abaixo se referem s notas de fsica dadas por seis
professores de seis cursinhos pr-vestibulares vestibulandos de
universidades federais.
Prof. 1
1.0
1.5
1.0
1.5
2.0
2.5
2.0
2.5
3.0
3.5
2.05

Prof. 2
1.0
3.0
4.0
4.5
5.0
6.0
6.5
7.0
3.0
4.0
4.4

Prof. 3
2.0
1.0
7.0
9.0
5.0
2.0
3.0
9.0
8.0
1.0
4.7

Prof. 4
0.5
1.0
10.0
1.0
9.0
4.0
2.0
3.0
2.0
8.0
4.05

Prof. 5
0.0
0.0
10.0
0.0
0.5
0.5
1.0
9.0
9.5
2.0
3.25

394

Os valores dos resduos absolutos so:


Prof. 1
1.05
0.55
1.05
0.55
0.05
0.45
0.05
0.45
0.95
1.45

Prof. 2
3.4
1.4
0.4
0.1
0.6
1.6
2.1
2.6
1.4
0.4

Prof. 3
2.7
3.7
2.3
4.3
0.3
2.7
1.7
4.3
3.3
3.7

Prof. 4
3.55
3.05
5.95
3.05
4.95
0.05
2.05
1.05
2.05
3.95

Prof. 5
3.25
3.25
6.75
3.25
2.75
2.75
2.25
5.75
6.25
1.25

O quadro da ANOVA com os valores absolutos dos resduos :


Quadro da ANOVA
Fonte de Variao

SQ

QM

Valor-p
8.51

Tratamentos
Resduo
Total

64.05

4.00

16.01

84.69

45.00

1.88

148.73

0.000

49.00

Interpretao:
A credibilidade da hiptese nula de que as mdias so iguais
baixssima,

ou

melhor,

nula.

As

diferenas

de

mdias

so

significantes, no fruto de erro amostral. Portanto, as varincias


podem ser consideradas heterogneas e h heterocedasticidade.
Teste de Levene deu negativo.
O grfico dos resduos fica:

395

Transformaes Estabilizadoras da Varincia:


Quando as varincias so muito heterogneas, possvel fazer
a anlise da varincia desde que seja feita uma transformao dos
dados, que as torne homogneas. Tais transformaes estabilizadoras
da varincia tambm eliminam a falta de normalidade.
A varivel obtida por contagem geralmente no tm varincia
constante e nem distribuio normal. No entanto, so relativamente
comuns em anlise de dados.
Para fazer a anlise da varincia recomenda-se transformar a
varivel, ou seja, extrair a raiz quadrada dos dados. A transformao
eficiente porque diminui a heterogeneidade das varincias.

396

Exemplos de Variveis obtidas por Contagem:


Nmero de itens vendidos por uma amostra de vendedores em
algumas filiais de uma grande loja de departamento, nmero de
clientes atendidos por uma amostra de bancrios em algumas
agncias, nmero de clientes satisfeitos por uma amostra de
sequncia de tempo em algumas operadoras de telefonia celular, etc..
Para analisar dados de contagem, recomenda-se extrair a raiz
quadrada. Essa nova varivel tem, em geral, varincia constante.
Exemplo de Transformao Estabilizadora da Varincia:
Os dados abaixo se referem ao nmero de clientes atendidos
por uma amostra de 20 bancrios em 4 agncias bancrias:
Agncia A
10
15
5
15
5

Agncia B
30
15
40
35
40

Agncia C
20
15
10
5
25

Agncia D
10
10
15
5
15

A tabela abaixo apresenta as varincias dos dados segundo o


grupo, antes e depois da transformao de variveis(raiz quadrada
dos dados originais).

397

Varincias dos Dados segundo grupo, Antes e Depois da


Transformao
Grupo

Sem

Com

Agncia A
Agncia B
Agncia C
Agncia D

transformao
25,0
107,5
62,5
17,5

transformao
0,7
1,0
1,2
0,5

Suprimir a interpretao e a ANOVA fornecida: sem


importncia analtica

398

Normalidade: (ATENO: Algumas frases e pargrafos foram


suprimidos)
Em linhas gerais, o pesquisador no precisa se preocupar com
a no-normalidade, desde que os dados no transgridam fortemente a
forma gaussiana. Para verificar o atendimento a este pressuposto,
vamos calculamos o coeficiente de assimetria e verificar o grfico de
resduos padronizados.
Exemplo:
Os dados abaixo se referem aos resduos do Grfico A. A
estatstica de assimetria se encontra na tabela abaixo:
Coeficiente Momento de Assimetria dos Dados do Grfico A
Estatsticas
Coeficiente momento de assimetria(M AS)

Valores
-0,17

Nota ; Clculos do Excel

A distribuio beira os limites tolerveis de simetria(curva


assimtrica negativa moderada), o que no implica em grandes
transgresses normalidade. Testes mais rigorosos de normalidade
sero fornecidos nos captulos seguintes(Teste de Bera-Jarque e
Teste de Kolmogorov-Smirnov).

399

Teste de Normalidade pelo Grfico de Resduos Padronizados:


A anlise da normalidade pode ser feita observando-se
diretamente o grfico dos resduos padronizados. Se os erros
padronizados estiverem 99% dentro da rea de -3 a 3, eles podem ser
considerados normalmente distribudos. Note que esse grfico e
esses limitem so os mesmos usados para verificar a presena de
dados discrepantes.
Ento do exemplo anterior, temos o grfico dos resduos
padronizados:

Interpretao:
Os resduos padronizados esto bem dentro dos limites
estabelecidos pela probabilidade da normal de 99%.

400

Exemplo Completo de Atendimento aos Pressupostos Bsicos


Agora vamos fazer uma anlise completa a um s problema do
atendimento aos pressupostos bsicos.
Os dados abaixo se referem s avaliaes de satisfao dada
por 25 clientes a cinco operadoras de TV Cabo com Internet, via
telefone de auto-atendimento.
Satisfao com Operadoras de TV a Cabo e Internet
A
7.5
7.0
8.0
8.5
9.0

B
5.0
5.5
5.0
6.5
6.0

C
10.0
10.0
9.0
9.5
10.0

D
2.0
2.5
3.0
2.5
4.0

E
8.0
6.0
7.0
7.5
8.5

1 )Anlise de Outlier:
Tabela de Resduos

-0.5
-1.0
0.0
0.5
1.0

Resduos
-0.6
0.3
-0.1
0.3
-0.6
-0.7
0.9
-0.2
0.4
0.3

-0.8
-0.3
0.2
-0.3
1.2

0.6
-1.4
-0.4
0.1
1.1

401

Quadro da ANOVA das Avaliaes

Fonte
Variao

de

SQ

QM

Valor-p

Tratamentos
138
11
149

Resduo
Total

4
20
24

34.5
0.55

62.73

0.000

Anlise:
O Teste F deu significante: existe diferena de mdias de
satisfao entre as operadoras de TV Cabo e Internet.
Tabela de Resduos Padronizados

-0.67
-1.35
0.00
0.67
1.35

Resduos
-0.8
-0.1
-0.8
1.2
0.5

Padronizados
0.4
-1.1
0.4
-0.4
-0.9
0.3
-0.3
-0.4
0.4
1.6

0.8
-1.9
-0.5
0.1
1.5

402

Grfico dos Resduos Padronizados

Interpretao:
Observado o grfico dos resduos padronizados, verificamos
que todos os resduos esto no intervalo de -3 a +3, comprovando a
ausncia de dados discrepantes(outliers).

403

2 )Teste da Independncia dos Resduos


a)Pelo Teste de Durbin-Watson:

Sequncia de
tempo
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
25
25
Total

ei2
0.25
1.00
0.00
0.25
1.00
0.36
0.01
0.36
0.81
0.16
0.09
0.09
0.49
0.04
0.09
0.64
0.09
0.04
0.09
1.44
0.36
1.96
0.16
0.01
1.21
11.00

ei
-0.50
-1.00
0.00
0.50
1.00
-0.60
-0.10
-0.60
0.90
0.40
0.30
0.30
-0.70
-0.20
0.30
-0.80
-0.30
0.20
-0.30
1.20
0.60
-1.40
-0.40
0.10
1.10

ei-1
0.00
-0.50
-1.00
0.00
0.50
1.00
-0.60
-0.10
-0.60
0.90
0.40
0.30
0.30
-0.70
-0.20
0.30
-0.80
-0.30
0.20
-0.30
1.20
0.60
-1.40
-0.40
0.10

ei - ei-1
-0.50
-0.50
1.00
0.50
0.50
-1.60
0.50
-0.50
1.50
-0.50
-0.10
0.00
-1.00
0.50
0.50
-1.10
0.50
0.50
-0.50
1.50
-0.60
-2.00
1.00
0.50
1.00

(ei - ei-1)2
0.25
0.25
1.00
0.25
0.25
2.56
0.25
0.25
2.25
0.25
0.01
0.00
1.00
0.25
0.25
1.21
0.25
0.25
0.25
2.25
0.36
4.00
1.00
0.25
1.00
19.89

D= (19,89/11.00) = 1,81
Consultado a Tabela de Durbin-Watson de 5% ,n=25 e NVI= 1,
temo que dL=1,29 e dU=1,45, logo:
1,45<1,81<2,55

(V)

Anlise:
O intervalo acima indica que os erros independentes.
b)Pela Observao do Grfico dos Resduos:
404

Grfico dos Resduos

Anlise:
Verifique pelo grfico acima que os resduos se distribuem de
forma aleatria no plano cartesiano.

3 )Teste da Homocedasticidade:
405

a)Pelo Teste de Levene:


Tabela dos Valores Absolutos dos Resduos
Valores Absolutos dos Resduos
0.5
0.6
0.3
0.8
0.6
1.0
0.1
0.3
0.3
1.4
0.0
0.6
0.7
0.2
0.4
0.5
0.9
0.2
0.3
0.1
1.0
0.4
0.3
1.2
1.1

Quadro da ANOVA
Fonte de Variao

SQ

QM

Tratamentos

0.34

4.00

0.09

Resduo

3.04

20.00

0.15

Total

3.38

24.00

Valor-p
0.56

0.69

Anlise:
Pelo valor-p, a credibilidade da hiptese nula alta, isto , a
diferena de mdias no significante, o que implica em
homocedasticidade das varincias. O Teste deu positivo.

406

b)Pela Observao do Grfico dos Resduos:

Grfico dos Resduos:

Anlise:
O grfico dos resduos confirma que a varincia dos resduos
constante ao longo do tempo.

407

4 )Teste de Normalidade:
a)Pelo Coeficiente Momento de Assimetria:
A estatstica de assimetria se encontra na tabela abaixo:
Coeficiente Momento de Assimetria
Estatsticas
Coeficiente momento de assimetria

Valores
0,000

Nota ; Clculos do Excel

Interpretao:
A distribuio simtrica, o que pressupe normalidade dos
erros.
b)Pelo Histograma com o Polgono de Freqncia Sobreposto:
Histograma dos Resduos

Interpretao:
O grfico apresenta simetria visual, o que implica na
confirmao da normalidade dos erros.

408

Validao dos Pressupostos Bsicos do Exemplo Geral


Os dados respeitam a todos os pressupostos da anlise da
varincia e isso indica que os resultados da anlise so vlidos, so
confiveis.
Conseqncias da No Validao dos Pressupostos:
Violao da independncia, normalidade e homocedasticidade
dos erros levam ao aumento dos erros do Tipo I e II. Quando isso
acontece, as concluses da tabela da ANOVA tornam-se duvidosas e
devem ser interpretadas com reservas.
A independncia

dos erros

crucial. A sua

violao

praticamente inviabiliza qualquer ANOVA.


A normalidade dos erros menos importante. Quando o
nmero de repeties dos tratamentos grande( r i 30), o Teorema
Central do Limite diz-nos que essas mdias tero aproximadamente
distribuio normal.
Entretanto, quando os grupos so pequenos em cada
tratamento,

estatstica

resistente

violao

de

normalidade(sua violao, em geral, no compromete a deciso


do teste de significncia da diferena de mdias) quando os erros
tm assimetria no mximo moderada.
A

estatstica

tambm

resistente

violao

da

homocedasticidade. A sua violao trs problemas apenas quando


grupos de tratamentos com varincia alta tm mdias muito afastadas
das restantes: a no se sabe se a diferena de mdias devido s
varincias heterogneas ou aos tratamentos em anlise.

409

Resumindo, o que foi dito em pargrafos acima, h trs


situaes em que a no violao de pressupostos pode ter
conseqncias graves:
o Independncia dos erros no plausvel. Deveremos ter
sempre assegurado este pressuposto. A indefinio
sobre este pressuposto tambm no aceitvel;
o Violao

grosseira

da

normalidade,

principalmente

quando os grupos so pequenos;


o Violao da homocedasticidade, quando grupos de alta
varincia tm mdias afastadas das restantes.
Nos casos em que h pressupostos violados de forma menos
graves, pode-se ainda assim executar a ANOVA normalmente. Neste
caso, deve-se tomar mais cuidado quando o resultado da deciso for
rejeitar a hiptese nula, isto , quando a estatstica F significante.
Para assegurar-se que a deciso foi correta, sugere-se mais
dados e repetir a ANOVA ou usar outro tipo de ANOVA. Fora isso, se
pode basear decises na tabela ANOVA com confiana.
Quando a violao de pressuposies grave, teremos de
recorrer a testes alternativos ANOVA. Existem vrios na literatura,
mas aqui estudaremos mais adiante apenas um: a ANOVA sobre os
Postos.

410

ANOVA sobre Postos( RT ANOVA):


simplesmente uma ANOVA paramtrica usual sobre os postos.
A transformao de postos a substituio dos dados originais Yij pelos
postos(Rij) de uma amostra ordenada. Chamaremos esta posio de
Rij. Se houver empate nos postos atribuir postos mdios.
As hipteses da ANOVA sobre Postos so:
Ho: Os grupos tm todos os mesmos postos mdios
H1: H pelo menos um grupo com posto mdio diferente dos
outros.
Exemplo:
Vamos realizar a ANOVA e o Teste de Durbin-Watson sobre os
dados do experimento abaixo e se for necessrio realizar uma ANOVA
sobre Postos.
Nmero de Vtimas Fatais numa Cidade
2007
174
192
195
196
191
180
184
168
180

2008
175
166
197
175
194
163
200
201
179

2009
204
182
214
237
190
214
213
228
204

2010
182
182
190
188
229
203
221
221
000

411

Soluo:
Quadro da ANOVA:

FV

SQ

QM

Valor-p

Tratamentos

5080

1693

1,24

0,31

Residual

43737

32

1367

Total

48816

35

Deciso:
Valor-p>0,05, aceita-se a hiptese nula. O nmero de vtimas
fatais no difere de ano para ano na cidade referida. A diferena de
mdias no significante.

412

Tabela de Clculo de Clculo do Teste de Durbi-Watson:


Sequncia de
tempo
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
26
27
28
29
30
31
32
33
34
35
36
Total

ei
-10.44
7.56
10.56
11.56
6.56
-4.44
-0.44
-16.44
-4.44
-8.33
-17.33
13.67
-8.33
10.67
-20.33
16.67
17.67
-4.33
-5.56
-27.56
4.44
27.44
-19.56
4.44
18.44
-5.56
2.44
2.44
10.44
8.44
49.44
23.44
41.44
41.44
-179.56

ei2
109.09
57.09
111.42
133.53
42.98
19.75
0.20
270.42
19.75
69.44
300.44
186.78
69.44
113.78
413.44
277.78
312.11
18.78
30.86
759.31
19.75
753.20
382.42
19.75
340.20
30.86
5.98
5.98
109.09
71.31
2444.75
549.64
1717.64
1717.64
32240.20
43737

ei-1
0.00
-10.44
7.56
10.56
11.56
6.56
-4.44
-0.44
-16.44
-4.44
-8.33
-17.33
13.67
-8.33
10.67
-20.33
16.67
17.67
-4.33
-5.56
-27.56
4.44
27.44
-19.56
3.44
18.44
-5.56
2.44
2.44
10.44
8.44
49.44
23.44
41.44
41.44

ei - ei-1
-10.44
18.00
3.00
1.00
-5.00
-11.00
4.00
-16.00
12.00
-3.89
-9.00
31.00
-22.00
19.00
-31.00
37.00
1.00
-22.00
-1.22
-22.00
32.00
23.00
-47.00
24.00
15.00
-24.00
8.00
0.00
8.00
-2.00
41.00
-26.00
18.00
0.00
-221.00

(ei - ei-1)2
109.09
324.00
9.00
1.00
25.00
121.00
16.00
256.00
144.00
15.12
81.00
961.00
484.00
361.00
961.00
1369.00
1.00
484.00
1.49
484.00
1024.00
529.00
2209.00
576.00
225.00
576.00
64.00
0.00
64.00
4.00
1681.00
676.00
324.00
0.00
48841.00
63002

413

Calculando ento o coeficiente:

( ei ei-1)2
i=1

D =
n

e i2
I=1

63002
D = 1,44
43737
Interpretao:
Consultando a Tabela de Durbin-Watson para 5% , n=36 e NVI=
1, temos que dL = 1,41 e dU= 1,52. Logo o valor de D est no segundo
intervalo da regra de deciso:
dL D < d U
1,41 1,44 < 1,52 (V)
Logo, conclumos que neste caso, temos uma indefinio
quanto autocorrelao dos erros, o que nos leva a adotar uma
medida preventiva que a aplicao da ANOVA sobre postos.

414

Nmero de Vtimas Fatais numa Cidade


2007
174
192
195
196
191
180
184
168
180

2008
175
166
197
175
194
163
200
201
179

2009
204
182
214
237
190
214
213
228
204

2010
182
182
190
188
229
203
221
221
000

Dados Transformados em Postos:


Sequncia
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36

Dados Ordenados
000
163
166
168
174
175
175
179
180
180
182
182
182
184
188
190
190
191
192
194
195
196
197
200
201
203
204
204
213
214
214
221
221
228
229
237

Postos
1
2
3
4
5
6,5
6,5
8
9.5
9.5
12
12
12
14
15
16.5
16.5
18
19
20
21
22
23
24
25
26
27.5
27.5
29
30.5
30.5
32.5
32.5
34
35
36

415

Postos Distribudos nos Tratamentos para a ANOVA


2007

2008
6,5
3
23
6,5
20
2
24
25
8

5
19
21
22
18
9.5
14
4
9.5

2009
27.5
12
30,5
36
16.5
30.5
29
34
27.5

2010
12
12
16.5
15
35
26
32.5
32.5
1

Quadro da ANOVA sobre Postos:

FV

SQ

QM

Valor-p

Tratamentos

1168.61

389.54

4.60

0.01

Residual

2711.39

32

84.73

Total

1168.61

35

Deciso:
O valor-p< 0,05; rejeita-se a hiptese nula. Existe pelo menos
um par de postos mdios que so diferentes. Resultado contrrio ao
encontrado com a ANOVA Paramtrica, o que ratifica o engano que se
comete ao lidar com erros autocorrelacionados.
Com a validao realizada pelo teste da ANOVA sobre Postos, o
analista tem maior confiana nos resultados.

416

Teste de Comparao Mltipla:


A anlise

da

varincia

serve

para

verificar

se

existe

diferena significante entre colunas( tratamentos ), no caso de


classificao nica e entre linhas ( blocos) e colunas ( tratamentos ),
no caso de classificao dupla. Se houver diferena, no sabemos
atravs da anlise da varincia, quais linhas ou colunas diferem
entre si. Para tanto,

so

usados os Testes de Comparao

Mltipla. Vamos apresentar o Teste de Tukey.


Critrio de Deciso da Significncia das Diferenas:
(tirei a expresso: como mostra a figura)
A d.m.s, diferena mnima significante, ser o instrumento de
medida. Toda vez que o valor absoluto da diferena entre duas
mdias igual ou maior do que a diferena mnima significante, as
mdias so consideradas estatisticamente diferentes, ao nvel de
significncia estabelecido.
Matematicamente,
_
Se /XB

XC/ d.m.s, ento a diferena entre XB

e XC

significante estatisticamente.

417

Formas de Clculo das d.m.s:


o Foram propostas diversas maneiras de calcular a diferena mnima
significante.
o Cada proposta , na realidade, um teste que, em geral, leva o nome de
seu autor.
o No existe um procedimento para comparao de mdias que seja
definitivamente melhor que todos os outros.
Teste de Tukey:
O processo apresentado serve tanto para o modelo de classificao nica
quanto dupla. Para obter o valor da diferena mnima significante (d.m.s) pelo
Teste de Tukey basta calcular:
d.m.s= q.(QMR) / r
Onde:
q=valor dado nas Tabelas 5-Teste de Tukey (= 1%), na Tabela 5-Teste de
Tukey (= 5%), na Tabela 5-Teste de Tukey (=10%), em funo do nmero de
colunas(k) e nmeros graus de liberdade dos resduos, presentes no anexo.
Onde:
o QMR = quadrado mdio dos resduos obtido pelo clculo da ANOVA.
o r = nmero mdio de repeties dos tratamentos.

418

Exemplo:
Diminuio da Presso Arterial, em Milmetros de
Mercrio, segundo o Tratamento

A
25
17
27
21
15

Tratamento
C
D
18
23
8
29
4
25
14
35
6
33

B
10
-2
12
4
16

E
11
23
5
17
9

Controle
8
-6
6
0
2

Quadro da ANOVA

Fonte de Variao
Tratamentos
Resduo
Total

SQ

QM

2354,17
864,00
3218,17

5
24
29

470,83
36,00

13,08

Deciso:
Como o valor de F apresentado na tabela acima significante ao nvel
de
5%, pode-se afirmar que existe diferena de mdias significantes neste nvel.

Tabela de Mdias da Diminuio da Presso Arterial Segundo o Tratamento


Tratamento
A
B
C
D
E
Controle

Mdias
21
8
10
29
13
2

419

razovel procurar um teste para comparar as mdias dos tratamentos. A


d.m.s estabelecido pelo Teste de Tukey, ao nvel de significncia de 5%, :
d.m.s= 4,37.(36,00)/5=11,73, uma vez que q=4,37, valor dado na Tabela
5-Teste de Tukey 0,05, associado a 6 tratamentos(k=6) e 24 graus de liberdade
de resduos(=24), QMR=36,00, obtido na anlise da varincia e r=5, nmero de
repeties dentro de cada tratamento(colunas).
As mdias esto na tabela de mdia da diminuio da presso arterial
segundo o tratamento. Pode-se ento concluir, por exemplo, que a mdia de A
significante maior que a mdia de B por que :
/ 21 8 / = 13 > 11,73.
Observao:
A ANOVA e os Testes de Comparao Mltipla tm potncia mxima quando
o nmero de repeties em cada tratamento ou grupo igual. Uma ANOVA deve ser
planejada antes da execuo das medies, justamente para se tentar ter o mesmo
nmero de medies para cada grupo/tratamento. Se isso no for possvel, o mal
menor ter pouca diferena entre o nmero de repeties das amostras. Muita
diferena entre grupos leva a perda de potncia, ou seja, a dificuldade em identificar
diferenas estatsticas entre grupos.

420

Mtodo da Anlise da Varincia

Para realizar uma anlise da varincia de confiana fortemente


recomendvel que o analista siga as fases abaixo, que podemos
nomear de Mtodo da Anlise da Varincia.
Fases
1)Delineamento e coleta de dados.

Definio
o

Definio do objetivo de estudo, estabelecimento


de hipteses a testar e planejamento do nmero de
repeties por tratamento.

2)Validao de pressupostos e deciso da ANOVA.

Verificao de dados discrepantes(outliers),

Execuo

dos

testes

de

independncia,

homocedasticidade e normalidade;
o

Deciso sobre que ANOVA usar(paramtrica ou por


postos).

3)Quadro da ANOVA e Deciso.

4)Teste de Comparao Mltipla(s se a ANOVA identificar

Clculo do Quadro da ANOVA;

Clculo da estatstica F e deciso estatstica.

Execuo do Teste de Comparao Mltipla de

diferenas entre grupos).

Tukey e identificar os grupos com diferenas


significantes;
o

Tomada de deciso empresarial ou institucional.

421

Exerccios Propostos:

1)O resultado das vendas efetuadas por 3 vendedores de uma


indstria durante certo perodo dado a seguir. Deseja-se saber,
ao nvel de 5%, se h diferena de eficincia entre os vendedores.

29

27

30

27

27

30

31

30

31

29

28

27

32

29

30

2)Obtm-se amostras de tamanho trs de cada uma das populaes


normais com os seguintes resultados: 3,5,4; 11,10,12; 16,21,17.
Testar a hiptese de que as mdias populacionais so as mesmas
com um nvel de significncia de 5%.

3)Um ensaio de trao mede a qualidade de uma solda a ponto de


um material revestido de alumnio. A fim de determinar se h
efeito de mquina quando se solda um material de bitola
especificada, obtm-se as seguintes amostras de 3 mquinas.
Realize a Anlise da Varincia conveniente

Mquina A : 3,2;4,1;3,5;3,0;3,1
Mquina B : 4,9;4,5;4,5;4,0;4,2
Mquina C : 3,0;2,9;3,7;3,5;4,2

4)Uma mquina para ensaio de desgaste consta de 4 escovas, sob


422

as quais se fixam amostras do material, a fim de medir suas


resistncias abraso. A perda de peso do material, depois de um
dado nmero de ciclos, usada como medida de resistncia ao
desgaste. Os dados da tabela a seguir indicam a perda de peso de
4 materiais ensaiados. Realize a Anlise da Varincia conveniente
e o Teste de Tukey.

Material

Posio da Escova
1

2
1,93
2,55
2,40
2,33

A
B
C
D

3
2,38
2,72
2,68
2,40

4
2,20
2,75
2,31
2,28

2,25
2,70
2,28
2,25

5)Com 5 marcas de automveis foi feita uma experincia para


verificar o nmero de quilmetros

percorridos com 4 litros de

gasolina. Esta experincia foi repetida em 3 cidades diferentes. Os


resultados obtidos foram. Realize a Anlises da Varincia
Marcas
A
B
C
D
E

A
20,3
19,5
22,1
17,6
23,6

Cidades
B
21,6
20,1
20,1
19,5
17,6

C
19,8
19,6
22,3
19,4
22,1

423

6)Os dados abaixo se referem s avaliaes de satisfao dada por


25 clientes a cinco operadoras de telefone celular, via telefone de
auto-atendimento. Faa a anlise de validao dos pressupostos
bsicos e conclua se a anlise da varincia confivel.
Satisfao com Operadoras de Telefone Celular
A

B
8.0

7.0

C
10.0

9.0

9.0

8.0

E
4.0

9.0

10.0

2.5

6.0

5.0

10.0

3.0

8.0

9.0

6.5

10.0

5.0

6.0

9.0

7.0

8.0

4.0

9.0

8.0

7.0

10.0

4.0

9.0

7)Verifique se os dados abaixo atendem ao pressuposto de


homocedasticidade pelo Teste de Levene .
Nmero de Reclamaes Feitas em 20 Ouvidorias de Quatro
Tipos de Planos de Sade
A

10

30

10

15

40

15

10

10

10

15

15

35

25

25

25

15

424

8)Um agricultor usa trs fertilizantes diferentes numa cultura de milho. No


fim da escolha, para cada tratamento, recolhe 6 espigas(18 no total) e
conta o nmero de gros, tendo obtido os dados da tabela abaixo.Ser
que estatisticamente os fertilizantes tm todos os mesmo efeitos? Ou ser
que produzem efeitos diferentes? Sero as flutuaes da mdia algo de
normal ou indicadores de uma tendncia?
Fertilizante 1
332
321
353
401
329
395
1778

Fertilizante 2
382
354
435
334
325
415
2245

Fertilizante 3
453
399
343
459
488
482
2624

9)Realize o teste de independncia dos resduos do exerccio 8 pelo Teste


de Durbin-Watson, ao nvel de 5% de significncia.
10)Realize o teste de igualdade de varincias dos resduos do exerccio 8
pelo Teste de Levene, ao nvel de 5% de significncia.
11)Realize a ANOVA sobre Postos do exerccio 8, caso seja necessrio,
ao nvel de 5% de significncia.

425

12)Um estudo se props a testar a eficcia de trs campanhas


publicitrias(A,B,C) na reduo da taxa de comprometimento de
renda de pessoas com jogos de azar.Uma amostra de 9 jogadores
tirada para experimento foi sujeita s campanhas publicitrias.
Utilizando a anlise da varincia, teste se as campanhas
publicitrias tm efeitos diferentes.

20

35

10

25

40

15

30

45

30

75

120

13)Numa anlise da varincia com um fator envolvendo uma


amostra de tamanho 75, foram geradas as estatsticas abaixo.
Utilizando o Teste de Durbin Watson, verifique se h autocorrelao
dos resduos.
n

( ei ei-1)2 = 300
i=1

ei2 =125

e
i=1

ei = distribuio de resduos.

426

Unidade VIII
Correlao de Variveis
Conceito de Correlao:
A correlao uma medida padronizada da relao entre duas variveis,
bem como a fora dessa relao.
A correlao nunca pode ser maior do que 1 ou menor do que menos 1.
Uma correlao prxima a zero indica que as duas variveis no esto
relacionadas. Uma correlao positiva indica que as duas variveis movem
juntas, e a relao forte quanto mais correlao se aproxima de um.
Uma correlao negativa indica que as duas variveis movem-se em
direes opostas, e que a relao tambm fica mais forte quanto mais prxima
de menos 1 a correlao ficar.
Duas variveis que esto perfeitamente correlacionadas positivamente
movem-se essencialmente em perfeita proporo na mesma direo, enquanto
dois conjuntos que esto perfeitamente correlacionados negativamente
movem-se em perfeita proporo em direes opostas.
Correlao de Variveis Contnuas- Correlao Linear:
o grau de relao linear existente entre duas variveis contnuas e
normalmente distribudas. Indica o grau de aderncia ou a qualidade do ajuste
dos pares X e Y a uma equao linear: a uma reta.

427

Coeficiente de Correlao Linear de Pearson:


O grau de relao entre duas variveis contnuas na populao pode ser
medido atravs do coeficiente de correlao de Pearson: .
Na populao, mede a aderncia ou a qualidade do ajuste
verdadeira reta, na qual pretendemos relacionar X e Y.
Mas, por questes operacionais de custo e tempo, nem sempre
podemos dispor de uma populao de pares X e Y e o que se tem disponvel
uma amostra de n pares ordenados X e Y.
O coeficiente de correlao de Pearson calculado na amostra chamase
r. O r , portanto, uma estimativa do parmetro :
^
=r
Expresso do Coeficiente de Correlao:

(XY) (X).(Y)/n
r=

(X2 (X)2/n). ( Y2 (Y)2/n)

Tambm pode ser obtido pela expresso:

(nXY) (X).(Y)
r=

[nX2 (X)2]. [nY2 (Y)2]

Onde n o nmero de observaes.

428

Intervalo de Variao de r:

O coeficiente de correlao r uma medida cujo valor se situa no


intervalo compreendido pelos valores [-1, +1 ]:
-1 r +1
Assim temos:
r=1, correlao linear perfeita positiva
r=-1, correlao linear perfeita negativa
r=0, no h relao linear entre as variveis X e Y.
Empiricamente, mostrou-se que a intensidade de r pode ser consultada
no quadro abaixo:
Valor Absoluto de r
0
(0; 0,3]
(0,3 ; 0,6]
(0,6 ; 0,9]
(0,9 ; 0,99]
1

Intensidade da Relao de X e Y
Nula
fraca
Mdia
Forte
Fortssima
perfeita

Para podermos tirar algumas concluses significativas sobre o


comportamento simultneo das variveis analisadas, necessrio que:

0,6 r 1

Contudo, se r for igual a zero no significa necessariamente que exista


ausncia de relao entre X e Y, mas apenas ausncia de relao linear. Uma
relao no linear perfeita entre X e Y poderia resultar igualmente em r = 0.

429

Representando, em um sistema coordenado cartesiano ortogonal, os


pares (X ; Y) obtemos uma nuvem de pontos que denominamos diagrama de
disperso. Esse diagrama fornece uma idia grosseira, porm til, da
correlao existente.

Exemplo:

Os pontos obtidos, vistos em conjunto, formam uma elipse em diagonal.


Podemos imaginar que, quanto mais fina for a elipse, mais ela se aproxima de
uma reta. Dizemos, ento, que a correlao de forma elptica que tem como
imagem uma reta forma a correlao linear.
O grfico abaixo mostra a imagem da elipse dos pontos do grfico
acima.

430

possvel verificar que a cada correlao est associada como


imagem uma relao funcional. Por esse motivo, os modelos lineares so
chamados relaes perfeitas, porque constituem imagens de elipses surgidas
no diagrama de disperso.
Como a correlao do diagrama acima tem como imagem uma reta
ascendente, ela chamada correlao linear positiva.

431

Diagramas de Disperso de X e Y com Casos Possveis de r:

432

Exemplo:
1)Um jornal quer verificar a eficcia de seus anncios na venda de
carros usados. A tabela abaixo mostra o nmero de anncios e o
correspondente nmero de carros vendidos por 6 companhias que usaram
apenas este jornal como veculo de propaganda. Existe relao linear entre as
variveis? Construa o diagrama de disperso e Calcule o coeficiente de
correlao linear r.
Companhia

Anncios(X)

Carros Vendidos(Y)

A
B
C
D
E
F
Total

74
45
48
36
27
16
246

139
108
98
76
62
57
540

Diagrama de Disperso:

433

Coeficiente de Correlao r:

Companhia Anncios(X)
A
74
B
45
C
48
D
36
E
27
F
16
Total
246

Carros
Vendidos(Y)
139
108
98
76
62
57
540

XY
10286
4860
4704
2736
1674
912
25172

X2
5476
2025
2304
1296
729
256
12086

Y2
19321
11664
9604
5776
3844
3249
53458

(nXY) (X)(Y)
r=

[nX2 (X)2]. [nY2 (Y)2]

(6.25172) (246).(540)
r=

[6.12086 (246)2]. [6.53458 (540)2]

r= (18192)/(18702) = 0,97, fortssima correlao linear positiva.

434

2)A indstria MIMI vende um remdio para combater resfriado. Aps dois
anos de operao, ela coletou as seguintes informaes trimestrais. Qual o
grau da relao entre as vendas do remdio e as despesas com propaganda?
Calcule r.

Quadro de Clculo
Trimestres Despesas(X) Vendas(Y)
1
2
3
4
5
6
7
8
Total

11
5
3
9
12
6
5
9
60

25
13
8
20
25
12
10
15
128

XY

X2

Y2

275
65
24
180
300
72
50
135
1101

121
25
9
81
144
36
25
81
522

625
169
64
400
625
144
100
225
2352

(nXY) (XY)
r=

[nX2 (X)2]. [nY2 (Y)2]


(8.1101) (60)(128)

r=

[8.522 (60)2]. [8.2352 (128)2]

r= (1120)/(1184) = 0,95, fortssima correlao linear positiva.

435

3)O faturamento de uma loja durante o perodo de janeiro a agosto de


2010 dado a seguir em milhares de reais. Qual a tendncia da evoluo do
faturamento da loja?

Meses
JAN
FEV
MR
ABR
MAI
JUN
JUL
AGO
Total

(X)
1
2
3
4
5
6
7
8
36

Faturamento(Y)
20
22
23
26
28
29
32
36
216

XY
20
44
69
104
140
174
224
288
1063

X2
1
4
9
16
25
36
49
64
204

Y2
400
484
529
676
784
841
1024
1296
6034

(nXY) (XY)
r=

[nX2 (X)2]. [nY2 (Y)2]


(8.1063) (36)(216)

r=

[8.204 (36)2]. [8.6034 (216)2]

r = 0,99, fortssima correlao linear positiva.


Existe uma tendncia de evoluo linear crescente do faturamento da
loja ao longo do tempo.

436

4)Em um presdio de uma cidade foram coletados dados sobre dias de


frias de servidores em funo de licenas solicitadas por stress. Qual o
sentido da associao entre as variveis?

Funcionrio
A
B
C
D
E
F
G
H
I
J
Total

Dias de
Frias(X)
20
18
16
14
12
10
8
6
4
2
110

Licenas por Stress(Y)


10
15
17
21
35
32
39
42
55
60
326

XY
200
270
272
294
420
320
312
252
220
120
2680

X2
400
324
256
196
144
100
64
36
16
4
1540

Y2
100
225
289
441
1225
1024
1521
1764
3025
3600
13214

(nXY) (XY)
r=

[nX2 (X)2]. [nY2 (Y)2]

(10.2680) (110)(326)
r=

[10.1540 (110)2]. [10.13214 (326)2]

r = -0,98, fortssima correlao linear negativa.


Quanto maior o perodo de frias , menor ser o perodo por licena por
stress. Veja o diagrama de disperso abaixo:

437

Teste de Significncia de r:
Quando calculamos a estatstica r, calculamos uma estimativa de um
parmetro populacional . Toda estatstica pode estar sujeita a um erro
amostral grande. Para conhecer se o valor do coeficiente de correlao obtido
junto amostra significante ou fruto de erro amostral, fortemente
recomendado que testemos a significncia de r.
oportuno testarmos as seguintes hipteses:
H0; = 0
H1: 0

438

Para realizar o referido teste de significncia, poderemos calcular o


valor-p bilateral junto distribuio t-Student com = n-2:
r
t =
(1- r2) / n-2
O valor-p obtido junto a tabela t-Student. Na linha do grau de liberdade
, procura-se o valor mais prximo do valor absoluto de t. O valor-p a
probabilidade na linha bilateral do cabealho da tabela associada a este
valor mais prximo de t.
Exemplo:
Em um estudo sobre como a safra de trigo depende do fertilizante,
suponhamos que dispomos de lotes para apenas sete observaes
experimentais. O pesquisador fixa X como quantidade de fertilizante em litros e
Y a toneladas da produo de trigo. Os dados se encontram na tabela abaixo.
Calcular o coeficiente de correlao entre as variveis e testar a sua
significncia.

Litros de
Fertilizantes(X)
100
200
300
400
500
600
700
2800

Toneladas de Trigo(Y)
40
50
50
70
65
65
80
420

XY
4000
10000
15000
28000
32500
39000
56000
184500

X2
10000
40000
90000
160000
250000
360000
490000
1400000

Y2
1600
2500
2500
4900
4225
4225
6400
26350

439

(7.184500) (2800.420)
r=

[7.1400000 (2800)2]. [726350 (420)2]

r = 0,92, fortssima correlao linear positiva.

Teste de Significncia de r:
0,92
t = = 5,25
(1- 0,922) / 7-2

= 7-2 = 5 Valor-p0,01
Valor-p 0,01 ou 1%
Deciso:
1% < 5%, rejeita-se H0. O coeficiente de correlao diferente de zero.
Existe correlao de X e Y. r=0,92 significante ao nvel de 5%. Existe
dependncia significante entre as variveis.

440

Vamos testar agora a significncia dos quatros exemplos anteriores de


clculo do coeficiente de correlao linear.
Do Exemplo 1:
Teste de Significncia de r:
0,97
t = = 7,98
(1- 0,972) / 6-2

= 6-2 = 4 Valor-p0,01
Valor-p 0,01 ou 1%
Deciso:
1% < 5%, rejeita-se H0. O coeficiente de correlao diferente de zero.
Existe correlao de X e Y. r=0,97 significante ao nvel de 5%. Existe
dependncia significante entre as variveis.

441

Do Exemplo 2:
Teste de Significncia de r:

0,95
t = = 7,45
(1- 0,952) / 8-2

= 8-2 = 6 Valor-p0,01
Valor-p 0,01 ou 1%

Deciso:
1% < 5%, rejeita-se H0. O coeficiente de correlao diferente de zero.
Existe correlao de X e Y. r=0,95 significante ao nvel de 5%. Existe
dependncia significante entre as variveis.

442

Do Exemplo 3:

Teste de Significncia de r:
0,99
t = = 17,19
(1- 0,992) / 8-2
= 8-2 = 6 Valor-p0,01
Valor-p 0,01 ou 1%

Deciso:
1% < 5%, rejeita-se H0. O coeficiente de correlao diferente de zero.
Existe correlao de X e Y. r=0,99 significante ao nvel de 5%. Existe
dependncia significante entre as variveis.

443

Do Exemplo 4:

Teste de Significncia de r:

-0,98
t = = -13,93
(1- (-0,98)2) / 10-2

= 10-2 = 8 Valor-p 0,01


Valor-p 0,01 ou 1%

Deciso:
1% < 5%, rejeita-se H0. O coeficiente de correlao diferente de zero.
Existe correlao de X e Y. r= -0,98 significante ao nvel de 5%. Existe
dependncia significante entre as variveis.

444

Observao:
A distribuio amostral do coeficiente de correlao amostral r, sob a
hiptese nula de o coeficiente de correlao populacional =0, simtrica,
enquanto que, se a hiptese nula for 0, assimtrica.
No primeiro caso, se utiliza uma estatstica que envolve a distribuio t
de Student, como vimos em pargrafos acima, e no segundo caso, se recorre a
uma alternativa desenvolvida por Fisher, a qual d origem a uma estatstica
com distribuio aproximadamente normal, obtida atravs da transformao da
estatstica r numa estatstica , que tem distribuio bastante prxima da
normal, mas foge ao escopo deste livro.
Como alternativa a este ltimo processo, pode-se criar uma distribuio
de amostragem real emprica de estimativas de coeficientes de correlao
atravs de simulaes ou re-amostragem e a partir da construir intervalos de
confiana no paramtricos e testar hipteses para um valor no nulo de ,
baseada nesta estimao intervalar, sem ter que se preocupar com a
normalidade da distribuio de amostragem da estatstica r. Sugere-se, ento,
uma alternativa vivel e prtica para a construo do intervalo de confiana
para ou para o teste de significncia de r.
De maneira operacional e em tempo hbil, graas ao crescente avano
da informtica e a disponibilidade de variados softwares estatstico amigveis,
pode ser realizada com mais freqncia a inferncia para o coeficiente de
correlao linear nos casos em que o valor do coeficiente de correlao linear
populacional testado seja o de no nulidade.
Portanto, prope-se obter via processo de reamostragem, uma
distribuio por amostragem real emprica para a estatstica r e calcular o seu
erro padro, possibilitando assim construir intervalo de confiana e realizar
testes de significncia para o coeficiente de correlao linear referente
hiptese de um valor no nulo.

445

Pressupostos para a Correlao Linear de Pearson

Vimos como calcular o coeficiente de correlao e isso j algo til no


dia a dia do pesquisador. No entanto, no qualquer dado que serve para o
clculo do coeficiente de correlao. Se os dados no so bem comportados,
ento existe uma grande possibilidade de que os resultados no sejam
confiveis. Relaes fracas podem parecer enganosamente fortes ou viceversa. Dados mal-comportados tm que ser tratados com vrios tipos de
transformaes antes de entrar nas frmulas. Os dados devem seguir pelo
menos trs pressupostos:
o Linearidade;
o Estacionaridade.
o Normalidade;
1-Linearidade:
O coeficiente de correlao uma medida de relacionamento entre duas
variveis, sempre supondo que esta relao seja linear. No diagrama de
disperso, a relao linear representada por uma linha reta. Em outras
palavras, uma relao forte e bem definida entre duas variveis, mas em forma
no-linear, por exemplo, quadrtica, vai produzir um r prximo zero, e levar
o pesquisador a decises erradas. Por isso, a relao das variveis deve ser
linearizada antes de entrar no clculo do coeficiente. Para isto basta
transformar uma ou as duas variveis numa maneira apropriada

e o

coeficiente de correlao resultante aumentar em valor, assim como a


estatstica de t seu teste de significncia. Em outras palavras, com uma
transformao das variveis, pode-se tornar uma relao aparentemente fraca
em surpreendentemente forte.

446

Exemplo:
Vejamos os dados do famoso Experimento de Boyle onde se encontra a
famosa lei de correlao linear de Presso(X) e a inversa do Volume(Y):
Presso(X)
29.12
30.56
31.94
33.50
35.31
36.79
39.31
41.12
44.19
46.60
50.31
54.31
58.25
61.31
63.55
66.57
70.00
74.25
77.67
82.75
87.88
93.06
100.44
107.81
117.56

Volume(Y)
48
46
44
42
40
38
36
34
32
30
28
26
24
23
22
21
20
19
18
17
16
15
14
13
12

447

Diagrama de Disperso das Variveis:

Interpretao:
A relao entre presso e volume intrinsecamente no-linear, nas duas
variveis originais sem transformao.

448

Transformaes Linearizveis:
Tradicionalmente, na rea de pesquisa quantitativa, as transformaes
mais usuais que transformam X em W so:
o

X-1

X-2

X-1/2

Exemplo:
Vamos transformar a varivel volume na sua inversa e construir o
diagrama de disperso de volume transformado e presso:
Presso(X)
29.12
30.56
31.94
33.50
35.31
36.79
39.31
41.12
44.19
46.60
50.31
54.31
58.25
61.31
63.55
66.57
70.00
74.25
77.67
82.75
87.88
93.06
100.44
107.81
117.56

Volume Transformado(W)
0.02
0.02
0.02
0.02
0.03
0.03
0.03
0.03
0.03
0.03
0.04
0.04
0.04
0.04
0.05
0.05
0.05
0.05
0.06
0.06
0.06
0.07
0.07
0.08
0.08

449

Diagrama de Disperso com Volume Transformado(W):

Interpretao:
A relao foi linearizada com a transformao da varivel volume. A
transformao que deve ser escolhida ser aquela que resulta em um
coeficiente de correlao mais alto. Com este exemplo, procurou-se mostrar
que muito importante transformar as relaes numa relao linear, antes de
se fazer o clculo do coeficiente de correlao .

450

2-Estacionaridade na Mdia e na Varincia:


Quando o caso de analisar a relao de duas variveis que so sries
temporais,

dados

coletados

ao

longo

do

tempo

em

intervalos

aproximadamente regulares, a estacionaridade dos dados uma condio


importante na anlise estatstica. A estacionaridade se revela quando a srie se
desenvolve no tempo aleatoriamente ao redor de uma mdia constante,
refletindo alguma forma de equilbrio estvel. Todavia, a maior parte das sries
que se encontra na prtica apresenta alguma forma de no-estacionaridade.
Exemplo:
As sries econmicas apresentam em geral tendncias mltiplas ao
longo do tempo.
Observao:
Uma srie pode ser estacionria durante um perodo muito longo, mas
pode ser estacionria em perodos muito curtos, mudando de nvel e/ou
inclinao. Neste ltimo caso, temos o que chamamos de no-estacionaridade
homognea, como mostra a figura abaixo:

451

Y(t)

Exemplo de srie No-estacionria Real:

452

Correlao de Sries Temporais:


As sries temporais tm a tendncia de subir e descer durante longos
perodos de tempo, e se forem comparadas duas sries deste tipo certamente
o coeficiente de correlao ter um valor alto. Mas neste caso, o valor alto no
revela um fato novo, que uma varivel necessariamente relaciona-se com
outra, apenas que as duas sries sobem e descem durante longos perodos e o
coeficiente de correlao est registrando o fato. Isso pode ocorrer em funo
de varias razes, mas a mais comum quando alguma terceira varivel
escondida da viso do pesquisador afeta simultaneamente a duas variveis
sob investigao.
Exemplo 1:
Preo de Compra(X) e Preo de Venda(Y) de uma Mercadoria
praticada em Vinte pocas Sequenciais Distintas
Preo de Compra(X)

Preo de Venda(Y)

(Em R$)
20
22
21
23
24
25
20
40
40
41
43
42
44
45
100
101
102
105
105
103

(Em R$)
50
50
51
50
55
50
51
70
71
70
75
75
71
73
150
152
151
155
150
153

453

O grfico das duas sries est abaixo:

Interpretao:
As duas sries so no-estacionrias. Isso se reflete no coeficiente de
correlao alto, r=0,998. Deveremos verificar se esta forte correlao real ou
fruto da no estacionaridade das variveis.

454

Transformaes Estacionarizveis:
A transformao mais comum consiste em tomar diferenas sucessivas
da srie temporal, at obter-se uma srie estacionria. A primeira diferena de
Y(t) definida por:
Y(t) = Y(t) Y(t 1)
A segunda diferena :
2Y(t) = [Y(t)] = [ Y(t) Y(t 1)]=
2Y(t) = Y(t) 2Y(t 1)] + Z(t 2)=
De modo geral, a n-sima diferena de Y(t) :
nY(t) = [n-1Y(t)]
Em situaes normais, ser suficiente tomar uma ou duas diferenas
para que a srie se torne estacionria.

Observao:
Outra razo para transformar os dados estabilizar a varincia.
comum, em sries econmicas, por exemplo, a existncia de diferentes
tendncias numa mesma srie e pode haver tambm um acrscimo de
varincia da srie medida que o tempo passa. Neste caso, uma
transformao logartima pode ser adequada.

455

Um procedimento usual em sries temporais econmicas considerar:


log Y(t) = log Y(t) log Y(t 1)
Uma classe geral de transformaes que pode ser utilizada a de BoxCox.
Exemplo:
Vamos proceder ao clculo das primeiras diferenas das sries do
exemplo dos preos de compra e venda de uma mercadoria.
Primeiras Diferenas do Preo de Compra(X) e Preo de Venda(Y) de
uma Mercadoria praticada em Vinte pocas Sequenciais Distintas

Tempos
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

X(t)

Y(t)

2
-1
2
1
1
-5
20
0
1
2
-1
2
1
55
1
1
3
0
-2

0
1
-1
5
-5
1
19
1
-1
5
0
-4
2
77
2
-1
4
-5
3

456

O grfico destes valores transformados se encontra abaixo:

Interpretao:
A primeira diferena eliminou a no-estacionaridade das sries e revelou
um coeficiente de correlao menor para as variveis, r=0,972.
No final, a boa aplicao do coeficiente de correlao exige que todos os
momentos das variveis aleatrias sejam constantes, pelo menos a mdia e a
varincia.

457

3-Normalidade:
Dependemos de um teste de significncia para decidir se a correlao
existe ou no. Nesta deciso, necessrio calcular o valor da estatstica t. s
vezes, quem utiliza a ferramenta no se preocupa com a pressuposio bsica
de normalidade das duas variveis. Se os dados no so distribudos
normalmente, ento o teste de significncia com o t no perfeitamente
confivel. O pesquisador pode sofrer o engano de aceitar a existncia de
correlao quando no existe ou vice-versa. Conseqentemente, devemos ver
dois conceitos aqui: um teste para verificar se a varivel tem ou no
normalidade, e se no tiver, temos que procurar alguma transformao da
varivel para resolver o problema e trazer a varivel para a normalidade.
Teste de Normalidade:
Existem vrios testes de normalidade, mas um dos mais simples o
teste chamado de Bera-Jarque. A fundamentao estatstica utilizada como
base do teste de Bera-Jarque dada pela equao:
(MAS)2

(Mk)2

BJ = n [ + ] < 6,0 para normalidade


6

24

Onde:
n= tamanho da amostra
n
MAS = . M3
(n-1)(n-2)

458

Tem-se que:

M3 = [( Xi )3 / S3]
i=1

n(n+1)

3(n-1)2

MK= [ . M4 ] [ ]
(n-1)(n-2)(n-3)

(n-2)(n-3)

Tem-se que:

M4 = [( Xi )4 / S4]
i=1

Observao:
Tanto o MAS quanto o MK

podem ser obtidos automaticamente e

diretamente na planilha eletrnica Excel na funo inserir funo e nas opes


Distoro e na funo Curt para assimetria e curtose respectivamente. A
estatstica de Bera-Jarque no est disponvel diretamente no Excel.

459

Exemplo 1:
Sejam as duas sries abaixo que representam o nvel de satisfao de
clientes usurios da Net com os planos NET TV e NET VIRTUAl. Qual o grau
de correlao entre as variveis?
Grau de Satisfao de Clientes com os Planos NET TV e NET
VIRTUAL da NET
NET TV(X)
1
2
2
2
2
3
3
3
3
3
3
3
3
3
3
4
4
4
4
5

NET VIRTUAl(Y)
1
1
2
2
2
3
3
3
3
3
3
3
3
3
3
4
4
4
5
5

460

Soluo:
Mas, antes, vamos verificar a normalidade por Bera-Jarque.
1 ) Verificando a varivel X:
a)Clculo da Assimetria:

X
1
2
2
2
2
3
3
3
3
3
3
3
3
3
3
4
4
4
4
5
Soma

(X-media)3
-8
-1
-1
-1
-1
0
0
0
0
0
0
0
0
0
0
1
1
1
1
8
0.00

Mdia
S

[(X-media) 3/S3
-10.35
-1.29
-1.29
-1.29
-1.29
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
1.29
1.29
1.29
1.29
10.35
0.00

3
0.92

461

20
MAS = . 0 = 0, distribuio simtrica
(20-1)(20-2)

b)Clculo da Curtose:

X
1
2
2
2
2
3
3
3
3
3
3
3
3
3
3
4
4
4
4
5
Soma

(X-media) 4
16
1
1
1
1
0
0
0
0
0
0
0
0
0
0
1
1
1
1
16
40.00

[(X-media)4/S4
22.56
1.41
1.41
1.41
1.41
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
1.41
1.41
1.41
1.41
22.56
56.41

Mdia

0.92

[(X-media)4/S4
22.56
1.41
1.41
1.41
1.41
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
1.41
1.41
1.41
1.41
22.56
56.40

462

20(20+1)

3(20-1)2

MK= [ . 56,40 ] [ ]
(20-1)(20-2)(20-3)

(20-2)(20-3)

20.21

3(19)2

MK= [ . 56,40 ] [ ]
(19)(18)(17)
420

(18)(17)
3.361

MK= [ . 56,40 ] [ ]
5814

(18)(17)

420

1083

MK= [ . 56,40 ] [ ]
5814

306

MK= 4,08 3,54 = 0,54, distribuio leptocurtica

463

c) Clculo de Bera-Jarques:

(0)2
BJ = 20 [
6

(0,54)2
+ ]
24

(0,54)2
BJ = 20 [ ] = 20 . 0,01 = 0,20 < 6,0, distribuio normal
24

Concluso:

A varivel X tem distribuio normal.

464

2 ) Verificando a varivel Y:

a)Clculo da Assimetria:

Y
1
1
2
2
2
3
3
3
3
3
3
3
3
3
3
4
4
4
5
5
Soma

(Y-media)3
-8
-8
-1
-1
-1
0
0
0
0
0
0
0
0
0
0
1
1
1
8
8
60.00

Mdia
S

[(Y-media) 3/S3
-6.42
-6.42
-0.80
-0.80
-0.80
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.80
0.80
0.80
6.42
6.42
0.00

3
1.08

20
MAS = . 0 = 0, distribuio simtrica
(20-1)(20-2)

465

b)Clculo da Curtose:

Y
1
1
2
2
2
3
3
3
3
3
3
3
3
3
3
4
4
4
5
5
Soma

(Y-media) 4
16
16
1
1
1
0
0
0
0
0
0
0
0
0
0
1
1
1
16
16
70.00

Mdia
S

[(Y-media)4/S4
11.93
11.93
0.75
0.75
0.75
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.75
0.75
0.75
11.93
11.93
52.22

3
1.08

466

20(20+1)

3(20-1)2

MK= [ . 52,22 ] [ ]
(20-1)(20-2)(20-3)

(20-2)(20-3)

20.21

3(19)2

MK= [ . 52,22] [ ]
(19)(18)(17)
420

(18)(17)
3.361

MK= [ . 52,22] [ ]
5814

(18)(17)

420

1083

MK= [ . 52,22] [ ]
5814

306

MK= 3,77 3,54 = 0,23, distribuio leptocurtica

467

c) Clculo de Bera-Jarques:

(0)2
BJ = 20 [
6

(0,23)2
+ ]
24

(0,23)2
BJ = 20 [ ] = 20 . 0,00 = 0,00 < 6,0, distribuio normal
24

Concluso:
A varivel Y tem distribuio normal.
Portanto, com esse pressuposto validado podemos calcular a relao
entre as variveis, que resultou em r=0,96, forte relao entre a satisfao com
a TV por assinatura e a internet da NET.

468

Exemplo 2:
A amostra abaixo se refere ao grau de satisfao de funcionrios de uma
empresa com salrio percebido e emprego, numa escala de 1 a 5.
Grau de Satisfao de Funcionrios com Salrio e Emprego
X(Salrio)
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
3
4
4
5

Y(Emprego)
1
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
3
4
4
5

Qual o grau de relao entre as variveis?

469

Soluo:
Mas, antes, vamos verificar a normalidade por Bera-Jarque.
1 ) Varivel X:
Efetuando os clculos temos:
MAs
MK

1.46
1.22

A estatstica de Bera-Jarque fica:

(1,46)2
BJ = 20 [
6

(1,22)2
+ ]
24

BJ = 20[0,36+ 0,06] = 20 . 0,42 = 8,4 > 6,0, distribuio no-normal

Concluso:

A varivel X no tem distribuio normal.

470

2 ) Varivel Y:

Efetuando os clculos temos:

MAs
MK

1.52
1.31

A estatstica de Bera-Jarque fica:

(1,52)2
BJ = 20 [
6

(1,34)2
+ ]
24

BJ = 20[0,39+ 0,07] = 20 . 0,46 = 9,2 > 6,0, distribuio no-normal

Concluso:
A varivel Y no tem distribuio normal.

471

3 )Transformao Adotada:
Antes de entrar na equao do coeficiente de correlao, as duas
variveis no-normais tero quer ser transformadas em normais. Por exemplo,
quando a varivel no normal, o pesquisador pode buscar uma
transformao como o logaritmo ou a inversa. A varivel transformada talvez
seja normal.
Outras

transformaes

so

disponveis

em

diversos

programas

computacionais, como a transformao de Box-Cox, que no veremos neste


curso.
4 )Transformao dos Dados:
Aplicaremos a transformao logaritmo de base 10 aos dados:

Grau de Satisfao de Funcionrios com Salrio e Emprego


Transformados
Log X(Salrio)
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.30
0.30
0.30
0.30
0.30
0.48
0.60
0.60
0.70

Log Y(Emprego)
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.3
0.3
0.3
0.3
0.5
0.6
0.6
0.70

472

Vamos, agora, verificar a normalidade por Bera-Jarque.

1 ) Varivel Log X:

Efetuando os clculos temos:

MAs
MK

0.85
-0.67

A estatstica de Bera-Jarque fica:

(0,85)2
BJ = 20 [
6

(-0,67)2
+ ]
24

BJ = 20[0,12+ 0,02] = 20 . 0,14 = 2,8 < 6,0, distribuio normal

Concluso:
A varivel log. X tem distribuio normal.

473

2 ) Varivel Log Y:
Efetuando os clculos temos:

MAs
MK

0.99
-0.48

A estatstica de Bera-Jarque fica:

(0,99)2
BJ = 20 [
6

(-0,48)2
+ ]
24

BJ = 20[0,16+ 0,01] = 20 . 0,17 = 3,4 < 6,0, distribuio normal

Concluso:

A varivel log. Y tem distribuio normal.

474

3) Clculo do Coeficiente de Correlao:


Calcule os coeficiente e correlao de Pearson entre as variveis:
Log X(Salrio)
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.30
0.30
0.30
0.30
0.30
0.48
0.60
0.60
0.70

Log Y(Emprego)
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.3
0.3
0.3
0.3
0.5
0.6
0.6
0.70

0.96

Concluso:
Forte correlao entre as variveis.

475

Correlao de Variveis Ordinais:


Os pesquisadores em administrao frequentemente descobrem que as
respostas para as suas perguntas s podem ser mensuradas com escalas
ordinais ou nominais. Por exemplo, se quisermos verificar se o gnero est
relacionado com o consumo de refrigerantes, temos um problema, pois gnero
uma varivel nominal. Se usssemos o coeficiente de correlao de Pearson
para examinar o consumo de refrigerantes por homens e mulheres e
supusssemos que a medida tem propriedades de variveis quantitativas
contnuas ou de classificao nossos resultados seriam enganosos. Por
exemplo,

uso

de

uma

escala

de

dois

pontos(qualitativa)reduz

substancialmente a quantidade de informaes disponveis e pode resultar em


uma atenuao do verdadeiro coeficiente na populao.
Quando as escalas para coletar dados so nominais ou ordinais, o que o
analista pode fazer? Uma opo utilizar o coeficiente de correlao de ordem
de ranqueamento de Spearman em vez do coeficiente de correlao de
Pearson. O coeficiente de correlao de Spearman tipicamente resulta em um
coeficiente mais baixo, mas considerada uma estatstica mais conservadora.
Exemplo:
A pesquisa sobre os clientes dos restaurantes coletou dados sobre
quatro fatores de escolha de restaurantes. Pediu-se aos clientes que
classificassem os quatro fatores seguintes em termos de sua importncia na
seleo de um restaurante: qualidade da comida, ambiente, preos,
funcionrios. As variveis da amostra iam de X 13 a X16 e eram mensuradas
ordinalmente. O administrador gostaria de saber se as classificaes para a
qualidade da comida esto relacionadas com as classificaes para
ambiente. Uma resposta para esta questo ajudar o administrador a saber
se deve enfatizar a qualidade da comida ou o ambiente em seus comerciais.
Esses dados so ordinais(ranqueamento) e, portanto, a correlao de Pearson

476

no pode ser usada. A correlao de Spearman a adequada para o clculo. A


hiptese nula a de que no existe diferena nos ranqueamentos dos dois
fatores de seleo de restaurantes.

Coeficiente de Spearman:
Se cada uma das variveis X e Y so classificadas em variveis
ordinais, como sendo especificamente classificaes, a correlao entre elas
no pode ser medida pelo Coeficiente de Correlao de Pearson( r ) e sim pelo
Coeficiente de Spearman.
Ao contrrio do coeficiente de correlao de Pearson, no requer a
suposio que a relao entre as variveis linear, nem requer que as
variveis sejam medidas quantitativas. Pode ser usado, ento, para as
variveis medidas no nvel ordinal.
Este coeficiente o mais antigo e tambm o mais conhecido para
calcular o coeficiente de correlao entre variveis mensuradas em nvel
ordinal, chamado tambm de coeficiente de correlao por postos de
Spearman, designado rs.
importante enfatizar que as correlaes ordinais no podem ser
interpretadas da mesma maneira que para variveis medidas em nvel
quantitativo. Inicialmente, no mostram necessariamente tendncia linear, mas
podem ser consideradas como ndices de monotonicidade, ou seja, para
aumentos positivos da correlao, aumentos no valor de X correspondem a
aumentos no valor de Y, e para coeficientes negativos ocorre o oposto.
Seu estimador foi derivado a partir do estimador do coeficiente de
correlao linear de Pearson.

477

Coeficiente de Correlao de Spearman(rs):


O coeficiente de correlao de Spearman( rs) leva em considerao no
os valores das variveis envolvidas, mas os dados dispostos em ordem de
tamanho, importncia ou classificaes.
Os valores das variveis do lugar, neste caso, aos nmeros 1, 2, 3,
4,..., os quais indicam posio, ordem, classificaes, postos ocupados por
cada um dos elementos da amostra em relao aos demais.
Dois ordenamentos assim obtidos de uma amostra de pares ordenados
levaram ao desenvolvimento da frmula:
6. D2
rs = 1 -
n(n2 - 1 )
Onde:
D = a diferena entre cada posto de valor correspondentes de X e Y, e
n = o nmero dos pares dos valores.
Da mesma forma que o coeficiente de correlao r, r s varia no intervalo
de [-1; 1], isto :
-1 rs +1

478

Exemplo 1:
A pesquisa sobre os clientes dos restaurantes coletou dados sobre
quatro fatores de escolha de restaurantes. Pediu-se aos clientes que
classificassem os quatro fatores seguintes em termos de sua importncia na
seleo de um restaurante: qualidade da comida, ambiente, preos,
funcionrios. As variveis da amostra iam de X 13 a X16 e eram mensuradas
ordinalmente. O administrador gostaria de saber se as classificaes para a
qualidade da comida esto relacionadas com as classificaes para
ambiente. Uma resposta para esta questo ajudar o administrador a saber
se deve enfatizar a qualidade da comida ou o ambiente em seus comerciais.
Esses dados so ordinais(ranqueamento) e, portanto, a correlao de Pearson
no pode ser usada. A correlao de Spearman a adequada para o clculo. A
hiptese nula a de que no existe diferena nos ranqueamentos dos dois
fatores de seleo de restaurantes. A tabela abaixo apresenta a base de dados
gerada atravs da coleta. Calcule rs e interprete os resultados.

X13-Qualidade da Comida

X14-Ambiente

X15-Preo

X16-Funcionrios

1
1
2
1
1
2
1
1
2
1

3
3
4
3
3
1
3
3
4
2

2
2
1
2
2
3
2
2
1
3

4
4
3
4
4
4
4
4
3
4

Quadro de Clculo de rS:

479

Clientes do
Restaurante
A
B
C
D
E
F
G
H
I
J
Total

Classificao
X13-Qualidade
da Comida
1
1
2
1
1
2
1
1
2
1

Classificao
X14-Ambiente
3
3
4
3
3
1
3
3
4
2

D
-2
-2
-2
-2
-2
1
-2
-2
-2
-1

D2
4
4
4
4
4
1
4
4
4
1
34

6. 34
rs = 1 -
10(102 - 1 )
204
rs = 1 - = 0,79
10(99 )
Forte correlao entre as duas classificaes.
O coeficiente de correlao de Spearman informa uma forte correlao
das variveis, contudo percebe-se que a qualidade da comida o fator mais
importante para escolha do restaurante pelos clientes. Portanto,os clientes que
colocam uma grande importncia na qualidade da comida como fator de
seleo, classificaro o ambiente como fator significativamente menos
importante. Os clientes do restaurante classificam a qualidade da comida como
algo muito importante com muito mais freqncia do que consideram o
ambiente e este deve ser o foco dos comerciais dos restaurantes.
Exemplo 2:

480

Cinco vestibulandos de um mesmo cursinho pr-vestibular foram


observados quanto s suas classificaes num simulado e no vestibular
propriamente dito. Qual o grau de associao entre a classificao no
simulado e no vestibular?
Vestibulandos

Classificao
no Simulado
2
4
5
1
3

A
B
C
D
E
Total

Classificao
no Vestibular
3
4
5
1
2

D2

-1
0
0
0
1

1
0
0
0
1
2

6. 2
rs = 1 -
5(52 - 1 )
12
rs = 1 -
5(24 )
12
rs = 1 -
120
rs = 1 - 0,1 = 0,90
Fortssima correlao entre as duas classificaes: a do simulado e a
do vestibular.

481

Exemplo 3:
Uma empresa de propaganda testou o grau de memorizao
proporcionado por 10 anncios de televiso atravs de dois grupos, um de
homens e o outro de mulheres. Os resultados em termos de classificao
quanto ao grau de memorizao encontram-se na tabela abaixo. Qual grau de
correlao entre a memorizao dos homens e mulheres?
Anncios
A
B
C
D
E
F
G
H
I
J
Total

Classificao

Classificao

D2

dos Homens
8
3
9
2
7
10
4
6
1
5

das Mulheres
9
5
10
1
8
7
3
4
2
6

-1
-2
-1
1
-1
3
1
2
-1
-1

1
4
1
1
1
9
1
4
1
1
24

6. 24
rs = 1 -
10(102 - 1 )
144
rs = 1 - = 0,85
10(99 )
Forte correlao entre as duas classificaes.

Teste de Significncia de rs:

482

Quando a seleo dos elementos que compem a amostra feita de


forma aleatria, a partir de uma populao, possvel determinar se as
variveis em estudo so associadas na populao. Ou seja, possvel testar a
hiptese de que as duas variveis esto associadas na populao. Para
amostras superiores a 10, a significncia de um valor obtido de r s pode ser
verificada atravs de t calculado pelo estimador apresentado a seguir:

n-2
t=

rs

1 - rs2

A expresso acima tem distribuio t-Student com = n-2 graus de


liberdade. A relao entre uma escala contnua e ordinal de monotonicidade e
a transformao monotnica em uma varivel causa pouco efeito sobre os
coeficientes de correlao, razes t e F. Assim, uma varivel medida em nvel
ordinal pode ser tratada como intervalar.
O valorp obtido de maneira anloga ao obtido no teste de
significncia de r. As hipteses testadas so as mesmas para o coeficiente de
correlao de Pearson.
Vamos testar a significncia dos r s calculados nos dois exemplos
anteriores.

483

Do Exemplo 1:

10 - 2
t=

0,79

1 (0,79)2

t = 3,64
= 10-2 = 8 Valor-p 0,05
Valor-p 0,05 ou 5%
Deciso:
O valor-p = 5% rejeita-se H 0. O coeficiente de correlao de Spearman
diferente de zero. Existe correlao de X e Y. rs= 0,79 significante ao nvel de
5%. Existe dependncia significante entre as variveis.

484

Do Exemplo 2:

n-2
t=

rs

1 - rs2

5-2
t=

0,90

1 - (0,90)2

t = 3,58
= 5-2 = 3 Valor-p 0,05
Valor-p 0,05 ou 5%

Deciso:
O valor-p igual ao nvel de significncia de 5% rejeita-se H 0. O
coeficiente de correlao de Spearman diferente de zero. Existe
correlao de X e Y. r s= 0,90 significante ao nvel de 5%. Existe
dependncia significante entre as variveis.

485

Do Exemplo 3:

10 - 2
t=

0,85

1 (0,85)2

t = 4,56
= 10-2 = 8 Valor-p 0,01
Valor-p 0,01 ou 1%
Deciso:
O valor-p < 5% rejeita-se H 0. O coeficiente de correlao de Spearman
diferente de zero. Existe correlao de X e Y. r s= 0,85 significante ao
nvel de 5%. Existe dependncia significante entre as variveis.

486

Correlao de Variveis Nominais:


Em algumas situaes, as variveis so medidas em nvel nominal ou
por categorias discretas e expressas em forma de freqncias. Nesses casos,
no possvel a utilizao de nenhum dos mtodos vistos anteriormente.
O estimador do coeficiente de correlao entre variveis nominais, o
coeficiente de contingncia C, tambm foi obtido a partir do estimador do
coeficiente linear de Pearson.
Tabela de Contingncia
X

Y
1
a
c
a+c

1
0
Total

Total
0
b
d
b+d

a+b
c+d
n=a+b+c+d

Onde a,b,c e d so as freqncias da tabela de contingncia e n a


soma destas freqncias.
Coeficiente de Contingncia:
Mede o grau de associao entre duas variveis nominais. O coeficiente
de contingncia C pode ser obtido pela expresso abaixo:
(ad-bc)
C =
(a+b)(a+c)(b+d)(c+d)
Da mesma forma que o coeficiente de correlao r, C varia no intervalo
de [-1; 1], isto :
-1 C +1

487

Exemplo 1:
Em uma pesquisa de satisfao, feita junto a clientes de um shopping
foram cruzadas duas variveis da pesquisa: satisfao(Y) e sexo(X). Os
resultados esto na tabela de contingncia abaixo. Qual o grau de relao
entre as variveis? A satisfao depende do sexo?

Tabela de Contingncia
Y
Masculino(1)
Feminino(0)
Total

X
Satisfeito(1)
1
10
11

Total
Insatisfeito(0)
12
2
14

13
12
25

(ad-bc)
C =
(a+b)(a+c)(b+d)(c+d)
2-120
C =
(13)(11)(14)(12)
-118
C = = -0,76
155

Forte correlao inversa

488

Exemplo 2:
Numa pesquisa sobre lembrana/ imagem do ltimo comercial da marca
de carro WY veiculado na TV aberta foram cruzadas duas perguntas do
questionrio: O modelo de carro WY umas de suas marcas preferidas de
carro? Voc se lembra do ltimo comercial veiculado na TV da marca WY? Os
resultados so apresentados na tabela de contingncia abaixo. Qual o grau de
associao entre as questes?
Tabela de Contingncia
Marca Preferida?
Sim
No
Total

Lembra?
Sim
23
2
25

Total
No
2
73
75

25
75
100

(ad-bc)

C =
(a+b)(a+c)(b+d)(c+d)
(1679-4)
C =
(25)(25)(75)(75)
1675
C = = 0,89
1875
Forte correlao positiva

489

Teste de Significncia de C:
O coeficiente de contingncia C est relacionado com a distribuio do
qui-quadrado(2) para tabela 2x2, dada pela expresso a seguir:

2
C=

ou
2 = (n)C2
Esta ltima expresso utilizada para o teste de significncia de C com
=1 grau de liberdade. Par obter o valorp basta ir linha 1 do grau de
liberdade e procurar o escore mais prximo do valor de 2. No cabealho da
probabilidade , o valor-p ser duas vezes(a qui-quadrado no uma
distribuio simtrica) a probabilidade associada ao escore mais prximo do
valor do 2. As hiptese testadas so as mesmas para o coeficiente de
correlao de Pearson.
Vamos testar a significncia dos coeficientes de continncia dos
exemplos anteriores:

490

Exemplo 1:
2 = (25)(-0,76)2 = 14,44=1Valor-p = 2x 0,005 = 0,01 ou 1%
Deciso:
1% < 5%, rejeita-se H0. O coeficiente de contingncia diferente de zero.
Existe correlao de X e Y. C= -0,76 significante ao nvel de 5%. Existe
dependncia significante entre as variveis.

Exemplo 2:
2 = (100)(0,89)2 = 79,21=1Valor-p = 2x 0,005 0,01 ou 1%
Deciso:
1% < 5%, rejeita-se H0. O coeficiente de contingncia diferente de
zero. Existe correlao de X e Y. C=0,89 significante ao nvel de 5%. Existe
dependncia significante entre as variveis.

491

Correlao entre Varivel Nominal e Ordinal:


Estamos diante da situao de anlise quando uma das variveis (X)
nominal dicotmica e a outra ordinal classificao(Y). O estimador da
correlao entre essas variveis tambm foi obtido a partir do coeficiente de
correlao linear de Pearson.
Coeficiente de Correlao Nominal/Ordinal( rNO):
O coeficiente de correlao para variveis nominal e ordinal obtido a
partir do coeficiente de correlao de Pearson toma a seguinte expresso:

n1

2. Yi - n1(n + 1)
i=1

rNO =
[n1n0(n2 1)]/3

Onde:
rNO = coeficiente de correlao nominal/ordinal
n1

Yi = soma da varivel ordinal Y


i=1

n = nmero total de observaes


n0 = nmero de observaes cuja varivel X assume o valor zero
n1 = nmero de observaes cuja varivel X assume o valor 1

492

Esta expresso especfica para a varivel Y em forma de classificao.


Para medir a correlao de variveis nominal e ordinal em que Y toma a forma
de qualquer varivel ordinal, deve-se usar a frmula do coeficiente de
correlao de Pearson:

(nXY) (XY)
rNO =

[nX2 (X)2]. [nY2 (Y)2]

Exemplo 1:
Numa seleo de motoristas para uma empresa que presta servios
logsticos, anotaram-se os resultados da classificao dos candidatos ao
cargo(Y) segundo sexo(X). Os resultados esto apresentados na tabela abaixo.
Existe relao entre X e Y? Qual o grau de associao entre as variveis?

493

X(Sexo)
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
Nota: 1=Homem e 0=Mulher

Y(Classificao)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

494

n1

2. Yi - n1(n + 1)
i=1

rNO =
[n1n0(n2 1)]/3

2. 105 14.(30+1)
rNO =
[14.16(302 1)]/3

210 434
rNO =
[14.16.899]/3

-224
rNO =
[20376]/3

-224
rNO =
67125

-224
rNO = = -0,86
259

Forte Correlao Inversa

495

Exemplo 2:
Em uma empresa 30 funcionrios foram submetidos a um teste de
qualidade na execuo de uma tarefa especfica. Os resultados da prova
possibilitaram a classificao dos empregados(Y). cada colaborador foi
registrado tambm a existncia ou no de treinamento prvio(X). Os dados
constam da tabela abaixo. Existe associao entre estas variveis?

X(Treinamento)
Y(Classificao)
1
1
1
2
1
3
1
4
1
5
1
6
1
7
1
8
1
9
1
10
1
11
1
12
1
13
1
14
1
15
1
16
1
17
1
18
0
19
0
20
0
21
0
22
0
23
0
24
0
25
0
26
0
27
0
28
0
29
0
30
Nota: 1=Sim e 0=No

496

n1

2. Yi - n1(n + 1)
i=1

rNO =
[n1n0(n2 1)]/3

2. 171 18.(30+1)
rNO =
[18.12(302 1)]/3

342 558
rNO =
[18.12.899]/3

-216
rNO =
[64728]

-216
rNO = = -0,85
254

Forte Correlao Inversa

497

Exemplo 3:
Trinta funcionrios de empresas variadas foram consultados em como
percebem o clima organizacional das empresas em que trabalham. Duas
questes constaram da pesquisa:
1)Na sua empresa, existem mecanismos sistemticos de promoo?
0-(

)No

1-(

)Sim

2 )Qual o seu grau de satisfao com seu ambiente de trabalho?


1- (

)Muito Insatisfeito

2-(

)Insatisfeito

3-(

)Neutro

4-(

)Satisfeito

5-(

)Muito satisfeito

Os resultados da coleta destas opinies constam da tabela abaixo.


Existe associao entre as variveis?

498

X
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0

Y
5
5
4
4
5
3
3
5
3
4
4
5
5
3
4
5
3
4
2
2
1
2
3
2
2
1
2
2
3
2

499

Quadro de Clculo:
(X)
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
18

(Y)
5
5
4
4
5
3
3
5
3
4
4
5
5
3
4
5
3
4
2
2
1
2
3
2
2
1
2
2
3
2
98

XY
5
5
4
4
5
3
3
5
3
4
4
5
5
3
4
5
3
4
0
0
0
0
0
0
0
0
0
0
0
0
74

X2
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
18

Y2
25
25
16
16
25
9
9
25
9
16
16
25
25
9
16
25
9
16
4
4
1
4
9
4
4
1
4
4
9
4
368

rNO =

(nXY) (XY)

[nX2 (X)2]. [nY2 (Y)2]

rNO =

(30.74) (18.98)
= 0,82
[30.18 (18)2]. [30.368 (98)2]

500

Teste de Significncia de rNO:


A significncia do coeficiente estimado para amostras com n 30,
poder ser obtida atravs da estatstica Z, como segue:
z = rNOn-1
O valor-p obtido junto tabela da normal padro e seu clculo dado
pela expresso:
Valor-p = 2. P[ Z ou z]
Quando n<30, deve-se realizar o teste t de significncia como ilustrado
para o coeficiente de correlao linear de Pearson e usaremos para obter o
valor-p na linha bicaudal da t-Student a estatstica t = rNOn-1.
Vamos agora testar a significncia dos exemplos anteriores:
Do Exemplo 1:
z = -0,86. n-1 = -0,86 . 29 = -4,63
Valor-p = 2.P(Z -4,63) = 2.(0,5 0,5) = 0,000
Deciso:
A credibilidade da hiptese nula nula, rejeita-se H 0. O coeficiente de
correlao entre as variveis nominal e ordinal diferente de zero. Existe
correlao de X e Y. rN0= -0,86 significante ao nvel de 5%. Existe
dependncia significante entre as variveis.

501

Do Exemplo 2:
z = -0,85. n-1 = -0,85. 29 = -4,58
Valor-p = P(Z -4,58) = 2.(0,5 0,5) = 0,000
Deciso:
A credibilidade da hiptese nula nula, rejeita-se H 0. O coeficiente de
correlao entre as variveis nominal e ordinal diferente de zero. Existe
correlao de X e Y. rN0= -0,85 significante ao nvel de 5%. Existe
dependncia significante entre as variveis.
Do Exemplo 3:
z = 0,82. n-1 = 0,82. 29 = 4,41
Valor-p = 2. P(Z 4,41) = 2.( 0,5 0,5) = 0,000
Deciso:
A credibilidade da hiptese nula nula, rejeita-se H 0. O coeficiente de
correlao entre as variveis nominal e ordinal diferente de zero. Existe
correlao de X e Y. rN0= 0,82 significante ao nvel de 5%. Existe
dependncia significante entre as variveis.

502

Correlao entre Varivel Ordinal e Contnua:


Quando se tem uma varivel (X) ordinal e outra (Y) contnua, possvel
estimar o coeficiente de correlao entre uma varivel ordinal e contnua a
partir do estimador do coeficiente de correlao linear populacional de Pearson.
Coeficiente de Correlao Ordinal/Contnua( rOC):
O coeficiente de correlao para variveis ordinal e contnua obtido a
partir do coeficiente de correlao de Pearson toma a seguinte expresso:

. XiYi - (n + 1) . Y
i=1


n
2
rOC =
[ (n2 1)]/12 . SY

Onde:
rOC o coeficiente de correlao entre a varivel ordinal e contnua.
S Y o desvio padro da varivel Y.
n o nmero de observaes da amostra.

503

Esta expresso tambm especfica para a varivel X em forma de


classificao. Para medir a correlao de variveis ordinal e contnua em que X
toma a forma de qualquer varivel ordinal, deve-se usar a frmula do
coeficiente de correlao de Pearson:
(nXY) (XY)
rOc =

[nX2 (X)2]. [nY2 (Y)2]

Exemplo 1:
A classificao dos trinta candidatos ao mestrado de matemtica no
exame de seleo(X) e o coeficiente de rendimento Y(CR) ao final da titulao
constam da tabela abaixo. Existe relao entre as variveis?

504

X
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

Y(CR)
9.0
8.0
8.0
7.5
7.0
9.5
9.0
8.5
7.0
7.0
6.0
8.5
8.0
7.5
7.0
7.5
6.0
5.5
5.0
5.0
5.0
6.5
6.0
5.5
5.0
5.0
5.0
5.0
5.0
5.0

505

Temos que:
XY = 2776

Y = 6,7
SY = 1,5
Logo,
n

XiYi - (n + 1) . Y
i=1

rOC =
[ (n2 1)]/12 . SY
. 2776 -

(30 + 1) . 6,7

30

rOC = =
[ (302 1)]/12 . 1,5
92,5 - 103,7
rOC = =
13,0
-11,2
rOC = = -0,86
13,0
Forte Correlao Inversa

506

Teste de Significncia de rOC:


A significncia do coeficiente estimado poder ser obtida atravs de:

n-2
t = roc

1 r2oc

A referida estatstica de teste uma t-Student com = n-2 graus de


liberdade. O valor-p obtido de maneira anloga ao do teste de significncia
do coeficiente de correlao linear de Pearson.
Vamos testar a significncia do coeficiente de correlao do exemplo
anterior:
Do Exemplo anterior:

30-2
t = -0,86

= -8,92
1 (-0,86)2

= 30-2 = 28 Valor-p 0,01


Valor-p 0,01 ou 1%

507

Deciso:
O valor-p < 5% rejeita-se H 0. O coeficiente de correlao diferente de
zero. Existe correlao de X e Y. roc= -0,86 significante ao nvel de 5%.
Existe dependncia significante entre as variveis.
Todos os valores-p calculados junto s distribuies t-Student e quiquadrado pelo mtodo desenvolvido aqui nesta unidade so valores
aproximados, uma vez que esto associados a valores prximos e no exatos
de escores das respectivas distribuies.
Os testes de significncia quando do positivos so indicadores de
existncia de correlao entre as variveis na populao. Portanto, podem ser
usados como testes de independncia de variveis.
Conclui-se que possvel utilizar o coeficiente linear de Pearson para
variveis medidas a nvel contnuo, ordinal e dicotmica, tendo as devidas
precaues na interpretao, ou seja, o quadrado do coeficiente de correlao
no pode ser interpretado como a proporo da varincia comum s duas
variveis, quando envolvem variveis ordinais e dicotmicas. Dentre os fatores
que afetam o coeficiente linear de Pearson, pode-se citar o tamanho da
amostra, principalmente quando pequeno. Assim, apesar da possibilidade da
utilizao do coeficiente linear de Pearson, para as variveis que no so
medidas em nvel quantitativo, h que se atentar para a questo do tamanho
da amostra, das variveis envolvidas na anlise.

508

Exerccios Propostos:

1)A tabela abaixo informa a quantidade de emprstimos averbados no


contracheque de uma amostra de servidores pblicos federais(X) em
funo da quantidade de refinanciamentos dos mesmos(Y). Construa o
diagrama de disperso, calcule o coeficiente de correlao de Pearson e
teste a sua significncia. Interprete os resultados.
X
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

Y
2
4
6
7
12
12
13
16
17
18
22
23
25
26
28
30
30
31
37
38

509

2)A pesquisa sobre os clientes dos restaurantes coletou dados sobre


quatro fatores de escolha de restaurantes. Pediu-se aos clientes que
classificassem os quatro fatores seguintes em termos de sua importncia
na seleo de um restaurante: qualidade da comida, ambiente, preos,
funcionrios. As variveis da amostra iam de X 13 a X16 e eram mensuradas
ordinalmente. O administrador gostaria de saber se as classificaes para
a qualidade da comida esto relacionadas com as classificaes para
ambiente. Uma resposta para esta questo ajudar o administrador a
saber se deve enfatizar a qualidade da comida ou o ambiente em seus
comerciais.

Esses dados so ordinais(ranqueamento) e, portanto, a

correlao de Pearson no pode ser usada. A correlao de Spearman


a adequada para o clculo. A hiptese nula a de que no existe
diferena

nos

ranqueamentos

dos

dois

fatores

de

seleo

de

restaurantes. A tabela abaixo apresenta a base de dados gerada atravs


da coleta. Calcule o coeficiente de correlao de Spearman e teste a
significncia entre as variveis X13/X15. Interprete os resultados.

X13-Qualidade da
Comida
1
1
2
1
1
2
1
1
2
1

X14Ambiente
3
3
4
3
3
1
3
3
4
2

X15-Preo
2
2
1
2
2
3
2
2
1
3

X16-Funcionrios
4
4
3
4
4
4
4
4
3
4

510

3)Um administrador de um restaurante tem a hiptese de que o


sexo descrimina os clientes quanto s suas classificaes do
ambiente como fator importante na seleo de um restaurante. O
analista obteve uma amostra de clientes do restaurante e a tabela
abaixo apresenta os resultados da coleta. teste a dependncia
entre as variveis.

Tabela de Contingncia
X
Feminino(1)
Masculino(0)
Total

Y
Importante(1)
20
10
30

Total
No Importante(0)
10
30
40

30
40
70

511

4)Um administrador levantou o nvel de satisfao dos seus clientes(Nosatisfeito=0 e Satisfeito=1) e a classificao dos mesmos em funo da
frequncia ao

estabelecimento. Os dados esto registrados na tabela

abaixo. Calcule o coeficiente de correlao pertinente e teste a sua


significncia.
X

Y
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

X
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

Y
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48

5)Uma pesquisa de um restaurante a peso do tipo Fast Food registrou a


classificao dos clientes pela frequncia ao estabelecimento em funo
do peso mdio da refeio consumidas pelos mesmos. O administrador
gostaria de saber se a classificao dos clientes pela frequncia esto
relacionadas com o peso mdio da refeio consumida por eles. Existe
associao entre estas variveis? Teste a independncia das variveis.
X(Classificao)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

Y(Gramas)
1000
990
980
960
955
950
920
910
900
890
885
880
860
850
830
825
820
815
810
800
795
790
740
735
700
690
650
600
580
500

OBS: O primeiro colocado em frequncia ao restaurante consume em


mdia 1000 g de refeies por dia no estabelecimento.

513

6)Verifique se as variveis abaixo atendem aos pressupostos para clculo


de correlao linear de Pearson.

Acidentes que Matam


Ano
2002

X(Nmero Total de Mortes


por Acidentes de Transporte
Terrestre no Brasil)
32753

Y(Nmero Total de Mortes por


Acidentes com Motocicletas
no Brasil)
3744

2003

33139

4271

2004

35105

5042

2005

35994

5974

2006

36367

7162

2007

37407

8078

2008

38273

8898

2009

37594

9268

2010

40610

10134

514

7)Verifique se as variveis abaixo so estacionrias e caso contrrio


indique a diferena que deve ser aplicvel para torn-la estacionrias.
ndices de Custo de Vida de Duas Sries Temporais
Tempo
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
29

X(t)
95.90
96.70
97.80
99.10
100.00
102.20
103.70
104.70
106.00
106.70
107.90
110.40
112.30
114.10
116.10
117.10
117.50
118.90
120.20

Y(t)
71.60
72.50
73.50
74.50
75.20
76.30
76.90
78.10
80.00
80.90
81.70
82.90
84.70
86.30
88.80
90.90
91.50
93.40
94.60

515

8)Verifique se as variveis notas de satisfao com a verso antiga e


verso nova do site de relacionamento Orkut dada por 40 usurios so
normalmente distribudas e, caso contrrio, realize a transformao
logaritmo e conclua sobre a normalidade das variveis transformadas.
Notas de Satisfao com a Verso Antiga e Verso Nova do Site de
Relacionamento Orkut dada por 40 Usurios
X

X
1.00
1.00
1.00
1.00
1.00
1.00
1.00
1.00
1.00
1.00
2.00
2.00
2.00
3.00
3.00
3.00
3.00
3.00
3.00
3.00

3.00
3.00
3.00
3.00
3.00
3.00
3.00
3.00
3.00
3.00
5.00
5.00
10.00
10.00
10.00
10.00
10.00
10.00
10.00
10.00

Y
1.00
1.00
1.00
1.00
1.00
1.00
1.00
1.00
1.00
1.00
1.00
2.00
2.00
2.00
2.00
2.00
3.00
3.00
3.00
3.00

0.48
0.48
0.48
0.48
0.48
0.48
0.48
0.60
0.60
0.60
0.70
0.70
0.90
0.95
0.95
1.00
1.00
1.00
1.00
1.00

516

9)Verifique por Bera-Jarque(BJ) se as duas variveis abaixo, preo do


aluguel e preo do condomnio de 20 residncias atendem ao
pressuposto da normalidade:

X(Preo do Aluguel)
252.20
262.00
356.40
408.10
598.30
616.30
569.20
582.30
653.00
692.00
568.20
468.40
436.20
517.70
594.70
666.40
681.50
656.30
735.50
865.20

Y(Preo do Condomnio)
58.18
56.89
55.78
56.98
58.31
62.42
62.52
61.01
60.40
63.32
70.85
70.74
72.73
87.77
93.85
101.59
103.71
99.31
108.54
123.45

517

10)Dadas s sries abaixo:


X(ICM da Cidade A)
71.60
72.50
73.50
74.50
75.20
76.30
76.90
78.10
80.00
80.90
81.70
82.90

Y(ICM da Cidade B)
50.00
55.00
52.00
55.00
54.00
56.00
100.00
102.00
101.00
105.00
100.00
102.00

a)As sries so estacionrias?


b)As sries X(t), Y(t), 2X(t), 2Y(t) so estacionrias?

518

Unidade IX
Regresso Linear Simples

Conceito de Regresso Linear:


o estabelecimento de uma relao, traduzida por uma equao, que
permite estimar e explicar o valor de uma varivel em funo de outras
variveis.
A anlise de regresso linear , ento, um conjunto de mtodos e
tcnicas para o estabelecimento de uma reta emprica que interprete a relao
funcional entre variveis como boa aproximao.

Conceito de Regresso Linear Simples:


o estabelecimento de uma relao, traduzida por uma equao linear,
que permite estimar e explicar o valor de uma varivel em funo de uma
nica outra varivel. A anlise da regresso linear simples tem como resultado
uma equao matemtica que descreve o relacionamento entre duas variveis.
chamada de regresso linear simples, portanto, porque s envolve uma
nica varivel explicativa num modelo linear.

Finalidades da Anlise de Regresso Linear Simples:


o Estimar o valor de uma varivel com base no valor conhecido de outra;
o Explicar o valor de uma varivel em termos de outra;
o Predizer o valor futuro de uma varivel.

519

Varivel Independente(X):
a varivel explicativa do modelo. com ela que se procura explicar ou
predizer a outra varivel. Tambm chamada de varivel preditora, explicativa
ou exgena.
Varivel Dependente(Y):
a varivel explicada do modelo. a varivel que se procura explicao
atravs da varivel explicativa. A regresso linear tenta reproduzir numa
equao matemtica o modo como o comportamento da varivel dependente
explicada pela varivel independente. Tambm chamada de varivel
desfecho, resposta, explicada ou endgena.

Exemplos:

{Altura(X): Peso(Y)}
{Nmero de dependentes(X); Gastos da famlia(Y)}
{Propaganda(X), Vendas do produto(Y)}
{Quilmetros rodados(X), Consumo de gasolina (Y)}
{Peso da refeio no Fast Food(X); Preo da refeio do Fast
Food(Y)}
{Nota em Clculo(X); Nota em Estatstica(Y)}
{IDH(X); Esperana de vida(Y}

520

Equao de Regresso Linear Simples:

impraticvel conhecer e utilizar todas as variveis que influenciam Y:


pelo desconhecimento da natureza e/ou valores de algumas ou pela dificuldade
de observ-las ou medi-las. Portanto, operacionalmente vivel utilizarmos um
nmero menor de variveis para explicar Y e chamar de e i todas as variveis
que no conseguimos colocar no modelo, isto , que no conseguimos
controlar. Esta varivel chamada de erro e sua estimativa denominada de
resduo, tal como na anlise da varincia.
Na anlise de regresso linear simples, a explicao da varivel
resposta pode se escrita na forma de um modelo:
Resposta = valor mdio de Y + erro
O modelo indica que a resposta de uma varivel explicada dada pelo
valor mdio de Y acrescida de uma quantidade, que os estatsticos chamam de
erro.
A anlise de regresso linear simples de um conjunto de dados exige,
assim como a anlise da varincia, que sejam feitas algumas pressuposies
sobres os erros, sem as quais os resultados das anlises no so vlidos. As
pressuposies so:
o Ausncia de pontos discrepantes;
o Erros independentes;
o Varincia constante;
o Distribuio dos erros normalmente distribudos.

521

Vamos falar dos pressupostos bsicos da anlise da regresso com


mais detalhes na sesso Pressupostos Bsicos.
O modelo linear simples o que contem uma nica varivel
independente. Logo, podemos escrever o modelo de regresso linear simples
da seguinte maneira:

Resposta = valor mdio de Y + erro


Resposta = reta de regresso + erro
Y = + X + erro
Y = + X + e
Os coeficientes do modelo so e , isto , os parmetros a serem
estimados. O valor de , coeficiente angular da reta, chamado de coeficiente
de regresso e indica em termos absolutos a importncia ou o peso que a
varivel explicativa X tem como preditora de Y: cada incremento de uma
unidade em X provoca um aumento ou diminuio igual ao coeficiente de
regresso em Y.
Exemplo:
Vamos supor que uma estimativa de um modelo que explique Y seja:
Y^ = 2 + 2X
X=1 Y^ = 4
X=2 Y^ = 6
X=3 Y^= 8
X=4 Y^= 10
E assim por diante...

522

Fases da Regresso Linear Simples:


1)Sempre iniciar com um grfico de disperso para observar a possvel
relao entre X e Y, calcular o coeficnete de correlao de Pearson para
confirmar a inspeo grfica e realizar o seu teste de significncia;
2)Estimar os valores dos coeficiente da linha de regresso, se a
correlao linear for aceitvel;
3)Calcular o coeficiente de explicao do modelo;
4)Realizar os testes de exitncia de regresso linear, inclusive o do
coeficiente de regresso;
5)Verificar a violao dos pressupostos bsicos e caso haja algum tomar
as providncias cabveis;
6)Se a avaliao feita nos item acima no indicar violao nos
pressupostos, ento podem-se considerar os aspectos de inferncia da
anlise de regresso e explicar a varivel dependente pela varivel
independente e fazer previses.
Estimao dos Parmetros do Modelo de Regresso Linear Simples:
A estimao consiste em estimar os valores dos parmetros e
atravs do mtodo dos mnimos quadrados.
Exemplo:
O modelo linear da forma:
Y = + X + e
Para estimar utilizaremos o estimador a e para estimar o estimador
b. Ser necessrio estimar aas estatsticas a e b a partir de n pares de

523

observaes(X; Y). Dessa forma utilizaremos como estimativa da linha de


regresso:
Y^ = a + bX
Onde, Y^(l-se Y chapu) ser o estimador de Y.
Visualizao do Erro no Diagrama de Disperso:

e3

524

e3
e6

Para determinao dos estimadores do modelo de regresso, existem


vrios mtodos, dos quais se sobressai o Mtodo dos Mnimos Quadrados.
Ele tem por objetivo obter a e b de modo que a soma da diferena ao quadrado
entre o valor real de Y e o estimado, Y^, seja mnimo:
Min (Y Y^)2 = Min (e)2
Substituindo Y^ = a + bX na expresso acima e chamando-a de S:
S= Min (Y a - bX )2
Como o mtodo dos mnimos quadrados consiste em determinar valores
de a e b de modo que a soma dos quadrados dos erros seja mnima,

525

deveremos ter as derivadas parciais de S em relao aos estimadores a e b


iguais a zero:
S
= -2(Y a - bX ) = 0
a
S
= -2X(Y a - bX ) = 0
b
Dessa forma, obtemos o sistema de equaes seguintes
Y = na + b X
XY = aX + b X2

526

Resolvendo o sistema de equaes acima, encontramos as expresses


dos estimadores a e b:

XY -

XY

b =
X2 -

(X)2

a= Y

b.X

Onde:

= (X)/n

= (Y)/n

527

Observaes:
o A previso da varivel dependente resultar sempre em um valor
mdio. Em analogia mdia aritmtica, a linha de regresso
uma Mdia dos valores de Y para cada valor de X. A relao
entre X e Y mdia;
o Quando fazemos previso no obteremos para um dado valor de
Y, necessariamente, um valor exato e sim um valor mdio quando
a varivel independente assume um dado valor X;
o Para fazermos previso a cerca da varivel dependente Y, no
devemos utilizar valores da varivel

independente X que

extrapolem o intervalo de valores utilizados no modelo de


regresso, porque a linha de regresso s vale para o domnio de
X utilizado.

528

Exemplo 1:
Um jornal quer verificar a eficcia de seus anncios na venda de carros
usados. A tabela abaixo mostra o nmero de anncios e o correspondente
nmero de carros vendidos por 6 companhias que usaram apenas este jornal
como veculo de propaganda. Obtenha a equao de regresso linear simples.
Qual a previso do nmero de carros vendidos para um volume de 70
anncios?
Companhia
A
B
C
D
E
F
Total

Anncios(X)
74
45
48
36
27
16
246

Carros Vendidos(Y)
139
108
98
76
62
57
540

Quadro de Clculo:

Companhia Anncios(X)
A
74
B
45
C
48
D
36
E
27
F
16
Total
246

Carros
Vendidos(Y)
139
108
98
76
62
57
540

XY
10286
4860
4704
2736
1674
912
25172

X2
5476
2025
2304
1296
729
256
12086

Y2
19321
11664
9604
5776
3844
3249
53458

529

XY -

XY

b =
X2 -

(X)2

25172 - 246.540

6
b = = 1,5
(246)2

12086 -

Y = (540)/6 = 90 e X = (246)/6 = 41

a= Y

b . X = 90 1,5.41 = 28,5

Logo a linha de regresso :


Y^= 28,5 + 1,5 X
Previso : Y^= 28,5 + 1,5 . 70 = 134. Em mdia 134 carros vendidos.

530

Exemplo 2:
A indstria MIMI vende um remdio para combater resfriado. Aps dois
anos de operao, ela coletou as seguintes informaes trimestrais. Obtenha a
equao de regresso linear simples.

Trimestres
1
2
3
4
5
6
7
8
Total

Despesas(X)
11
5
3
9
12
6
5
9
60

Vendas(Y)
25
13
8
20
25
12
10
15
128

XY
275
65
24
180
300
72
50
135
1101

X2
121
25
9
81
144
36
25
81
522

Y2
625
169
64
400
625
144
100
225
2352

531

XY -

XY

b =
X2 -

(X)2

1101 -

60.128

b = = 2,0
(60)2

522 -

Y = (128)/8 = 16 e X = (60)/8 = 7,5

a= Y

b . X = 16 2,0.7,5 = 1,0

Logo a linha de regresso :


Y^= 1,0 + 2,0 X

532

Exemplo 3:
O faturamento de uma loja durante o perodo de janeiro a agosto de
2010 dado a seguir em milhares de reais. Obtenha a equao de regresso
linear simples.Qual a previso do faturamento para setembro deste ano?

Meses
JAN
FEV
MR
ABR
MAI
JUN
JUL
AGO
Total

(X)
1
2
3
4
5
6
7
8
36

Faturamento(Y)
20
22
23
26
28
29
32
36
216

XY
20
44
69
104
140
174
224
288
1063

X2
1
4
9
16
25
36
49
64
204

Y2
400
484
529
676
784
841
1024
1296
6034

533

XY -

XY

b =
X2 -

(X)2

1063 -

36.216

b = = 2,17
(36)2

204 -

Y = (216)/8 = 27 e X = (36)/8 = 4,5

a= Y

b . X = 27 2,17.4,5 = 17,24

Logo a linha de regresso :


Y^= 17,24 + 2,17 X

Previso: Y^= 17,24 + 2,17.9 = 36,77 mil reais em mdia.

534

Exemplo 4:
Em um presdio de uma cidade foram coletados dados sobre dias de
frias de servidores em funo de licenas solicitadas por stress. Obtenha a
equao de regresso linear simples

Funcionrio
A
B
C
D
E
F
G
H
I
J
Total

Dias de
Frias(X)
20
18
16
14
12
10
8
6
4
2
110

Licenas por Stress(Y)


10
15
17
21
35
32
39
42
55
60
326

XY
200
270
272
294
420
320
312
252
220
120
2680

X2
400
324
256
196
144
100
64
36
16
4
1540

Y2
100
225
289
441
1225
1024
1521
1764
3025
3600
13214

535

XY -

XY

b =
X2 -

(X)2

2680 -

110.326

10

b = = -2,7
(110)2

1540 -

10

Y = (326)/10 = 32,6 e X = (110)/10 = 11,0

a= Y

b . X = 32,6 + 2,7.11 = 62,3

Logo a linha de regresso :


Y^= 62,3 - 2,7 X

Observao: As

estimativas

dos parmetros

de

regresso

se

apresentam nos exemplos acima como valores aproximados tendo em vista os


arredondamentos realizados.

536

Coeficiente de Explicao ou de Determinao (R 2):


uma medida estatstica que tem o objetivo de informar, em termos
percentuais, o quanto a varivel independente X, includa no modelo, contribui
para o comportamento da varivel dependente Y. Se a varivel independente X
tem uma taxa de explicao satisfatria, isso significa que o modelo que se
criou para explicar X adequado. Portanto, o coeficiente de determinao um
indicador utilizado para verificar se o modelo adotado para explicar Y bom.
Tal coeficiente definido por:
Variao Explicada

VE

R2 = = =
Variao Total

VT

b. SXY
R2 = . 100
SYY
Onde:

SXY =

XY -

XY

SYY =

Y2 -

(Y)2

537

O intervalo de variao do R2 :

0R21
Observe que:
a)Se R2= 0 o modelo adotado no explica nada a realidade
a)Se R2= 1 o modelo adotado explica a realidade com perfeio
Portanto, quanto mais VE se aproxima de VT, mais nos aproximamos a
realidade. Assim, quanto maior o coeficiente de explicao, melhor o modelo
adotado.
Observao:
Pode-se provar que o valor da raiz quadrada do coeficiente de
explicao o Coeficiente de Correlao de Pearson. Logo, o coeficiente de
explicao o quadrado do Coeficiente de Correlao de Pearson.
Interpretao:
O coeficiente de explicao indica em porcentagem o quanto X explica
Y, isto , a porcentagem do poder de explicao das variaes de Y pelo
modelo adotado.

538

Exemplo 1:

Um jornal quer verificar a eficcia de seus anncios na venda de carros


usados. A tabela abaixo mostra o nmero de anncios e o correspondente
nmero de carros vendidos por 6 companhias que usaram apenas este jornal
como veculo de propaganda. Existe relao linear entre as variveis? Calcule
o coeficiente de explicao do modelo e interprete o resultado.

Companhia
A
B
C
D
E
F
Total

Anncios(X)
74
45
48
36
27
16
246

Carros Vendidos(Y)
139
108
98
76
62
57
540

Coeficiente de Correlao r:
Carros
Companhia Anncios(X)
A
74
B
45
C
48
D
36
E
27
F
16
Total
246

Vendidos(Y)
139
108
98
76
62
57
540

XY
10286
4860
4704
2736
1674
912
25172

X2
5476
2025
2304
1296
729
256
12086

Y2
19321
11664
9604
5776
3844
3249
53458

(nXY) (X)(Y)
r=

[nX2 (X)2]. [nY2 (Y)2]

539

(6.25172) (246).(540)
r=

[6.12086 (246)2]. [6.53458 (540)2]

r= (18192)/(18702) = 0,97 R2 = 0,94 ou 94%


Interpretao:
O nmero de carros vendidos explicado 94% pela varivel anncio.

Exemplo 2:

540

A indstria MIMI vende um remdio para combater resfriado. Aps dois


anos de operao, ela coletou as seguintes informaes trimestrais. Qual o
grau da relao entre as vendas do remdio e as despesas com propaganda?
Calcule o coeficiente de explicao do modelo e interprete o resultado.
Trimestres
1
2
3
4
5
6
7
8
Total

Despesas(X)
11
5
3
9
12
6
5
9
60

Vendas(Y)
25
13
8
20
25
12
10
15
128

XY
275
65
24
180
300
72
50
135
1101

X2
121
25
9
81
144
36
25
81
522

Y2
625
169
64
400
625
144
100
225
2352

(nXY) (XY)
r=

[nX2 (X)2]. [nY2 (Y)2]


(8.1101) (60)(128)

r=

[8.522 (60)2]. [8.2352 (128)2]

r= (1120)/(1184) = 0,95 R2 = 0,90 ou 90%

Interpretao:
As vendas so explicadas 90% pelas despesas.

541

Exemplo 3:
O faturamento de uma loja durante o perodo de janeiro a agosto de
2010 dado a seguir em milhares de reais. Calcule o coeficiente de explicao
do modelo e interprete o resultado.

Meses
JAN
FEV
MR
ABR
MAI
JUN
JUL
AGO
Total

(X)
1
2
3
4
5
6
7
8
36

Faturamento(Y)
20
22
23
26
28
29
32
36
216

XY
20
44
69
104
140
174
224
288
1063

X2
1
4
9
16
25
36
49
64
204

Y2
400
484
529
676
784
841
1024
1296
6034

(nXY) (XY)
r=

[nX2 (X)2]. [nY2 (Y)2]


(8.1063) (36)(216)

r=

[8.204 (36)2]. [8.6034 (216)2]

r = 0,99 , logo: R2 = 0,98 ou 98%


Interpretao:
O modelo linear em funo do tempo explica 98% da tendncia mensal
do faturamento da loja.

542

Exemplo 4:
Em um presdio de uma cidade foram coletados dados sobre dias de
frias de servidores em funo de licenas solicitadas por stress. Qual o
sentido da associao entre as variveis? Calcule o coeficiente de explicao
do modelo e interprete o resultado.

Funcionrio
A
B
C
D
E
F
G
H
I
J
Total

Dias de
Frias(X)
20
18
16
14
12
10
8
6
4
2
110

Licenas por Stress(Y)


10
15
17
21
35
32
39
42
55
60
326

XY
200
270
272
294
420
320
312
252
220
120
2680

X2
400
324
256
196
144
100
64
36
16
4
1540

Y2
100
225
289
441
1225
1024
1521
1764
3025
3600
13214

(nXY) (XY)
r=

[nX2 (X)2]. [nY2 (Y)2]


(10.2680) (110)(326)

r=

[10.1540 (110)2]. [10.13214 (326)2]

r = -0,98 R2 = (-0,98)2 = 0,96 ou 96%

543

Interpretao:
As licenas por stress so explicadas 96% pelos dias de frias tirados
pelos servidores.
Testes de Significncia da Existncia de Regresso Linear Simples
ou Teste da Significncia do Coeficiente de Explicao(R 2):
Ajustar uma reta a valores observados de duas variveis sempre
possvel, por pior que seja a dependncia linear entre essas variveis.
Entretanto, a priori, no podemos garantir que existe de fato regresso linear
entre as variveis na populao. Estamos com uma amostra de pares de
valores e a dependncia revelada na amostra pode ser fruto de erro-amostral.
Para testar a existncia de regresso linear na populao das variveis
X e Y atravs da amostra dos pares (X ; Y) , podemos utilizar o Teste F atravs
da Anlise da Varincia, adaptada ao caso de anlise de regresso linear.
O modelo de regresso linear dado por:
Y = + X + e
Pode-se decompor o modelo de regresso linear em duas partes:
1 Parte: + X variao explicada(VE)
2 Parte: e

variao residual(VR)

A variao total de Y dada pelo prprio modelo Y = + X + e ou pela


soma das duas componentes:
VT = VE + VR

544

Se VE foi significativamente maior do que VR, existe regresso linear


entre as variveis X e Y. Caso contrrio, no existe regresso linear entre as
variveis .
Para se verificar se VE significativamente maior do que VR, a ANOVA
utiliza da relao:
VE
F =
VR
Para testar a significncia da regresso linear necessrio testar a
significncia da estimativa b e para isso testamos as seguintes hipteses:
H0 : = 0
H1 ; 0
Portanto, se a relao entre as variveis do modelo de regresso
significativa, possvel predizer os valores da varivel dependente, com base
nos valores da varivel independente

545

O quadro da ANOVA adaptada ao teste de significncia da linha de


regresso fica:

Fonte de

Soma dos

Graus de

Variao

Quadrados

Liberdade

Quadrado Mdio

Explicada

SQE = b . SXY

QME = b.SXY

Residual

SQR =SYY-bSXY

n-2

QMR = (SQR)/(n-2)

Total

SQT = SYY

n-1

Teste F

F=QME/QMR

Deciso da ANOVA:
Calcular o Valor-p com base na Tabela 6 - V a l o r - p p o r v a l o r e s
d e F , que est anexa.
Deciso: se o valor-p , rejeitar H0.

546

Exemplo 1:
Um jornal quer verificar a eficcia de seus anncios na venda de carros
usados. A tabela abaixo mostra o nmero de anncios e o correspondente
nmero de carros vendidos por 6 companhias que usaram apenas este jornal
como veculo de propaganda. Teste a existncia da regresso pela ANOVA.
Companhia
A
B
C
D
E
F
Total

Anncios(X)
74
45
48
36
27
16
246

Carros Vendidos(Y)
139
108
98
76
62
57
540

Quadro de Clculo:
Companhia Anncios(X)
A
74
B
45
C
48
D
36
E
27
F
16
Total
246

Carros
Vendidos(Y)
139
108
98
76
62
57
540

XY
10286
4860
4704
2736
1674
912
25172

X2
5476
2025
2304
1296
729
256
12086

Y2
19321
11664
9604
5776
3844
3249
53458

b = 1,5
SXY = 25172 - 246.540

= 3032

6
SYY =

53458 -

(540)2

= 4858

547

Quadro da ANOVA:
Tirar o negrito do que est em vermelho
Fonte de

Soma dos

Graus de

Quadrado

Variao

Quadrados

Liberdade

Mdio

Explicada

SQE= 1,5 .

QME = 4548

Teste F

3032 =4548
F=4548/77,5=
Residual

SQR =4858-

6-2 = 4

4548 = 310

Total

SQT = 4858

QMR = 310/4 =

58,68

77,5

6-1= 5

548

Consultando a Tabela 6 para 1=1 e 2=4 valor-p 0,001


Deciso:
O valor-p< 0,05, rejeita-se H0. 0. b=1,5 significante. A
regresso existe entre X e Y.
Exemplo 2:
A indstria MIMI vende um remdio para combater resfriado.
Aps dois anos de operao, ela coletou as seguintes informaes
trimestrais. Qual o grau da relao entre as vendas do remdio e as
despesas com propaganda? Teste a existncia da regresso pela
ANOVA
Trimestres
1
2
3
4
5
6
7
8
Total

Despesas(X)
11
5
3
9
12
6
5
9
60

Vendas(Y)
25
13
8
20
25
12
10
15
128

XY
275
65
24
180
300
72
50
135
1101

X2
121
25
9
81
144
36
25
81
522

Y2
625
169
64
400
625
144
100
225
2352

b = 2,0

SXY = 1101 -

60.128

= 141

549

SYY = 2352 -

(128)2

= 304

8
Quadro da ANOVA:
Tirar o negrito do que est em vermelho
Fonte de

Soma dos

Graus de

Variao

Quadrados

Liberdade

Explicada

SQE = 2,0 . 141

Quadrado Mdio

Teste F

QME = 282

= 282
F=282/3,7=
Residual

SQR =304-282

8-2 = 6

QMR = 22/6 = 3,7

8-1= 7

76,2

= 22

Total

SQT = 304

Consultando a Tabela 6 para 1=1 e 2=6 valor-p 0,001

550

Deciso:
O valor-p< 0,05, rejeita-se H0. 0. b= 2,0 significante. A
regresso existe entre X e Y.
Exemplo 3:
O faturamento de uma loja durante o perodo de janeiro a
agosto de 2010 dado a seguir em milhares de reais. Teste a
existncia da regresso pela ANOVA

Meses
JAN
FEV
MR
ABR
MAI
JUN
JUL
AGO
Total

(X)
1
2
3
4
5
6
7
8
36

Faturamento(Y)
20
22
23
26
28
29
32
36
216

XY
20
44
69
104
140
174
224
288
1063

X2
1
4
9
16
25
36
49
64
204

Y2
400
484
529
676
784
841
1024
1296
6034

b = 2,17
SXY = 1063 -

36.216

= 91

8
SYY = 6034 -

(216)2

= 202

551

Quadro da ANOVA:
Tirar o negrito do que est em vermelho
Fonte de

Soma dos

Graus de

Quadrado

Variao

Quadrados

Liberdade

Mdio

Explicada

SQE = 2,17 .

QME =

91 = 197,47

Teste F

197,47
F=197,47/0,76=

Residual

Total

SQR =202-

8-2 = 6

QMR =

197,47 =

4,53/6 =

4,53

0,76

SQT = 202

8-1= 7

259,83

Consultando a Tabela 6 para 1=1 e 2=6 valor-p 0,001


Deciso:
O valor-p< 0,05, rejeita-se H 0. 0. b= 2,17 significante. A
regresso existe entre X e Y.

552

Exemplo 4 :
Em um presdio de uma cidade foram coletados dados sobre
dias de frias de servidores em funo de licenas solicitadas por
stress. Teste a existncia da regresso pela ANOVA.

Funcionrio
A
B
C
D
E
F
G
H
I
J
Total

Dias de
Frias(X)
20
18
16
14
12
10
8
6
4
2
110

Licenas por Stress(Y)


10
15
17
21
35
32
39
42
55
60
326

XY
200
270
272
294
420
320
312
252
220
120
2680

X2
400
324
256
196
144
100
64
36
16
4
1540

Y2
100
225
289
441
1225
1024
1521
1764
3025
3600
13214

b = -2,7
SXY = 2680 -

110.326

= -906

10
SYY = 13214 -

(326)2

= 2586,4

10

553

Quadro da ANOVA:

Fonte de

Soma dos

Graus de

Quadrado

Variao

Quadrados

Liberdade

Mdio

Explicada

SQE = -2,7 -906

QME = 2446,2

Teste F

= 2446,2
F=2446,2/17,5=
Residual

SQR =2586,4-

10-2 = 8

2446,2 = 140,2

Total

SQT = 2586,4

QMR = 140,2/8

139,8

= 17,5

8-1= 7

Consultando a Tabela 6 para 1=1 e 2=8 valor-p 0,001


Deciso:
O valor-p< 0,05, rejeita-se H0. 0. b= -2,7 significante. A
regresso existe entre X e Y.

554

Teste da Significncia do Coeficiente de Regresso(b)- Teste


de Wald:
Aps a estimao do coeficiente de regresso deve-se proceder
investigao da significncia estatstica do mesmo. O teste de Wald
utilizado para avaliar se o coeficiente de regresso estatisticamente
significante. A estatstica teste utilizada obtida atravs da razo do
coeficiente pelo seu respectivo erro padro. Esta estatstica teste tem
distribuio t-Student, com =n-2 graus de liberdade, sendo seu valor
comparado com valores tabulados de acordo com o nvel de
significncia definido. A estatstica teste, para avaliar se o parmetro b
igual a zero, assim especificada:
Estatstica de Wald:
b
W =
EP( b)
Onde:
QMR
EP(b) =
SXX
SYY b.SXY
QMR =

n-2

SXX =

X2 -

(X)2

555

O valor-p obtido junto tabela T-Student com =n-2, como


procedemos comumente em unidades anteriores. O critrio de deciso
anlogo aos testes de significncia que j estudamos.
Um coeficiente de regresso no significante um indicador
forte de que a varivel independente inserida no modelo de regresso
no explica o comportamento da varivel dependente. A idia que ela
seja substituda por outra varivel explicativa.
O teste de Wald, todavia, freqentemente, aceita a hiptese de
que o coeficiente no significante, quando significante(Erro do Tipo
II). Sendo assim, aconselha-se que os coeficientes, identificados pelo
Teste de Wald como sendo estatisticamente no significantes, sejam
testados novamente pelo teste da razo de verossimilhana, que no
visto neste livro, mas que pode ser consultado na bibliografia sobre o
assunto.
Exemplo 1:
Um jornal quer verificar a eficcia de seus anncios na venda de
carros usados. A tabela abaixo mostra o nmero de anncios e o
correspondente nmero de carros vendidos por 6 companhias que
usaram apenas este jornal como veculo de propaganda. Teste a
significncia do coeficiente de regresso.
Quadro de Clculo:
Carros
Companhia Anncios(X)
A
74
B
45
C
48
D
36
E
27
F
16
Total
246

Vendidos(Y)
139
108
98
76
62
57
540

XY
10286
4860
4704
2736
1674
912
25172

X2
5476
2025
2304
1296
729
256
12086

Y2
19321
11664
9604
5776
3844
3249
53458

556

b = 1,5
QMR = 77,5
QMR = 77,5 = 8,80
SXX =

X2 -

(X)2

SXX =

(246)2

12086 -

= 2000

6
QMR
EP(b) =
SXX
8,80
EP(b) = = 0,20
2000
b
W =
EP( b)
1,5
W = = 7,5
0,20
Consultando a Tabela 2 com = 6-2 = 4 valor=p 0,01

557

Deciso:
O valor p < 0,05, rejeita-se H o. O coeficiente de regresso
b=1,5 significante. A varivel independente explica a varivel
dependente.
Exemplo 2:
A indstria MIMI vende um remdio para combater resfriado.
Aps dois anos de operao, ela coletou as seguintes informaes
trimestrais. Qual o grau da relao entre as vendas do remdio e as
despesas com propaganda? Teste a significncia do coeficiente de
regresso.
Trimestres
1
2
3
4
5
6
7
8
Total

Despesas(X)
11
5
3
9
12
6
5
9
60

Vendas(Y)
25
13
8
20
25
12
10
15
128

XY
275
65
24
180
300
72
50
135
1101

X2
121
25
9
81
144
36
25
81
522

Y2
625
169
64
400
625
144
100
225
2352

b = 2,0
QMR = 3,7
QMR = 3,7 = 1,92
SXX =

X2 -

(X)2

558

SXX =

(60)2

522 -

= 72

8
QMR
EP(b) =
SXX
1,92
EP(b) = = 0,23
72
b
W =
EP( b)
2,0
W = = 8,7
0,23
Consultando a Tabela 2 com = 8-2 = 6valor=p 0,01
Deciso:
O valor p < 0,05, rejeita-se H o. O coeficiente de regresso
b=2,0 significante. A varivel independente explica a varivel
dependente.

559

Exemplo 3:
O faturamento de uma loja durante o perodo de janeiro a
agosto de 2010 dado a seguir em milhares de reais. Teste a
significncia do coeficiente de regresso.
Meses
JAN
FEV
MR
ABR
MAI
JUN
JUL
AGO
Total

(X)
1
2
3
4
5
6
7
8
36

Faturamento(Y)
20
22
23
26
28
29
32
36
216

XY
20
44
69
104
140
174
224
288
1063

X2
1
4
9
16
25
36
49
64
204

Y2
400
484
529
676
784
841
1024
1296
6034

b = 2,17
QMR = 0,76
QMR = 0,76 = 0,87
SXX =

X2 -

(X)2

SXX =

204 -

(36)2

= 42

8
QMR
EP(b) =
SXX

560

0,87
EP(b) = = 0,13
42
b
W =
EP( b)
2,17
W = = 16,69
0,13
Consultando a Tabela 2 com = 8-2 = 6valor=p 0,01
Deciso:
O valor p < 0,05, rejeita-se H o. O coeficiente de regresso
b=2,17 significante. A varivel independente explica a varivel
dependente.

561

Exemplo 4 :
Em um presdio de uma cidade foram coletados dados sobre
dias de frias de servidores em funo de licenas solicitadas por
stress. Teste a significncia do coeficiente de regresso.

Funcionrio
A
B

Dias de
Frias(X)
20
18

Licenas por Stress(Y)


10
15

XY
200
270

X2
400
324

Y2
100
225

C
D
E
F
G
H
I
J
Total

16
14
12
10
8
6
4
2
110

17
21
35
32
39
42
55
60
326

272
294
420
320
312
252
220
120
2680

256
196
144
100
64
36
16
4
1540

289
441
1225
1024
1521
1764
3025
3600
13214

b = -2,7
QMR = 17,5
QMR = 17,5 = 4,18
SXX =

X2 -

(X)2

SXX =

1540 -

(110)2

= 330

10

562

QMR
EP(b) =
SXX
4,18
EP(b) = = 0,23
330
b
W =
EP( b)
- 2,70
W = = -11,74
0,23
Consultando a Tabela 2 com = 10-2 = 8valor=p 0,01
Deciso:
O valor p < 0,05, rejeita-se H o. O coeficiente de regresso b=2,70 significante. A varivel independente explica a varivel
dependente.

563

Validao das Pressuposies Bsicas:


A anlise da regresso linear simples exige que algumas
pressuposies sobre os erros sejam satisfeitas, sem as quais os
resultados dos testes de significncia no so confiveis.
Os pressupostos bsicos da anlise da regresso so:
o Ausncia de pontos discrepantes;
o Erros independentes;
o Varincia constante;
o Distribuio dos erros normalmente distribudos.
Anlise dos Resduos e Verificao dos Pressupostos Bsicos da
Regresso:
O ajuste de modelos a um conjunto de dados muito til para
analisar, interpretar e fazer previses sobre questes de interesse de
pesquisadores.
O desenvolvimento desses modelos exige uma srie de
pressupostos para o fenmeno e uma boa modelagem no estaria
completa sem uma adequada investigao da veracidade das
mesmas. J sabemos que para que todos os testes estatsticos vistos
anteriormente tenham plena validade preciso que o modelo de
regresso sob anlise siga os pressupostos bsicos referentes
regresso.
A existncia e consequente detectao da transgresso de
algumas das suposies permite evitar o emprego de modelo pobres,
de pouca utilidade e que acarretam baixa confiabilidade nos seus
resultados.

564

Uma das maneiras de investigar o problema estudando o


comportamento do modelo no conjunto de dados observados,
principalmente as discrepncias entre os valores observados e os
valores ajustados, ou seja, pela "Anlise dos Resduos".
Tecnicamente, para cada observao, temos associado o resduo
e, a diferena entre o valor observado Y e o estimado de Y^, isto :
e = Y Y^
A ideia estudar o comportamento conjunto e individual dos
resduos, cotejando-os com as suposies feitas sobre os erros.
As estimativas dos erros recebem o nome de resduos. o
estudo dessas estimativas, ou seja, a anlise dos resduos que
ajuda verificar se a anlise da regresso linear simples feita
aceitvel.
Uma das maneiras mais usadas para anlise dos resduos a
representao grficas bidimensional dos mesmos, usando a varivel
auxiliar X como uma das componentes do par. A anlise de resduos
investiga a nuvem de disperso gerada pelo conjunto de pontos : ( X : e ) e
investiga a violao dos prespostos bsicos .
Nos pargrafos seguintes,

apresentaremos como

verificar se os

pressupostos bsicos da anlise de regresso esto sendo atendidos. Esta


verificao pode passar pela anlise grfica e/ou testes de estatsticos.

565

Ausncia de Dados Discrepantes(Outlier):


Dados discrepante( outlier ) um valor muito maior ou muito
menor do que o valor esperado. Pode-se verificar outliers no prprio
grfico de resduos.
O valor discrepante fica mais visvel se for desenhado um
grfico

com

resduos

padronizados

em

lugar

dos

resduos

propriamente ditos.
Para obter os resduos padronizados(epi), basta dividir os
resduos pela raiz quadrada do quadrado mdio dos resduo(QMR) da
anlise da varincia para a regresso.
A expresso dos resduos padronizados fica ento:
epi = ei /QMR
Exemplo :
Um analista pesquisou uma amostra de 30 pessoas que haviam
comprado relgios de pulso de particulares e revendidos a outras
pessoas. O preo de compra X e o preo de revenda, Y. Os dados
esto apresentados abaixo. Faa a anlise de outlier dos dados.

566

X(R$)

Y(R$)

10

12

20

21

30

26

40

32

50

35

60

40

70

45

80

54

90

55

100

60

110

70

120

71

130

81

140

82

150

85

160

93

170

95

180

98

190

100

200

110

210

115

220

120

230

125

240

133

250

135

260

145

270

150

280

152

290

155

300

160

567

Quadro da ANOVA
Fonte de Variao

SQ

QM

Tratamentos
Resduo
Total

Valor-p

9555,96
56789,1
166,40
56955,5

1
28
29

0,000

56789,1
5,94

Com a reta de regresso Y^= 10,59 + 0,50X, fazendo e = Y


Y^ e, ento, aplicando epi= ei /5,94, temos a tabela abaixo:

X
10
20
30
40
50
60
70
80
90
100
110
120
130
140
150
160
170
180
190
200
210
220
230
240
250
260
270
280
290
300

Y
12
21
26
32
35
40
45
54
55
60
70
71
81
82
85
93
95
98
100
110
115
120
125
133
135
145
150
152
155
160

Y^
15.6
20.6
25.7
30.7
35.7
40.7
45.8
50.8
55.8
60.9
65.9
70.9
75.9
81.0
86.0
91.0
96.0
101.1
106.1
111.1
116.1
121.2
126.2
131.2
136.3
141.3
146.3
151.3
156.4
161.4

ei
-3.6
0.4
0.3
1.3
-0.7
-0.7
-0.8
3.2
-0.8
-0.9
4.1
0.1
5.1
1.0
-1.0
2.0
-1.0
-3.1
-6.1
-1.1
-1.1
-1.2
-1.2
1.8
-1.3
3.7
3.7
0.7
-1.4
-1.4

epi
-1.51
0.15
0.14
0.55
-0.30
-0.31
-0.32
1.34
-0.35
-0.36
1.72
0.04
2.12
0.43
-0.41
0.83
-0.43
-1.28
-2.54
-0.47
-0.48
-0.49
-0.50
0.74
-0.52
1.55
1.54
0.28
-0.57
-0.58

O grfico dos resduos padronizados o segue:

568

Valores fora do intervalo de -3 a +3 devem ser considerados


suspeitos. Como todos os valores esto dentro do intervalo de -3 e +3,
logo no existe outlier neste estudo.
Caso houvesse a presena de outlier, a medida tomada seria a
identificao das causas plausveis para o evento e caso no seja por
erro de digitao ou mensurao dever(ao) ser iliminado(s). Se for
por erro de digitao ou mensurao o(s ) dado(s) dever(ao) ser
corrigido(s).
A manuteno de outlier na anlise causa srios desajustes
linha de regresso, distorcendo completamente a modelagem e
comprometendo os testes de significncia.

569

Independncia ou Ausncia de Autocorrelao Residual:


Para fazer uma anlise de regresso, preciso pressupor que
os erros so variveis aleatrias independentes: os resduos devem
ser distribudos aleatoriamente em torno da reta de regresso. Os
resduos no devem ter correlao entre si.
Grficos de Sries com e sem Autocorrelao respectivamente:
Grfico 1- Ausncia de Autocorrelao entre os Resduos

570

Grfico 2- Presena de Autocorrelao entre os Resduos

A autocorrelao dos resduos um problema importante na


anlise de dados, principalmente na econometria. Mas existem testes
para o diagnstico deste problema. Tambm existem correes para
ele.
A presena de autocorrelao residual faz com que ocorra uma
piora na eficincia das estimativas dos parmetros. Ou seja, estas
estimativas no apresentam o atributo desejvel da varincia mnima.
No se pode garantir que a reta estimada seja de fato a reta de
mnimos quadrados. Alm disso, estimativas ficam com os seus
desvios padres enviesados. Isto faz com que os Testes t , F e os
clculos de intervalos de confiana sejam prejudicados.

571

Tipos de Autocorrelao:

A autocorrelao residual positiva ocorre quando os resduos


so diretamente relacionados entre si. A autocorrelao negativa
ocorre quando medida que a varivel X aumenta, os erros
decrescem. Autocorrelao residual positiva um problema mais srio
do que a autocorrelao residual negativa.
Consequncia das Autocorrelaes:

o Autocorrelao

positiva

=> os desvios padres ficam

subestimados => valores das estatsticas F ficam subestimados.


Quando se faz o Teste F, na presena de autocorrelao
residual positiva, h o risco de aceitar a hiptese nula de
ausncia de regresso (quando o correto seria rejeit-la).
o Autocorrelao negativa => os desvios padres ficam
superestimados

=>

valores

das

estatsticas

ficam

superestimados. Quando se faz o Teste F, na presena de


autocorrelao residual negativa, h o risco de rejeitar-se a
hiptese nula de ausncia de regresso (quando o correto seria
aceit-la).

Fatores de Autocorrelao:
o Erro na forma matemtica da especificao do modelo.
o Omisso de varivel independente (explicativa) causada por
erros na especificao do modelo. Por exemplo, h uma
tendncia

de

as

variveis

econmicas

serem

autocorrelacionadas. Assim, a omisso de uma ou mais


variveis explicativas causar impactos no termo residual.
Portanto, os valores dos resduos podem ficar correlacionados
entre si;

572

Observao:
Pode ocorrer que, mesmo se muitas variveis explicativas forem
omitidas, os resduos apresentem ausncia de autocorrelao. Isto
ocorrer desde que o padro da autocorrelao das variveis
explicativas, inseridas efetivamente no modelo, apresente uma
configurao que compense a autocorrelao do termo residual.
Testes para detectar a autocorrelao residual
o Teste de Durbin-Watson;
o Teste de Godfrey.
Neste livro, apresentaremos somente o Teste de DurbinWatson.
Mtodos de Correo da Autocorrelao Residual:
o Mtodo interativo de Cochrane-Orcutt;
o Mtodo de dois estgios de Durbin;
o Mtodo das primeiras diferenas.
A verificao da independncia dos erros pela inspeo do
grfico dos resduos extremamente til, mas grfica. Isto significa
que no se pode realizar um teste de significncia. Mas a
pressuposio de independncia pode ser transformada em hiptese
e essa hiptese pode ser colocada em teste. Quando existe forte
suspeita de no-independncia, pode-se aplicar o Teste de DurbinWatson, que veremos a seguir.

573

Teste de Durbin-Watson
Usando um grfico residual, as violaes dos pressupostos do
modelo no so sempre fceis de detectar e podem ocorrer apesar
dos grficos parecerem bem comportados. A anlise de resduos,
usando grficos residuais um mtodo subjetivo. Nesse sentido, a
verificao da independncia usualmente feita atravs do Teste de
Durbin-Watson correlao entre resduos sucessivos, como vimos
na unidade de anlise da varincia.
Como j aprendemos se houver independncia, a magnitude de
um resduo no influencia a magnitude do resduo seguinte. Neste
caso, a correlao entre resduos sucessivos nula (autocorrelao =
0). As hipteses do teste, para aferir se a relao entre dois resduos
consecutivos estatisticamente significativa, so ento:
H0: autocorrelao = 0 existe independncia
H1; autocorrelao 0 existe dependncia
Sabemos que este teste serve para detectar se h presena
significativa de autocorrelao entre os resduos em um modelo de
anlise de regresso. O coeficiente de Durbin-Watson mede a
correlao

entre

cada

resduo

resduo

da

observao

imediatamente anterior. Recorrendo Unidade VII, a equao a


seguinte:

( ei ei-1)2
i=1

D =
n

e i2
I=1

onde ei o resduo para o perodo de tempo i.

574

J sabemos que os valores da estatstica D so interpretados


da seguinte forma:
D 0 resduos positivamente autocorrelacionados.
D 2 resduos no so autocorrelacionados.
D 4 resduos negativamente autocorrelacionados.
Lembrando que com a tabela de Durbi-Watson para o nvel de
significncia , tamanho da amostra n e NVI(nmeros de variveis
independentes do modelo), obtm-se dU que o limite superior de
variao e dL, o limite inferior. Os valores de d U e dL encontram- se
tabelados para os nveis de significncia de 1% e 5% e tamanhos de
amostras fixas esto anexas ao livro.

Regra de Deciso para o Teste de Durbin-Watson, j foi


vista e, :
Valor de D

Interpretao

0 D < dL

Evidncia de autocorrelao positiva

dL D < dU

Zona de indeciso

dU D < 4 - dU
4 - dU D < 4 - dL
4 - dL D 4

Ausncia de autocorrelao
Zona de indeciso
Evidncia de autocorrelao negativa

575

Exemplo:
Vamos realizar o teste de autocorrelao do exemplo do
analista que pesquisou uma amostra de 30 pessoas que haviam
comprado relgios de pulso de particulares e revendido a outras
pessoas. O preo de compra X e o preo de revenda, Y.
1 ) Pela Inspeo Grfica:

576

Pela anlise do grfico de resduos, observamos que parece


haver aleatoriedade dos erros no geral, mas existem certos trechos
onde existe evidncia de tendncia, caracterizando uma indefinio no
diagnstico por esse mtodo. fortemente recomendvel neste caso
a realizao do Teste de Durbin-Watson.

2 ) Pelo Teste de Durbin-Watson:


Os resduos obtidos segundo a sequncia de tempo em que
foram coletados e o quadro de clculo para o teste se encontram na
tabela abaixo:
Sequncia

ei

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Total

-3.60
0.40
0.30
1.30
-0.70
-0.70
-0.80
3.20
-0.80
-0.90
4.10
0.10
5.10
1.00
-1.0
2.00
-1.00
-3.10
-6.10
-1.10
-1.10
-1.20
-1.20
1.80
-1.30
3.70
3.70
0.70
-1.40
-1.40

ei2
13.05
0.13
0.11
1.71
0.52
0.56
0.60
10.24
0.68
0.73
16.98
0.01
25.67
1.08
0.97
3.95
1.08
9.40
37.13
1.25
1.32
1.38
1.44
3.14
1.57
13.84
13.64
0.44
1.85
1.92

ei-1
0.00
-3.60
0.40
0.30
1.30
-0.70
-0.70
-0.80
3.20
-0.80
-0.90
4.10
0.10
5.10
1.00
-1.00
2.0
-1.0
-3.10
-6.10
-1.10
-1.10
-1.20
-1.20
1.80
-1.30
3.70
3.70
0.70
-1.40

ei - ei-1
-3.61
3.97
-0.03
0.97
-2.03
-0.03
-0.03
3.97
-4.03
-0.03
4.97
-4.03
4.97
-4.03
-2.03
2.97
-3.03
-2.03
-3.03
4.97
-0.03
-0.03
-0.03
2.97
-3.03
4.97
-0.03
-3.03
-2.03
-0.03

(ei - ei-1)2
13.05
15.79
0.00
0.95
4.11
0.00
0.00
15.79
16.21
0.00
24.73
16.21
24.73
16.21
4.11
8.84
9.16
4.11
9.16
24.73
0.00
0.00
0.00
8.84
9.16
24.73
0.00
9.16
4.11
0.00

166,40

263,91

577

Calculando ento o coeficiente:

( ei ei-1)2
i=1

D =
n

e i2
I=1

263,91
D = 1,59
166,40

Interpretao:
Consultando a Tabela de Durbin-Watson para 5%, n=30 e NVI=
1(temos uma varivel independente X), temos que dL = 1,35 e dU=
1,49. Logo o valor de D:
dU D< 4-dU
1,49 1,59< 2,51
O valor de D est, ento, no terceiro intervalo da regra de
deciso e indica ausncia de autocorrelao para os resduos.
Portanto, com o teste chegamos a uma concluso sobre a
independncia dos resduos.

Varincia Constante( Homocedasticidade ):


578

Quando os resduos se distribuem aleatoriamente em torno da


reta de regresso e de forma constante, ou seja, a varincia dos
resduos igual a uma constante para todo X, temos que o
pressuposto da homogeneidade est satisfeita.
A violao do pressuposto da homocedasticidade compromete
a eficincia das estimativas do modelo de regresso.
Para testar a homocedasticidade podemos recorrer inspeo
grfica, que pode indicar dvidas e o Teste de Pesaran-Pesaran, que
diluir possveis indefinies na tomada de deciso.
Teste de Pesaran-Pesaran:
O teste de Pesaran-Pesaran consiste em detectar a presena
de heterocedasticidade com base no coeficiente de explicao(R 2) na
regresso entre a varivel dependente(Y) representada pelos valores
dos quadrados dos resduos(e 2) e a varivel independente(X)
constituda pelos valores estimados (Y^). Num modelo de regresso
no aceitvel que medida que a estimativa cresa, o erro, que no
caso est ao quadrado, que se cometa, cresa tambm. Isso alm de
evidenciar aumento na variao dos resduos implica em um modelo
de previso pobre. Se houver baixo poder de explicao de X em Y,
implicando numa baixa correlao linear entre estimativa e erro ao
quadrado, ento podemos aceitar a hiptese de ausncia de
heterocedasticidade.
Portanto,
ANOVA NO-SIGNIFICANTE(y^ ; ei2) = HOMOCEDASTICIDADE
Se aceitarmos a hiptese nula de que no existe regresso
linear, ento o teste de homogeneidade deu positivo.
Exemplo:
579

Vamos realizar o teste de homocedasticidade do exemplo do


analista que pesquisou uma amostra de 30 pessoas que haviam
comprado relgios de pulso de particulares e revendido a outras
pessoas. O preo de compra X e o preo de revenda, Y.
1 ) Pela Inspeo Grfica:

Pela anlise do grfico de resduos, observamos parece que


haver homogeneidade na varincia dos resduos medida que X
cresce. Mas talvez pela insuficincia de ponto isso esteja no
plenamente claro. Vamos testar atravs de Pesaran-Pesaran.

580

2 )Pelo Teste Pesarn-Pesaran:


A tabela abaixo informa as variveis includas no clculo do
coeficiente de determinao:

X(y^)
15.6
20.6
25.7
30.7
35.7
40.7
45.8
50.8
55.8
60.9
65.9
70.9
75.9
81.0
86.0
91.0
96.0
101.1
106.1
111.1
116.1
121.2
126.2
131.2
136.3
141.3
146.3
151.3
156.4
161.4

ei
-3.6
0.4
0.3
1.3
-0.7
-0.7
-0.8
3.2
-0.8
-0.9
4.1
0.1
5.1
1.0
-1.0
2.0
-1.0
-3.1
-6.1
-1.1
-1.1
-1.2
-1.2
1.8
-1.3
3.7
3.7
0.7
-1.4
-1.4

Y(ei2)
13.05
0.13
0.11
1.71
0.52
0.56
0.60
10.24
0.68
0.73
16.98
0.01
25.67
1.08
0.97
3.95
1.08
9.40
37.13
1.25
1.32
1.38
1.44
3.14
1.57
13.84
13.64
0.44
1.85
1.92

581

Utilizando a planilha Excel para o clculo, temos o coeficiente


de explicao R2 = 0,38%. O Teste de F da ANOVA tambm resultou
em no significante. Portanto, podemos aceitar a hiptese nula de
independncia entre as variveis e ausncia de heterocedascicidade.
Quadro da ANOVA

Fonte de Variao
Explicada
Residual
Total

SQ
8.24
2186.52
2194.76

QM
1
28
29

8.24
78.09

Valor-p
0.11

0.7478

O valor-p no significante, o que indica independncia entre


as estimativas e os erros ao quadrado. O valor de R 2 = 0,38% no
significante, o que implica em homocedascidade. O teste deu positivo.

582

Heterocedascidade:
A suposio de mesma varincia dos erros para todos os nveis
da varivel independente X fundamental para validao dos testes
de significncia da anlise de regresso. Entretanto, nem sempre
possvel assegurar a validade desta afirmao.
Quando existe a constatao da heterocedascidade, possvel
fazer a anlise da regresso desde que seja feita uma transformao
dos

dados,

que

as

torne

homogneas.

Tais

transformaes

estabilizadoras da varincia tambm eliminam a falta de


normalidade.
Um modo de resolver a questo procurar remover a
heterocedascidade atravs de transformaes da varivel resposta Y,
ou da explicativa X, ou ento em ambas. So as chamadas
Transformaes Estabilizadoras da Varincia.
Abaixo relacionamos algumas transformaes que estabilizam
a varincia em uma anlise de regresso:

583

584

Exemplo:
Estamos interessados em analisar os acidentes ocorridos
durante certo perodo em uma amostra de 7 companhias de nibus
intermunicipais. Observou-se a porcentagem de viagens realizadas
por cada companhia(X) e o nmero de acidentes graves(Y). Vamos
realizar o teste de heterocedasticidade e realizar a transformao
necessria se for o caso.

X
6,0
8.6
10.7
14.6
15.6
21.5
23,0

Y
4
6
10
14
9
13
21

585

Exemplo:
Vamos testar a homocedasticidade do nosso exemplo anterior:
1 ) Pela Inspeo Grfica:

Pela anlise do grfico de resduos, observamos parece que


haver heterocedascicidade na varincia dos resduos medida que X
cresce. Mas talvez pela insuficincia de ponto isso no esteja
plenamente claro. Vamos testar atravs de Pesarn-Pesaran.

586

2 )Pelo Teste Pesarn-Pesaran:


A tabela abaixo informa as variveis includas no clculo do
coeficiente de determinao:
X(Y^)
4.5
6.6
8.2
11.2
12.0
16.6
17.8

Y(ei2)
0.29
0.32
3.22
7.59
9.15
13.12
10.29

ei
-0.54
-0.57
1.79
2.76
-3.02
-3.62
3.21

Utilizando a planilha Excel para o clculo, temos o coeficiente


de explicao R289%, indicado um poder de explicao forte das
estimativas em relao aos erros ao quadrado. O Teste de F da
ANOVA tambm resultou em significante. Portanto, podemos concluir
a presena de heterocedascicidade.

Quadro da ANOVA

Fonte de Variao

SQ

QM

Explicada

137

137

Residual
Total

16
154

5
6

Valor-p

42

0,001

Vamos proceder ento a uma transformao nos dados


originais: a varivel dependente Y ser transformada numa outra
varivel dependente atravs da raiz quadrada:

587

Y
6,0
8.6
10.7
14.6
15.6
21.5
23,0

2.0
2.4
3.2
3.7
3.0
3.6
4.6

Vamos testar a homocedasticidade dos dados transformados:


1 ) Pela Inspeo Grfica:

Pela anlise do grfico de resduos, observamos parece que o


grau de heterocedascidade reduziu. Mas talvez pela insuficincia de
ponto isso no esteja plenamente claro. Vamos testar atravs de
Pesarn-Pesaran.

588

2 )Pelo Teste Pesarn-Pesaran:


A tabela abaixo informa as variveis includas no clculo do
coeficiente de determinao:
X(Y^)
2.23
2.54
2.79
3.26
3.38
4.09
4.27

Y(ei2)
0.05
0.01
0.14
0.23
0.14
0.23
0.10

ei
-0.23
-0.09
0.37
0.48
-0.38
-0.48
0.32

O coeficiente de explicao R 2=32% e o Teste F resultou em


no significncia para a regresso, isto , as estimativas so
independentes dos erros ao quadrado. Existe, agora, a presena da
homocedasticidade dos erros. O Teste deu positivo.

Quadro da ANOVA

Fonte de Variao
Explicada
Residual
Total

SQ
0.014
0.029
0.043

QM
1
5
6

0.014
0.006

Valor-p

2,35

0,186

589

Normalidade:
Os testes de significncia e os intervalos de confiana das
estimativas do modelo de regresso so baseados no pressuposto da
normalidade, isto , que os resduos apresentem distribuio normal.
A violao da normalidade pode estar ligada a alguns aspectos
relacionados ao modelo, tais como: omisso de variveis explicativas
importantes, incluso de variveis irrelevantes no modelo, utilizao
de relao matemtica incorreta para anlise entre as variveis da
regresso.
Contudo, porm, em linhas gerais, o pesquisador no precisa
se preocupar com a no-normalidade, a no ser que os dados
transgridam fortemente a forma gaussiana.
Para verificar o atendimento a este pressuposto, temos vrias
alternativas que j estudamos:
o Histograma;
o Coeficientes de assimetria,
o Inspeo no Grfico dos Resduos;
o Teste de Bera-Jarque.
Neste momento, vamos estudar uma alternativa que no
utilizamos ainda:
o Teste de Kolmogorov-Smirno.

590

Exemplo:
Vamos testar a normalidade dos resduos do exemplo do
analista que pesquisou uma amostra de 30 pessoas que haviam
comprado relgios de pulso de particulares e revendido a outras
pessoas. O preo de compra X e o preo de revenda, Y. Os dados
esto apresentados abaixo.

X(R$)

Y(R$)

10

12

20

21

30

26

40

32

50

35

60

40

70

45

80

54

90

55

100

60

110

70

120

71

130

81

140

82

150

85

160

93

170

95

180

98

190

100

200

110

210

115

220

120

230

125

240

133

250

135

260

145

270

150

280

152

290

155

300

160

591

1 ) Pela Inspeo Grfica:


Para que uma srie de valores siga o modelo da Curva Normal,
necessrio que 99% de seus valores devam estar entre -3 a +3, se
os dados foram padronizados.
Exemplo:
O Grfico dos resduos do exemplo do analista que pesquisou
uma amostra de 30 pessoas que haviam comprado relgios de pulso
de particulares e revendido a outras pessoas apresentado abaixo:

Pela observao do grfico acima, 100% dos valores da srie


de resduos esto dentro do intervalo -3 a +3, respeitando a
probabilidade da Curva Normal. Mas para a confirmao da inspeo
grfica vamos realizar o Teste de Kolmogorov-Smirnov.

592

2 )Pelo Teste de Kolmogorov-Smirnov:


A estatstica de teste de Kolmogorov-Smirnov :
KS= Max I [(i/n)-P(Zepi)] I
Onde:
o i= 1, ... , n
o n = tamanho da amostra
o Z= valor crtico obtido junto a normal padro
o epi= resduo padronizado( ei/ EMQ)
o P(Zepi) = probabilidade obtida junto normal padro,
considerando os resduos padronizados ordenados
de forma crescente;
Para a realizao do teste, procedemos da seguinte maneira:
Se:
o KSKScrtico, aceitamos a hiptese de que os resduos se
distribuem normalmente;
o KS>KScrtico, rejeitamos a hiptese de que os resduos se
distribuem normalmente.
O KScrtico obtido junto Tabela 8-Tabela de KolmogorovSmirnov, em anexo.

593

A tabela abaixo apresenta o quadro de clculo:

i
1
2
3
4
5
6
7
8
9
10
11
12
13

Resduos
Ordenados
de Forma
Crescente
-6.093
-3.613
-3.067
-1.387
-1.360
-1.254
-1.200
-1.174
-1.147
-1.120
-1.040
-0.987
-0.853

Resduos
Padronizados(epi)
-2.500
-1.482
-1.258
-0.569
-0.558
-0.514
-0.492
-0.481
-0.470
-0.459
-0.427
-0.405
-0.350

P(Zepi)
0.006
0.069
0.104
0.285
0.288
0.304
0.311
0.315
0.319
0.323
0.335
0.343
0.363

i/n
0.033
0.067
0.100
0.133
0.167
0.200
0.233
0.267
0.300
0.333
0.367
0.400
0.433

4
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

-0.826
-0.773
-0.746
-0.720
0.093
0.334
0.360
0.666
1.040
1.307
1.773
1.987
3.200
3.693
3.720
4.120
5.067

-0.339
-0.317
-0.306
-0.295
0.038
0.137
0.148
0.273
0.427
0.536
0.727
0.815
1.313
1.515
1.526
1.690
2.078

0.367
0.376
0.380
0.384
0.515
0.554
0.559
0.608
0.665
0.704
0.766
0.792
0.905
0.935
0.936
0.954
0.981

0.133
0.500
0.533
0.567
0.600
0.633
0.667
0.700
0.733
0.767
0.800
0.833
0.867
0.900
0.933
0.967
1.000

[(i/n)-P(Zepi)]
0.027
-0.002
-0.004
-0.151
-0.122
-0.104
-0.078
-0.048
-0.019
0.010
0.032
0.057
0.070
-0.234
0.124
0.154
0.183
0.085
0.079
0.108
0.092
0.068
0.063
0.034
0.041
-0.039
-0.035
-0.003
0.012
0.019

I [(i/n)-P(Z<=epi)] I
0.027
0.002
0.004
0.151
0.122
0.104
0.078
0.048
0.019
0.010
0.032
0.057
0.070

0.234
0.124
0.154
0.183
0.085
0.079
0.108
0.092
0.068
0.063
0.034
0.041
0.039
0.035
0.003
0.012
0.019

Verificamos que o valor mximo da ltima coluna da tabela


acima KS=0,234 e para n=30 e =0,05 o KScrtico=0,240, o que indica
normalidade dos resduos(KS<KScrtico), como a inspeo grfica j
havia indicado.

Importncia da Anlise dos Resduos:

594

Os grficos de resduos so de importncia vital para uma


anlise de regresso completa. As informaes que eles fornecem so
to bsicas para uma anlise digna de crdito, que esses grficos
deveriam ser sempre includos como parte de uma anlise de
regresso. Portanto, uma estratgia que poderia ser empregada para
evitar a adoo de modelos de regresso inadequados envolveria o
seguinte mtodo:
1)Sempre iniciar com um grfico de disperso para observar a
possvel relao entre X e Y, calcular o coeficnete de correlao de
Pearson para confirmar a inspeo grfica e realizar o seu teste de
significncia;
2)Estimar os valores dos coeficiente da linha de regresso, se a
correlao linear for aceitvel;
3)Calcular o coeficiente de explicao do modelo;
4)Realizar os testes de exitncia de regresso linear, inclusive o
do coeficnete de regresso;
5)Verificar a violao dos pressupostos bsicos e caso haja
algum tomar as providncias cabveis;
6)Se a avaliao feita nos item acima no indicar violao nos
pressupostos, ento podem-se considerar os aspectos de
inferncia da anlise de regresso e explicar a varivel
dependente pela varivel independente e fazer previses.

595

Exerccios Propostos:

1)Os dados abaixo correspondem s variveis: renda familiar e gasto com


alimentao numa amostra de 10 famlias, representadas em S.M._Salrios
Mnimos.
Renda Familiar
3
5
10
20
30
50
70
100
150
200

Gasto com Alimentao


1,5
2,0
6,0
10,0
15,0
20,0
25,0
40,0
60,0
80,0

Faa um grfico de disperso para observar a possvel relao entre X e Y, calcular


o coeficnete de correlao de Pearson para confirmar a inspeo grfica.

596

2)Um jornal quer verificar a eficcia de seus anncios na venda de


carros usados. A tabela abaixo mostra o nmero de anncios na
venda de carros e o correspondente nmero de carros vendidos por 6
companhias

que

usaram

apenas

este

jornal

como

veculo

de

propaganda.
Anncios
74
45
48
36
27
16

Carros Vendidos
139
108
98
76
62
57

Obtenha a Reta de Regresso Linear.

597

3)A indstria farmacutica MIMI vende um remdio para combater


resfriado. Aps 2 anos de operao, ela coletou as seguintes
informaes trimestrais:
Temperatura(X)
2
13
16
7
4
10
13
4

Vendas(Y)
25
13
8
20
25
12
10
15

Teste a significncia do coeficiente de regresso pelo Teste de Wald.

598

4)Realize Teste Pesarn-Pesaran com os dados abaixo:


X(anos de estudos)
15
8
12
19
16
16
12
15
12
12
18
12
20
8
8
12
12
12
8
16
12
19
12
16
15
16
12
16
12
18

Y(tempo de servio)
98
98
97
96
93
93
90
90
88
88
88
86
85
85
85
85
85
85
83
81
81
80
79
78
75
74
74
71
69
66

5)Faa uma anlise de regresso completa com os dados abaixo:

599

X
10
20
30
40
50
60
70
80
90
100
110
120
130
140
150
160
170
180
190
200
210
220
230
240
250
260
270
280
290
300

Y
12
21
26
32
35
40
45
54
55
60
70
71
81
82
85
93
95
98
100
110
115
120
125
133
135
145
150
152
155
160

600

6)Teste a normalidade dos resduos abaixo pela anlise do


histograma e confirmado pelo Teste de Kolmogorov-Smirnov,
ao nvel de 5% de significncia.
i
1
2
3
4
5
6
7
8
9
10

Resduos
0
2
2
4
4
4
4
6
6
8

Resduos Padronizados
-1.73
-0.87
-0.87
0.00
0.00
0.00
0.00
0.87
0.87
1.73

601

7)Realize o Teste de Durbin-Watson para verificar se os


resduos constantes da tabela abaixo so independentes, ao
nvel de 5% de significncia.
i
1
2
3
4
5
6
7
8
9
10

Resduos
-0.45
-0.10
0.52
-0.68
0.00
0.62
0.48
0.57
-0.95
0.00

602

8)Realize o Teste Pesaran-Pesaran para verificar se os resduos


presentes na tabela abaixo so homocedsticos, ao nvel de 1%
de significncia.
i
1
2
3
4
5
6
7
8
9
10

Y previsto
18
24
30
36
42
46
50
54
58
62

Resduos
-3
3
0
3
-3
0
0
0
0
0

603

9)Uma anlise de regresso linear simples forneceu as


estatsticas Abaixo. Teste a significncia do coeficiente de
Regresso pelo Teste de Wald, ao nvel de 5% de significncia.

Y^ = 22,5 -0,62X
Quadro da ANOVA

Fonte de Variao

SQ

QM

Explicada

82.32

82.32

Residual

7.28

0.91

Total

89.60

F
90.41

Valor-p
0.000

Sxx= 21,36

604

10)Teste utilizando a inspeo grfica e o Teste de PesaranPesaran se os resduos da anlise da regresso da amostra
abaixo so homocedsticos, ao nvel de 5% d significncia.
Relao entre Escolaridade e Salrio em SM

X(Escala de Escolaridade)
5
5
6
6
7
7
8
8
9
9

Y(Salrio em SM)
15.4
11.0
15.8
17.8
23.3
15.6
14.0
24.1
23.0
20.3

Resultado da Anlise de Regresso


i
1
2
3
4
5
6
7
8
9
10

Y previsto
14.5
14.5
16.19
16.19
17.88
17.88
19.57
19.57
21.26
21.26

Resduos
0.9
-3.5
-0.39
1.61
5.42
-2.28
-5.57
4.53
1.74
-0.96

605

ANEXO
Tabelas

606

Tabela 1
Distribuio Normal Reduzida (0< Z < z)

z
0,0

0
0,0000

1
0,0040

2
0,0080

3
0,0120

4
0,0160

5
0,0199

6
0,0239

7
0,0279

8
0,0319

9
0,0359

0,1

0,0398

0,0438

0,0478

0,0517

0,0557

0,0596

0,0636

0,0675

0,0714

0,0753

0,2

0,0793

0,0832

0,0871

0,0910

0,0948

0,0987

0,1026

0,1064

0,1103

0,1141

0,3

0,1179

0,1217

0,1255

0,1293

0,1331

0,1368

0,1406

0,1443

0,1480

0,1517

0,4

0,1554

0,1591

0,1628

0,1664

0,1700

0,1736

0,1772

0,1808

0,1844

0,1879

0,5

0,1915

0,1950

0,1985

0,2019

0,2054

0,2088

0,2123

0,2157

0,2190

0,2224

0,6

0,2257

0,2291

0,2324

0,2357

0,2389

0,2422

0,2454

0,2486

0,2517

0,2549

0,7

0,2580

0,2611

0,2642

0,2673

0,2704

0,2734

0,2764

0,2794

0,2823

0,2852

0,8

0,2881

0,2910

0,2939

0,2967

0,2995

0,3023

0,3051

0,3078

0,3106

0,3133

0,9

0,3159

0,3186

0,3212

0,3238

0,3264

0,3289

0,3315

0,3340

0,3365

0,3389

1,0

0,3413

0,3438

0,3461

0,3485

0,3508

0,3531

0,3554

0,3577

0,3599

0,3621

1,1

0,3643

0,3665

0,3686

0,3708

0,3729

0,3749

0,3770

0,3790

0,3810

0,3830

1,2

0,3849

0,3869

0,3888

0,3907

0,3925

0,3944

0,3962

0,3980

0,3997

0,4015

1,3

0,4032

0,4049

0,4066

0,4082

0,4099

0,4115

0,4131

0,4147

0,4162

0,4177

1,4

0,4192

0,4207

0,4222

0,4236

0,4251

0,4265

0,4279

0,4292

0,4306

0,4319

1,5

0,4332

0,4345

0,4357

0,4370

0,4382

0,4394

0,4406

0,4418

0,4429

0,4441

1,6

0,4452

0,4463

0,4474

0,4484

0,4495

0,4505

0,4515

0,4525

0,4535

0,4545

1,7

0,4554

0,4564

0,4573

0,4582

0,4591

0,4599

0,4608

0,4616

0,4625

0,4633

1,8

0,4641

0,4649

0,4656

0,4664

0,4671

0,4678

0,4686

0,4693

0,4699

0,4706

1,9

0,4713

0,4719

0,4726

0,4732

0,4738

0,4744

0,4750

0,4756

0,4761

0,4767

2,0

0,4772

0,4778

0,4783

0,4788

0,4793

0,4798

0,4803

0,4808

0,4812

0,4817

2,1

0,4821

0,4826

0,4830

0,4834

0,4838

0,4842

0,4846

0,4850

0,4854

0,4857

2,2

0,4861

0,4864

0,4868

0,4871

0,4875

0,4878

0,4881

0,4884

0,4887

0,4890

2,3

0,4893

0,4896

0,4898

0,4901

0,4904

0,4906

0,4909

0,4911

0,4913

0,4916

2,4

0,4918

0,4920

0,4922

0,4925

0,4927

0,4929

0,4931

0,4932

0,4934

0,4936

2,5

0,4938

0,4940

0,4941

0,4943

0,4945

0,4946

0,4948

0,4949

0,4951

0,4952

2,6

0,4953

0,4955

0,4956

0,4957

0,4959

0,4960

0,4961

0,4962

0,4963

0,4964

2,7

0,4965

0,4966

0,4967

0,4968

0,4969

0,4970

0,4971

0,4972

0,4973

0,4974

2,8

0,4974

0,4975

0,4976

0,4977

0,4977

0,4978

0,4979

0,4979

0,4980

0,4981

2,9

0,4981

0,4982

0,4982

0,4983

0,4984

0,4984

0,4985

0,4985

0,4986

0,4986

3,0

0,4987

0,4987

0,4987

0,4988

0,4988

0,4989

0,4989

0,4989

0,4990

0,4990

3,1

0,4990

0,4991

0,4991

0,4991

0,4992

0,4992

0,4992

0,4992

0,4993

0,4993

3,2

0,4993

0,4993

0,4994

0,4994

0,4994

0,4994

0,4994

0,4995

0,4995

0,4995

3,3

0,4995

0,4995

0,4995

0,4996

0,4996

0,4996

0,4996

0,4996

0,4996

0,4997

3,4

0,4997

0,4997

0,4997

0,4997

0,4997

0,4997

0,4997

0,4997

0,4997

0,4998

3,5

0,4998

0,4998

0,4998

0,4998

0,4998

0,4998

0,4998

0,4998

0,4998

0,4998

3,6

0,4998

0,4998

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

3,7

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

3,8

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

3,9

0,5000

0,5000

0,5000

0,5000

0,5000

0,5000

0,5000

0,5000

0,5000

0,5000

607

Tabela 2
Distribuio T-Student
Valores de t, segundo os graus de liberdade( ) e o valor de

Monocaudal,
Bicaudal,

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29

0,25
0,50

0,10
0,20

0,05
0,10

0,025
0,05

0,01
0,02

0,005
0,01

1,000
0,816
0,765
0,741
0,727
0,718
0,711
0,706
0,703
0,700
0,697
0,695
0,694
0,692
0,691
0,690
0,689
0,688
0,688
0,687
0,686
0,686
0,685
0,685
0,684
0,684
0,684
0,683
0,683
0,674

3,078
1,886
1,638
1,533
1,476
1,440
1,415
1,397
1,383
1,372
1,363
1,356
1,350
1,345
1,341
1,337
1,333
1,330
1,328
1,325
1,323
1,321
1,319
1,318
1,316
1,315
1,314
1,313
1,311
1,282

6,314
2,920
2,353
2,132
2,015
1,943
1,895
1,860
1,833
1,812
1,796
1,782
1,771
1,761
1,753
1,746
1,740
1,734
1,729
1,725
1,721
1,717
1,714
1,711
1,708
1,706
1,703
1,701
1,699
1,645

12,706
4,303
3,182
2,776
2,571
2,447
2,365
2,306
2,262
2,228
2,201
2,179
2,160
2,145
2,131
2,120
2,110
2,101
2,093
2,086
2,080
2,074
2,069
2,064
2,060
2,056
2,052
2,048
2,045
1,960

31,821
6,965
4,541
3,747
3,365
3,143
2,998
2,896
2,821
2,764
2,718
2,681
2,650
2,624
2,602
2,583
2,567
2,552
2,539
2,528
2,518
2,508
2,500
2,492
2,485
2,479
2,473
2,467
2,462
2,326

63,657
9,925
5,841
4,604
4,032
3,707
3,499
3,355
3,250
3,169
3,106
3,055
3,012
2,977
2,947
2,921
2,898
2,878
2,861
2,845
2,831
2,819
2,807
2,797
2,787
2,779
2,771
2,763
2,756
2,576

608

Tabela 3
Distribuio Qui-quadrado( 2 )
Valores de 2, segundo os graus de liberdade( ) e o valor de

0,995

0,99

0,975

0,95

0,90

0,10

0,05

0,025

0,01

0,005

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100

0,000

0,000

0,001

0,004

0,016

2,706

3,841

5,024

6,635

7,879

0,010

0,020

0,051

0,103

0,211

4,605

5,991

7,378

9,210

10,597

0,072

0,115

0,216

0,352

0,584

6,251

7,815

9,348

11,345

12,838

0,207

0,297

0,484

0,711

1,064

7,779

9,488

11,143

13,277

14,860

0,412

0,554

0,831

1,145

1,610

9,236

11,070

12,833

15,086

16,750

0,676

0,872

1,237

1,635

2,204

10,645

12,592

14,449

16,812

18,548

0,989

1,239

1,690

2,167

2,833

12,017

14,067

16,013

18,475

20,278

1,344

1,646

2,180

2,733

3,490

13,362

15,507

17,535

20,090

21,955

1,735

2,088

2,700

3,325

4,168

14,684

16,919

19,023

21,666

23,589

2,156

2,558

3,247

3,940

4,865

15,987

18,307

20,483

23,209

25,188

2,603

3,053

3,816

4,575

5,578

17,275

19,675

21,920

24,725

26,757

3,074

3,571

4,404

5,226

6,304

18,549

21,026

23,337

26,217

28,300

3,565

4,107

5,009

5,892

7,042

19,812

22,362

24,736

27,688

29,819

4,075

4,660

5,629

6,571

7,790

21,064

23,685

26,119

29,141

31,319

4,601

5,229

6,262

7,261

8,547

22,307

24,996

27,488

30,578

32,801

5,142

5,812

6,908

7,962

9,312

23,542

26,296

28,845

32,000

34,267

5,697

6,408

7,564

8,672

10,085

24,769

27,587

30,191

33,409

35,718

6,265

7,015

8,231

9,390

10,865

25,989

28,869

31,526

34,805

37,156

6,844

7,633

8,907

10,117

11,651

27,204

30,144

32,852

36,191

38,582

7,434

8,260

9,591

10,851

12,443

28,412

31,410

34,170

37,566

39,997

8,034

8,897

10,283

11,591

13,240

29,615

32,671

35,479

38,932

41,401

8,643

9,542

10,982

12,338

14,041

30,813

33,924

36,781

40,289

42,796

9,260

10,196

11,689

13,091

14,848

32,007

35,172

38,076

41,638

44,181

9,886

10,856

12,401

13,848

15,659

33,196

36,415

39,364

42,980

45,559

10,520

11,524

13,120

14,611

16,473

34,382

37,652

40,646

44,314

46,928

11,160

12,198

13,844

15,379

17,292

35,563

38,885

41,923

45,642

48,290

11,808

12,879

14,573

16,151

18,114

36,741

40,113

43,195

46,963

49,645

12,461

13,565

15,308

16,928

18,939

37,916

41,337

44,461

48,278

50,993

13,121

14,256

16,047

17,708

19,768

39,087

42,557

45,722

49,588

52,336

13,787

14,953

16,791

18,493

20,599

40,256

43,773

46,979

50,892

53,672

20,707

22,164

24,433

26,509

29,051

51,805

55,758

59,342

63,691

66,766

27,991

29,707

32,357

34,764

37,689

63,167

67,505

71,420

76,154

79,490

35,534

37,485

40,482

43,188

46,459

74,397

79,082

83,298

88,379

91,952

43,275

45,442

48,758

51,739

55,329

85,527

90,531

95,023

100,425

104,215

51,172

53,540

57,153

60,391

64,278

96,578

101,879

106,629

112,329

116,321

59,196

61,754

65,647

69,126

73,291

107,565

113,145

118,136

124,116

128,299

67,328

70,065

74,222

77,929

82,358

118,498

124,342

129,561

135,807

140,169

Tabela 4
Tabela F 0,001

609

Valores de F para = 0,1%, segundo o nmero de graus de liberdade do numerador (1)


e do denominador( 2 )
1

2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120

10

405284,07
998,50
167,03
74,14
47,18
35,51
29,25
25,41
22,86
21,04
19,69
18,64
17,82
17,14
16,59
16,12
15,72
15,38
15,08
14,82
14,59
14,38
14,20
14,03
13,88
13,74
13,61
13,50
13,39
13,29
12,61
11,97
11,38
10,83

499999,50
999,00
148,50
61,25
37,12
27,00
21,69
18,49
16,39
14,91
13,81
12,97
12,31
11,78
11,34
10,97
10,66
10,39
10,16
9,95
9,77
9,61
9,47
9,34
9,22
9,12
9,02
8,93
8,85
8,77
8,25
7,77
7,32
6,91

540379,20
999,17
141,11
56,18
33,20
23,70
18,77
15,83
13,90
12,55
11,56
10,80
10,21
9,73
9,34
9,01
8,73
8,49
8,28
8,10
7,94
7,80
7,67
7,55
7,45
7,36
7,27
7,19
7,12
7,05
6,59
6,17
5,78
5,42

562499,58
999,25
137,10
53,44
31,09
21,92
17,20
14,39
12,56
11,28
10,35
9,63
9,07
8,62
8,25
7,94
7,68
7,46
7,27
7,10
6,95
6,81
6,70
6,59
6,49
6,41
6,33
6,25
6,19
6,12
5,70
5,31
4,95
4,62

576404,56
999,30
134,58
51,71
29,75
20,80
16,21
13,48
11,71
10,48
9,58
8,89
8,35
7,92
7,57
7,27
7,02
6,81
6,62
6,46
6,32
6,19
6,08
5,98
5,89
5,80
5,73
5,66
5,59
5,53
5,13
4,76
4,42
4,10

585937,11
999,33
132,85
50,53
28,83
20,03
15,52
12,86
11,13
9,93
9,05
8,38
7,86
7,44
7,09
6,80
6,56
6,35
6,18
6,02
5,88
5,76
5,65
5,55
5,46
5,38
5,31
5,24
5,18
5,12
4,73
4,37
4,04
3,74

592873,29
999,36
131,58
49,66
28,16
19,46
15,02
12,40
10,70
9,52
8,66
8,00
7,49
7,08
6,74
6,46
6,22
6,02
5,85
5,69
5,56
5,44
5,33
5,23
5,15
5,07
5,00
4,93
4,87
4,82
4,44
4,09
3,77
3,47

598144,16
999,37
130,62
49,00
27,65
19,03
14,63
12,05
10,37
9,20
8,35
7,71
7,21
6,80
6,47
6,19
5,96
5,76
5,59
5,44
5,31
5,19
5,09
4,99
4,91
4,83
4,76
4,69
4,64
4,58
4,21
3,86
3,55
3,27

602283,99
999,39
129,86
48,47
27,24
18,69
14,33
11,77
10,11
8,96
8,12
7,48
6,98
6,58
6,26
5,98
5,75
5,56
5,39
5,24
5,11
4,99
4,89
4,80
4,71
4,64
4,57
4,50
4,45
4,39
4,02
3,69
3,38
3,10

605620,97
999,40
129,25
48,05
26,92
18,41
14,08
11,54
9,89
8,75
7,92
7,29
6,80
6,40
6,08
5,81
5,58
5,39
5,22
5,08
4,95
4,83
4,73
4,64
4,56
4,48
4,41
4,35
4,29
4,24
3,87
3,54
3,24
2,96

Tabela F 0,001- Continuao

2
1
2

11

12

13

14

15

16

17

18

19

20

608367,68
999,41

610667,82
999,42

612622,01
999,42

614302,75
999,43

615763,66
999,43

617045,18
999,44

618178,43
999,44

619187,70
999,44

620092,29
999,45

620907,67
999,45

610

3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120

128,74
47,70
26,65
18,18
13,88
11,35
9,72
8,59
7,76
7,14
6,65
6,26
5,94
5,67
5,44
5,25
5,08
4,94
4,81
4,70
4,60
4,51
4,42
4,35
4,28
4,22
4,16
4,11
3,75
3,42
3,12
2,84

128,32
47,41
26,42
17,99
13,71
11,19
9,57
8,45
7,63
7,00
6,52
6,13
5,81
5,55
5,32
5,13
4,97
4,82
4,70
4,58
4,48
4,39
4,31
4,24
4,17
4,11
4,05
4,00
3,64
3,32
3,02
2,74

127,96
47,16
26,22
17,82
13,56
11,06
9,44
8,32
7,51
6,89
6,41
6,02
5,71
5,44
5,22
5,03
4,87
4,72
4,60
4,49
4,39
4,30
4,22
4,14
4,08
4,01
3,96
3,91
3,55
3,23
2,93
2,66

127,64
46,95
26,06
17,68
13,43
10,94
9,33
8,22
7,41
6,79
6,31
5,93
5,62
5,35
5,13
4,94
4,78
4,64
4,51
4,40
4,30
4,21
4,13
4,06
3,99
3,93
3,88
3,82
3,47
3,15
2,85
2,58

127,37
46,76
25,91
17,56
13,32
10,84
9,24
8,13
7,32
6,71
6,23
5,85
5,54
5,27
5,05
4,87
4,70
4,56
4,44
4,33
4,23
4,14
4,06
3,99
3,92
3,86
3,80
3,75
3,40
3,08
2,78
2,51

127,14
46,60
25,78
17,45
13,23
10,75
9,15
8,05
7,24
6,63
6,16
5,78
5,46
5,20
4,99
4,80
4,64
4,49
4,37
4,26
4,16
4,07
3,99
3,92
3,86
3,80
3,74
3,69
3,34
3,02
2,72
2,45

126,93
46,45
25,67
17,35
13,14
10,67
9,08
7,98
7,17
6,57
6,09
5,71
5,40
5,14
4,92
4,74
4,58
4,44
4,31
4,20
4,10
4,02
3,94
3,86
3,80
3,74
3,68
3,63
3,28
2,96
2,67
2,40

126,74
46,32
25,57
17,27
13,06
10,60
9,01
7,91
7,11
6,51
6,03
5,66
5,35
5,09
4,87
4,68
4,52
4,38
4,26
4,15
4,05
3,96
3,88
3,81
3,75
3,69
3,63
3,58
3,23
2,91
2,62
2,35

126,57
46,21
25,48
17,19
12,99
10,54
8,95
7,86
7,06
6,45
5,98
5,60
5,29
5,04
4,82
4,63
4,47
4,33
4,21
4,10
4,00
3,92
3,84
3,77
3,70
3,64
3,59
3,53
3,19
2,87
2,58
2,31

126,42
46,10
25,39
17,12
12,93
10,48
8,90
7,80
7,01
6,40
5,93
5,56
5,25
4,99
4,78
4,59
4,43
4,29
4,17
4,06
3,96
3,87
3,79
3,72
3,66
3,60
3,54
3,49
3,14
2,83
2,53
2,27

611

Tabela F 0,001- Continuao

2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
12
0

21

22

23

24

25

26

27

28

29

30

621646,41
999,45
126,28
46,00
25,32
17,06
12,87
10,43
8,85
7,76
6,96
6,36
5,89
5,51
5,21
4,95
4,73
4,55
4,39
4,25
4,13
4,02
3,92
3,83
3,76
3,68
3,62
3,56
3,50
3,45
3,11
2,79

622318,83
999,45
126,15
45,92
25,25
17,00
12,82
10,38
8,80
7,71
6,92
6,32
5,85
5,48
5,17
4,91
4,70
4,51
4,35
4,21
4,09
3,98
3,89
3,80
3,72
3,65
3,58
3,52
3,47
3,42
3,07
2,75

622933,47
999,46
126,04
45,84
25,19
16,95
12,78
10,34
8,76
7,67
6,88
6,28
5,81
5,44
5,13
4,88
4,66
4,48
4,32
4,18
4,06
3,95
3,85
3,77
3,69
3,62
3,55
3,49
3,44
3,39
3,04
2,72

623497,46
999,46
125,93
45,77
25,13
16,90
12,73
10,30
8,72
7,64
6,85
6,25
5,78
5,41
5,10
4,85
4,63
4,45
4,29
4,15
4,03
3,92
3,82
3,74
3,66
3,59
3,52
3,46
3,41
3,36
3,01
2,69

624016,83
999,46
125,84
45,70
25,08
16,85
12,69
10,26
8,69
7,60
6,81
6,22
5,75
5,38
5,07
4,82
4,60
4,42
4,26
4,12
4,00
3,89
3,79
3,71
3,63
3,56
3,49
3,43
3,38
3,33
2,98
2,67

624496,66
999,46
125,75
45,64
25,03
16,81
12,65
10,22
8,66
7,57
6,78
6,19
5,72
5,35
5,04
4,79
4,57
4,39
4,23
4,09
3,97
3,86
3,77
3,68
3,60
3,53
3,47
3,41
3,35
3,30
2,96
2,64

624941,30
999,46
125,67
45,58
24,99
16,77
12,62
10,19
8,63
7,54
6,76
6,16
5,70
5,32
5,02
4,76
4,55
4,37
4,21
4,07
3,95
3,84
3,74
3,66
3,58
3,51
3,44
3,38
3,33
3,28
2,93
2,62

625354,49
999,46
125,59
45,53
24,94
16,74
12,59
10,16
8,60
7,52
6,73
6,14
5,67
5,30
4,99
4,74
4,53
4,34
4,18
4,05
3,93
3,82
3,72
3,63
3,56
3,49
3,42
3,36
3,31
3,26
2,91
2,60

625739,44
999,47
125,52
45,48
24,91
16,70
12,56
10,13
8,57
7,49
6,71
6,11
5,65
5,28
4,97
4,72
4,50
4,32
4,16
4,03
3,90
3,80
3,70
3,61
3,54
3,46
3,40
3,34
3,29
3,24
2,89
2,57

626098,96
999,47
125,45
45,43
24,87
16,67
12,53
10,11
8,55
7,47
6,68
6,09
5,63
5,25
4,95
4,70
4,48
4,30
4,14
4,00
3,88
3,78
3,68
3,59
3,52
3,44
3,38
3,32
3,27
3,22
2,87
2,55

2,50
2,23

2,46
2,19

2,43
2,16

2,40
2,13

2,37
2,10

2,35
2,08

2,33
2,05

2,30
2,03

2,28
2,01

2,26
1,99

612

Tabela F 0,001- Continuao

1
40

60

80

628712,03
999,47
124,96
45,09
24,60
16,44
12,33
9,92
8,37
7,30
6,52
5,93
5,47
5,10
4,80
4,54
4,33
4,15
3,99
3,86
3,74
3,63
3,53
3,45
3,37
3,30
3,23
3,18
3,12
3,07
2,73
2,41
2,11
1,84

631336,56
999,48
124,47
44,75
24,33
16,21
12,12
9,73
8,19
7,12
6,35
5,76
5,30
4,94
4,64
4,39
4,18
4,00
3,84
3,70
3,58
3,48
3,38
3,29
3,22
3,15
3,08
3,02
2,97
2,92
2,57
2,25
1,95
1,66

633972,40
999,49
123,97
44,40
24,06
15,98
11,91
9,53
8,00
6,94
6,18
5,59
5,14
4,77
4,47
4,23
4,02
3,84
3,68
3,54
3,42
3,32
3,22
3,14
3,06
2,99
2,92
2,86
2,81
2,76
2,41
2,08
1,77
1,45

636619,12
999,50
123,47
44,05
23,79
15,75
11,70
9,33
7,81
6,76
6,00
5,42
4,97
4,60
4,31
4,06
3,85
3,67
3,51
3,38
3,26
3,15
3,05
2,97
2,89
2,82
2,75
2,69
2,64
2,59
2,23
1,89
1,54
1,01

2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120

613

Tabela 4
Tabela F 0,01
Valores de F para = 1%, segundo o nmero de graus de liberdade do
numerador ( 1 ) e do denominador(

2 )

10

2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120

4052,18
98,50
34,12
21,20
16,26
13,75
12,25
11,26
10,56
10,04
9,65
9,33
9,07
8,86
8,68
8,53
8,40
8,29
8,18
8,10
8,02
7,95
7,88
7,82
7,77
7,72
7,68
7,64
7,60
7,56
7,31
7,08
6,85
6,63

4999,50
99,00
30,82
18,00
13,27
10,92
9,55
8,65
8,02
7,56
7,21
6,93
6,70
6,51
6,36
6,23
6,11
6,01
5,93
5,85
5,78
5,72
5,66
5,61
5,57
5,53
5,49
5,45
5,42
5,39
5,18
4,98
4,79
4,61

5403,35
99,17
29,46
16,69
12,06
9,78
8,45
7,59
6,99
6,55
6,22
5,95
5,74
5,56
5,42
5,29
5,18
5,09
5,01
4,94
4,87
4,82
4,76
4,72
4,68
4,64
4,60
4,57
4,54
4,51
4,31
4,13
3,95
3,78

5624,58
99,25
28,71
15,98
11,39
9,15
7,85
7,01
6,42
5,99
5,67
5,41
5,21
5,04
4,89
4,77
4,67
4,58
4,50
4,43
4,37
4,31
4,26
4,22
4,18
4,14
4,11
4,07
4,04
4,02
3,83
3,65
3,48
3,32

5763,65
99,30
28,24
15,52
10,97
8,75
7,46
6,63
6,06
5,64
5,32
5,06
4,86
4,69
4,56
4,44
4,34
4,25
4,17
4,10
4,04
3,99
3,94
3,90
3,85
3,82
3,78
3,75
3,73
3,70
3,51
3,34
3,17
3,02

5858,99
99,33
27,91
15,21
10,67
8,47
7,19
6,37
5,80
5,39
5,07
4,82
4,62
4,46
4,32
4,20
4,10
4,01
3,94
3,87
3,81
3,76
3,71
3,67
3,63
3,59
3,56
3,53
3,50
3,47
3,29
3,12
2,96
2,80

5928,36
99,36
27,67
14,98
10,46
8,26
6,99
6,18
5,61
5,20
4,89
4,64
4,44
4,28
4,14
4,03
3,93
3,84
3,77
3,70
3,64
3,59
3,54
3,50
3,46
3,42
3,39
3,36
3,33
3,30
3,12
2,95
2,79
2,64

5981,07
99,37
27,49
14,80
10,29
8,10
6,84
6,03
5,47
5,06
4,74
4,50
4,30
4,14
4,00
3,89
3,79
3,71
3,63
3,56
3,51
3,45
3,41
3,36
3,32
3,29
3,26
3,23
3,20
3,17
2,99
2,82
2,66
2,51

6022,47
99,39
27,35
14,66
10,16
7,98
6,72
5,91
5,35
4,94
4,63
4,39
4,19
4,03
3,89
3,78
3,68
3,60
3,52
3,46
3,40
3,35
3,30
3,26
3,22
3,18
3,15
3,12
3,09
3,07
2,89
2,72
2,56
2,41

6055,85
99,40
27,23
14,55
10,05
7,87
6,62
5,81
5,26
4,85
4,54
4,30
4,10
3,94
3,80
3,69
3,59
3,51
3,43
3,37
3,31
3,26
3,21
3,17
3,13
3,09
3,06
3,03
3,00
2,98
2,80
2,63
2,47
2,32

614

Tabela F 0,01- Continuao


1

11

12

13

14

15

16

17

18

19

20

2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120

6083,32
99,41
27,13
14,45
9,96
7,79
6,54
5,73
5,18
4,77
4,46
4,22
4,02
3,86
3,73
3,62
3,52
3,43
3,36
3,29
3,24
3,18
3,14
3,09
3,06
3,02
2,99
2,96
2,93
2,91
2,73
2,56
2,40
2,25

6106,32
99,42
27,05
14,37
9,89
7,72
6,47
5,67
5,11
4,71
4,40
4,16
3,96
3,80
3,67
3,55
3,46
3,37
3,30
3,23
3,17
3,12
3,07
3,03
2,99
2,96
2,93
2,90
2,87
2,84
2,66
2,50
2,34
2,18

6125,86
99,42
26,98
14,31
9,82
7,66
6,41
5,61
5,05
4,65
4,34
4,10
3,91
3,75
3,61
3,50
3,40
3,32
3,24
3,18
3,12
3,07
3,02
2,98
2,94
2,90
2,87
2,84
2,81
2,79
2,61
2,44
2,28
2,13

6142,67
99,43
26,92
14,25
9,77
7,60
6,36
5,56
5,01
4,60
4,29
4,05
3,86
3,70
3,56
3,45
3,35
3,27
3,19
3,13
3,07
3,02
2,97
2,93
2,89
2,86
2,82
2,79
2,77
2,74
2,56
2,39
2,23
2,08

6157,28
99,43
26,87
14,20
9,72
7,56
6,31
5,52
4,96
4,56
4,25
4,01
3,82
3,66
3,52
3,41
3,31
3,23
3,15
3,09
3,03
2,98
2,93
2,89
2,85
2,81
2,78
2,75
2,73
2,70
2,52
2,35
2,19
2,04

6170,10
99,44
26,83
14,15
9,68
7,52
6,28
5,48
4,92
4,52
4,21
3,97
3,78
3,62
3,49
3,37
3,27
3,19
3,12
3,05
2,99
2,94
2,89
2,85
2,81
2,78
2,75
2,72
2,69
2,66
2,48
2,31
2,15
2,00

6181,43
99,44
26,79
14,11
9,64
7,48
6,24
5,44
4,89
4,49
4,18
3,94
3,75
3,59
3,45
3,34
3,24
3,16
3,08
3,02
2,96
2,91
2,86
2,82
2,78
2,75
2,71
2,68
2,66
2,63
2,45
2,28
2,12
1,97

6191,53
99,44
26,75
14,08
9,61
7,45
6,21
5,41
4,86
4,46
4,15
3,91
3,72
3,56
3,42
3,31
3,21
3,13
3,05
2,99
2,93
2,88
2,83
2,79
2,75
2,72
2,68
2,65
2,63
2,60
2,42
2,25
2,09
1,93

6200,58
99,45
26,72
14,05
9,58
7,42
6,18
5,38
4,83
4,43
4,12
3,88
3,69
3,53
3,40
3,28
3,19
3,10
3,03
2,96
2,90
2,85
2,80
2,76
2,72
2,69
2,66
2,63
2,60
2,57
2,39
2,22
2,06
1,90

6208,73
99,45
26,69
14,02
9,55
7,40
6,16
5,36
4,81
4,41
4,10
3,86
3,66
3,51
3,37
3,26
3,16
3,08
3,00
2,94
2,88
2,83
2,78
2,74
2,70
2,66
2,63
2,60
2,57
2,55
2,37
2,20
2,03
1,88

615

Tabela F 0,01- Continuao


1

21

22

23

24

25

26

27

28

29

30

2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120

6216,12
99,45
26,66
13,99
9,53
7,37
6,13
5,34
4,79
4,38
4,08
3,84
3,64
3,48
3,35
3,24
3,14
3,05
2,98
2,92
2,86
2,81
2,76
2,72
2,68
2,64
2,61
2,58
2,55
2,53
2,35
2,17
2,01
1,85

6222,84
99,45
26,64
13,97
9,51
7,35
6,11
5,32
4,77
4,36
4,06
3,82
3,62
3,46
3,33
3,22
3,12
3,03
2,96
2,90
2,84
2,78
2,74
2,70
2,66
2,62
2,59
2,56
2,53
2,51
2,33
2,15
1,99
1,83

6228,99
99,46
26,62
13,95
9,49
7,33
6,09
5,30
4,75
4,34
4,04
3,80
3,60
3,44
3,31
3,20
3,10
3,02
2,94
2,88
2,82
2,77
2,72
2,68
2,64
2,60
2,57
2,54
2,51
2,49
2,31
2,13
1,97
1,81

6234,63
99,46
26,60
13,93
9,47
7,31
6,07
5,28
4,73
4,33
4,02
3,78
3,59
3,43
3,29
3,18
3,08
3,00
2,92
2,86
2,80
2,75
2,70
2,66
2,62
2,58
2,55
2,52
2,49
2,47
2,29
2,12
1,95
1,79

6239,83
99,46
26,58
13,91
9,45
7,30
6,06
5,26
4,71
4,31
4,01
3,76
3,57
3,41
3,28
3,16
3,07
2,98
2,91
2,84
2,79
2,73
2,69
2,64
2,60
2,57
2,54
2,51
2,48
2,45
2,27
2,10
1,93
1,77

6244,62
99,46
26,56
13,89
9,43
7,28
6,04
5,25
4,70
4,30
3,99
3,75
3,56
3,40
3,26
3,15
3,05
2,97
2,89
2,83
2,77
2,72
2,67
2,63
2,59
2,55
2,52
2,49
2,46
2,44
2,26
2,08
1,92
1,76

6249,07
99,46
26,55
13,88
9,42
7,27
6,03
5,23
4,68
4,28
3,98
3,74
3,54
3,38
3,25
3,14
3,04
2,95
2,88
2,81
2,76
2,70
2,66
2,61
2,58
2,54
2,51
2,48
2,45
2,42
2,24
2,07
1,90
1,74

6253,20
99,46
26,53
13,86
9,40
7,25
6,02
5,22
4,67
4,27
3,96
3,72
3,53
3,37
3,24
3,12
3,03
2,94
2,87
2,80
2,74
2,69
2,64
2,60
2,56
2,53
2,49
2,46
2,44
2,41
2,23
2,05
1,89
1,72

6257,05
99,46
26,52
13,85
9,39
7,24
6,00
5,21
4,66
4,26
3,95
3,71
3,52
3,36
3,23
3,11
3,01
2,93
2,86
2,79
2,73
2,68
2,63
2,59
2,55
2,51
2,48
2,45
2,42
2,40
2,22
2,04
1,87
1,71

6260,65
99,47
26,50
13,84
9,38
7,23
5,99
5,20
4,65
4,25
3,94
3,70
3,51
3,35
3,21
3,10
3,00
2,92
2,84
2,78
2,72
2,67
2,62
2,58
2,54
2,50
2,47
2,44
2,41
2,39
2,20
2,03
1,86
1,70

616

Tabela F 0,01- Continuao


1
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120

40

60

80

6286,78
99,47
26,41
13,75
9,29
7,14
5,91
5,12
4,57
4,17
3,86
3,62
3,43
3,27
3,13
3,02
2,92
2,84
2,76
2,69
2,64
2,58
2,54
2,49
2,45
2,42
2,38
2,35
2,33
2,30
2,11
1,94
1,76
1,59

6313,03
99,48
26,32
13,65
9,20
7,06
5,82
5,03
4,48
4,08
3,78
3,54
3,34
3,18
3,05
2,93
2,83
2,75
2,67
2,61
2,55
2,50
2,45
2,40
2,36
2,33
2,29
2,26
2,23
2,21
2,02
1,84
1,66
1,47

6339,39
99,49
26,22
13,56
9,11
6,97
5,74
4,95
4,40
4,00
3,69
3,45
3,25
3,09
2,96
2,84
2,75
2,66
2,58
2,52
2,46
2,40
2,35
2,31
2,27
2,23
2,20
2,17
2,14
2,11
1,92
1,73
1,53
1,32

6365,86
99,50
26,13
13,46
9,02
6,88
5,65
4,86
4,31
3,91
3,60
3,36
3,17
3,00
2,87
2,75
2,65
2,57
2,49
2,42
2,36
2,31
2,26
2,21
2,17
2,13
2,10
2,06
2,03
2,01
1,80
1,60
1,38
1,00

Tabela 4

617

Tabela F 0,05
Valores de F para = 5%, segundo o nmero de graus de liberdade do numerador (1) e
do denominador( 2 )
1
1

10

2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120

161,45
18,51
10,13
7,71
6,61
5,99
5,59
5,32
5,12
4,96
4,84
4,75
4,67
4,60
4,54
4,49
4,45
4,41
4,38
4,35
4,32
4,30
4,28
4,26
4,24
4,23
4,21
4,20
4,18
4,17
4,08
4,00
3,92
161,45

199,50
19,00
9,55
6,94
5,79
5,14
4,74
4,46
4,26
4,10
3,98
3,89
3,81
3,74
3,68
3,63
3,59
3,55
3,52
3,49
3,47
3,44
3,42
3,40
3,39
3,37
3,35
3,34
3,33
3,32
3,23
3,15
3,07
199,50

215,71
19,16
9,28
6,59
5,41
4,76
4,35
4,07
3,86
3,71
3,59
3,49
3,41
3,34
3,29
3,24
3,20
3,16
3,13
3,10
3,07
3,05
3,03
3,01
2,99
2,98
2,96
2,95
2,93
2,92
2,84
2,76
2,68
215,71

224,58
19,25
9,12
6,39
5,19
4,53
4,12
3,84
3,63
3,48
3,36
3,26
3,18
3,11
3,06
3,01
2,96
2,93
2,90
2,87
2,84
2,82
2,80
2,78
2,76
2,74
2,73
2,71
2,70
2,69
2,61
2,53
2,45
224,58

230,16
19,30
9,01
6,26
5,05
4,39
3,97
3,69
3,48
3,33
3,20
3,11
3,03
2,96
2,90
2,85
2,81
2,77
2,74
2,71
2,68
2,66
2,64
2,62
2,60
2,59
2,57
2,56
2,55
2,53
2,45
2,37
2,29
230,16

233,99
19,33
8,94
6,16
4,95
4,28
3,87
3,58
3,37
3,22
3,09
3,00
2,92
2,85
2,79
2,74
2,70
2,66
2,63
2,60
2,57
2,55
2,53
2,51
2,49
2,47
2,46
2,45
2,43
2,42
2,34
2,25
2,18
233,99

236,77
19,35
8,89
6,09
4,88
4,21
3,79
3,50
3,29
3,14
3,01
2,91
2,83
2,76
2,71
2,66
2,61
2,58
2,54
2,51
2,49
2,46
2,44
2,42
2,40
2,39
2,37
2,36
2,35
2,33
2,25
2,17
2,09
236,77

238,88
19,37
8,85
6,04
4,82
4,15
3,73
3,44
3,23
3,07
2,95
2,85
2,77
2,70
2,64
2,59
2,55
2,51
2,48
2,45
2,42
2,40
2,37
2,36
2,34
2,32
2,31
2,29
2,28
2,27
2,18
2,10
2,02
238,88

240,54
19,38
8,81
6,00
4,77
4,10
3,68
3,39
3,18
3,02
2,90
2,80
2,71
2,65
2,59
2,54
2,49
2,46
2,42
2,39
2,37
2,34
2,32
2,30
2,28
2,27
2,25
2,24
2,22
2,21
2,12
2,04
1,96
240,54

241,88
19,40
8,79
5,96
4,74
4,06
3,64
3,35
3,14
2,98
2,85
2,75
2,67
2,60
2,54
2,49
2,45
2,41
2,38
2,35
2,32
2,30
2,27
2,25
2,24
2,22
2,20
2,19
2,18
2,16
2,08
1,99
1,91
241,88

618

Tabela F 0,05- Continuao


1

11

12

13

14

15

16

17

18

19

20

2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120

242,98
19,40
8,76
5,94
4,70
4,03
3,60
3,31
3,10
2,94
2,82
2,72
2,63
2,57
2,51
2,46
2,41
2,37
2,34
2,31
2,28
2,26
2,24
2,22
2,20
2,18
2,17
2,15
2,14
2,13
2,04
1,95
1,87
1,79

243,91
19,41
8,74
5,91
4,68
4,00
3,57
3,28
3,07
2,91
2,79
2,69
2,60
2,53
2,48
2,42
2,38
2,34
2,31
2,28
2,25
2,23
2,20
2,18
2,16
2,15
2,13
2,12
2,10
2,09
2,00
1,92
1,83
1,75

244,69
19,42
8,73
5,89
4,66
3,98
3,55
3,26
3,05
2,89
2,76
2,66
2,58
2,51
2,45
2,40
2,35
2,31
2,28
2,25
2,22
2,20
2,18
2,15
2,14
2,12
2,10
2,09
2,08
2,06
1,97
1,89
1,80
1,72

245,36
19,42
8,71
5,87
4,64
3,96
3,53
3,24
3,03
2,86
2,74
2,64
2,55
2,48
2,42
2,37
2,33
2,29
2,26
2,22
2,20
2,17
2,15
2,13
2,11
2,09
2,08
2,06
2,05
2,04
1,95
1,86
1,78
1,69

245,95
19,43
8,70
5,86
4,62
3,94
3,51
3,22
3,01
2,85
2,72
2,62
2,53
2,46
2,40
2,35
2,31
2,27
2,23
2,20
2,18
2,15
2,13
2,11
2,09
2,07
2,06
2,04
2,03
2,01
1,92
1,84
1,75
1,67

246,46
19,43
8,69
5,84
4,60
3,92
3,49
3,20
2,99
2,83
2,70
2,60
2,51
2,44
2,38
2,33
2,29
2,25
2,21
2,18
2,16
2,13
2,11
2,09
2,07
2,05
2,04
2,02
2,01
1,99
1,90
1,82
1,73
1,64

246,92
19,44
8,68
5,83
4,59
3,91
3,48
3,19
2,97
2,81
2,69
2,58
2,50
2,43
2,37
2,32
2,27
2,23
2,20
2,17
2,14
2,11
2,09
2,07
2,05
2,03
2,02
2,00
1,99
1,98
1,89
1,80
1,71
1,62

247,32
19,44
8,67
5,82
4,58
3,90
3,47
3,17
2,96
2,80
2,67
2,57
2,48
2,41
2,35
2,30
2,26
2,22
2,18
2,15
2,12
2,10
2,08
2,05
2,04
2,02
2,00
1,99
1,97
1,96
1,87
1,78
1,69
1,60

247,69
19,44
8,67
5,81
4,57
3,88
3,46
3,16
2,95
2,79
2,66
2,56
2,47
2,40
2,34
2,29
2,24
2,20
2,17
2,14
2,11
2,08
2,06
2,04
2,02
2,00
1,99
1,97
1,96
1,95
1,85
1,76
1,67
1,59

248,01
19,45
8,66
5,80
4,56
3,87
3,44
3,15
2,94
2,77
2,65
2,54
2,46
2,39
2,33
2,28
2,23
2,19
2,16
2,12
2,10
2,07
2,05
2,03
2,01
1,99
1,97
1,96
1,94
1,93
1,84
1,75
1,66
1,57

619

Tabela F 0,05- Continuao


1
21

22

23

24

25

26

27

28

29

30

248,31
19,45
8,65
5,79
4,55
3,86
3,43
3,14
2,93
2,76
2,64
2,53
2,45
2,38
2,32
2,26
2,22
2,18
2,14
2,11
2,08
2,06
2,04
2,01
2,00
1,98
1,96
1,95
1,93
1,92
1,83
1,73
1,64
1,56

248,58
19,45
8,65
5,79
4,54
3,86
3,43
3,13
2,92
2,75
2,63
2,52
2,44
2,37
2,31
2,25
2,21
2,17
2,13
2,10
2,07
2,05
2,02
2,00
1,98
1,97
1,95
1,93
1,92
1,91
1,81
1,72
1,63
1,54

248,83
19,45
8,64
5,78
4,53
3,85
3,42
3,12
2,91
2,75
2,62
2,51
2,43
2,36
2,30
2,24
2,20
2,16
2,12
2,09
2,06
2,04
2,01
1,99
1,97
1,96
1,94
1,92
1,91
1,90
1,80
1,71
1,62
1,53

249,05
19,45
8,64
5,77
4,53
3,84
3,41
3,12
2,90
2,74
2,61
2,51
2,42
2,35
2,29
2,24
2,19
2,15
2,11
2,08
2,05
2,03
2,01
1,98
1,96
1,95
1,93
1,91
1,90
1,89
1,79
1,70
1,61
1,52

249,26
19,46
8,63
5,77
4,52
3,83
3,40
3,11
2,89
2,73
2,60
2,50
2,41
2,34
2,28
2,23
2,18
2,14
2,11
2,07
2,05
2,02
2,00
1,97
1,96
1,94
1,92
1,91
1,89
1,88
1,78
1,69
1,60
1,51

249,45
19,46
8,63
5,76
4,52
3,83
3,40
3,10
2,89
2,72
2,59
2,49
2,41
2,33
2,27
2,22
2,17
2,13
2,10
2,07
2,04
2,01
1,99
1,97
1,95
1,93
1,91
1,90
1,88
1,87
1,77
1,68
1,59
1,50

249,63
19,46
8,63
5,76
4,51
3,82
3,39
3,10
2,88
2,72
2,59
2,48
2,40
2,33
2,27
2,21
2,17
2,13
2,09
2,06
2,03
2,00
1,98
1,96
1,94
1,92
1,90
1,89
1,88
1,86
1,77
1,67
1,58
1,49

249,80
19,46
8,62
5,75
4,50
3,82
3,39
3,09
2,87
2,71
2,58
2,48
2,39
2,32
2,26
2,21
2,16
2,12
2,08
2,05
2,02
2,00
1,97
1,95
1,93
1,91
1,90
1,88
1,87
1,85
1,76
1,66
1,57
1,48

249,95
19,46
8,62
5,75
4,50
3,81
3,38
3,08
2,87
2,70
2,58
2,47
2,39
2,31
2,25
2,20
2,15
2,11
2,08
2,05
2,02
1,99
1,97
1,95
1,93
1,91
1,89
1,88
1,86
1,85
1,75
1,66
1,56
1,47

250,10
19,46
8,62
5,75
4,50
3,81
3,38
3,08
2,86
2,70
2,57
2,47
2,38
2,31
2,25
2,19
2,15
2,11
2,07
2,04
2,01
1,98
1,96
1,94
1,92
1,90
1,88
1,87
1,85
1,84
1,74
1,65
1,55
1,46

2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120

620

Tabela F 0,05- Continuao


1

2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120

40

60

80

251,14
19,47
8,59
5,72
4,46
3,77
3,34
3,04
2,83
2,66
2,53
2,43
2,34
2,27
2,20
2,15
2,10
2,06
2,03
1,99
1,96
1,94
1,91
1,89
1,87
1,85
1,84
1,82
1,81
1,79
1,69
1,59
1,50
1,39

252,20
19,48
8,57
5,69
4,43
3,74
3,30
3,01
2,79
2,62
2,49
2,38
2,30
2,22
2,16
2,11
2,06
2,02
1,98
1,95
1,92
1,89
1,86
1,84
1,82
1,80
1,79
1,77
1,75
1,74
1,64
1,53
1,43
1,32

253,25
19,49
8,55
5,66
4,40
3,70
3,27
2,97
2,75
2,58
2,45
2,34
2,25
2,18
2,11
2,06
2,01
1,97
1,93
1,90
1,87
1,84
1,81
1,79
1,77
1,75
1,73
1,71
1,70
1,68
1,58
1,47
1,35
1,22

254,31
19,50
8,53
5,63
4,37
3,67
3,23
2,93
2,71
2,54
2,40
2,30
2,21
2,13
2,07
2,01
1,96
1,92
1,88
1,84
1,81
1,78
1,76
1,73
1,71
1,69
1,67
1,65
1,64
1,62
1,51
1,39
1,25
1,01

Tabela F 0,10

621

Valores de F para = 10%, segundo o nmero de graus de liberdade do numerador (1) e


do denominador( 2)
1
1

10

2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120

39,86
8,53
5,54
4,54
4,06
3,78
3,59
3,46
3,36
3,29
3,23
3,18
3,14
3,10
3,07
3,05
3,03
3,01
2,99
2,97
2,96
2,95
2,94
2,93
2,92
2,91
2,90
2,89
2,89
2,88
2,84
2,79
2,75
2,71

49,50
9,00
5,46
4,32
3,78
3,46
3,26
3,11
3,01
2,92
2,86
2,81
2,76
2,73
2,70
2,67
2,64
2,62
2,61
2,59
2,57
2,56
2,55
2,54
2,53
2,52
2,51
2,50
2,50
2,49
2,44
2,39
2,35
2,30

53,59
9,16
5,39
4,19
3,62
3,29
3,07
2,92
2,81
2,73
2,66
2,61
2,56
2,52
2,49
2,46
2,44
2,42
2,40
2,38
2,36
2,35
2,34
2,33
2,32
2,31
2,30
2,29
2,28
2,28
2,23
2,18
2,13
2,08

55,83
9,24
5,34
4,11
3,52
3,18
2,96
2,81
2,69
2,61
2,54
2,48
2,43
2,39
2,36
2,33
2,31
2,29
2,27
2,25
2,23
2,22
2,21
2,19
2,18
2,17
2,17
2,16
2,15
2,14
2,09
2,04
1,99
1,94

57,24
9,29
5,31
4,05
3,45
3,11
2,88
2,73
2,61
2,52
2,45
2,39
2,35
2,31
2,27
2,24
2,22
2,20
2,18
2,16
2,14
2,13
2,11
2,10
2,09
2,08
2,07
2,06
2,06
2,05
2,00
1,95
1,90
1,85

58,20
9,33
5,28
4,01
3,40
3,05
2,83
2,67
2,55
2,46
2,39
2,33
2,28
2,24
2,21
2,18
2,15
2,13
2,11
2,09
2,08
2,06
2,05
2,04
2,02
2,01
2,00
2,00
1,99
1,98
1,93
1,87
1,82
1,77

58,91
9,35
5,27
3,98
3,37
3,01
2,78
2,62
2,51
2,41
2,34
2,28
2,23
2,19
2,16
2,13
2,10
2,08
2,06
2,04
2,02
2,01
1,99
1,98
1,97
1,96
1,95
1,94
1,93
1,93
1,87
1,82
1,77
1,72

59,44
9,37
5,25
3,95
3,34
2,98
2,75
2,59
2,47
2,38
2,30
2,24
2,20
2,15
2,12
2,09
2,06
2,04
2,02
2,00
1,98
1,97
1,95
1,94
1,93
1,92
1,91
1,90
1,89
1,88
1,83
1,77
1,72
1,67

59,86
9,38
5,24
3,94
3,32
2,96
2,72
2,56
2,44
2,35
2,27
2,21
2,16
2,12
2,09
2,06
2,03
2,00
1,98
1,96
1,95
1,93
1,92
1,91
1,89
1,88
1,87
1,87
1,86
1,85
1,79
1,74
1,68
1,63

60,19
9,39
5,23
3,92
3,30
2,94
2,70
2,54
2,42
2,32
2,25
2,19
2,14
2,10
2,06
2,03
2,00
1,98
1,96
1,94
1,92
1,90
1,89
1,88
1,87
1,86
1,85
1,84
1,83
1,82
1,76
1,71
1,65
1,60

Tabela F 0,10- Continuao


1
11

12

13

14

15

16

17

18

19

20

2
1

60,47

60,71

60,90

61,07

61,22

61,35

61,46

61,57

61,66

61,74

622

2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120

9,40
5,22
3,91
3,28
2,92
2,68
2,52
2,40
2,30
2,23
2,17
2,12
2,07
2,04
2,01
1,98
1,95
1,93
1,91
1,90
1,88
1,87
1,85
1,84
1,83
1,82
1,81
1,80
1,79
1,74
1,68
1,63
1,57

9,41
5,22
3,90
3,27
2,90
2,67
2,50
2,38
2,28
2,21
2,15
2,10
2,05
2,02
1,99
1,96
1,93
1,91
1,89
1,87
1,86
1,84
1,83
1,82
1,81
1,80
1,79
1,78
1,77
1,71
1,66
1,60
1,55

9,41
5,21
3,89
3,26
2,89
2,65
2,49
2,36
2,27
2,19
2,13
2,08
2,04
2,00
1,97
1,94
1,92
1,89
1,87
1,86
1,84
1,83
1,81
1,80
1,79
1,78
1,77
1,76
1,75
1,70
1,64
1,58
1,52

9,42
5,20
3,88
3,25
2,88
2,64
2,48
2,35
2,26
2,18
2,12
2,07
2,02
1,99
1,95
1,93
1,90
1,88
1,86
1,84
1,83
1,81
1,80
1,79
1,77
1,76
1,75
1,75
1,74
1,68
1,62
1,56
1,50

9,42
5,20
3,87
3,24
2,87
2,63
2,46
2,34
2,24
2,17
2,10
2,05
2,01
1,97
1,94
1,91
1,89
1,86
1,84
1,83
1,81
1,80
1,78
1,77
1,76
1,75
1,74
1,73
1,72
1,66
1,60
1,55
1,49

9,43
5,20
3,86
3,23
2,86
2,62
2,45
2,33
2,23
2,16
2,09
2,04
2,00
1,96
1,93
1,90
1,87
1,85
1,83
1,81
1,80
1,78
1,77
1,76
1,75
1,74
1,73
1,72
1,71
1,65
1,59
1,53
1,47

9,43
5,19
3,86
3,22
2,85
2,61
2,45
2,32
2,22
2,15
2,08
2,03
1,99
1,95
1,92
1,89
1,86
1,84
1,82
1,80
1,79
1,77
1,76
1,75
1,73
1,72
1,71
1,71
1,70
1,64
1,58
1,52
1,46

9,44
5,19
3,85
3,22
2,85
2,61
2,44
2,31
2,22
2,14
2,08
2,02
1,98
1,94
1,91
1,88
1,85
1,83
1,81
1,79
1,78
1,76
1,75
1,74
1,72
1,71
1,70
1,69
1,69
1,62
1,56
1,50
1,44

9,44
5,19
3,85
3,21
2,84
2,60
2,43
2,30
2,21
2,13
2,07
2,01
1,97
1,93
1,90
1,87
1,84
1,82
1,80
1,78
1,77
1,75
1,74
1,73
1,71
1,70
1,69
1,68
1,68
1,61
1,55
1,49
1,43

9,44
5,18
3,84
3,21
2,84
2,59
2,42
2,30
2,20
2,12
2,06
2,01
1,96
1,92
1,89
1,86
1,84
1,81
1,79
1,78
1,76
1,74
1,73
1,72
1,71
1,70
1,69
1,68
1,67
1,61
1,54
1,48
1,42

623

Tabela F 0,10- Continuao


1

2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120

21

61,81
9,44
5,18
3,84
3,20
2,83
2,59
2,42
2,29
2,19
2,12
2,05
2,00
1,96
1,92
1,88
1,86
1,83
1,81
1,79
1,77
1,75
1,74
1,72
1,71
1,70
1,69
1,68
1,67
1,66
1,60
1,53
1,47
1,41

22

61,88
9,45
5,18
3,84
3,20
2,83
2,58
2,41
2,29
2,19
2,11
2,05
1,99
1,95
1,91
1,88
1,85
1,82
1,80
1,78
1,76
1,74
1,73
1,71
1,70
1,69
1,68
1,67
1,66
1,65
1,59
1,53
1,46
1,40

23

61,95
9,45
5,18
3,83
3,19
2,82
2,58
2,41
2,28
2,18
2,11
2,04
1,99
1,94
1,90
1,87
1,84
1,82
1,79
1,77
1,75
1,74
1,72
1,71
1,70
1,68
1,67
1,66
1,65
1,64
1,58
1,52
1,46
1,39

24

62,00
9,45
5,18
3,83
3,19
2,82
2,58
2,40
2,28
2,18
2,10
2,04
1,98
1,94
1,90
1,87
1,84
1,81
1,79
1,77
1,75
1,73
1,72
1,70
1,69
1,68
1,67
1,66
1,65
1,64
1,57
1,51
1,45
1,38

25

62,05
9,45
5,17
3,83
3,19
2,81
2,57
2,40
2,27
2,17
2,10
2,03
1,98
1,93
1,89
1,86
1,83
1,80
1,78
1,76
1,74
1,73
1,71
1,70
1,68
1,67
1,66
1,65
1,64
1,63
1,57
1,50
1,44
1,38

26

62,10
9,45
5,17
3,83
3,18
2,81
2,57
2,40
2,27
2,17
2,09
2,03
1,97
1,93
1,89
1,86
1,83
1,80
1,78
1,76
1,74
1,72
1,70
1,69
1,68
1,67
1,65
1,64
1,63
1,63
1,56
1,50
1,43
1,37

27

62,15
9,45
5,17
3,82
3,18
2,81
2,56
2,39
2,26
2,17
2,09
2,02
1,97
1,92
1,88
1,85
1,82
1,80
1,77
1,75
1,73
1,72
1,70
1,69
1,67
1,66
1,65
1,64
1,63
1,62
1,56
1,49
1,43
1,36

28

62,19
9,46
5,17
3,82
3,18
2,81
2,56
2,39
2,26
2,16
2,08
2,02
1,96
1,92
1,88
1,85
1,82
1,79
1,77
1,75
1,73
1,71
1,69
1,68
1,67
1,66
1,64
1,63
1,62
1,62
1,55
1,49
1,42
1,35

29

62,23
9,46
5,17
3,82
3,18
2,80
2,56
2,39
2,26
2,16
2,08
2,01
1,96
1,92
1,88
1,84
1,81
1,79
1,76
1,74
1,72
1,71
1,69
1,68
1,66
1,65
1,64
1,63
1,62
1,61
1,55
1,48
1,41
1,35

30

62,26
9,46
5,17
3,82
3,17
2,80
2,56
2,38
2,25
2,16
2,08
2,01
1,96
1,91
1,87
1,84
1,81
1,78
1,76
1,74
1,72
1,70
1,69
1,67
1,66
1,65
1,64
1,63
1,62
1,61
1,54
1,48
1,41
1,34

624

Tabela F 0,10- Continuao


1
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120

40

60

80

62,53
9,47
5,16
3,80
3,16
2,78
2,54
2,36
2,23
2,13
2,05
1,99
1,93
1,89
1,85
1,81
1,78
1,75
1,73
1,71
1,69
1,67
1,66
1,64
1,63
1,61
1,60
1,59
1,58
1,57
1,51
1,44
1,37
1,30

62,79
9,47
5,15
3,79
3,14
2,76
2,51
2,34
2,21
2,11
2,03
1,96
1,90
1,86
1,82
1,78
1,75
1,72
1,70
1,68
1,66
1,64
1,62
1,61
1,59
1,58
1,57
1,56
1,55
1,54
1,47
1,40
1,32
1,24

63,06
9,48
5,14
3,78
3,12
2,74
2,49
2,32
2,18
2,08
2,00
1,93
1,88
1,83
1,79
1,75
1,72
1,69
1,67
1,64
1,62
1,60
1,59
1,57
1,56
1,54
1,53
1,52
1,51
1,50
1,42
1,35
1,26
1,17

63,33
9,49
5,13
3,76
3,11
2,72
2,47
2,29
2,16
2,06
1,97
1,90
1,85
1,80
1,76
1,72
1,69
1,66
1,63
1,61
1,59
1,57
1,55
1,53
1,52
1,50
1,49
1,48
1,47
1,46
1,38
1,29
1,19
1,01

625

Tabela 5
Tabela de Tukey 0,01

R
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
24
30
40
60
120

N de Colunas da ANOVA( K )
2
90,00
14,00
8,26
6,51
5,70
5,24
4,95
4,74
4,60
4,48
4,39
4,32
4,26
4,21
4,17
4,13
4,10
4,07
4,05
4,02
3,96
3,89
3,82
3,76
3,70
3,64

3
135,00
19,00
10,60
8,12
6,97
6,33
5,92
5,63
5,43
5,27
5,14
5,04
4,96
4,89
4,83
4,78
4,74
4,70
4,67
4,64
4,54
4,45
4,37
4,28
4,20
4,12

4
164,00
22,30
12,20
9,17
7,80
7,03
6,54
6,20
5,96
6,77
5,62
5,50
5,40
5,32
5,25
5,19
5,14
5,09
5,05
5,02
4,91
4,80
4,70
4,60
4,50
4,40

5
186,00
24,70
13,30
9,96
8,42
7,56
7,01
6,63
6,35
6,14
5,97
5,84
5,73
5,63
5,56
5,49
5,43
5,38
5,33
5,29
5,17
5,05
4,93
4,82
4,71
4,60

6
202,00
26,60
14,20
10,60
8,91
7,97
7,37
6,96
6,66
6,43
6,25
6,10
5,98
5,88
5,80
5,72
5,66
5,60
5,55
5,51
5,37
5,24
5,11
4,99
4,87
4,76

7
216,00
28,20
15,00
11,10
9,32
8,32
7,68
7,24
6,91
6,67
6,48
6,32
6,19
6,08
5,99
5,92
5,85
5,79
5,73
5,69
5,54
5,40
5,27
5,13
5,01
4,88

8
227,00
29,50
15,60
11,50
9,67
8,61
7,94
7,47
7,13
6,87
6,67
6,51
6,37
6,26
6,16
6,08
6,01
5,94
5,89
5,84
5,69
5,54
5,39
5,25
5,12
4,99

9
237,00
30,70
16,20
11,90
9,97
8,87
8,17
7,68
7,32
7,05
6,84
6,67
6,53
6,41
6,31
6,22
6,15
6,08
6,02
5,97
5,81
5,65
5,50
5,36
5,21
5,08

10
246,00
31,70
16,70
12,30
10,20
9,10
8,37
7,87
7,49
7,21
6,99
6,81
6,67
6,54
6,44
6,35
6,27
6,20
6,14
6,09
5,92
5,76
5,60
5,45
5,30
5,16

11
253,00
32,60
17,10
12,60
10,50
9,30
8,55
8,03
7,65
7,36
7,13
6,94
6,79
6,66
6,55
6,46
6,38
6,31
6,25
6,19
6,02
5,85
5,69
5,53
5,38
5,23

Tabela 5
Tabela de Tukey 0,05
626

R
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
24
30
40
60
120

N de Colunas da ANOVA( K )
2
18,00
6,08
4,50
3,93
3,64
3,46
3,34
3,26
3,20
3,15
3,11
3,08
3,06
3,03
3,01
3,00
2,98
2,97
2,96
2,95
2,92
2,89
2,86
2,83
2,80
2,77

3
27,00
8,33
5,91
5,04
4,60
4,34
4,16
4,04
4,95
3,88
3,82
3,77
3,73
3,70
3,67
3,65
3,63
3,61
3,59
3,58
3,53
3,49
3,44
3,40
3,36
3,31

4
32,80
9,80
6,82
5,76
5,22
4,90
4,68
4,53
4,41
4,33
4,26
4,20
4,15
4,11
4,08
4,05
4,02
4,00
3,98
3,96
3,90
3,85
3,79
3,74
3,68
3,63

5
37,10
10,90
7,50
6,29
5,67
5,30
5,06
4,89
4,76
4,65
4,57
4,51
4,45
4,41
4,37
4,33
4,30
4,28
4,25
4,23
4,17
4,10
4,04
3,98
3,92
3,86

6
40,40
11,70
8,04
6,71
6,03
5,63
5,36
5,17
5,02
4,91
4,82
4,75
4,69
4,64
4,59
4,56
4,52
4,49
4,47
4,45
4,37
4,30
4,23
4,16
4,10
4,03

7
43,10
12,40
8,48
7,05
6,33
5,90
5,61
5,40
5,24
5,12
5,03
4,95
4,88
4,83
4,78
4,74
4,70
4,67
4,65
4,62
4,54
4,46
4,39
4,31
4,24
4,17

8
45,40
13,00
8,85
7,35
6,58
6,12
5,82
5,60
5,43
5,30
5,20
5,12
5,05
4,99
4,94
4,90
4,86
4,82
4,79
4,77
4,68
4,60
4,52
4,44
4,36
4,29

9
47,40
13,50
9,18
7,60
6,80
6,32
6,00
5,77
5,59
5,46
5,35
5,27
5,19
5,13
5,08
5,03
4,99
4,96
4,92
4,90
4,81
4,72
4,63
4,55
4,47
4,39

10
49,10
14,00
9,46
7,83
6,99
6,49
6,16
5,92
5,74
5,60
5,49
5,39
5,32
5,25
5,20
5,15
5,11
5,07
5,04
5,01
4,92
4,82
4,73
4,65
4,56
4,47

11
50,60
14,40
9,72
8,03
7,17
6,65
6,30
6,05
5,87
5,72
5,61
5,51
5,43
5,36
5,31
5,26
5,21
5,17
5,14
5,11
5,01
4,92
4,82
4,73
4,64
4,55

627

Tabela 5
Tabela de Tukey 0,10

R
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
24
30
40
60
120

N de Colunas da ANOVA( K )
2
8,93
4,13
3,33
3,01
2,85
2,75
2,68
2,63
2,59
2,56
2,54
2,52
2,50
2,49
2,48
2,47
2,46
2,45
2,45
2,44
2,42
2,40
2,38
2,36
2,34
2,33

3
13,40
5,73
4,47
3,98
3,72
3,56
3,45
3,37
3,32
3,27
3,23
3,20
3,18
3,16
3,14
3,12
3,11
3,10
3,09
3,08
3,05
3,02
2,99
2,96
2,93
2,90

4
16,40
6,77
5,20
4,59
4,26
4,07
3,93
3,83
3,76
3,70
3,66
3,62
3,59
3,56
3,54
3,52
3,50
3,49
3,47
3,46
3,42
3,39
3,35
3,31
3,28
3,24

5
18,50
7,54
5,74
5,03
4,66
4,44
4,28
4,17
4,08
4,02
3,96
3,92
3,88
3,85
3,83
3,80
3,78
3,77
3,75
3,74
3,69
3,65
3,60
3,56
3,52
3,48

6
20,20
8,14
6,16
5,39
4,98
4,73
4,55
4,43
4,34
4,26
4,20
4,16
4,12
4,08
4,05
4,03
4,00
3,98
3,97
3,95
3,90
3,85
3,80
3,75
3,71
3,66

7
21,50
8,63
6,51
5,68
5,24
4,97
4,78
4,65
4,54
4,47
4,40
4,35
4,30
4,27
4,23
4,21
4,18
4,16
4,14
4,12
4,07
4,02
3,96
3,91
3,86
3,81

8
22,60
9,05
6,81
5,93
5,46
5,17
4,97
4,83
4,72
4,64
4,57
4,51
4,46
4,42
4,39
4,36
4,33
4,31
4,29
4,27
4,21
4,16
4,10
4,04
3,99
3,93

9
23,60
9,41
7,26
6,14
5,65
5,34
5,14
4,99
4,87
4,78
4,71
4,65
4,60
4,56
4,52
4,49
4,46
4,44
4,42
4,40
4,34
4,28
4,21
4,16
4,10
4,04

10
24,50
9,72
7,29
6,33
5,82
5,50
5,28
5,13
5,01
4,91
4,84
4,78
4,72
4,68
4,64
4,61
4,58
4,55
4,53
4,51
4,44
4,38
4,32
4,25
4,19
4,13

11
25,20
10,00
7,49
6,49
5,97
5,64
5,41
5,25
5,13
5,03
4,95
4,89
4,83
4,79
4,75
4,71
4,68
4,65
4,63
4,61
4,54
4,47
4,41
4,34
4,28
4,21

Tabela 6
Valor-p por Valores de F
2

Valor-p

628

0,250
0,100
0,050

1
5,83
39,90
161,00

2
7,50
49,50
200,00

3
8,20
53,60
216,00

4
8,58
55,80
225,00

5
8,82
57,20
230,00

6
8,98
58,20
234,00

8
9,19
59,40
239,00

10
9,32
60,20
242,00

20
9,58
61,70
248,00

40
9,71
62,50
251,00

9,85
63,30
254,00

0,250
0,100
0,050
0,010
0,001

2,57
8,53
18,50
98,50
998,00

3,00
9,00
19,00
99,00
999,00

3,15
9,16
19,20
99,20
999,00

3,23
9,24
19,20
99,20
999,00

3,28
9,29
19,30
99,30
999,00

3,31
9,33
19,30
99,30
999,00

3,35
9,37
19,40
99,40
999,00

3,38
9,39
19,40
99,40
999,00

3,43
9,44
19,40
99,40
999,00

3,45
9,47
19,50
99,50
999,00

3,48
9,49
19,50
99,50
999,00

0,250
0,100
0,050
0,010
0,001

2,02
5,54
10,10
34,10
167,00

2,28
5,46
9,55
30,80
149,00

2,36
5,39
9,28
29,50
141,00

2,39
5,34
9,12
28,70
137,00

2,41
5,31
9,10
28,20
135,00

2,42
5,28
8,94
27,90
133,00

2,44
5,25
8,85
27,50
131,00

2,44
5,23
8,79
27,20
129,00

2,46
5,18
8,66
26,70
126,00

2,47
5,16
8,59
26,40
125,00

2,47
5,13
8,53
26,10
124,00

0,250
0,100
0,050
0,010
0,001

1,81
4,54
7,71
21,10
74,10

2,00
4,32
6,94
18,00
61,30

2,05
4,19
6,59
16,70
56,20

2,06
4,11
6,39
16,00
53,40

2,07
4,05
6,26
15,50
51,70

2,08
4,01
6,16
15,20
50,50

2,08
3,95
6,04
14,80
49,00

2,08
3,92
5,96
14,50
48,10

2,08
3,84
5,80
14,00
46,10

2,08
3,80
5,72
13,70
45,10

2,08
3,76
5,63
13,50
44,10

0,250
0,100
0,050
0,010
0,001

1,69
4,06
6,61
16,30
47,20

1,85
3,78
5,79
13,30
37,10

1,88
3,62
5,41
12,10
33,20

1,89
3,52
5,19
11,40
31,10

1,89
3,45
5,05
11,00
29,80

1,89
3,40
4,95
10,70
28,80

1,89
3,34
4,82
10,30
27,60

1,89
3,30
4,74
10,10
26,90

1,88
3,21
4,56
9,55
25,40

1,88
3,16
4,46
9,29
24,60

1,87
3,10
4,36
9,02
23,80

0,250
0,100
0,050
0,010
0,001

1,62
3,78
5,99
13,70
35,50

1,76
3,46
5,14
10,90
27,00

1,78
3,29
4,76
9,78
23,70

1,79
3,18
4,53
9,15
21,90

1,79
3,11
4,39
8,75
20,80

1,78
3,05
4,28
8,47
20,00

1,77
2,98
4,15
8,10
19,00

1,77
2,94
4,06
7,87
18,40

1,76
2,84
3,87
7,40
17,10

1,75
2,78
3,77
7,14
16,40

1,74
2,72
3,67
6,88
15,80

0,250
0,100
0,050
0,010
0,001

1,57
3,59
5,59
12,20
29,30

1,70
3,26
4,74
9,55
21,70

1,72
3,07
4,35
8,45
18,80

1,72
2,96
4,12
7,85
17,20

1,71
2,88
3,97
7,46
16,20

1,71
2,83
3,87
7,19
15,50

1,70
2,75
3,73
6,84
14,60

1,69
2,70
3,64
6,62
14,10

1,67
2,59
3,44
6,16
12,90

1,66
2,54
3,34
5,91
12,30

1,65
2,47
3,23
5,65
11,70

0,250
0,100
0,050
0,010
0,001

1,54
3,46
5,32
11,30
25,40

1,66
3,11
4,46
8,65
18,50

1,67
2,92
4,07
7,59
15,80

1,66
2,81
3,84
7,01
14,40

1,66
2,73
3,69
6,63
13,50

1,65
2,67
3,58
6,37
12,90

1,64
2,59
3,44
6,03
12,00

1,63
2,54
3,35
5,81
11,50

1,61
2,42
3,15
5,36
10,50

1,59
2,36
3,04
5,12
9,92

1,58
2,29
2,93
4,86
9,33

Valor-p

Tabela 6-Valor-p por Valores de F-(Continuao)


1

0,250
0,100
0,050
0,010
0,001

1
1,51
3,36
5,12
10,6
22,9

10

0,250
0,100

1,49
3,28

2
1,62
3,01
4,26
8,02
16,4

3
1,63
2,81
3,86
6,99
13,90

4
1,63
2,69
3,63
6,42
12,60

5
1,62
2,61
3,48
6,06
11,70

6
1,61
2,55
3,37
5,80
11,10

8
1,60
2,47
3,23
5,47
10,40

10
1,59
2,42
3,14
5,26
9,89

20
1,56
2,30
2,94
4,81
8,90

40
1,55
2,23
2,83
4,57
8,37

1,53
2,16
2,71
4,31
7,81

1,60
2,92

1,60
2,73

1,59
2,61

1,59
2,52

1,58
2,46

1,56
2,38

1,55
2,32

1,52
2,20

1,51
2,13

1,48
2,06

629

0,050
0,010
0,001

4,96
10,00
21,00

4,10
7,56
14,90

3,71
6,55
12,60

3,48
5,99
11,30

3,33
5,64
10,50

3,22
5,39
9,92

3,07
5,06
9,20

2,98
4,85
8,75

2,77
4,41
7,80

2,66
4,17
7,30

2,54
3,91
6,76

12

0,250
0,100
0,050
0,010
0,001

1,56
3,18
4,75
9,33
18,6

1,56
2,81
3,89
6,93
13,00

1,56
2,61
3,49
5,95
10,80

1,55
2,48
3,26
5,41
9,63

1,54
2,39
3,11
5,06
8,89

1,53
2,33
3,00
4,82
8,38

1,51
2,24
2,85
4,50
7,71

1,50
2,19
2,75
4,30
7,29

1,47
2,06
2,54
3,86
6,40

1,45
1,99
2,43
3,62
5,93

1,42
1,90
2,30
3,36
5,42

14

0,250
0,100
0,050
0,010
0,001

1,44
3,10
4,60
8,86
17,10

1,53
2,73
3,74
5,51
11,80

1,53
2,52
3,34
5,56
9,73

1,52
2,39
3,11
5,04
8,62

1,51
2,31
2,96
4,69
7,92

1,50
2,24
2,85
4,46
7,43

1,48
2,15
2,70
4,14
6,80

1,46
2,10
2,60
3,94
6,40

1,43
1,96
2,39
3,51
5,56

1,41
1,89
2,27
3,27
5,10

1,38
1,80
2,13
3,00
4,60

16

0,250
0,100
0,050
0,010
0,001

1,42
3,05
4,49
8,53
16,10

1,51
2,67
3,63
6,23
11,00

1,51
2,46
3,24
5,29
9,00

1,50
2,33
3,01
4,77
7,94

1,48
2,24
2,85
4,44
7,27

1,48
2,18
2,74
4,20
6,81

1,46
2,09
2,59
3,89
6,19

1,45
2,03
2,49
3,69
5,81

1,40
1,89
2,28
3,26
4,99

1,37
1,81
2,15
3,02
4,54

1,34
1,72
2,01
2,75
4,06

18

0,250
0,100
0,050
0,010
0,001

1,41
3,01
4,41
8,29
15,40

1,50
2,62
3,55
6,01
10,40

1,49
2,42
3,16
5,09
8,49

1,48
2,29
2,93
4,58
7,46

1,46
2,20
2,77
4,25
6,81

1,45
2,13
2,66
4,01
6,35

1,43
2,04
2,51
3,71
5,76

1,42
1,98
2,41
3,51
5,39

1,38
1,84
2,19
3,08
4,59

1,35
1,75
2,06
2,84
4,15

1,32
1,66
1,92
2,57
3,67

20

0,250
0,100
0,050
0,010
0,001

1,40
2,97
4,35
8,10
14,80

1,49
2,59
3,49
5,85
9,95

1,48
2,38
3,10
4,94
8,10

1,46
2,25
2,87
4,43
7,10

1,45
2,16
2,71
4,10
6,46

1,44
2,09
2,60
3,87
6,02

1,42
2,00
2,45
3,56
5,44

1,40
1,94
2,35
3,37
5,08

1,36
1,79
2,12
2,94
4,29

1,33
1,71
1,99
2,69
3,86

1,29
1,61
1,84
2,42
3,38

30

0,250
0,100
0,050
0,010
0,001

1,38
2,88
4,17
7,56
13,30

1,45
2,49
3,32
5,39
8,77

1,44
2,28
2,92
4,51
7,05

1,42
2,14
2,69
4,02
6,12

1,41
2,05
2,53
3,70
5,53

1,39
1,98
2,42
3,47
5,12

1,37
1,88
2,27
3,17
4,58

1,35
1,82
2,16
2,98
4,24

1,30
1,67
1,93
2,55
3,49

1,27
1,57
1,79
2,30
3,07

1,23
1,46
1,62
2,01
2,59

Tabela 6-Valor-p por Valores de F-(Continuao)

Valor-p
2
1,44
2,44
3,23
5,18
8,25

3
1,42
2,23
2,84
4,31
6,60

4
1,40
2,09
2,61
3,83
5,70

5
1,39
2,00
2,45
3,51
5,13

1
6
1,37
1,93
2,34
3,29
4,73

8
1,35
1,83
2,18
2,99
4,21

10
1,33
1,76
2,08
2,80
3,87

20
1,28
1,61
1,84
2,37
3,15

40
1,24
1,51
1,69
2,11
2.73

1,19
1,38
1,51
1,80
2,23

40

0,250
0,100
0,050
0,010
0,001

1
1,36
2,84
4,08
7,31
12,60

60

0,250
0,100
0,050
0,010
0,001

1,35
2,79
4,00
7,08
12,00

1,42
2,39
3,15
4,98
7,76

1,41
2,18
2,76
4,13
6,17

1,38
2,04
2,53
3,65
5,31

1,37
1,95
2,37
3,34
4,76

1,35
1,87
2,25
3,12
4,37

1,32
1,77
2,10
2,82
3,87

1,30
1,71
1,99
2,63
3,54

1,25
1,54
1,75
2,20
2,83

1,21
1,44
1,59
1,94
2,41

1,15
1,29
1,39
1,60
1,89

120

0,250

1,34

1,40

1,39

1,37

1,35

1,33

1,30

1,28

1,22

1,18

1,10

630

0,100
0,050
0,010
0,001

2,75
3,92
6,85
11,40

2,35
3,07
4,79
7,32

2,13
2,68
3,95
5,79

1,99
2,45
3,48
4,95

1,90
2,29
3,17
4,42

1,82
2,17
2,96
4,04

1,72
2,02
2,66
3,55

1,65
1,91
2,47
3,24

1,48
1,66
2,03
2,53

1,37
1,50
1,76
2,11

1,19
1,25
1,38
1,54

0,250
0,100
0,050
0,010
0,001

1,32
2,71
3,84
6,63
10,80

1,39
2,30
3,00
4,61
6,91

1,37
2,08
2,60
3,78
5,42

1,35
1,94
2,37
3,32
4,62

1,33
1,85
2,21
3,02
4,10

1,31
1,77
2,10
2,80
3,74

1,28
1,67
1,94
2,51
3,27

1,25
1,60
1,83
2,32
2,96

1,19
1,42
1,57
1,88
2,27

1,14
1,30
1,39
1,59
1,84

1,00
1,00
1,00
1,00
1,00

631

Tabela 7
Durbin-Watson 1%
n
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
45
50
55
60
65
70
75
80
85
90
95
100

NVI=1
dL
dU
0,81
1,07
0,84
1,09
0,87
1,10
0,90
1,12
0,93
1,13
0,95
1,15
0,97
1,16
1,00
1,17
1,02
1,19
1,04
1,20
1,05
1,21
1,07
1,22
1,09
1,23
1,10
1,24
1,12
1,25
1,13
1,26
1,15
1,27
1,16
1,28
1,17
1,29
1,18
1,30
1,19
1,31
1,21
1,32
1,22
1,32
1,23
1,33
1,24
1,34
1,25
1,34
1,29
1,38
1,32
1,40
1,36
1,43
1,38
1,45
1,41
1,47
1,43
1,49
1,45
1,50
1,47
1,52
1,48
1,53
1,50
1,54
1,51
1,55
1,52
1,56

NVI=2
dL
dU
0,70
1,25
0,74
1,25
0,77
1,25
0,80
1,26
0,83
1,26
0,86
1,27
0,89
1,27
0,91
1,28
0,94
1,29
0,96
1,30
0,98
1,30
1,00
1,31
1,02
1,32
1,04
1,32
1,05
1,33
1,07
1,34
1,08
1,34
1,10
1,35
1,11
1,36
1,13
1,36
1,14
1,37
1,15
1,38
1,16
1,38
1,18
1,39
1,19
1,39
1,20
1,40
1,24
1,42
1,28
1,45
1,32
1,47
1,35
1,48
1,38
1,50
1,40
1,52
1,42
1,53
1,44
1,54
1,46
1,55
1,47
1,56
1,49
1,57
1,50
1,58

NVI=3
dL
dU
0,59
1,46
0,63
1,44
0,67
1,43
0,71
1,42
0,74
1,41
0,77
1,41
0,80
1,41
0,83
1,40
0,86
1,40
0,88
1,41
0,90
1,41
0,93
1,41
0,95
1,41
0,97
1,41
0,99
1,42
1,01
1,42
1,02
1,42
1,04
1,43
1,05
1,43
1,07
1,43
1,08
1,44
1,10
1,44
1,11
1,45
1,12
1,45
1,14
1,45
1,15
1,46
1,20
1,48
1,24
1,49
1,28
1,51
1,32
1,52
1,35
1,53
1,37
1,55
1,39
1,56
1,42
1,57
1,43
1,58
1,45
1,59
1,47
1,60
1,48
1,60

NVI=4
dL
dU
0,49
1,70
0,53
1,66
0,57
1,63
0,61
1,60
0,65
1,58
0,68
1,57
0,72
1,55
0,75
1,54
0,77
1,53
0,80
1,53
0,83
1,52
0,85
1,52
0,88
1,51
0,90
1,51
0,92
1,51
0,94
1,51
0,96
1,51
0,98
1,51
1,00
1,51
1,01
1,51
1,03
1,51
1,04
1,51
1,06
1,51
1,07
1,52
1,09
1,52
1,10
1,51
1,16
1,51
1,20
1,51
1,25
1,52
1,28
1,52
1,31
1,57
1,34
1,58
1,37
1,59
1,39
1,60
1,41
1,60
1,43
1,61
1,45
1,62
1,46
1,63

NVI=5
dL
dU
0,39
1,96
0,44
1,90
0,48
1,85
0,52
1,80
0,56
1,77
0,60
1,74
0,63
1,71
0,66
1,69
0,70
1,67
0,72
1,66
0,75
1,65
0,78
1,64
0,81
1,63
0,83
1,62
0,85
1,61
0,88
1,61
0,90
1,60
0,92
1,59
0,94
1,59
0,95
1,59
0,97
1,59
0,99
1,59
1,00
1,58
1,02
1,58
1,03
1,58
1,05
1,58
1,11
1,59
1,16
1,59
1,21
1,60
1,25
1,61
1,28
1,61
1,31
1,61
1,34
1,62
1,36
1,62
1,39
1,63
1,41
1,64
1,42
1,64
1,44
1,64

632

Tabela 7
Durbin-Watson 5%
n
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
45
50
55
60
65
70
75
80
85
90
95
100

NVI=1
dL
dU
1,08
1,36
1,10
1,37
1,13
1,38
1,16
1,39
1,18
1,40
1,20
1,41
1,22
1,42
1,24
1,43
1,26
1,44
1,27
1,45
1,29
1,45
1,30
1,46
1,32
1,47
1,33
1,48
1,34
1,48
1,35
1,49
1,36
1,50
1,37
1,50
1,38
1,51
1,39
1,51
1,40
1,52
1,41
1,52
1,42
1,53
1,43
1,54
1,43
1,54
1,44
1,54
1,48
1,57
1,50
1,59
1,53
1,60
1,55
1,62
1,57
1,63
1,58
1,64
1,60
1,65
1,61
1,66
1,62
1,67
1,63
1,68
1,64
1,69
1,65
1,69

NVI=2
dL
dU
0,95
1,54
0,98
1,54
1,02
1,54
1,05
1,53
1,08
1,53
1,10
1,54
1,13
1,54
1,15
1,54
1,17
1,54
1,19
1,55
1,21
1,55
1,22
1,55
1,24
1,56
1,26
1,56
1,27
1,56
1,28
1,57
1,30
1,57
1,31
1,57
1,32
1,57
1,33
1,58
1,34
1,58
1,35
1,59
1,36
1,59
1,37
1,59
1,38
1,60
1,39
1,60
1,43
1,62
1,46
1,63
1,49
1,64
1,51
1,65
1,54
1,66
1,55
1,67
1,57
1,68
1,59
1,69
1,60
1,70
1,61
1,70
1,62
1,71
1,63
1,72

NVI=3
dL
dU
0,82
1,75
0,86
1,73
0,90
1,71
0,93
1,69
0,97
1,68
1,00
1,68
1,03
1,67
1,05
1,66
1,08
1,66
1,10
1,66
1,12
1,66
1,14
1,65
1,16
1,65
1,18
1,65
1,20
1,65
1,21
1,65
1,23
1,65
1,24
1,65
1,26
1,65
1,27
1,65
1,28
1,65
1,29
1,65
1,31
1,66
1,32
1,66
1,33
1,66
1,34
1,66
1,38
1,67
1,42
1,67
1,45
1,68
1,48
1,69
1,50
1,70
1,52
1,70
1,54
1,71
1,56
1,72
1,57
1,72
1,59
1,73
1,60
1,73
1,61
1,74

NVI=4
dL
dU
0,69
1,97
0,74
1,93
0,78
1,90
0,82
1,87
0,86
1,85
0,90
1,83
0,93
1,81
0,96
1,80
0,99
1,79
1,01
1,78
1,04
1,77
1,06
1,76
1,08
1,76
1,10
1,75
1,12
1,74
1,14
1,74
1,16
1,74
1,18
1,73
1,19
1,73
1,21
1,73
1,22
1,73
1,24
1,73
1,25
1,72
1,26
1,72
1,27
1,72
1,29
1,72
1,34
1,72
1,38
1,72
1,41
1,72
1,44
1,73
1,47
1,73
1,49
1,74
1,51
1,74
1,53
1,74
1,55
1,75
1,57
1,75
1,58
1,75
1,59
1,76

NVI=5
dL
dU
0,56
2,21
0,62
2,15
0,67
2,10
0,71
2,06
0,75
2,02
0,79
1,99
0,83
1,96
0,86
1,94
0,90
1,92
0,93
1,90
0,95
1,89
0,98
1,88
1,01
1,86
1,03
1,85
1,05
1,84
1,07
1,83
1,09
1,83
1,11
1,82
1,13
1,81
1,15
1,81
1,16
1,80
1,18
1,80
1,19
1,80
1,21
1,79
1,22
1,79
1,23
1,79
1,29
1,79
1,34
1,77
1,38
1,77
1,41
1,77
1,44
1,77
1,46
1,77
1,49
1,77
1,51
1,77
1,52
1,77
1,54
1,78
1,56
1,78
1,57
1,78

633

Tabela 8
Kolmogorov-Smirnov

Tamanho
da
Amostra(n)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
25
30
35
Mais de 35

Nvel de Significncia( )
0,10
0,05

0,20

0,15

0,900
0,684
0,565
0,494
0,446
0,410
0,381
0,358
0,339
0,322
0,307
0,295
0,284
0,274
0,266
0,258
0,250
0,244
0,237
0,231
0,210
0,190
0,180
1,07/n

0,925
0,726
0,597
0,525
0,474
0,436
0,405
0,381
0,360
0,342
0,326
0,313
0,302
0,292
0,283
0,274
0,266
0,259
0,252
0,246
0,220
0,200
0,190
1,14/n

0,950
0,776
0,642
0,564
0,510
0,470
0,438
0,411
0,388
0,368
0,352
0,338
0,325
0,314
0,304
0,295
0,286
0,278
0,272
0,264
0,240
0,220
0,210
1,22/n

0,975
0,842
0,708
0,624
0,565
0,521
0,486
0,457
0,432
0,410
0,391
0,375
0,361
0,349
0,338
0,328
0,318
0,309
0,301
0,294
0,270
0,240
0,230
1,36/n

0,01
0,995
0,929
0,828
0,733
0,669
0,618
0,577
0,543
0,514
0,490
0,468
0,450
0,433
0,418
0,404
0,392
0,381
0,371
0,363
0,356
0,320
0,290
0,270
0,63/n

Bibliografia

634

1. BARBETTA, PEDRO ALBERTO; REIS, MARCELO MENEZES;


BORNIA, ANTONIO CEZAR. Estatstica para Cursos de Engenharia
e Informtica. So Paulo. Editora Atlas, 2004.
2. BARNETT, V. Sample Survey: Principies and Methods. 3nd Edition.
London: Arnold, 1974.
3. BOLFARINE, H ; BUSSAB, W. O. Elementos de Amostragem. So Paulo:
ABE-Projeto Fisher, 2005.
4. BOLFARINE, HELENO; SANDOVAL, MNICA CARNEIRO. Introduo
Inferncia Estatstica. Rio de Janeiro. Coleo Matemtica Aplicada, 2000.
5. BUSSAB. W. O. ; MORETTIN, P. A. Estatstica Bsica. 5ed. So Paulo. Saraiva,
2003.
6. CONOVER, W J. (1998) Practical Nonparametric Statistics. 3. ed.
New York: John Wiley.
7. COSTA, Giovani G . O. Curso de Estatstica Bsica. So Paulo.
Editora Atlas, 2011.
8. COSTA, Giovani G . O. ; GIANNOTTI, Juliana D. G. Estatstica
Aplicada ao Turismo. Volumes 1 e 2. 3 ed. Rio de Janeiro: Fundao
CECIERJ, 2010.
9. COSTA NETO, PEDRO LUIZ DE OLIVEIRA. Estatstica. Editora
Edgard Blcher Ltda. So Paulo, 2002.
10. CRESPO, ANTNIO ARNOT. Estatstica Fcil. So Paulo. Editora
Saraiva, 2000.
11. DE GROOT, M.H. ; SCHERVISH, MJ.

Probability and Staistics. 3ed.,

NewYork: Addison-//weley, 2002.


12. DURBIN, J., and WATSON, G. S. "Testing for Serial Correlation in
Least Squares Regression, I." Biometrika 37, 409428,1950.
13. DURBIN, J., and WATSON, G. S, G. S. "Testing for Serial Correlation
in Least Squares Regression, II." Biometrika 38, 159179,1951.

14. FREUND, JOHN E.; SIMON, GARY A. Estatstica Aplicada: economia,


administrao e contabilidade.Traduo: Alfredo Alves de farias. 9ed. Porto Alegre:
Bookman, 2000.
635

15. GAUSS, CARL FRIEDRICH. Theoria Motus Corporum Coelestium in


Sectionibus Conicis Solem Ambientium. Estados Unidos. Paperback,
2011.
16. HAIR, JOSEPH F.; ANDERSON, ROLPH E.; TATHAM, RONALD L.;
BLACK, WILLIAN C. Anlise Multivariada de Dados. Traduo:
AdonaiSchlup SabtAnna e Anselmo Chaves Neto. Porto Alegre:Bookman.,
5ed. 2005.
17. HOFFMANN, Rodolfo. (2006) Anlise de Regresso. 4. ed. So
Paulo: Hucitec.
18. JARQUE, CARLOS M.; BERA, ANIL K. "Efficient tests for normality,
homoscedasticity and serial independence of regression residuals".
Economics Letters 6 (3): 255259. doi:10.1016/0165-1765(80)900245,1980
19. JARQUE, CARLOS M.; BERA, ANIL K. "Efficient tests for normality,
homoscedasticity and serial independence of regression residuals:
Monte

Carlo

evidence".

Economics

Letters

(4):

313318.

doi:10.1016/0165-1765(81)90035-5, 1981
20. JARQUE, CARLOS M.; BERA, ANIL K. "A test for normality of
observations and regression residuals". International Statistical
Review 55 (2): 163172. JSTOR 1403192, 1987.
21. JUDGE; et al. Introduction and the theory and practice of
econometrics (3rd ed.). pp. 890892, 1982.
22. JOHNSON,

Richard;

WICHERN,

Dean.

Applied

Multivariate

Statistical Analysis. 6. ed. New Jersey: Prentice Hall, 2007.


23. JNIO, Joseph F. Hair ; BALIM, Barry; MONEY Artur H.; SAMOUEL,
Phillip. Fundamentos de Mtodos de Pesquisa em Administrao.
So Paulo: Bookman, 2010.
24. KOLMOGOROV, A. "Sulla determinazione empirica di una legge di
distribuzione" G. Inst. Ital. Attuari, 4, 83,1933
25. KUTNER,

MICHAEL;

NETER,

JOHN;

NACHTSHEIM,

CHRISTOPHER J.; LI, WILLIAN. Applied Linear Statistical Models. 5.


ed. New York: McGraw-Hill/Irwin, 2004.
26. LARSON, RON.; FARBER, BETSY. Estatstica Aplicada. So Paulo.
Pearson Prentice Halll, 2004.
636

27. LEVINE, DAVID M.; BERENSON, MARK L.. Estatstica: Teoria e


Aplicaes Usando Microsoft Excel em Portugus. Rio de Janeiro.
Livros Tcnicos e Cientficos S.A, 2000.
28. MAGALHES, M.N ; LIMA, A.C.P DE- Noes de Probabilidade e
Estatstica. 5ed... So Paulo: Ed. Edusp, 2005.
29. MOORE, DAVID S. A Estatstica Bsica e Sua Prtica. Traduo: Cristiana
Filizola Carneiro Pessoa.3ed. Rio de Janeiro: LTC, 2005.
30. MORETTIN, LUIZ GONZAGA. Estatstica Bsica. Volumes 1 e 2. So
Paulo. Perarson Makron Books, 2000.
31. MORETTIN, PEDRO A; TOLOI, CLLIA M. Sries Temporais. So
Paulo. 2. Ed. Editora Atual, 1987.
32. NETER, J., KUTNER, M.H., NACHTSHEM, C.J., WASSERMAN, W.
Applied Linear Regression Models. 3 ed., Irwin, 1996.
33. OLIVEIRA, FRANCISCO ESTEVAM MARTINS. Estatstica e Probabilidades.
So Paulo. Editora Atlas, 1999.
34. PESARAN, H. M and B. PESARAN. Working with Microfit 4.0:
Interactive

Economteric

Analysis.

London:

Oxford

University

Press,1997.
35. PESARAN, H; SHIN, Y. and SMITH, R. Bound testing approaches to
the

analysis

of

level

relationships.

Journal

of

Applied

conometrics.16, 289-326, 2001.


36. PESARAN, H; SHIN, Y. and SMITH, R. Bound testing approaches to
the analysis of level relationships. University of Cambridge, RevisedDAE Working,2000.
37. ROSS, Sheldon. A First Course in Probability. 7. ed. New Jersey:
Prentice Hall,2005.
38. ROSS, Sheldon. Introduction to Probability Models. 9. ed. New York:
Academic Press,2006.
39. SIEGEL, SIDNEY. Nonparametric Statistic for the Behavioral Sciences.
USA: McGraw-Hill, 1956.
40. SILVA, Nilza Nunes. Amostragem Probabilstica. 1. ed. So Paulo:
Edusp,1997.
637

41. SMAILES, JOANNE; McGrane, ANGELA.

Estatstica Aplicada

Administrao com Excel. So Paulo. Editora Atlas, 2002


42. VIEIRA, Snia. Bioestatstica-Tpicos Avanados. 2. ed. Rio de
Janeiro: Campus Elsevier, 2004.
43. VIEIRA, Snia. Estatstica para a qualidade. Rio de Janeiro: Campus
Elsevier,1999.
44. VIEIRA, Snia. Anlise da Varincia(ANOVA). So Paulo. Editora
Atlas, 2006.
45. SMIRNOV, N.V. "Tables for estimating the goodness of fit of empirical
distributions", Annals of Mathematical Statistic, 19, 279, 1948.

638