Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
AMOSTRAGEM
14.1 INTRODUO
CONFIABILIDADE DA AMOSTRA
A estimativa do tamanho da amostra um dos fatores determinantes para o sucesso de
uma Pesquisa Estatstica. O tamanho da amostra pode ser pequeno em relao
populao geral. Veremos formas especficas para o clculo da amostra mnima
necessria para dar confiana aos resultados obtidos.
Entretanto, existem dois fatores estatsticos que devem ser mantidos em mente:
- Quanto maior o tamanho da amostra, as informaes sobre a populao sero mais
precisas;
- Acima de determinado tamanho poucas informaes extras sobre a populao
podem ser obtidas, no entanto, o tempo e os custos aumentam.
PLANEJAMENTO DA AMOSTRA
A amostragem ideal para todo o estudo estatstico a Amostragem Aleatria Simples.
Em estatstica, um planejamento da amostra um plano definido completamente antes
da coleta de quaisquer dados e que tem por objetivo a obteno de uma amostra de uma
populao.
- Amostragem Sistemtica;
- Amostragem Estratificada;
Para resumir, aqui temos uma lista de verificao das principais etapas do projeto de uma
pesquisa:
3 + 5 + 7 + 9 + 11
= =7
5
e seu desvio padro :
( 3 7 ) 2 + (5 7 ) 2 + (7 7 ) 2 + (9 7 ) 2 + (11 7 ) 2
= = 8
5
4 5 6 7 6 7 8 8 9 10
Como cada amostra tem probabilidade 1/10, obtemos a seguinte Distribuio Amostral da
Mdia:
__ Probabilidade
Mdia X
4 1/10
5 1/10
6 2/10
7 2/10
8 2/10
9 1/10
10 1/10
PROBABILIDADE
0,2
6 7 8
0,1
4 5 9 10
0,0
4 5 6 7 8 9 10
MDIA
__
Observa-se que para X = 6, 7, 8 h uma probabilidade de 6/10 de uma Mdia Amostral
__
Tambm para mdia X = 5, 6, 7, 8 ou 9 h uma probabilidade de 8/10 de uma Mdia
4 + 5 + 6 + 6 + 7 + 7 + 8 + 8 + 9 + 10
__ = =7
X 10
(4 7 ) 2 + (5 7 ) 2 + (6 7 ) 2 + (6 7 ) 2 + (7 7 ) 2 + (7 7 ) 2 + (8 7 ) 2 + (8 7 ) 2 + (9 7 ) 2 + (10 7 ) 2
__ =
X 10
__ = 3
X
__
desvio padro , a Distribuio Normal de X tem mdia:
__ =
X
N n
__ = ou __ = .
X n X n N 1
- se __ for pequeno h uma boa chance que a Mdia da Amostra (ou Amostral)
X
da Populao
N n
O Fator chamado de Fator de Correo para Populao Finita.
N 1
N n 8 52 8 3 8.3 24
__ = . = = = =
X n N 1 2 5 1 2 4 2.4 8
__ = 3
X
(a) n = 10 e N = 200
(b) n = 10 e N = 500
(c) n = 10 e N = 2000
(d) n = 20 e N = 200
(e) n = 40 e N = 400
__
(c) Liste todas as amostras possveis e calcule as suas mdias X
J sabemos calcular a mdia e o desvio padro, mas temos tambm que saber a forma
da Distribuio Amostral.
Isso significa que para qualquer distribuio individual, podemos ter a distribuio normal
com a nica restrio que o tamanho da amostra seja grande, ou seja, acima de 30
amostras.
Questes Resolvidas:
, logo
A mdia da distribuio Amostral sempre igual mdia da Populao
__ = 20 .
X
1,4 1,4
__ = = = __ = 0,2
X n 49 7 X
(B) Qual a porcentagem das possveis mdias amostrais que diferiro por mais de 0,2
da mdia da Populao?
Como n > 30, podemos supor que a distribuio normal.
Temos:
__ = 0,2 e __ = 20
X X
F(X)
0,3413 0,3413
( -3 )( -2 )( - ) ( + )( +2 )( +3 )
__ __ __ __ __ __ __ __ __ __ __ __ __
X X X X X X X X X X X X X
Z1 Z2 Z
19,8 20 0,2
Z1 = = = 1 I Z 1 = 0,3413
0,2 0,2
20,2 20 0,2
Z2 = = =1 I Z 2 = 0,3413
0,2 0,2
1- Um fabricante de baterias alega que seu artigo, de primeira categoria, tem uma vida
3- Determine a mdia da distribuio de mdias amostrais, dada cada uma das seguintes
mdias populacionais:
(a) 5,01
(b) 199,5
seguintes casos:
comemorativas. A espessura mdia das moedas de 0,2 cm, com desvio padro
(c) Qual a probabilidade de se obter uma mdia amostral que se afaste por mais de
Quando decidimos usar mtodos de Amostragem para chegar a uma deciso sobre a
varivel investigada, devemos definir rigorosamente nossos conceitos e procedimentos.
Uma vez nasceu, em um dos hospitais, duas vezes mais meninos do que meninas (67%
meninos e 33% meninas). Em qual dos hospitais provvel que isso tenha ocorrido?
claro que foi no menor.
As amostras muito pequenas so inteis por que no do, em geral, boas estimativas.
No entanto amostras muito grandes, porm mal feitas, so piores porque do a iluso de
conter a verdade.
__
1- Para muitas populaes, a distribuio de mdias amostrais X tende a ser
consistente (apresenta menor variao) do que as distribuies de outras
estatsticas amostrais (mediana ou moda)
__
2- A mdia amostral X tende a centrar-se em torno da mdia populacional .
__ __
X1 __ X6
__ X5
X3
__
X4 __
__ X8
X2 __
X7
__
Quando usamos a mdia X para estimar a mdia populacional e fazemos uma
estimativa pontual no temos qualquer indicao de quo boa essa estimativa. Para
isso foi desenvolvido outro tipo de estimativa que efetivamente indica quo boa uma
estimativa pontual.
Para tanto usa-se a probabilidade , que corresponde rea na curva normal, a qual
pela simetria da curva divide-se em duas partes como aparece sombreada na curva
abaixo:
/2 Z=0 /2
EXEMPLO
90%
95%
99%
0,45 0,45
/2=0.05
/2=0,05
/2=0.025
0,495 0,495
/2=0.005
/2=0.005
FRMULA
E = Z / 2
n
Esta frmula s pode ser usada quando conhecemos (Desvio Padro da Populao).
Intervalo de confiana (ou estimativa intervalar) para a mdia populacional (com base
em grandes amostras: n > 30) :
__ __
X E X + E , onde:
E = Z / 2
n
2 - Calcular a margem de erro E = Z / 2 . Se o desvio padro da populao no for
n
conhecido, utilizar o desvio padro da amostra S, desde que n > 30.
__ __
3 - Com a margem de erro e o valor da mdia amostral X , calcular os valores X E e
__
X + E . Levar esses valores na expresso do intervalo de confiana.
__ __
X E X +E
__ E
ou = X ou (X E; X + E).
69,9 69,9 72,6 70,2 70,0 71,8 70,6 72,8 69,0 68,4
60,0 68,4 68,3 69,6 71,7 69,2 70,8 71,0 70,4 66,8
70,4 66,8 69,9 69,2 70,5 70,2 70,0 70,8 72,6 70,6
72,8 70,8 70,2 71,7 70,0 68,3 66,8 69,9 69,0 69,4
70,4 69,4 69,9 70,0 71,7 70,2 70,8 72,8 71,0 69,9
a- 99%
b- 94%
c- 98%
d- 92%
e- 96%
3 - Use o grau de confiana e os valores amostrais dados para achar a margem de erro e
o intervalo de confiana para a mdia populacional .
__
a- Altura das alunas: 95% de confiana, n = 50, X = 164, S = 4,5
__
b- Mdias das notas: 99% de confiana, n = 70, X = 7,0, S = 0,88
__
c- Notas de um teste: 90% de confiana, n = 150, X = 77,6 , S = 14,6
__
d- Salrio da Policia: 92% de confiana, n = 64, X = R$ 1200,00 , S = R$
80,00
4 - A partir de uma amostra de 35 crnios de homens egpcios que viveram por volta de
1850 AC mede-se a largura mxima de cada crnio, obtendo-se:
__
X = 134,5 mm e S = 3,48 mm. Com esses dados amostrais construa um intervalo de
95% de confiana para a mdia populacional .
Suponha que estamos definindo um procedimento para uma pesquisa cientifica. Como
sabemos quantos elementos da Populao devem ser escolhidos?
Suponha, por exemplo, que queiramos estimar a renda mdia de pessoas que concluram
um curso superior, no primeiro ano aps a formatura. Quantas rendas devemos incluir em
nossa amostra?
2
Z .
n= /2
E
O nmero da amostra deve ser um nmero inteiro, quando isso no ocorre devemos
arredondar usando o nmero inteiro mais prximo para cima.
EXEMPLO:
2 2
Z . 1,96 . 100
n= / 2 = = 96,04 97 valores de renda
E 20
__
Com tal amostra teremos 95% de confiana de que a mdia amostral X difira em menos
de R$ 20,00 da verdadeira mdia populacional,
__ __ __ __
X E X + E X 20 X + 20
RT 400
= = = 100
4 4
PEQUENAS AMOSTRAS
Neste caso:
__
A melhor estimativa continua sendo a partir de X .
Usaremos intervalo de confiana a partir da curva normal com a mesma margem de erro
do captulo anterior.
X
t=
S
n
EXEMPLO
A soma das 10 notas deve ser 800, de modo que a 10 deve ser igual a 800 menos a
soma das 9 primeiras.
S
E =t / 2 onde t / 2 tem (n - 1) graus de liberdade
n
__ __
X E X +E
Suponhamos que tenhamos feito teste de coliso de 12 carros de um tipo A cujo preo
de venda seja R$ 59.000,00 sob diversas condies que simulam colises tpicas.
SOLUO:
__
a- A melhor estimativa pontual de o valor X , neste caso R$ 26.000,00.
- n 30 (n=12)
Ento:
S 15000
E =t / 2 E = 2,201 . = 9.530,61
n 12
Com base nesse resultado, temos 95% de confiana de que os limites 16490 e 35530
contem o valor da mdia populacional .
Esse exemplo real e trata de um carro americano, dos mais caros para consertar em
caso de coliso.
a- 98% e n=10
b- 98% e n=21
c- 95% e n=16
d- 90% e n=8
EXEMPLO:
J sabemos que Q=1-P; podemos associar que Q^= 1-P^, desta forma:
P= Proporo Populacional
FRMULAS
Estimativa Pontual
P ^ Q^
E = Z / 2
n
P^ E P P^ + E
P = P^ E ou (P^ - E; P^ + E)
EXEMPLO:
SOLUO:
A- A estimativa pontual de P :
X 673
P^ = = = 0,630
n 1068
e Q^ = 1 P^ Q^ = 1 0,63 = 0,37
P ^ Q^
Se E = Z / 2
n
Podemos definir:
2
Z / 2 . P^ . Q^
n=
E2
2
Z / 2 . 0,25
n=
E2
A- Suponha que tenhamos uma estimativa de P^ com base em estudos anteriores que
mostrou que 18% dos motoristas falam ao telefone dirigindo.
B- Suponha que no tenhamos qualquer informao que possa sugerir um valor de P^.
SOLUO:
A- P^ = 0,18 e Q^ = 0,82
2
Z / 2 . P^ . Q^ 1,96 2 . 0,18 . 0,82
n= = = 631 (arredondado para cima)
E2 0,03 2
2
Z / 2 . 0,25 1,96 2 . 0,25
n= = = 1068 (arredondado para cima)
E2 0,03 2
SOLUO:
2
Z / 2 . 0,25 1,96 2 . 0,25
n= = = 1985 (arredondado para cima)
E2 0,022 2
3- Utilize os dados abaixo para determinar o tamanho da amostra necessria para estimar
uma proporo ou porcentagem populacional:
4- A Ita seguros deseja estimar a porcentagem dos motoristas que trocam fita ou CD
enquanto dirigem. Uma amostra de 850 motoristas acusou 544 que trocam fitas ou CD
quando dirigem.
(n 1) . S 2
X2 = , onde:
2
n tamanho da amostra
S varincia amostral
varincia populacional
Denotamos Qui-Quadrado por .
Para achar os valores crticos dos valores Qui-Quadrado, recorremos Tabela 1 a seguir.
A Distribuio Qui-Quadrado determinada pelo nmero de graus de liberdade. Neste
capitulo utilizamos (n-1) graus de liberdade.
Propriedades da Distribuio Qui-Quadrado.
1- A Distribuio Qui-Quadrado no simtrica ao contrrio das distribuies Normal
e t de Student. Na medida que aumenta o nmero de graus de liberdade, a
GL=10
GL=20
5 10 15 20 25 30 35 40 45
2 2 2 2 2 2 2 2 2 2 2 2 2
X X X X X X X X X X X X X
v 0,995 0,99 0,975 0,95 0,90 0,75 0,50 0,25 0,10 0,05 0,025 0,01 0,005
1 7,88 6,63 5,02 3,84 2,71 1,32 0,455 0,102 0,0158 0,0039 0,0010 0,0002 0,0000
2 10,6 9,21 7,38 5,99 4,61 2,77 1,39 0,575 0,211 0,103 0,05,6 0,0201 0,0100
3 12,8 11,3 9,35 7,81 6,25 4,11 2,37 1,21 0,584 0,352 0,216 0,115 0,072
4 14,9 13,3 11,1 9,49 7,78 5,39 3,36 1,92 1,06 0,711 0,484 0,297 0,207
5 16,7 15,1 12,8 11,1 9,24 6,63 4,35 2,67 1,61 1,15 0,831 0,554 0,412
6 18,5 16,8 14,4 12,6 10,6 7,84 5,35 3,45 2,20 1,64 1,24 0,872 0,676
7 20,3 18,5 16,0 14,1 12,0 9,04 6,35 4,25 2,83 2,17 1,69 1,24 0,989
8 22,0 20,1 17,5 15,5 13,4 10,2 7,34 5,07 3,49 2,73 2,18 1,65 1,34
9 23,6 21,7 19,0 16,9 14,7 11,4 8,34 5,90 4,17 3,33 2,70 2,09 1,73
10 25,2 23,2 20,5 18,3 16,0 12,5 9,34 6,74 4,87 3,94 3,25 2,56 2,16
11 26,8 24,7 21,9 19,7 17,3 13,7 10,3 7,58 5,58 4,57 3,82 3,05 2,60
12 28,3 26,2 23,3 21,0 18,5 14,8 11,3 8,44 6,30 5,23 4,40 3,57 3,07
13 29,8 27,7 24,7 22,4 19,8 16,0 12,3 9,30 7,04 5,89 5,01 4,11 3,57
14 31,3 29,1 26,1 23,7 21,1 17,1 13,3 10,2 7,79 6,57 5,63 4,66 4,07
15 32,8 30,6 27,5 25,0 22,3 18,2 14,3 11,0 8,55 7,26 6,26 5,23 4,60
16 34,3 32,0 28,8 26,3 23,5 19,4 15,3 11,9 9,31 7,96 6,91 5,81 5,14
17 35,7 33,4 30,2 27,6 24,8 20,5 16,3 12,8 10,1 8,67 7,56 6,41 5,70
18 37,2 34,8 31,5 28,9 26,0 21,6 17,3 13,7 10,9 9,39 8,23 7,01 6,26
19 38,6 36,2 32,9 30,1 27,2 22,7 18,3 14,6 11,7 10,1 8,91 7,63 6,84
20 40,0 37,6 34,2 31,4 28,4 23,8 19,3 15,5 12,4 10,9 9,59 8,26 7,43
21 41,4 38,9 35,5 32,7 29,6 24,9 20,3 16,3 13,2 11,6 10,3 8,90 8,03
22 42,8 40,3 36,8 33,9 30,8 26,0 21,3 17,2 14,0 12,3 11,0 9,54 8,64
23 44,2 41,6 38,1 35,2 32,0 27,1 22,3 18,1 14,8 13,1 11,7 10,2 9,26
24 45,6 43,0 39,4 36,4 33,2 28,2 23,3 19,0 15,7 13,8 12,4 10,9 9,89
25 46,9 44,3 40,6 37,7 34,4 29,3 24,3 19,9 16,5 14,6 13,1 11,5 10,5
26 48,3 45,5 41,9 38,9 35,6 30,4 25,3 20,8 17,3 15,4 13,8 12,2 11,2
27 49,6 47,0 43,2 40,1 36,7 31,5 26,3 21,7 18,1 16,2 14,6 12,9 11,8
28 51,0 48,3 44,5 41,3 37,9 32,6 27,3 22,7 18,9 16,9 15,3 13,6 12,5
29 52,3 49,6 45,7 42,6 39,1 33,7 28,3 23,6 19,8 17,7 16,0 14,3 13,1
30 53,7 50,9 47,0 43,8 40,3 34,8 29,3 24,5 20,6 18,5 16,8 15,0 13,8
40 66,8 63,7 59,3 55,8 51,8 45,6 39,3 33,7 29,1 26,5 24,4 22,2 20,7
50 79,5 76,2 71,4 67,5 63,2 56,3 49,3 42,9 37,7 34,8 32,4 29,7 28,0
60 92,0 88,4 83,3 79,1 74,4 67,0 59,3 52,3 46,5 43,2 40,5 37,5 35,5
70 104,2 100,4 95,0 90,5 85,5 77,6 69,3 61,7 55,3 51,7 48,8 45,4 43,3
80 116,3 112,3 106,0 101,9 96,6 88,1 79,3 71,1 64,3 60,4 57,2 53,5 51,2
90 128,3 124,1 118,1 113,3 107,6 98,6 89,3 80,6 73,3 69,1 65,6 61,8 59,2
100 140,2 135,8 129,6 124,3 118,5 109,1 99,3 90,1 82,4 77,9 74,2 70,1 67,3
0,025
0,025
Estimadores de
(n 1) . S 2 (n 1) . S 2
< <
2
X 2R X L2
(n 1) . S 2 (n 1) . S 2
<<
X 2R X L2
Com uma rea total dividida igualmente entre as extremidades de uma distribuio Qui-
Quadrado, X2L denota o valor crtico da extrema esquerda e X2R denota o valor crtico da
extrema direita.
EXEMPLO:
35,8 35,0 36,8 36,1 34,2 35,2 36,6 35,0 33,6 34,2 (gramas)
Calculamos:
__
X = 35,25 e S = 1,070 superior ao desejado 0,60.
Com uma amostra de 10 valores, temos 9 graus de liberdade. Com o grau de confiana
de 95%, dividimos = 0,05 igualmente entre as duas caudas de distribuio e
localizamos os valores 0,975 e 0,025 na linha superior. Os valores crticos de X2L e X2R na
tabela so:
X2L = 2,70
X2R = 19,0
__
e X = 35,25 e S = 1,070
n = 10
Aplicamos a frmula
(n 1) . S 2 (n 1) . S 2
< 2
<
X 2R X L2
Com base nesses resultados parece que o desvio padro populacional sempre superior
ao desejado = 0,60 mostrando que o peso dos bombons deve ser mais consistente.
a- 95% n = 26
b- 90% n = 60
c- 99% n = 17
d- 95% n = 50
confiana para o desvio padro populacional . Em cada caso admita que a populao
__
a- Altura das alunas: 95% de confiana, n = 10, X = 164 , S = 4,5
__
b- Mdias das notas: 99% de confiana, n = 15, X = 7,0 , S = 0,88
__
c- Notas de um teste: 95% de confiana, n = 16, X = 77,6 , S = 14,2
__
d- Salrio da Polcia: 92% de confiana, n = 19, X = R $ 1200,00 , S= R$ 80,00
J foi visto como uma amostra pode ser usada para desenvolver estimativas
pontuais e do intervalo dos parmetros da populao. Agora, continuaremos a discusso
da inferncia estatstica mostrando como o teste de hipteses pode ser usado para
determinar se uma declarao sobre o valor de um parmetro da populao deve ser
rejeitado.
O objetivo aqui mostrar como o teste de hipteses pode ser conduzido sobre uma
mdia da populao. Comearemos dando exemplos que ilustram abordagens para
desenvolver as hipteses nula e alternativa.
Seja 0 denotando o valor numrico especfico que est sendo considerado nas
hipteses nula e alternativa. Em geral, um teste de hipteses ao redor dos valores de uma
mdia de populao precisa tomar uma das seguintes trs formas:
H0 : 0 H0 : 0 H0 : = 0
Ha : < 0 Ha : > 0 Ha : 0
2. Devido aos tempos e aos altos custos das mudanas de turno, um diretor de
fabricao precisa convencer a administrao de que um proposto mtodo de
fabricao reduz os custos antes que o novo mtodo seja implementado. O mtodo
corrente de produo opera com um custo mdio de US$ 220 por hora. Uma pesquisa
est para ser realizada em que o custo do novo mtodo ser medido com relao a um
perodo de produo da amostra.
A primeira linha da tabela acima mostra o que pode acontecer quando a concluso
aceitar H0. Como tanto H0 como Ha so verdadeiras, se H0 verdadeira e a concluso
aceitar H0, essa concluso correta. No entanto se Ha verdadeira e a concluso
aceitar H0, comete-se um erro do Tipo II; isto , aceita-se H0 quando ela falsa. A
segunda linha da tabela acima mostra o que acontece quando a concluso para rejeitar
H0. Nesse caso, se H0 verdadeira, comete-se um erro do Tipo I; isto , rejeitamos H0
quando ela verdadeira. No entanto, se Ha verdadeira e a concluso rejeitar H0, essa
concluso correta.
Embora no possamos eliminar a possibilidade de erros no teste de hipteses,
podemos considerar as possibilidades de suas ocorrncias. Usando a notao usual de
estatstica, denotamos as possibilidades de se cometer os dois erros como segue:
H0 : 24
Ha : > 24
A hiptese alternativa Ha : > 24, indica que os pesquisadores esto procurando por uma
evidncia de amostra que confirmar a concluso de que a mdia de quilmetros por litro
maior que 24.
Nesta aplicao, o erro do Tipo I de rejeitar H0 quando ela verdadeira
corresponde aos pesquisadores afirmarem que o novo motor melhora a mdia de
quilmetros por litro ( > 24) quando de fato o novo motor no nada melhor do que o
motor em uso. Em contraste, o erro do Tipo II de aceitar H0 quando ela falsa
corresponde aos pesquisadores conclurem que o novo motor no nada melhor do que
o motor em uso ( 24) quando de fato o novo motor melhora o desempenho de
quilmetros por litro.
Na prtica, a pessoa que conduz o teste de hipteses especifica a probabilidade
mxima permissvel de se cometer o erro do Tipo I, chamado de nvel de significncia
para o teste. Escolhas comuns para o nvel de significncia so 0,05 e 0,01. Referindo-se
segunda linha da tabela acima, observe que a concluso de rejeitar H0 indica que tanto
um erro do Tipo I como uma concluso correta foram feitos. Assim, se a probabilidade de
se cometer um erro do Tipo I controlada por selecionar um pequeno valor para o nvel
de significncia, temos um alto grau de confiana de que a concluso para rejeitar H0 est
correta. Em tais casos, temos o suporte estatstico para concluir que H0 falsa e que Ha
verdadeira. Qualquer ao sugerida pela hiptese alternativa Ha apropriada.
Embora a maioria das aplicaes de teste de hipteses esteja atenta
probabilidade de se cometer um erro do Tipo I, nem sempre esto atentas probabilidade
de se cometer um erro do Tipo II. Por isso se decidimos aceitar H0 no podemos
determinar quo confiantes podemos estar com aquela deciso. Por causa da incerteza
associada com o cometer o erro do Tipo II, os estatsticos freqentemente recomendam
que usemos a declarao no rejeitar H0 em vez de aceitar H0. Usar a declarao
no rejeitar H0 inclui a recomendao para reter tanto o julgamento como a ao. Com
1. O rtulo em um recipiente de trs quartos de suco de laranja indica que esse suco
contem uma mdia de um grama de gordura ou menos. Responda s seguintes
questes para um teste de hipteses que poderia ser usado para testar a declarao
no rtulo.
Um resumo das etapas que podem ser aplicadas a qualquer teste de hipteses
apresentado a seguir:
1. Determinar as hipteses nula e alternativa que so apropriadas para a aplicao.
2. Selecionar a estatstica de teste que ser usada para decidir rejeitar ou no a
hiptese nula.
3. Especificar o nvel de significncia para o teste.
4. Usar o nvel de significncia para desenvolver a regra de rejeio que indica os
valores da estatstica de teste que levar rejeio de H0.
5. Coletar os dados amostrais e calcular o valor da estatstica de teste.
6. Comparar o valor da estatstica do teste com o(s) valor(es) crtico(s0
especificado(s) na regra de rejeio para determinar se H0 deve ser rejeitada.
sadio doente
14 18
Xi ~ N(, 36),
Onde:
2 = 62 = 36 e,
= 14 ou = 18 dependendo se o tratamento for eficiente ou no.
H0 : o tratamento no eficaz
Ha : o tratamento eficaz
Ou seja,
H0 : = 18 Hipteses
Ha : = 14 Simples
Se o tratamento for eficaz, ento uma amostra com 30 indivduos podem ser vistos como
membros da populao com concentrao modelada por uma normal N(14,36); caso
contrrio, eles pertencero populao N(18,36).
No teste teremos:
__ __
- X mdia amostral ( X um estimador de )
__
- a tomada de deciso ser baseada no valor observado, denotado por x obs
- n = 30 (tamanho da amostra)
2
N(, 36/30) (lembrando que s = e s2 = )
n n
__
(1) Mesmo quando = 14, X pode apresentar valores maiores que 14, e,
__
P( X > 14 =14) = 0,5 (pela simetria)
(2) Um critrio que pode ser utilizado, para decidir sobre o valor de , determinar um
valor crtico, xC, tal que,
__
se X > xC a amostra pertence populao com = 18, ou seja,
o tratamento no eficaz.
__
(3) Quando X xC a amostra pertence populao com = 14, ou seja,
o tratamento eficaz.
= 14 = 18
__
x obs
xC
Lembrando que:
Sadio Ha Doente H0
14 18
xC
Regio de Regio de
Rejeio de H0 Aceitao de H0
xC -18 6
zC = xC =18 + zC .
6 30
30
=0,05
18
para 0,05 em uma das caudas, por simetria, temos uma rea total nas duas caudas igual
a 0,10, logo
Portanto:
6
xC =18 + (1,645) =16,1980 xC 16,20
30
14 18
16,20
Regio de
Rejeio ou
Regio Crtica (RC)
RC = {x |R : x < 16,20}
(Teste Unilateral)
xC1 0 xC2
__ __
= P( X < xC1 ou X > xC2), onde:
__
__
= P( X < xC1) e = P( X > xC2)
2 2
logo,
15,85 18 20,15
Uma varivel aleatria tem distribuio normal e desvio-padro 12. Estamos testando se a
sua mdia igual ou diferente de 20 e coletamos uma amostra de 100 valores dessa
varivel, obtendo uma mdia amostral de 17,4.
(a) H0 : = 20
Ha : 20
xC1 0 xC2
__
__
= P( X < xC1) e = P( X > xC2)
2 2
logo,
12 12
xC1 = 20 + zC1 . e xC1 = 20 + zC2 .
100 100
12 12
xC1 = 20 + (2,576) . e xC1 = 20 + (2,576) .
100 100
xC1 =16,91 e xC2 = 23,09
Portanto:
para = 1% RC = {x |R : x < 16,91 ou x > 23,09}
no rejeitar H0 pois 17,4 RC
16,91 20 23,09
17.1 INTRODUO
Assim, quando consideramos variveis como peso e altura de um grupo de pessoas, uso
do cigarro e incidncia do cncer, a potncia gasta e a temperatura da gua no chuveiro,
procuramos verificar se existe alguma relao entre as variveis de cada um dos pares e
qual o grau dessa relao.
Quando duas variveis esto ligadas por uma relao estatstica, dizemos que existe
uma correlao entre elas.
Consideremos uma amostra aleatria, formada por 98 alunos de uma classe de uma
Universidade e pelas notas obtidas por eles em matemtica e estatstica:
NOTAS
N MATEMTICA ESTATSTICA
(xi) (yi)
01 5,0 6,0
08 8,0 9,0
24 7,0 8,0
38 10,0 10,0
44 6,0 5,0
58 7,0 7,0
59 9,0 8,0
72 3,0 4,0
80 8,0 6,0
92 2,0 2,0
.
o
8 . o o
. o
6 . o o
. o
4 . o
2 . o
. . . . . . . . . .
2 4 6 8 10 xi
Podemos imaginar que, quanto mais fina for a elipse mais ela se aproximara de uma reta.
Dizemos, ento, que a correlao de forma elptica tem como imagem uma reta, sendo,
por isso denominada de correlao Linear.
yi
10 . RETA IMAGEM o
.
o
8 . o o
. o
6 . o o
. o
4 . o
2 . o
. . . . . . . . . .
2 4 6 8 10 xi
Como a correlao em estudo tem como imagem uma reta ascendente, ela e chamada
de correlao Linear Positiva.
o
oo
ooo
oo
ooooo correlao positiva
ooo
ooooo
oo
o
oo
o
oo
ooo
oo
ooooo correlao negativa
ooo
ooooo
oo
o
oo
o
o oo
oo oooo
ooo oo
oo ooo
ooooo o correlao no linear
ooo oooo
ooooo ooo
oo oo
o oooo
oo ooo
oo
o o o o
o o o oooo ooo o ooo
oo ooo oooo oooo oooo o no h correlao
o oo ooo ooooo o
o ooo oo o
ooooo
Onde:
n = nmero de observaes
Os valores limites de r so -1 e +1, isto , o valor de r pertence ao intervalo [ -1 e +1].
Assim:
NOTAS
- Para que uma relao possa ser descrita por meio do Coeficiente de
correlao de Person imprescindvel que ela se aproxime de uma funo
Linear. Uma maneira prtica de verificarmos a linearidade da relao a
inspeo do Diagrama de Disperso: se a elipse apresenta salincias ou
reentrncias muito acentuadas, provavelmente trata-se de uma relao
curvilnea.
- Para podermos tirar algumas concluses significativas sobre o comportamento
simultneo das variveis analisadas, necessrio que:
0,6 | r | 1
Se 0,3 | r | < 0,6, h uma correlao relativamente fraca entre as variveis.
Se 0 < | r | < 0,3, a correlao muito fraca e, praticamente, nada podemos
concluir sobre a relao entre as variveis em estudo.
MATEMTICA ESTATSTICA
(xi) (yi) xi yi x i2 y i2
5,0 6,0 30 25 36
8,0 9,0 72 64 81
7,0 8,0 56 49 64
10,0 10,0 100 100 100
6,0 5,0 30 36 25
7,0 7,0 49 49 49
9,0 8,0 72 81 64
3,0 4,0 12 09 16
8,0 6,0 48 64 36
2,0 2,0 04 04 04
=65 =65 =473 =481 =475
Logo:
10 . 473 65 . 65 505 505
r= = = = 0,911
[4810 4225 ][4750 4225 ] 585 . 525 554,18
Da: r = 0,91 - Resultado que indica uma correlao linear positiva altamente significativa
entre as duas variveis.
mdias. Quando utilizamos taxas ou mdias para os dados, suprimimos a variao entre
inflacionado.
xi 4 6 8 10 12
yi 12 10 8 12 14
Temos:
(xi) (yi) xi yi x i2 y i2
4,0 12,0
. .
.
....
12,0 14,0
= = = = =
Logo:
. .
r= = = =
[ ][ ] .
ONDE: r =
(xi) (yi) xi yi x i2 y i2
34 21
30 22
40 25
34 28
39 15
35 24
42 24
45 22
43 17
= = = = =
B-
(xi) (yi) xi yi x i2 y i2
3,9 46
4,6 46
6,0 52
2,8 50
3,1 48
3,4 40
4,2 42
4,0 44
= = = = =
1 AVALIAO 2 AVALIAO
estudante (xi) (yi) xi yi x i2 y i2
1 82 92
2 84 91
3 86 90
4 83 92
5 88 87
6 87 86
7 85 89
8 83 90
9 86 92
10 85 90
11 87 91
= = = = =
4- Com os dados abaixo, sobre crimes violentos e a temperatura mdia entre 21 e 2 horas
das noites de sbado numa grande comunidade, monte o grfico para os dados e calcule
o coeficiente de correlao.
18.1 INTRODUO
Podemos dizer que a anlise de regresso tem por objetivo descrever, atravs de um
modelo matemtico, a relao entre duas variveis, partindo de n observaes das
mesmas.
A varivel sobre a qual desejamos fazer uma estimativa recebe o nome de varivel
dependente e a outra recebe o nome de varivel independente.
Assim, supondo X a varivel independente e Y a dependente, vamos procurar determinar o ajustamento de uma reta
relao entre essas variveis.
Exemplo:
Variao percentual do PIB, no Brasil
1991 1,03
1992 -0,54
1993 4,92
1994 5,85
1995 4,22
1996 2,76
1997 3,68
1998* 0,15
Grfico de linhas
Variao percentual do PIB, no Brasil
7,00
6,00
5,00
Variao do PIB
4,00
3,00
2,00
1,00
0,00
1991 1992 1993 1994 1995 1996 1997 1998*
-1,00
825 3,50
215 1,00
1070 4,00
550 2,00
480 1,00
920 3,00
1350 4,50
325 1,50
670 3,00
1215 5,00
Diagrama de Disperso
Tempo de entrega de dez carregamentos em funa da
distncia rodoviria
6
Tempo de entrega
0
0 200 400 600 800 1000 1200 1400 1600
Distncia
Y = + X.
Reta de regresso
Y = + X
= tg
X
Y = + X + ,
xy n
x y
_ _
= = y x
2 ( x)
2
x n
X Y XY X2 Y2
6
Tempo de entrega
0
0 200 400 600 800 1000 1200 1400 1600
Distncia
EXERCCIO:
1- A tabela abaixo apresenta o tempo, em meses, que seis pessoas esto trabalhando na
inspeo de carros e o nmero de carros que elas inspecionaram em uma tarde de
trabalho. Ajuste uma reta de regresso aos dados e calcule o coeficiente de
determinao. Se uma pessoa tivesse trabalhado dez meses, quantos caros ela teria
inspecionado?
Exerccio:
Nmero de carros inspecionados, segundo o
tempo de servio, em meses, de seis pessoas
5 16
1 15
7 19
9 23
2 14
12 21
BIBLIOGRAFIA BSICA
CRITRIOS DE AVALIAO
P1 : / / 2013 FEIRA
P2 : / / 2013 FEIRA
Sub : / / 2013 FEIRA
Rec. : / / 2013 FEIRA
Estatstica Descritiva
Probabilidade
Variveis Aleatrias Discretas e Contnuas
Distribuio e Parmetros de Varivel Aleatria
Distribuies Discretas e Distribuies Contnuas
Distribuies Amostrais
Estimao por Ponto
Estimao por Intervalo
Inferncia Estatstica
Regresso Linear