Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Mtodos Estatsticos
Mtodos Estatsticos
Estatstica Descritiva
Inferncia Estatstica
Estimao
Teste de Hipteses
TESTE DE HIPTESES
Eu acredito que 30% da populao careca.
Populao
Amostra Aleatria
Proporo
= 0.05 p
Estimao
Qual a probabilidade de cara no lanamento de uma moeda? Qual a proporo de votos que o candidato A ter na prxima eleio? Qual a proporo de motoristas habilitados de SP que tiveram suas carteiras apreendidas aps a vigncia da nova lei de trnsito?
Teste de Hipteses
A moeda honesta ou desequilibrada? O candidato A vencer a eleio? A proporo dos motoristas habilitados de SP que tiveram suas carteiras apreendidas aps a nova lei maior que 2% ou no?
5
Introduo
Em estimao, o objetivo estimar o valor desconhecido de um parmetro, por exemplo, a proporo p de indivduos em uma populao com determinada caracterstica. A estimativa baseada no nmero x de indivduos com a caracterstica numa amostra aleatria de tamanho n. Entretanto, se o objetivo for saber se o valor observado x nessa amostra d ou no suporte a uma conjectura sobre o valor de p, trata-se de um teste de hipteses.
6
Exemplo 1: Queremos avaliar se uma moeda honesta. Ou seja, queremos testar a hiptese nula H: a moeda honesta contra a hiptese alternativa A: a moeda no honesta.
Em linguagem estatstica, essas hipteses podem ser reescritas como:
H: p = 0,5 A: p 0,5
Hipteses
De maneira geral, uma hiptese estatstica uma afirmao ou conjectura sobre um parmetro da distribuio de probabilidades de uma varivel aleatria. No caso especial de teste de hipteses sobre a proporo populacional p, temos: Hiptese nula: afirmao sobre p geralmente relacionada a um valor de referncia, ou a uma especificao padro ou histrica. Hiptese alternativa: afirmao sobre p que suspeitamos ser verdadeira.
8
No nosso exemplo, o parmetro a probabilidade p de sair cara. Se consideramos 12 lanamentos independentes da moeda e denotamos por X o nmero de caras obtidas nesses lanamentos, ento
Se observarmos 5 caras em 12 lanamentos independentes da moeda, o que podemos concluir? E se observarmos 4 caras? Ou 10 caras? Podemos considerar uma regra de deciso, por exemplo, Se nos 12 lanamentos da moeda, observarmos 0,1, 2, 3, 9, 10, 11 ou 12 caras, ento rejeitamos a hiptese nula H de que a moeda honesta. Caso contrrio, no rejeitamos a hiptese H.
10
Testar uma hiptese estatstica estabelecer uma regra que nos permita, com base na informao de uma amostra, decidir pela rejeio ou no de H. No exemplo, segundo a regra de deciso, o conjunto de valores de X que levam rejeio da hiptese nula H {0, 1, 2, 3, 9, 10, 11, 12}. Denominamos esse conjunto regio crtica (RC) ou regio de rejeio de H. RC = {0, 1, 2, 3, 9, 10, 11, 12} : regio de rejeio
0 1 2 3 4 5 6 7 8 9 10 11 12
9 10 11 12
x RC rejeitamos H.
Ser que a nossa concluso est correta?
12
9 10 11 12
Valor observado na amostra Como x RC no rejeitamos H (no temos evidncia suficiente de que a moeda seja desequilibrada). Ser que a nossa concluso est correta?
13
Ao decidir pela rejeio ou no da hiptese nula H, podemos cometer dois tipos de erro.
14
Erros
Erro tipo I: Rejeitar H quando H verdadeira. (Afirmar que a moeda no honesta quando na verdade ela ). Erro tipo II: II: No rejeitar H quando H falsa. (Afirmar que a moeda honesta quando na verdade ela desequilibrada).
15
Probabilidades de erros
P(erro I) = P(rejeitar H | H verdadeira) =
17
No exemplo da moeda:
H: p = 0,5 A: p 0,5
X ~ binomial (12; p)
RC = {0,1,2,3,9,10,11,12}
= P(erro erro I) = P(rejeitar H | H verdadeira )
= P(X RC | p = 0,5) = P(X=0 | p=0,5) + ... + P(X=3 | p=0,5) + P(X=9 | p=0,5)+ ... + P(X=12 | p=0,5)
19
Regio de rejeio
4 6 x
Regio de no rejeio
8 10
=0,1458
Regio de rejeio
12
Verdadeiro valor de p Deciso p = 0,5 (H verd.) p 0,5 (A verd.) No rejeitar H Deciso correta Erro II 1 - = 0,8542 Rejeitar H Erro I Deciso correta 1- = 0,1458
21
Se alterarmos a regra de deciso para RC = {0, 1, 2, 10, 11, 12}, isto , concluiremos que a moeda desonesta se o nmero de caras for 0, 1, 2, 10, 11 ou 12, o que acontece com o nvel de significncia do teste (probabilidade de erro tipo I)?
22
23
24
Alternativamente, podemos fixar determinar RC. Os valores de nvel de significncia usualmente adotados esto entre 1% e 10%.
25
Seja X o nmero de pacientes, dentre os 10, para os quais o novo medicamento produz o efeito desejado. Temos que: X ~ b (10; p), onde p a proporo de pacientes para os quais o novo medicamento eficaz. (1) Hipteses estatsticas:
(2) Fixemos o nvel de significncia em 5% ( = 0,05). (3) A regio crtica deve ter a forma: RC = { X k } O valor de k deve ser tal que P(erro erro I I) = P(X RC | p = 0,6) = P(X k | p = 0,6) = Pela tabela da binomial (10; 0,6), para k = 9: P(X 9) = 0,0463 para k = 8: P(X 8) = 0,1672 Portanto, RC = {X 9}, que garante um nvel de significncia menor que 5% (na realidade, = 4,63%). 28
29
0,25
0,20
P(X = x)
0,15
0,10
0,05
=0,0463
0,00 0 2 4 x 6 8 10
Regio de no rejeio
Regio de rejeio
31
32
Exemplo 3: A proporo de analfabetos em um municpio era de 15% na gesto anterior. No incio da sua gesto, o prefeito atual implantou um programa de alfabetizao e aps 2 anos afirma que reduziu a proporo de analfabetos.
Para verificar a afirmao do prefeito, n = 60 cidados foram entrevistados.
33
Ento:
X ~ b(60; p),
34
Equivalentemente,
(3) A regio crtica deve ter a forma: RC = { X k } O valor de k deve ser tal que P(erro I) = , ou seja, P(X k | p = 0,15) = 0,05. Pela tabela da binomial(60; 0,15),
RC = {X 4}.
Na realidade, temos = 0,0424.
36
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
Binomial com n = 60 e p = 0,15 x Pr Pr 0 0,00005822849 5.822849e-05 1 0,0006165370 6.165370e-04 2 0,003209619 3.209619e-03 3 0,01095046 1.095046e-02 4 0,02753720 2.753720e-02 5 0,05442646 5.442646e-02 6 0,08804281 8.804281e-02 7 0,1198566 1.198566e-01 8 0,1401265 1.401265e-01 9 0,1428740 1.428740e-01 10 0,1285866 1.285866e-01 11 0,1031444 1.031444e-01 12 0,07432461 7.432461e-02 13 0,04842871 4.842871e-02 14 0,02869096 2.869096e-02 15 0,01552687 1.552687e-02 16 0,007706351 7.706351e-03 17 0,003519856 3.519856e-03 18 0,001483861 1.483861e-03 19 0,0005788435 5.788435e-04 20 0,0002094052 2.094052e-04 21 0,00007038829 7.038829e-05 2.201987e-05 22 0,00002201987
(4) Buscar a evidncia na amostra para concluir. Se observamos 6 analfabetos entre os 60 entrevistados, qual a concluso? (5) Deciso e concluso: 6 RC Decidimos por no rejeitar H ao nvel de significncia 4,24%. Conclumos que no temos evidncia suficiente para afirmar que a proporo de analfabetos (aps o programa de alfabetizao) inferior a 15%, isto , no h evidncia suficiente de que a afirmao do prefeito seja correta.
38
Resumo
(1) Estabelecer as hipteses: H: p = p0 contra uma das alternativas
A: p p0 , A: p > p0 ou A: p < p0 . (2) Escolher um nvel de significncia . (3) Determinar a regio crtica RC da forma { X k1 } U { X k2 }, { X k } ou { X k }, respectivamente s hipteses alternativas.
39
(4) Selecionar uma amostra aleatria e determinar o nmero x de elementos na amostra com o atributo desejado. (5) Decidir, usando a evidncia x, ao nvel de significncia , e concluir. x RC rejeitamos H. x RC no rejeitamos H.
40