Sei sulla pagina 1di 54

1

MOQ 13
PROBABILIDADE
E ESTATSTICA
Teste de Hiptese - Fundamentos

Armando Z. Milioni 2 Semestre 2016

TH: PRINCPIO LGICO


Ao contrrio de estimao pontual e de intervalos de
confiana (IC), conhecer o valor do parmetro
desconhecido no to importante
O que realmente se deseja saber se possvel afirmar,
dentro de margens de erros tolerveis, que esse
parmetro desconhecido maior, menor ou diferente do
que um determinado valor crtico
Como veremos, esse valor crtico (Hiptese Nula)
constitui a grande diferena entre TH e IC
Exemplos

TH: OS TEMAS DE INTERESSE


Hiptese Nula
Hiptese Alternativa
Probabilidade de Erro Tipo I
Probabilidade de Erro Tipo II
tamanho da Amostra Aleatria
valor p do teste

TH: AS HIPTESES E
expressa como uma igualdade com o valor crtico
expressa na forma de uma desigualdade
Em resumo

NOTA: A igualdade em permite o clculo do erro tipo I no


pior caso falaremos mais sobre isso, adiante

TH: OS ERROS TIPO I E TIPO II


Probabilidade de Erro Tipo I (*)
a probabilidade de concluir que Falsa (ou seja, rejeitar
Ho), quando ela Verdadeira, i.e.,

Probabilidade de Erro Tipo II


a probabilidade de concluir que Verdadeira (no rejeitar
Ho), quando ela Falsa, i.e.,
(*) tambm dito nvel de significncia do teste

TH: UM EXEMPLO ILUSTRATIVO


Um fabricante F de pneus quer fornecer pneus a uma
montadora de automveis M
M s homologa um fornecedor se a vida mdia dos
pneus desse fornecedor for superior a 17 mil milhas
Suponha que uma amostra de 25 pneus submetida a
um teste padro e a vida mdia observada na amostra
igual a 17,4 mil milhas
Isso suficiente para que M deva homologar F como seu
fornecedor?

TH: UM EXEMPLO ILUSTRATIVO


Em outras palavras, ser que 17,4 mil suficientemente
maior do que o valor crtico 17 mil?
A pergunta pertinente, pois, a esta altura, sabemos
com clareza que o resultado da amostra pode ser igual a
17,4 mil mesmo que a vida mdia seja igual a 17 mil.

TH: UM EXEMPLO ILUSTRATIVO


Em outras palavras, ser que 17,4 mil suficientemente
maior do que o valor crtico 17 mil?
A pergunta pertinente, pois, a esta altura, sabemos
com clareza que o resultado da amostra pode ser igual a
17,4 mil mesmo que a vida mdia seja igual a 17 mil.
Para analisar essa questo, faremos duas hipteses
simplificadoras por razes puramente didticas (mais
adiante, ambas sero relaxadas):
a vida dos pneus regida por uma v.a. Normal e
o desvio padro conhecido (1,5 mil milhas)

FORMULANDO O TH
Ou seja, temos a seguinte configurao:

Ainda:
Dispomos de uma a.a. com
Sabemos que

10

FORMULANDO O TH: INCIO


Tudo comea (sempre, em Inferncia Estatstica) com um
Estimador do parmetro desconhecido (e uma a.a., claro)
J sabemos que
O que faremos agora ser construir uma Estatstica do
Teste que nos permita monitorar as probabilidades de
erro e
A ideia sempre essa

11

A BUSCA DA ESTATSTICA DO TESTE


Ainda sem qualquer preocupao formal, parece
razovel (intuitivo) que s devamos rejeitar Ho se o
estimador de (i.e., ) fornecer uma estimativa
suficientemente maior do que o valor crtico
Ou seja, rejeitaremos Ho se

12

A BUSCA DA ESTATSTICA DO TESTE


Ainda sem qualquer preocupao formal, parece
razovel (intuitivo) que s devamos rejeitar Ho se o
estimador de (i.e., ) fornecer uma estimativa
suficientemente maior do que o valor crtico
Ou seja, rejeitaremos Ho se
Reparem que dimensional, mas pode ser
adimensionalizado se essa mesma medida for tomada
em unidades de desvio padro de (prtica recorrente na
busca da Estatstica do Teste)

13

A BUSCA DA ESTATSTICA DO TESTE


Portanto, mantendo o raciocnio, rejeitaremos Ho se
Lembremos, todavia, que
Mas, ento

14

A BUSCA DA ESTATSTICA DO TESTE


Mas,
Ento, fixado , podemos encontrar tal que

Temos, portanto, a nossa Estatstica do Teste


Nota: coerentemente com a notao que empregamos
at aqui, chamaremos de

15

FORMULANDO O TH
Assim, para fazer o Teste de Hiptese:
Fixamos
Procuramos na tabela Normal (0,1)
Calculamos o valor da Estatstica do Teste
e o comparamos com
Se o resultado for , rejeitamos , assegurando que a
probabilidade de erro inferior a
Caso contrrio, no rejeitamos

16

VOLTANDO AO EXEMPLO
No exemplo
Fixamos , que equivale a
Calculamos:

Como , no podemos rejeitar Ho


Ou seja, M no deve aceitar F como fornecedor

17

Z
Z
I
U
Q

!
!
!! !

18

CONTINUANDO
Mas a histria no acabou (est longe de acabar)
A deciso foi tomada com base no erro tipo I, algo que,
por si s, constitui evidncia de que esse o erro
considerado mais grave (assimetria)
Todavia, como a concluso foi a de no rejeitar , o erro
no qual se pode estar incorrendo no o tipo I, mas o
tipo II, claro
F sabe disso, e quer discutir o assunto, pois M se
protegeu do de aceitar um mau fornecedor, mas pode
estar incorrendo no erro de deixar de aceitar um bom
fornecedor (perda da oportunidade tpico tipo II)

19

O ERRO TIPO II
Lembrando:
ou seja:
Digamos que

20

O ERRO TIPO II
Mas, se
no mais , pois est sendo subtrada de algo que no a
sua mdia.

21

O ERRO TIPO II
Mas, se
no mais , pois est sendo subtrada de algo que no a
sua mdia. Ainda assim, podemos calcular

22

O ERRO TIPO II
Prosseguindo:

que, fixado , sabemos calcular para qualquer valor de

23

A FIGURA CLSSICA (ESSENCIAL)


,
fdp de supondo
Ho V, i.e.,

fdp de supondo Ho
F, i.e.,

24

A FIGURA CLSSICA (ESSENCIAL)


,
fdp de supondo
Ho V, i.e.,

fdp de supondo Ho
F, i.e.,

O que ocorre se: (i) ? (ii) diminui? (iii) cresce? (iv) varia?

25

O ERRO TIPO II
Retornemos ao nosso exemplo (F x M)
Fixado , sabemos calcular para valor de
Para qual valor de queremos calcular ?
Um possvel candidato natural , ou seja 17.400 milhas
(estimativa pontual de , j que dispomos de dados)
Ento:

26

O ERRO TIPO II
Ou seja, resumindo:
Ao arbitrar em 5%, com os nmeros do exemplo, M
no aceita F como fornecedor
Ao faz-lo, M no pode mais incorrer no erro tipo I, de
aceitar um mau fornecedor
O nico erro em que M pode estar incorrendo o erro
tipo II, de no aceitar um bom fornecedor (perder a
oportunidade)
O risco que M corre depende do valor de
Se (uma hiptese natural), h 62,2% de chance de M
estar rejeitando um possvel bom fornecedor

27

E O JOGO CONTINUA
A histria, portanto, ainda no acabou.
H negociaes possveis
Por exemplo: diminuir o valor de surge o p-value
Ou, aumentar o tamanho n da amostra aleatria
Como isso pode ser feito?

28

A relao entre n, e
H pouco estabelecemos que:

Ento, para qualquer valor de , podemos arbitrar o valor


mximo que toleramos para (como fizemos com , para a
probabilidade de erro tipo I) para aquele valor de ,
deixando n como grau de liberdade, ou seja:

29

A relao entre n, e
Para , arbitramos e, portanto, da tabela tiramos
(repare a notao negativa) tal que

que implica

30

De volta Ilustrao
Suponha que para , arbitramos
Da tabela temos
Ento:

Portanto, para assegurar e , seria necessrio tomar uma


amostra aleatria quase 5 vezes maior do que a disponvel
(n=25).

31

REFLEXES SOBRE TH
Nos tribunais de jri, muitos consideram que o resultado
mais confivel se d quando o ru considerado culpado
Qual a lgica por trs dessa mxima?
O ru foi presumido inocente (Ho), mas as evidncias
encontradas no sentido de culp-lo foram to fortes que
ele foi considerado culpado (Ho foi rejeitada)

Tomada essa deciso, o nico erro em que se pode estar


incorrendo o tipo I, culp-lo quando ele era inocente (Ho
V), que controlado num patamar (hipoteticamente) muito
baixo (embora no explicitado)

32

REFLEXES SOBRE TH
Suponha, agora, que os jurados reconhecem haver
diversas evidncias da culpa do ru, mas consideram
que a soma de todas elas no suficiente para formar a
convico da culpa do ru (beyond a reasonable doubt)
Nesse caso, o ru inocentado (not guilty)
Tomada essa deciso, o nico erro em que se pode estar
incorrendo o tipo II, inocent-lo quando ele era culpado
(Ho F), que, ao contrrio do erro tipo I, no controlado,
em princpio, em nenhum patamar
Da a assero inicial (em roxo, no slide anterior)

33

ANALOGAMENTE
Da mesma forma, e com argumentos absolutamente
anlogos, em Estatstica diz-se que um teste de
hipteses termina bem quando Ho rejeitado
Por que?
Porque o nico erro que se pode estar incorrendo o
erro tipo I, que controlado num patamar to pequeno
quanto possvel arbitrado pelo decisor
nesse contexto que surge o conceito de p-value ou
valor-p do teste

34

VALOR-P DO TESTE
Vimos que a Estatstica do teste gerava o resultado
que no permitia rejeitar Ho com , j que
Todavia, vimos tambm, na Quizz, que se , , ou seja,
rejeita-se Ho para esse valor de
Portanto, conforme varia, h uma fronteira em que a
deciso se inverte esse ponto de fronteira o valor-p
do teste

35

VALOR-P DO TESTE
Naturalmente, a fronteira se d para tal que igual ao
resultado da Estatstica do Teste
No exemplo ilustrativo, esse resultado era igual a 1,333
Da tabela da N(0,1), temos que corresponde a =
9,13%, que o valor-p do teste
Qualquer valor de arbitrado abaixo de 9,13% implica a
no rejeio de Ho
Qualquer valor de arbitrado acima de 9,13% implica a
rejeio de Ho

36

NOVAS REFLEXES
Como ilustraremos a seguir, possvel roubar (no
sentido cheating) em um teste de hiptese, mas no
diante de um interlocutor estatisticamente treinado
Alis, essa mxima se aplica, em geral, s chamadas
mentiras estatsticas (i.e., elas no funcionam diante
de algum estatisticamente treinado)
Em estatstica, o interlocutor tem direito a toda a
informao disponvel (informao perfeita)
Na dvida, portanto, pea esclarecimentos

37

NOVAS REFLEXES
Um jeito de roubar este:
Note que conforme , rejeitar vai ficando praticamente
impossvel
Ento, formule tal que ela represente o que voc
deseja afirmar e, independentemente do resultado da
Estatstica do Teste, arbitre em um valor to baixo
que no seja rejeitado
Em seguida, divulgue o resultado, informando o valor
de , mas omitindo a especificao de e

38

DE VOLTA ILUSTRAO
Lembremos que nossa formulao foi esta:

39

DE VOLTA ILUSTRAO
Lembremos que nossa formulao foi esta:

Mas, e se houvssemos formulado assim?

40

DE VOLTA FIGURA CLSSICA


,

41

DE VOLTA ILUSTRAO
Nesta formulao com do tipo menor do que, por
raciocnio totalmente anlogo ao desenvolvido na
formulao anterior, s rejeitaremos se

Portanto, ainda por raciocnio anlogo, a Estatstica do


Teste rigorosamente a mesma, mas, arbitrado , s
rejeitaremos se

42

DE VOLTA ILUSTRAO
Se arbitrarmos , teremos
Mas, lembrando o resultado da Estatstica do Teste

Como 1,333 no menor do que -2,326, no podemos


rejeitar
De fato, mesmo para valores de indefinidamente
menores do que 1% (raramente praticados), tambm no
podemos rejeitar

43

DE VOLTA ILUSTRAO
Ocorre que o erro relevante nesse caso no o tipo I
(especificado por ), mas o tipo II
Vamos dar uma olhada em para
Por raciocnio completamente anlogo:

44

DE VOLTA ILUSTRAO
Ocorre que o erro relevante nesse caso no o tipo I
(especificado por ), mas o tipo II
Vamos dar uma olhada em para
Por raciocnio completamente anlogo:

Ou seja, ao no rejeitar , tomei uma deciso que tem


probabilidade 99,987% de estar errada!!!

45

AINDA SOBRE A FORMULAO DO TH


FATO: Embraer s aceita lotes de rebites caso p<0,5%,
onde p o percentual de rebites defeituosos.
CASO 1: Para um produtor de rebites demonstrar que h
evidncias suficientes para que ele seja homologado
como fornecedor, como deve ser formulado o TH?
CASO 2: E para a Embraer demonstrar que h evidncias
suficientes para rejeitar (devolver) um lote?
Claro, nos dois casos,
Qual a adequada em cada caso?

46

AINDA SOBRE A FORMULAO DO TH


FATO: Embraer s aceita lotes de rebites caso p<0,5%,
onde p o percentual de rebites defeituosos.
CASO 1: Para um produtor de rebites demonstrar que h
evidncias suficientes para que ele seja homologado
como fornecedor, como deve ser formulado o TH?
CASO 2: E para a Embraer demonstrar que h evidncias
suficientes para rejeitar (devolver) um lote?
Qual a adequada em cada caso?
CASO 1:

CASO 2:

47

E QUANDO for do tipo ?


,

48

E QUANDO for do tipo ?


,

49

O GRANDE RESUMO Parte 1

Fonte:
Probabilidade e
Estatstica para
Engenharia e
Cincias
8 Edio, 2014
Devore,Jay L.
Cengage Learning

50

O GRANDE RESUMO Parte 2

Fonte: a mesma do slide anterior livro Devore

51

E QUANDO for do tipo ?


,

E
D

O
I
F
A
S

52

REFLEXES FINAIS DESTES FUNDAMENTOS


O resultado de um TH encerra o assunto?
Anlise de Sensibilidade (especialmente quando a
amostra pequena)
Hipteses simplificadoras quase nunca verdadeiras
(neste caso, normalidade, amostra aleatria, outras)
Casos (que no estudaremos) em que necessrio
colocar em aquilo que se deseja demonstrar (Testes de
Aderncia) como agir, ento?

53

OBRIGADO!
Armando Z. Milioni
ITA IEM IEMB, Sala 2303
milioni@ita.br ou azmilioni@gmail.com
(12) 3947-5912

54

13 QUIZZ TH
Retornemos ao exemplo (questo F x M)

Dispomos de uma a.a. com e


Agora, fixamos , para o qual
A Estatstica do teste :
E agora? M deve aceitar F como seu fornecedor?