Sei sulla pagina 1di 8

Teste de hiptese um procedimento de inferncia estatstica cuja finalidade decidir

se existe evidncia suficiente para rejeitar uma hiptese de nulidade, representada por
H0, em favor de uma hiptese alternativa, representada por H1.
V-se, portanto, que a especificao completa de uma hiptese estatstica inclui a
hiptese de nulidade e uma hiptese alternativa, que corresponder a uma deciso
alternativa a ser adotada caso a hiptese de nulidade seja rejeitada.
Deve-se observar que no rejeitar no o mesmo que aceitar, ou seja, no rejeitar H0
no mesmo que dizer que H0 verdadeira; apenas no h evidncia suficiente na
amostra para que ela seja rejeitada. De qualquer maneira, a terminologia H0 ou H1
verdadeira e H0 ou H1 falsa muito comum. Assim, por H0 verdadeira deve-se
compreender que no existe evidncias na amostra contra H0 e por H0 falsa que existe
evidncias contra H0 (ou a favor de H1). Nesse processo, H0 inicialmente assumida e,
posteriormente, verifica-se se a amostra contm evidncias contrrias a ela.
A deciso, como j ressaltado, tomada com base na amostra y. Assim, busca-se um
subconjunto R do espao amostral Sy de tal forma que H0 ser rejeitada se, e somente
se, wR. Esse subconjunto denominado regio crtica ou regio de rejeio.
Testes de hiptese so procedimentos muito gerais. Muitas vezes, entretanto, as
hipteses podem ser especificadas em termos de valores para os parmetros e so
frequentemente enquadrados em uma das formas:
1. H0:=0

vs

H1:0 (hiptese bilateral).

2. H0:=0

vs

H1:<0 (hiptese unilateral esquerda).

3. H0:=0

vs

H1:>0 (hiptese unilateral direita).

As hipteses foram especificadas para um parmetro mas so formas vlidas para


grupos de parmetros. O nome hiptese de nulidade, utilizado desde os anos 1920,
deriva desse tipo de hiptese.
O formato geral dos testes de hipteses, tal qual eles so utilizados hoje, foi inicialmente
estabelecido por Jerzy Neyman e Egon Pearson, a partir do final dos anos 1920.
Estatstica de teste
Muito frequentemente, a regio de rejeio definida em termos de uma estatstica,
denominada estatstica do teste.
Estatstica do teste uma estatstica que possibilita o teste de uma hiptese estatstica.
Usualmente, estatsticas possibilitam o mesmo processo de deciso numa dimenso
menor (observe-se que y tem dimenso n, o que torna muito difcil estabelecer
concluses em termos das observaes), devido reduo dos dados providenciada pela
estatstica. Desse modo, a regio de rejeio pode ser estabelecida de modo equivalente
em termos da estatstica do teste. Assim, se a regio de rejeio em termos da estatstica
g(y) for representada por R ento

H0 ser rejeitada se, e somente se, g(w)R


de maneira que a regio de rejeio em termos de Sy
R={wSy: g(w)R}
Assim como nos conjuntos de confiana, as variveis piv tm grande importncia nos
testes de hiptese. Sob H0, essas variveis se tornam estatsticas, cujo comportamento
probabilstico possibilita que uma concluso seja tomada.
Nas situaes que seguem, g(y) representa a estatstica do teste e R a
correspondente regio de rejeio.
Erros de deciso
A deciso sobre uma hiptese estatstica um processo de inferncia, de modo que a
possibilidade de que erros sejam cometidos inerente ao processo. Em termos da
deciso sobre uma hiptese H0 existem dois tipos de erro:
1. Erro do tipo I: rejeitar a hiptese de nulidade quando ela no deveria ser
rejeitada.
2. Erro do tipo II: falhar na rejeio da hiptese de nulidade quando ela deveria ser
rejeitada.
Evidentemente, decises corretas podem ser tomadas: no rejeitar quando H0 a
hiptese adequada e rejeitar quando H1 a hiptese adequada. A tabela que segue
resume as situaes.

Essa situao totalmente anloga deciso de um juiz sobre um ru aps um


julgamento, como se pode ver na tabela abaixo. A hiptese de nulidade o ru
inocente e a deciso no sentido de condenar ou no condenar o ru. Observe-se que o
erro do tipo I o mais importante.

interessante notar que muitas vezes no h condenao porque as evidncias (provas)


no so suficientes para condenao, ou seja, H0 no rejeitada, mas no quer dizer
necessariamente que a inocncia est provada. Reforando a analogia: no rejeitar H0

no quer dizer necessariamente que ela verdadeira; apenas no h evidncias na


amostra para a sua rejeio.
Se H0 a hiptese adequada (ou seja, a distribuio da estatstica g(y) a
especificada por H0) ento
P(g(y)RH0)=P(yRH0)
a probabilidade do erro do tipo I ou probabilidade de que H0 verdadeira seja rejeitada.
Se H1 a hiptese adequada (a distribuio de g(y) a especificada por H1) ento
P(g(y)RH1)=P(yRH1)
a probabilidade do erro do tipo II. Ou seja, a probabilidade de que H0 falsa no
seja rejeitada.
Como se pode ver, as probabilidades dos erros do tipo I e tipo II so relacionadas, j que
R um subconjunto de Sy. Assim, uma diminuio na probabilidade do erro do tipo I,
reduzindo a regio de rejeio, ir, necessariamente, provocar um aumento na
probabilidade do erro do tipo II.
A probabilidade mxima do erro do tipo I, denotada por , denominada nvel de
significncia, tipicamente fixada como um valor pequeno, como 0.1, 0.05, ou 0.01.
A considerao de casos extremos pode ser ilustrativa ( evidente que o caso usual est
situado entre esses dois extremos):
1. H0 nunca rejeitada, independentemente da evidncia presente na amostra.
Nesse caso, R= (ou seja, a regio de rejeio um conjunto vazio), o erro tipo
I no ocorre, o nvel de significncia igual a 0 e a probabilidade de erro tipo II
igual a 1 para qualquer distribuio definida por H1
2. H0 sempre rejeitada, independentemente da evidncia presente na amostra.
Aqui, R=Sy, o erro tipo II no ocorre, a probabilidade do erro tipo I igual a 1
para qualquer distribuio definida por H0
Na perspectiva frequentista, o nvel de significncia 0.05, por exemplo, pode ser
interpretado como a fixao de no mximo uma rejeio incorreta de H0 a cada vinte
pesquisas do mesmo tipo realizadas, ou, de modo equivalente, de 5 a cada 100.

Poder do teste

Considere-se que H1 a hiptese correta. Nesse caso, P(g(y)R) a probabilidade


de que a deciso seja correta, ou seja, rejeitar H0.
Poder do teste a capacidade do teste de hiptese rejeitar uma hiptese de nulidade
falsa, dado que H1 verdadeira.
Se as hipteses so especificadas em termos de valores do parmetro (um parmetro,
sem perda de generalidade) e como, em geral, H1 no especifica valores para ento
no possvel calcular a probabilidade para o erro do tipo II.
Entretanto, uma funo de grande importncia
()=P(g(y)R)
denominada curva caracterstica de operao e a funo
1-()=()=P(g(y)R)
a funo poder do teste.
Como se pode ver, essa funo depende do nvel de significncia utilizado na
definio da regio de rejeio e do parmetro . Tem grande importncia na criao e
escolha dos testes de hiptese. Note-se que, em geral, as pesquisas buscam discriminar
situaes, de modo que importante um teste detectar diferenas, por exemplo, onde
elas de fato existem.
Estabelecendo as hipteses no formato
H0:0 versus H1:0c=-0
sendo o espao paramtrico e 0 um subconjunto de , ento:
1. ()= a probabilidade do erro do tipo I, quando 0.
2. max{():0} o nvel de significncia do teste.
3. 1-() a probabilidade do erro do tipo II, quando -0.
4. () o poder do teste, quando -0.
O poder do teste um critrio usual para escolha de testes competidores, ou seja, testes
que podem ser utilizados para testar a mesma hiptese. Sejam dois testes concorrentes,
ambos com nvel de significncia , com regies de rejeio R1 e R2. Se
P(g(y)R1)P(g(y)R2)
para qualquer distribuio especificada por H1, ento o teste de regio R1 mais
poderoso ao nvel .

Se, ademais, ele for mais poderoso que qualquer outro teste ao nvel ento recebe o
nome de teste uniformemente mais poderoso ao nvel . Claramente, o melhor teste
que se pode utilizar.
Valor p
A fixao da probabilidade do erro do tipo I embute uma boa dose de arbitrariedade.
Um procedimento mais informativo e que permite construir uma regio de rejeio para
(0,1), representada por R (note que R decresce com ), e especfica para cada
situao, aquele que obtm uma probabilidade associada ao valor observado de y
(ou da estatstica g(y)), denominada valor p.
O valor p, identificado por p(w), o menor nvel de significncia para o qual H0
rejeitada, dado que y=w.
Assim, estabelecido um nvel de significncia , a deciso ser:
rejeitar H0 se o valor p for menor ou igual a ; no rejeitar caso contrrio.
O valor p uma estatstica, pois depende somente da amostra y.
Informalmente, o valor p pensado como a probabilidade de obter uma estatstica do
teste to ou mais extrema (em relao a H0) que o valor observado g(w).
O que quer dizer um resultado estatisticamente significativo?
Como visto acima, um teste de hiptese avalia duas proposies mutuamente exclusivas
sobre uma populao estatstica e verifica qual delas parece mais adequada, dada a
amostra observada. A regio crtica construda considerando que H0 verdadeira.
Portanto, se o valor da estatstica do teste est nessa regio, um valor atpico para essa
populao estatstica, de modo que parece bastante provvel que a hiptese de nulidade
no seja verdadeira. Em outras palavras, existem evidncias na amostra para a rejeio
da hiptese de nulidade. Isso rotineiramente denominado resultado estatisticamente
significativo.
A presena do valor da estatstica do teste na regio crtica, no entanto, pode ser devido
a uma conformao especfica, pouco provvel, da amostra. Assim, nesse caso, concluir
pela rejeio da hiptese de nulidade um erro de concluso. Esse tipo de erro
denominado erro do tipo I.
Usualmente se especifica uma probabilidade (baixa, evidentemente) para o erro do
tipo I, estabelecendo um percentual mximo de pesquisas do mesmo tipo onde esse tipo
de erro poderia ocorrer. Essa probabilidade denominada nvel de significncia,
porque quanto menor o seu valor mais difcil ser a rejeio da hiptese de nulidade.
preciso cuidado um cuidado duplo na especificao de : no pode ser elevado, pois,
afinal, uma probabilidade de erro, e no pode ser muito pequeno, pois diminuir a
probabilidade do erro do tipo usualmente aumenta a probabilidade do erro do tipo II.
Tradicionalmente so fixados os valores 0.01, 0.05 ou 0.1 para .

O valor p, p(w), dentre outros significados, a menor probabilidade para a qual a


hiptese de nulidade pode ser rejeitada. Se o pesquisador fixou como aceitvel cometer
o erro do tipo I em at 100% dos casos, ento p(w)< um indicativo para a rejeio
da hiptese de nulidade.
Alguns aspectos adicionais so relevantes:
1. Toda deciso estatstica, por serem baseadas em amostras, tm uma
probabilidade de erro. Ou seja, uma concluso errada no ocorre
necessariamente por deficincia da pesquisa ou do pesquisador. Valores atpicos
so pouco provveis, mas possveis. Um bom planejamento e execuo da
pesquisa apenas garante que os valores especificados para a probabilidade de
erro so confiveis
2. Os valores usualmente fixados para no so mgicos, so apenas tradicionais.
O ideal que, antes da fixao, o pesquisador pondere com cuidado sobre o
tamanho do prejuzo que se teria se uma rejeio de H0 fosse feita erroneamente.
3. Alm do tamanho da amostra adequado, a validade das pressuposies
(normalidade, independncia, etc.) essencial para os valores calculados
corretamente
4. O valor p indica a conformidade da amostra com a hiptese de nulidade.
Portanto, no deve ser interpretado como a probabilidade de que a hiptese de
nulidade seja incorreta. Ele no capaz de informar se a hiptese de nulidade
de fato falsa ou se a hiptese verdadeira, mas um valor atpico da estatstica
ocorreu. O conhecimento da rea em estudo e a repetio da pesquisa so
aspectos importantes nessa diferenciao
5. Um valor p igual a 5% no significa que a probabilidade de erro do tipo I (s

vezes chamada de taxa de falsos positivos) tambm 5%. De fato, a taxa de


falsos positivos pode ser muito maior, dependendo do tamanho da amostra
(quanto maior, melhor), da prevalncia de diferenas reais existentes na
populao (quanto maior, melhor), do poder do teste (quanto maior, melhor) e
do valor p (quanto menor, melhor). Isso mostra que o mesmo valor p em
diferentes pesquisas pode estar associado a diferentes taxas de falsos positivos
Testes de hiptese e conjuntos de confiana
Em termos gerais, se C(,) um conjunto de confiana 1- para ento se as hipteses
em considerao num teste a um nvel de significncia forem
H0:=0 versus H1:0
a hiptese de nulidade H0 ser rejeitada se, e somente se
0C(,g(y))
De modo equivalente, H0 no ser rejeitada se, e somente se
0C(,g(y)).

De modo mais especfico, se os conjuntos de confiana forem intervalos de confiana,


ento
1. Se (l(g(y)),u(g(y))) for um intervalo bilateral, H0:=0 versus H1:0
deve ser rejeitada se, e somente se, 0<l(g(y)) ou 0>u(g(y)).
2. Se l(g(y)) for o limite inferior de um intervalo unilateral esquerda, H0:0
versus H1:<0 deve ser rejeitada se, e somente se, 0<l(g(y)).
3. Se u(g(y)) for o limite superior de um intervalo unilateral direita, H0:0
versus H1:>0 deve ser rejeitada se, e somente se, 0>u(g(y)).
Nesses casos, o intervalo de confiana mais informativo que o correspondente teste de
hiptese, porque especifica um conjunto de valores para os quais a hiptese de nulidade
ser ou no rejeitada e no apenas um valor. evidente que nem sempre os testes de
hiptese tm intervalos de confiana correspondentes.
Procedimento geral para testes de hiptese
A aplicao de um teste de hipteses pode ser pensada como um conjunto de passos a
serem seguidos nessa ordem:
1. Escolha da hiptese.
Escolha qual ser a hiptese de nulidade H0 e qual ser a hiptese alternativa.
Lembre-se de que ser fixada a probabilidade de erro do tipo I, de modo que
deve ser escolhida como H0 aquela hiptese cuja rejeio errnea seja o erro
mais grave ou com piores consequncias. Em muitos casos, H0 reflete uma
situao j conhecida e H1 uma nova situao, que dever ser assumida apenas
se houver fortes evidncias a seu favor, ou, ainda, fortes evidncias contra H0.
2. Estatstica do teste.
Defina a estatstica do teste. Assim como nos conjuntos de confiana, as
variveis piv tambm so muito teis aqui. Uma varivel piv para testes sobre
o parmetro dever ser algo do tipo g(y,), ou seja, uma funo da amostra e
do parmetro , e se H0:=0 ento o comportamento probabilstico da
estatstica g(y,0) (ou seja, sob H0, a varivel piv uma estatstica) poder
ser estudado para que se possa concluir sobre H0. evidente, portanto, a
necessidade de conhecer a distribuio amostral da estatstica do teste.
3. Nvel de significncia.
Defina , a probabilidade mxima do erro do tipo I, e a consequente regio de
rejeio da hiptese de nulidade.
4. Clculo da estatstica e do valor p.
Utilizando a amostra disponvel, obtenha o valor da estatstica do teste e, se
necessrio, o valor p correspondente.

Bibliografia:
http://www.galileu.esalq.usp.br/mostra_topico.php?cod=341

Potrebbero piacerti anche