Sei sulla pagina 1di 13

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Captulo 8 - Testes de hipteses 8.1 Introduo Nos captulos anteriores vimos como estimar um parmetro desconhecido a partir de uma amostra (obtendo estimativas pontuais e intervalos de confiana para o parmetro). Muitas situaes prticas tm uma natureza diferente, requerendo que em funo dos valores observados se tomem decises acerca dos parmetros (ou de outros aspectos) da populao. Exemplos: 1) Mquina de encher pacotes de acar. O peso de cada pacote deve ser 8g (isto , = 8). Ser que a mquina est a funcionar correctamente? 1

2 ) O pKa tabelado para o cido ortohidroxibenzico 2.81 ( y = 2.81). Ser que o valor calculado experimentalmente est de acordo com o valor tabelado, isto , a eventual diferena entre os dois ser devida apenas a erros acidentais ou existir tambm erro sistemtico? Definio: Uma hiptese estatstica uma afirmao acerca dos parmetros de uma ou mais populaes (testes paramtricos) ou acerca da distribuio da populao (testes de ajustamento). Vamos estudar em primeiro lugar os testes paramtricos. Exemplo 1) (cont.): temos duas hipteses: a mquina funciona correctamente ( = 8) ou a mquina no funciona correctamente ( 8): H0 : = 8 (hiptese nula) versus H1: 8 (hiptese alternativa) 2

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Hiptese simples: especificado apenas um valor para o parmetro. Hiptese composta: especificado mais de um valor para o parmetro. Vamos considerar sempre H0 como hiptese simples. A hiptese alternativa ( H1 ) , em geral, uma das trs seguintes: H1: 8 hiptese alternativa bilateral H1: > 8 H1: < 8 hiptese alternativa unilateral (superior) hiptese alternativa unilateral (inferior)

Definio: Teste de hipteses um procedimento que conduz a uma deciso acerca das hipteses (com base numa amostra). Exemplo 1) (cont.): X - v.a. que representa o peso de um pacote de acar, E( X ) = , V(X) = 2 . H0 : = 8 versus H1: 8

Dispomos de uma amostra de 10 observaes:

( X1 ,

, X10 )

(a.a.)

Faz sentido decidir com base em X , aceitando H0 se X estiver prxima de 8 e rejeitando H0 se X estiver longe de 8.

Nota: os valores especificados nas hipteses no devem ter nada a ver com valores observados na amostra. 3 4

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

regio crtica "Aceitar" H1 Rejeitar H0

regio de aceitao "Aceitar" H0 No rejeitar H0

= P(erro do tipo I) =
regio crtica "Aceitar" H1 Rejeitar H0

= P( Rejeitar H0 H0 verdadeira )

A chama-se nvel de significncia.

= P(erro do tipo II) =

= P("Aceitar" H0 H0 falsa )

8c

8+c

Voltando ao exemplo, vamos admitir que fazamos c = 0.5 e que = 1 e n = 10 . A regio crtica : X < 7.5 ou X > 8.5. 1 Supondo que X ~ N ( ,1) ento X ~ N , 10

Regio crtica: X < 8 c ou X > 8 + c Aos pontos de fronteira chamam-se valores crticos. Tipos de erro: Deciso: "Aceitar" H0 Rejeitar H0 Situao: H0 verdadeira H0 falsa no h erro erro do tipo I erro do tipo II no h erro 5

= P( X < 7.5 ou X > 8.5 = 8) =


7.5 8 8.5 8 = + 1 = 0.1142 0.1 0.1 6

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Se aumentarmos n, mantendo os valores crticos, diminui. Quanto a , no vamos ter um nico valor mas uma funo, ou seja, para cada de H1 podemos calcular um valor ( ) . Por exemplo, para = 9:

Se mudarmos a regio crtica, com n fixo: Se c diminuir, aumenta e, para cada , ( ) diminui. Se c aumentar, diminui e, para cada , ( ) aumenta. mais fcil controlar do que controlar (que depende de em H1 ). Logo: rejeitar H0 uma concluso "forte". "aceitar" H0 uma concluso "fraca". Em vez de dizer "aceita-se H0 " prefervel dizer "no se rejeita H0 ", ou "no h evidncia suficiente para rejeitar H0 ".

(9) = P(aceitar H0 = 9) =

= P( 7.5 X 8.5 = 9) =

8.5 9 7.5 9 = = 0.0571 0.1 0.1

(10) = P(aceitar H0 = 10) =

= P( 7.5 X 8.5 = 10) =

8.5 10 7.5 10 = 0 0.1 0.1 Por simetria ( 7) = (9) e (6) = (10)

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

D e f i n i o : Chama-se potncia do teste probabilidade de rejeitar a hiptese nula quando a hiptese alternativa verdadeira ( = 1 ). No exemplo, a potncia do teste quando = 9 1 0.0571 = 0.9429 , ou seja, se a verdadeira mdia for 9, a diferena em relao a 8 ser detectada 94.29% das vezes. Como decidir entre alternativa unilateral ou bilateral? I) H0 : = 8 versus H1: > 8 Regio crtica: X > 8 + c

II)

H0 : = 8 versus H1: < 8 Regio crtica: X < 8 c Ponto de vista do consumidor! Quando rejeitar H0 no aceita a encomenda

III)

H0 : = 8 versus H1: 8 Regio crtica: X < 8 c ou X > 8 + c Compromisso entre os dois!

Ponto de vista do fabricante! Quando rejeitar H0 pra a produo para afinar a mquina. 9 10

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Procedimento Geral dos Testes de hipteses 1. Pelo contexto do problema identificar o parmetro de interesse 2. Especificar a hiptese nula 3. Especificar uma hiptese alternativa apropriada

8.2 Testes de hipteses para a mdia, varincia conhecida X populao tal que: E( X ) = V(X) = 2

(desconhecido) (conhecido)

5. Escolher uma estatstica de teste adequada 6. Fixar a regio crtica do teste 7. Recolher uma amostra e calcular o valor observado da estatstica de teste 8. Decidir sobre a rejeio ou no de H0

Teste de

Sabemos j que, quando H0 verdadeira 2 2 X ~ N 0 , ou X ~ N 0 , a n n

11

4. Escolher o nvel de significncia,

( X1 ,

, Xn ) a. a. de dimenso n

X ~ N ( , 2 ) ou X qq com n grande. H0 : = 0 versus H1: 0

12

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

conveniente estandardizar e usar como estatstica de teste: Z0 = X 0 n Z0 ~ N (0,1)

Seja z0 =

x 0 o valor observado da estatstica de n

teste. Ento rejeita-se H0 se z0 < a ou z0 > a e no se rejeita H0 se a z0 a Estas regras podem ser expressas em termos de x

Quando H0 verdadeira

A regio crtica deve ser bilateral porque H1 bilateral:

Z0|H0 /2 -a 1 0 a /2

rejeita-se H0 se x < 0 a

ou x > 0 + a n n x 0 + a n n

e no se rejeita H0 se 0 a

R.C.: Z0 < a ou Z0 > a com a: P( Z > a) = 2


(recordar que = P( Rejeitar H0 H0 verdadeira ) ) 13

Exemplo 1) (cont.): X - v.a. que representa o peso de um pacote de acar (supe-se que X ~ N ( ,1) ). A mquina est afinada quando

= 8. Numa amostra de 25 pacotes (recolhida


aleatoriamente) observou-se x = 8.5. 14

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Quer-se saber se, ao nvel de significncia de 5%, se pode afirmar que a mquina continua afinada. H0 : = 8 versus H1: 8 Nvel de significncia = 5% Estatstica de teste: Z0 = X 8 1 25 (1. 2. e 3.) (4.) (5.)

Alternativas unilaterais 1) Se fosse H0 : = 0 versus H1: > 0 X 0 estatstica de teste: Z0 = n R.C.: Z0 > a onde a : P( Z > a ) =
Z0 |H0 1 0 a'

= 0.05 a = 1.96 donde


R.C.: Z0 < 1.96 ou Z0 > 1.96 Com x = 8.5 obtm-se z0 = 8.5 8 = 2.5 1 25 (6.) (7.) R.C.: Z0 < a onde

2) Se fosse H0 : = 0 versus H1: < 0 estatstica de teste: a mesma a : P( Z > a ) =


Z0 |H0 1 -a' 0

Como z0 > 1.96 rejeita-se H0 , ou seja, existe evidncia (ao nvel de significncia considerado) de que a mquina est desafinada.

15

16

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Outro mtodo: valor-p Em vez de fixar , determinar a regio crtica e, em seguida, verificar se o valor observado pertence regio crtica, pode olhar-se directamente para o valor observado da estatstica de teste e determinar para que nvel de significncia a deciso muda. Definio: Dado o valor observado da estatstica de teste, o valor-p (p-value) o maior nvel de significncia que levaria no rejeio da hiptese nula (ou o menor que levaria rejeio). No exemplo, z0 = 2.5, para este valor H0 no rejeitada se 2[1 (2.5)] = 0.0124 , ou seja, p = 0.0124 .

Quanto mais baixo for o valor-p maior a evidncia contra a hiptese nula. Relao entre intervalos de confiana e testes de hipteses: Parmetro desconhecido . I.C. a 100 (1 )% para = [l,u] , baseado numa dada amostra e v. a. fulcral, ento a mesma amostra leva rejeio de H0 : = 0 contra H1: 0 ,

ao nvel de significncia , se e s se 0 [l,u] ou no rejeio de H0 se e s se 0 [l,u] Nota: necessrio que a v.a fulcral e a estatstica de teste sejam da mesma forma.

0.0062 -2.5 0 2.5

0.0062

17

18

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Vamos ver que isto verdade para o teste que estamos a estudar (teste para a mdia com varincia conhecida): H0 : = 0 versus H1: 0 No se rejeita H0 , ao nvel de significncia , se e s se

Nota: o teste que acabmos de estudar aplicvel com 2 desconhecida (substituda por S 2 ) desde que a dimenso da amostra seja grande ( n > 30). 8.3 Testes de hipteses sobre a igualdade de duas mdias, varincias conhecidas X1 , populao 1, com E( X1 ) = 1 e V ( X1 ) = 12 (conhecida)
2 X2 , populao 2, com E( X2 ) = 2 e V ( X2 ) = 2 (conhecida)

0 a x 0 + a n n 0 x + a xa n n 0 I.C.100 (1 )% ( )

( X1 e X2 independentes) a. a. da populao 1 X11 , , X1n1 com mdia X1 a. a. da populao 2 X21 , , X2n2 com mdia X2

No exemplo, n = 25, x = 8.5, = 1, I.C. a 95% ( = 0.05) a = 1.96 I.C.95% ( ) = [8.108;8.892] , como 0 = 8 no pertence ao I.C., rejeita-se H0 : = 8 (contra H1: 8) ao nvel = 5%. 19

( (

(X

21

2n 2

(e a a.a.

(X , ,X ) )
11

, X1n1

independente da a.a.

20

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Queremos testar H0 : 1 = 2 contra uma das alternativas H1: 1 2 (bilateral) ou H1: 1 > 2 (unilateral superior) ou H1: 1 < 2 (unilateral inferior) j sabemos que 2 2 X1 X2 ~ N 1 2 , 1 + 2 n1 n2 Ento, quando H0 verdadeira ( 1 2 = 0 ) Z0 = X1 X2
2 12 2 + n1 n2

Daqui em diante tudo semelhante ao caso anterior, ou seja, dadas as amostras concretas calcula-se z0 = x1 x2
2 12 2 + n1 n2

Com H1: 1 2 , rejeita-se H0 para o nvel de significncia se z0 < a ou z0 > a com a: P( Z > a) = etc. N o t a : este teste vlido para varincias 2 desconhecidas (substitudas por S12 e S2 ) desde que n1 > 30 e n2 > 30.

~ N (0,1)

21

22

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

8.4 Testes de hipteses para a mdia de uma populao normal, varincia desconhecida Se n < 30 s possvel efectuar testes para a mdia se for possvel assumir que X ~ N ( , 2 ) . Nesse caso para testar H0 : = 0 contra uma das alternativas H1: 0 (bilateral) ou H1: > 0 (unilateral superior) ou H1: < 0 (unilateral inferior) usa-se a estatstica de teste T0 = X 0 S n

Ento para H1: 0 , rejeita-se H0 ao nvel de significncia se t0 = x 0 < a s n ou t0 > a

com a:P(Tn 1 > a) = etc.

Quando H0 verdadeira T0 ~ tn 1

Nota: Para os testes em que a estatstica de teste tem distribuio normal o valor-p fcil de determinar. Para outras distribuies (t e chiquadrado) esse valor s pode ser obtido usando um programa de computador ou em certas calculadoras. Recorrendo s tabelas o melhor que se consegue obter um intervalo que contm (de certeza) o valor-p.

23

24

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Exemplo: Determinao da constante de acidez do cido orto-hidroxibenzico. O valor tabelado para pKa 2.81. Queremos saber se o valor determinado experimentalmente est de acordo com o valor tabelado (devendo-se as eventuais diferenas apenas a erros acidentais) ou se, pelo contrrio, o valor obtido no est de acordo com o valor tabelado (podendo ento afirmar-se que ocorreu algum erro sistemtico). Ou seja, em termos de testes de hipteses e sendo Y a v.a. que representa um valor de pKa determinado experimentalmente, queremos testar H0 : Y = 2.81 contra H1: Y 2.81
2 Admitindo que Y ~ N ( Y , Y )

Relatrio 1: Como j determinmos no Cap. 7 (pg. 22) I.C.95% ( Y ) = [2.8117;2.8768] fazendo uso da analogia descrita, como 2.81 I.C.95% ( Y ) , podemos concluir que, ao nvel de significncia de 5%, rejeitamos H0 . Relatrio 2: A concluso semelhante I.C.95% ( Y ) = [3.0877;3.1249] No entanto visvel uma diferena grande entre os dois relatrios que pode ser melhor avaliada calculando o valor-p para cada teste. Para isso precisamos calcular o valor observado da estatstica de teste.

25

26

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Relatrio 1: t0 = y 2.81 2.8443 2.81 = = 3.35 0.020468 4 sy 4

8.5 Testes de hipteses sobre a igualdade das mdias de duas populaes normais, varincias desconhecidas Exemplo: Comparao entre os resultados obtidos pelos dois grupos na determinao da constante de acidez do cido orto-hidroxibenzico (vamos usar os dados relativos a pKa). Teste de H0 : 1 = 2 contra H1: 1 2

0.022 -3.35 0 3.35

0.022

valor - p = 0.044 (pelas tabelas: 0.01 < p < 0.05)

Relatrio 2: t0 = 3.1063 2.81 = 44.33 0.014946 5 valor p 0 Relatrio 1 y1 = 2.844275 sy1 = 0.020468 n1 = 4 Relatrio 2 y2 = 3.1063 sy2 = 0.014946 n2 = 5

Ao nvel de significncia de 5% conclui-se que h erro sistemtico nos dois relatrios, usando o valorp conclui-se que h muito maior evidncia a favor da existncia de erro sistemtico no relatrio 2 do que no relatrio 1. 27

28

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Admitimos que (hipteses de trabalho): A primeira amostra uma concretizao de uma a.a. de uma populao Y1 ~ N (1 , 12 ) ; A segunda amostra uma concretizao de 2 uma a.a. de uma populao Y2 ~ N ( 2 , 2 ) ; Y1 e Y2 so independentes;
2 2 2 12 = 2 = 2 (parece razovel porque sy1 e sy2

Estatstica de teste: T0 = X1 X2 , 1 1 + Sp n1 n2 sob H0 T0 ~ tn1 + n2 2 = 7

Valor observado: t0 = 2.8443 3.1063 = 22.28 1 1 + 0.017527 4 5 valor p 0

so da mesma ordem de grandeza).

Pelo

I.C.99% (1 2 ) = [ 0.3031;0.2209]

concluamos que se rejeitava H0 ao nvel = 1%. sp = 3 0.020468 + 4 0.014996 = 0.017527 7


2 2

n1 + n2 2 = 7

29

30

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Teste relativo igualdade das varincias (no faz parte do programa) Output do Excel para este teste:
t-Test: Two-Sample Assuming Equal Variances
Variable 1 Variable 2

F-Test: Two-Sample for Variances


Variable 1 Variable 2

Mean Variance Observations Pooled Variance Hyp. Mean Difference df t P(T<=t) one-tail t Critical one-tail P(T<=t) two-tail t Critical two-tail

2.844275 3.1063 0.00041894 0.00022337 4 5 0.00030719 0 7 -22.286055 4.6302E-08 1.89457751 9.2604E-08 2.36462256

Mean Variance Observations df F P(F<=f) one-tail F Critical one-tail


2 H0 : 12 = 2

2.844275 3.1063 0.00041894 0.00022337 4 5 3 4 1.87551203 0.27464723 6.59139232

2 contra H1: 12 2

Estatstica de teste: S12 F0 = 2 S2 sob H0 F0 ~ Fn1 1;n2 1

31

32

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

8.6 Testes de hipteses para a varincia de uma populao normal

8.7 Testes de hipteses para uma proporo

X ~ N ( ,

( X1 ,

, Xn ) a.a. contra
2 H1: 2 0

( X1 ,

, Xn ) amostra aleatria de uma populao

muito grande ou infinita. Seja Y ( n) o nmero de observaes desta

2 Para testar H0 : 2 = 0

usa-se a estatstica de teste Q0 =

amostra que pertencem a uma dada categoria de interesse.


2 0

(n 1)S 2

Seja p a proporo de indivduos na populao que pertencem a essa categoria de interesse. Exemplos: Populao Peas Eleitores Categoria ser defeituosa vota no partido X

2 Quando H0 verdadeira Q0 ~ n 1

Ento, rejeita-se H0 ao nvel de significncia se q0 =

(n 1)s 2
2 0

< a ou q0 > b

com a: P(Q0 < a) =

e b: P(Q0 > b) = 2 2
33

Y O estimador pontual de p P = . n 34

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

J vimos que se n for grande Z= P p ~ N (0,1) p(1 p) a n

Logo para testar H0 : p = p0 contra H1: p p0 (ou H1: p < p0 , ou H1: p > p0 ) usa-se a estatstica de teste Z0 = p0 (1 p0 ) n P p0 , sob H0 Z0 ~ N (0,1)
a

Exemplo: Populao de eleitores portugueses. Sondagem (aleatria) a 1200 eleitores revelou que 683 tencionam votar no partido ABC. Entretanto o presidente do partido tinha afirmado "estou convencido que vamos obter mais de 50% dos votos". Concordamos com esta afirmao? p = 683 1200 = 0.569 Podemos testar H0 : p = 0.5 contra H1: p > 0.5

Para H1: p p0 , rejeita-se H0 ao nvel se z0 = p0 (1 p0 ) n p p0 < a ou z0 > a a: P( Z > a) = 2 35

Se rejeitarmos a hiptese nula (e isso uma concluso "forte") ento a afirmao corroborada pela sondagem. 0.569 0.5 = 4.79 valor-p = 0.000001 0.5(1 0.5) 1200 Como o valor-p muito baixo rejeita-se H0 para os z0 = nveis de significncia usuais. 36

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

8.8 Teste do qui-quadrado de ajustamento O objectivo testar a hiptese de que as observaes seguem uma determinada distribuio (discreta ou contnua, com ou sem parmetros desconhecidos) Exemplo: O lanamento de um dado 1000 vezes conduziu seguinte tabela de frequncias observadas ( oi ) xi oi 1 2 3 4 5 6 Total 174 174 154 179 154 165 1000

Ser que os resultados obtidos sustentam a hiptese de que o "dado perfeito"? X - v.a. que representa o nmero de pontos obtido num lanamento 1 H0 : P( X = i ) = , i = 1, ,6 ou 6 X ~ Unif . Disc. (1, ,6) H1: negao de H0 Quando H0 verdadeira sabemos calcular a probabilidade de cada valor (ou classe, em geral), que designamos por pi , e o valor esperado para o nmero de observaes em cada classe (abreviadamente, frequncias esperadas), Ei = npi onde n a dimenso da amostra, neste caso n = 1000 37 38

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Vamos acrescentar essas duas colunas tabela: xi 1 2 3 4 5 6 Total oi 174 174 154 179 154 165 1000 pi 16 16 16 16 16 16 1 Ei = npi 166.67 166.67 166.67 166.67 166.67 166.67 1000.02

A varivel que usada para medir o afastamento X =


2 0 i =1 k

(Oi Ei )2
Ei

(Estatstica de teste)

Pode mostrar-se que, quando H0 verdadeira,


2 2 X0 ~ k 1

onde k o n. de classes (no exemplo, 6) e o n. de parmetros estimados (no exemplo, 0)


2 Deve rejeitar-se H0 se o valor observado de X0 for

Mesmo quando H0 verdadeira no estamos espera que as colunas oi e Ei coincidam. ento necessrio medir o afastamento entre oi e Ei e saber at que ponto esse afastamento razovel para H0 verdadeira (se determinarmos que o afastamento razovel no rejeitamos H0 , caso contrrio rejeitamos H0 ).

muito elevado, ou seja a regio crtica do teste da forma


2 R.C.: X0 > a 2 onde a: P( X0 > a) =

e o nvel de significncia do teste. 39 40

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Tabela incluindo os clculos para obter o valor 2 observado de X0 :

xi 1 2 3 4 5 6 Total

oi 174 174 154 179 154 165 1000

pi 16 16 16 16 16 16 1

Ei = npi 166.67 166.67 166.67 166.67 166.67 166.67 1000.02

(oi Ei )2
Ei 0.322 0.322 0.963 0.912 0.963 0.017 3.499

Exemplo: Pensa-se que o nmero de defeitos por circuito, num certo tipo de circuitos, deve seguir uma distribuio de Poisson. De uma amostra (escolhida aleatoriamente) de 60 circuitos obtiveram-se os resultados seguintes: N. de def. 0 1 2 3 Total oi 32 15 9 4 60

2 O valor observado de X0 3.499. Se fixarmos

X - v.a. que representa o n. de defeitos num circuito H0 : X ~ Poisson( ) contra H1: X ~ outra dist.

= 0.05, com k 1 = 5, obtm-se a = 11.07.


Uma vez que 3.499 < 11.07, no se rejeita H0 ao nvel de significncia de 5%. 41

42

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

desconhecido, ento deve ser estimado (pelo mtodo da mxima verosimilhana)


32 0 + 15 1 + 9 2 + 4 3 =x= = 0.75 60 donde e 0.75 0.750 1 = P( X = 0 ) = p = 0.472 0! e p2 = P( X = 1) =
0.75 1

Obtm-se ento a tabela final: N. de def. 0 1

oi 32 15 13 60

pi 0.472 0.354 0.174 1.000

ei = npi 28.32 21.24 10.44 60.00

(oi ei )2
ei 0.478 1.833 0.628 2.939

e1 = 28.32

2 Total

0.75 = 0.354 e2 = 21.24 1!

e 0.75 0.752 3 = P( X = 2 ) = p = 0.133 e3 = 7.98 2! p4 = P( X 3) = 1 ( p1 + p2 + p3 ) = 0.041 e4 = 2.46 Deve ter-se ei 5, i , se para algum i ei < 5, deve fazer-se um agrupamento de classes. 43

k 1 = 3 11 = 1 a = 3.841 = 0.05 Como 2.939 < 3.841, no se rejeita H0 ao nvel de significncia de 5%.

44

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Observaes: 1) Para variveis contnuas o procedimento semelhante: As observaes devem previamente ser agrupadas em classes (intervalos). Podem usarse as regras para construo de histogramas e, partida, classes de amplitude constante. pi 's so as probabilidades das classes.

8.9 Teste do qui-quadrado de independncia em tabelas de contingncia O objectivo testar a hiptese de que duas variveis (discretas ou contnuas) so independentes. Para isso devemos ter observaes relativas ocorrncia simultnea dos valores possveis das duas variveis. Essas observaes organizam-se numa tabela de frequncias a que se chama tabela de contingncia. Exemplo: Um estudo sobre a ocorrncia de falhas numa certa componente electrnica revelou que podem ser considerados 4 tipos de falhas (A, B, C e D) e duas posies de montagem. Em 134 componentes seleccionadas aleatoriamente obtiveram-se as frequncias absolutas registadas na tabela (de contingncia) da pgina seguinte. Ser que o tipo de falha independente da posio de montagem? 46

2) necessrio n relativamente elevado para fazer este teste (pelo menos 5 observaes por classe). 3) Existem outros testes que no requerem tantas observaes (teste de Kolmogorov-Smirnov e papel de probabilidade) mas no fazem parte do programa. 45

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Falha Montagem 1 2 A 22 4 B 46 17 C 18 6 D 9 12 Total 95 39

A hiptese nula (independncia) pode ser escrita como: H0 : P( X = i,Y = j ) = P( X = i ) P(Y = j ) i, j ou H0 : pij = pi p j i, j Seguindo raciocnio semelhante ao usado no teste de ajustamento, precisamos de calcular a tabela de frequncias esperadas sob a hiptese nula e compar-la com a de frequncias observadas. Para isso necessrio primeiro estimar pi e p j i, j : pi = ni n p j = n j , n

Total 26 63 24 21 134 Designamos por oij , (onde i se refere linha e j coluna) os valores do interior da tabela. Por ni os totais das colunas e por n j os totais das linhas. Tabela genrica (com as mesmas dimenses): j i 1 2 n j 1 o11 o21 n1 2 o12 o22 n2 3 o13 o23 n3 4 o14 o24 n4 ni n1 n2 n 47

donde se obtm eij = npi p j = n ni n j ni n j = n n n

48

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

Ana Pires, IST, Outubro de 2000

Probabilidades, Erros e Estatstica

No exemplo em considerao obtm-se ento a seguinte tabela de frequncias esperadas: Falha Montagem 1 2 A 18.4 7.6 B 44.7 18.3 C 17.0 7.0 D

Valor observado da estatstica de teste no exemplo: x =


2 0

(22 18.4)2
18.4

Deciso: 14.9 6.1

( (r 1)( s 1) = 3)

2 2 = 1% a: P( 3 > a) = 0.99 a = 3,0.99 = 11.34 2 = 2.5% a = 3,0.975 = 9.348

A varivel que usada para medir o afastamento (entre a tabela de frequncias observadas e a tabela de frequncias esperadas)
2 X0 = i =1 j =1 r s

ou seja, 0.01 < valor p < 0.025 O resultado no muito conclusivo, embora v no

(O

ij

Eij Eij

(Estatstica de teste)

sentido da no independncia. Para ter um resultado mais convincente seria necessrio repetir a experincia, eventualmente com mais observaes.

Pode mostrar-se que, quando H0 verdadeira,


2 X0 ~ (2r 1)( s 1)

com r=n de linhas e s = n de colunas da tabela. 49 50

(12 6.1)2
6.1

= 10.78

Potrebbero piacerti anche