Sei sulla pagina 1di 56

3. Testes de Hipóteses Paramétricos

74

Objectivos

Com o estudo deste capítulo o leitor deverá ser capaz de:

Estabelecer e interpretar hipóteses estatísticas;

Proceder à construção de um teste de hipóteses em geral;

Realizar testes de hipótese para proporções, diferenças entre proporções, média , diferença entre médias, variância e razão de variâncias, reconhecendo a estatística apropriada a cada caso particular;

Explicar e calcular os erros do Tipo I e Tipo II.

Construir os testes mais potentes para hipóteses simples;

Construir os melhores testes envolvendo hipóteses compostas.

Resumo

Pretende-se com este capítulo permitir ao leitor uma abordagem geral à problemática da construção de testes de hipóteses. São definidos testes de hipóteses em geral e são apresentados os conceitos de hipótese nula e alternativa, bem como de hipótese simples e de hipótese composta. Apresentam-se os testes de hipóteses mais comuns: proporção, diferença de proporções, média, diferença de médias, variância e razão de variâncias. Como se sabe, associada a cada hipótese há sempre uma certa probabilidade de errar ao tomar esta ou aquela decisão. São por isso descritos e interpretados os erros Tipo I e Tipo II. Estudam-se técnicas para a construção dos testes mais potentes, envolvendo hipóteses simples e hipóteses compostas. Finalmente o leitor é convidado a contactar com alguns problemas práticos e a resolver os exercícios propostos.

75

76

3.1 Introdução e definição das hipóteses estatísticas

Observe-se o seguinte exemplo de um problema prático:

Na fábrica CD-Logics um dos responsáveis pelo controlo de qualidade está encarregue de em cada meia hora recolher uma pequena amostra dos CDs acabados de produzir e efectuar medições do nº de Megabytes respectivo. Inúmeros factores podem influenciar esta produção, sendo óbvia a variação subjacente. O objectivo da fábrica é produzir CDs com 700 Megabytes, donde será conveniente verificar se é isto que se passa na produção actual. Pretende-se averiguar se = 700 , ou seja se a média

populacional dos CDs produzidos se mantém igual ao pretendido. Assim, enquanto as médias amostrais não desviarem demais do valor pretendido, = 700 , a produção pode continuar sem problemas. Se o desvio for

demasiado há que tomar a decisão de parar a produção e averiguar qual o problema, rejeitando-se portanto que esteja tudo bem e que a média dos CDs produzidos continue com = 700 MegaBytes. Qual o desvio que se

considera demasiado? Qual a barreira que distingue pequenos desvios aleatórios de grandes desvios? Os grandes desvios são conhecidos por desvios significativos, pois necessitam de outra teoria que justifique os resultados das experiências produzidas, o que já não acontece com os pequenos desvios cuja razão de existência reside exclusivamente em factores aleatórios. Qual o erro que pode estar associado à decisão? Será desenvolvida a teoria que permite a resposta a todas estas questões. De acordo com o exemplo anterior, muitas vezes na prática é necessário tomar decisões sobre a população, tomando por base a informação obtida em amostras dessa mesma população, sujeitas a variações aleatórias. Para se tomarem decisões é necessário estabelecer suposições acerca da população. Uma hipótese estatística não é mais do que uma suposição ou conjectura acerca do valor de um determinado parâmetro de uma população, como no exemplo anterior, ou acerca da natureza dessa mesma

77

população. Note-se que esta suposição pode ser ou não verdadeira, mas a veracidade ou falsidade de uma hipótese estatística nunca é conhecida com certeza absoluta a menos que seja examinada toda a população, o que na

maioria dos casos é impraticável. Assim, é usual recorrer-se a uma amostra aleatória da população com interesse e com base na informação contida nessa amostra decidir se a hipótese é verdadeira ou falsa, com uma certa probabilidade associada. Quando se pretende testar o valor de um determinado parâmetro a verificação da suposição é feita por um teste paramétrico; quando se pretende testar a natureza de uma população a verificação da suposição é feita por um teste não paramétrico ou teste de aderência. São exemplos do primeiro caso (i), (ii) e (iii) ; são exemplos do segundo caso (iv) e (v):

(i)

(ii)

(iii)

(iv)

(v)

A média populacional dos ordenados da fábrica CD-Logics é 1000 Euros, ou seja = 1000 ;

A variância populacional dos ordenados da fábrica CD-Logics

é 500 Euros, ou seja

A proporção de empregados da fábrica CD-Logics no Controlo de Qualidade é de 15%, ou seja p=0.15;

A distribuição dos ordenados da fábrica CD-Logics é normal;

O número de acidentes de trabalho que ocorre na fábrica CD- Logics segue uma distribuição de Poisson.

2

=

500

;

Um teste de hipóteses não é mais do que a formulação de uma regra de decisão para não rejeitar ou rejeitar uma hipótese estatística, com base nas observações da amostra. Note-se que a não rejeição de uma hipótese estatística é resultado de insuficiente evidência para a rejeitar e não implica necessariamente que ela é verdadeira ( daí a preocupação em usar o termo “não rejeitar” em vez de “aceitar”).

H , hipótese nula, a hipótese estatística

Na notação usual designa-se por

a ser testada (efeito nulo ou ausência de diferença nos resultados de

0

78

interesse) e por

conjectura que se pretende provar. Se uma hipótese especifica completamente a distribuição, isto é se especifica a sua forma funcional bem como os valores de todos os parâmetros é chamada hipótese simples. Caso contrário é chamada

hipótese composta. O resultado do teste será portanto a confirmação ou não da suposição inicial, rejeitando ou não a hipótese nula. Em ambos os casos corre-se o risco de errar, logo uma das principais preocupações na construção dos testes de hipóteses é procurar minimizar esse risco. De um modo geral a construção de um teste de hipóteses rege-se pelos seguintes passos:

Definição das hipótese nula e alternativa: a hipótese nula é sempre de igualdade (=) e a alternativa pode ser de diferença (π , teste bilateral ) , ou de maior (>, teste unilateral

H 1 a hipótese alternativa, que geralmente representa a

(i)

direito) ou menor (< , teste unilateral esquerdo);

(ii)

Determinação de e identificação da estatística de teste e sua distribuição;

Estabelecimento da regra de decisão, determinando as regiões crítica e não crítica em função de (valores tabelados);

Cálculo da estatística de teste com base nos valores amostrais;

0 comparando o valor

(v)

observado do teste com as regiões crítica e não crítica. A hipótese nula será rejeitada se o valor da estatística do teste pertencer à região crítica e não será rejeitada caso contrário. Com base nas distribuições amostrais respectivas, serão agora expostos

(iv)

(iii)

Tomada de decisão: rejeitar ou não

H

79

de um modo geral os passos a seguir para a realização dos testes de hipóteses para proporções, diferenças entre proporções, médias, diferenças entre médias.

3.2 Testes de hipóteses para proporções (n grande)

Muitas vezes na prática é desejável a realização de testes de hipóteses referentes a proporções. São muitas as áreas de aplicação destes testes, e um exemplo clássico é o de um político que está interessado em averiguar qual a fracção de eleitores por ele conquistada. Pode testar se esta fracção se pode considerar, ou não, igual a determinado valor, com uma determinada confiança. Outro exemplo clássico é usado na área do Controlo da Qualidade em que o inspector deve testar com regularidade se a fracção de defeituosos fabricados se mantém aceitável.

Com base numa população binomial de parâmetros n, p e com q=1-p, é sabido que, admitindo uma amostra grande, a proporção é distribuída de acordo com a normal de parâmetros:

= p

e

=

p q n
p q
n

Ao realizar-se um teste de hipóteses para proporções, o objectivo será testar a hipótese nula:

H

0

: p = p

0

,

em que

hipóteses alternativas:

p

0 é um valor fixo e conhecido, contra três possíveis tipos de

H

11 Teste bilateral

: p π p

0

H

12 Teste unilateral direito

: p > p

0

80

H

13

: p < p

0

Teste unilateral esquerdo

Uma estatística adequada para o estabelecimento de um critério de decisão é dada por:

z =

pˆ p 0 p (1 p ) 0 0 n
p
0
p
(1
p
)
0
0
n

Sendo x o número de sucessos na amostra de dimensão n, recorde-se que

=

x

n

.

Regra de decisão: Após a determinação do nível de significância do teste, compara-se o valor observado da estatística de teste com o valor tabelado correspondente na tabela da distribuição normal reduzida. Para os três tipos de alternativas, tem-se respectivamente:

Teste bilateral:

Seja

z

/

2

o valor tabelado de z acima do qual corresponde uma área /2.

O procedimento do teste consiste em não rejeitar

H

0

caso o valor

observado do teste pertença ao intervalo

crítica .

Rejeitar H

z

/ 2

<

z

<

z

/ 2

, região não

0 caso contrário, ou seja caso z pertença à região crítica,

z

<

z

/ 2

ou

z >

z

/ 2

.

Teste unilateral direito:

O procedimento do teste consiste em não rejeitar H

0

se

z < z

.

Rejeitar H

0

caso contrário, ou seja caso z pertença à região crítica,

Teste unilateral esquerdo:

z > z

.

81

O procedimento do teste consiste em não rejeitar H

0

se

z > z

.

Rejeitar H

0

caso contrário, caso z pertença à região crítica,

z < z

.

3.3 Testes de hipóteses para diferenças entre proporções (Amostras grandes)

São muitas e diversas as situações em que se pretendem comparar

proporções. A título de exemplo, pode ser desejável comparar proporções

de peças defeituosas produzidas por duas máquinas diferentes, ou

proporções de votos de dois candidatos a determinada presidência. Pode ainda ser importante para a tomada de decisão de fumar ou não fumar, o conhecimento do facto de a proporção de fumadores que morrem com cancro no pulmão ser bastante superior à proporção dos não fumadores

que morrem desse mal.

Sejam duas populações P1 e P2, distribuídas binomialmente com

parâmetros respectivamente

representam as

. É já sabido que

de proporções

proporções de sucessos, com

admitindo amostras grandes e independentes, a diferença é distribuída de acordo com a normal com os parâmetros:

n

1

,p

1

e

n

2

, p

p

1

2

, onde p

1

e

q

2

= 1

e

p

2

p

2

q

1

=1

1

2

=

p

1

p

2

e

1

2

=

p q p q 2 1 1 2 2 2 + = + pˆ pˆ
p q
p
q
2
1
1
2
2
2 +
=
+
1
2
n
n
1
2

Em geral pretende-se testar a igualdade de proporções, podendo o teste ser

unilateral direito, unilateral esquerdo ou bilateral.

A hipótese nula será:

H

o

: p

1

p

2

= 0

H

o

: p

1

= p

2

As hipótese alternativas podem ser:

82

H

H

H

11

12

13

: p

: p

: p

1

1

1

p

p

p

2

2

2

π 0

>

<

0

0

H

H

H

11

o

o

: p

1

: p

1

: p

1

π p

2

> p

2

< p

2

Teste bilateral

Teste unilateral direito

Teste unilateral esquerdo

A estatística de teste apropriada

será:

ao estabelecimento da regra de decisão

Sob a hipótese

H

z =

pˆ pˆ 1 2 p q q 1 1 2 2 + p n 1
1
2
p q
q
1
1
2
2
+ p
n
1 n
2

0 pode escrever-se:

z =

pˆ pˆ 1 2  1 1  (pq)  +    n
1
2
 1
1
(pq) 
+
n
n
1
2

Quando

distribuição normal. Para calcular o valor de z é necessário estimar o

parâmetro p (e obviamente q). Assim é usual a consideração de um

2 são grandes a variável z segue uma

H

0

é verdadeira e

n

1

e

n

estimador ponderado, combinando os dados de ambas amostras da

seguinte forma:

Note-se que

x

das

amostras

1

e

x

x 1 2

x

n

1

2

+ = 1

+ n

=

e

2 representam o número de sucessos em cada uma

independentes

e

recorde-se

que

1

=

x

1

n

1

e

2

=

x

2

n

2

.

Finalmente a estatística de teste pode escrever-se:

83

z =

pˆ pˆ 1 2  1 1  (pˆqˆ)  +    n
1
2
 1
1
(pˆqˆ) 
+
n
n
1
2

Regra de decisão: Após a determinação de , nível de significância do

teste, deve comparar-se o valor observado da estatística de teste com o

valor tabelado correspondente na tabela da distribuição normal reduzida.

Para os três tipos de alternativas, tem-se respectivamente:

Teste bilateral:

O procedimento do teste consiste em não rejeitar

H

0

caso o valor

observado do teste pertença ao intervalo

crítica.

Rejeitar

H

0

caso contrário, ou seja caso z

z

/ 2

<

z

<

z

/ 2

, região não

pertença à região crítica,

z

<

z

/ 2

ou

z >

z

/ 2

.

Teste unilateral direito:

O procedimento do teste consiste em não rejeitar H

0

se

z < z

.

Rejeitar H

0

caso contrário, ou seja caso z pertença à região crítica,

Teste unilateral esquerdo:

O procedimento do teste consiste em não rejeitar H

0

se

z > z

.

Rejeitar H

0

caso contrário, caso z pertença à região crítica,

z < z

z > z

.

.

3.4 Testes de hipóteses para a média populacional

84

Tal como para os intervalos de confiança para a média, também para os

respectivos testes de hipóteses há dois casos que exigem especial atenção. Distinguem-se as situações em que a variância populacional é conhecida,

das situações em que a variância populacional é desconhecida e a amostra

de que se dispõe é de pequena dimensão. Como se sabe nos casos em que a amostra é grande, pode utilizar-se a distribuição normal e usar-se a variância amostral para estimar a variância populacional. Nos casos em que a amostra é pequena e a variância populacional é desconhecida

recorre-se à distribuição t-de-Student.

Ao realizar-se um teste de hipóteses para a média populacional, o

objectivo será testar a hipótese nula:

H

0

:

=

0

,

em que

0

é um valor fixo e conhecido, contra três possíveis tipos de

hipóteses alternativas:

H

H

H

11

12

13

:

:

:

π

>

<

0

0

0

Teste

bilateral

Teste

unilateral direito

Teste

unilateral esquerdo

3.4.1 Caso 1: Variância populacional conhecida

Um estimador pontual para a média

pode ser obtido a partir da média

amostral, representada pela variável aleatória X , de valor observado x . Já

foi estudado que, para amostras grandes (n>30), admitindo que a

população é infinita, que a amostragem é com reposição, e atendendo ao Teorema do limite central, tem-se:

x = e = . x n
x =
e
=
.
x
n

85

Uma estatística adequada para o estabelecimento de um critério de

decisão é dada por:

X n(X ) 0 0 Z = = n
X
n(X
)
0
0
Z =
=
n

Regra de decisão: Determina-se o nível de significância do teste e

compara-se o valor observado da estatística de teste, z, com o valor

tabelado correspondente, na tabela da distribuição normal reduzida. Para

os três tipos de alternativas, tem-se respectivamente:

Teste bilateral:

Não

se rejeita

H

0

se o valor observado do teste pertencer ao intervalo

z

/ 2

<

z

Rejeita-se

<

z

H

0

/ 2

, região não crítica .

caso contrário, ou seja caso z

pertença à região crítica,

z

<

z

/ 2

ou

z

>

z

/ 2

.

Teste unilateral direito:

O procedimento do teste consiste em não rejeitar H

0

se

z < z

.

Rejeitar H

0

caso contrário, ou seja caso z pertença à região crítica,

Teste unilateral esquerdo:

O procedimento do teste consiste em não rejeitar H

0

se

z > z

.

Rejeitar H

0

caso contrário, caso z pertença à região crítica,

z < z

z > z

.

.

3.4.2 Caso2: Variância populacional desconhecida

Considere um estudo realizado numa população normal, com média

e

variância

2 desconhecida, no que respeita à variável aleatória X, ou seja,

86

X

X

N(

N(

,

,

2

)

2

n

.

)

.

Sabe-se

que

X

representa

a

média

amostral

e

que

Sendo o desvio padrão populacional, , desconhecido,

deverá ser estimado através do desvio padrão amostral:

ˆ

S =

n 2 ∑ X 2 nX i i = 1 n 1
n
2
X
2 nX
i
i
= 1
n
1

No caso particular de variância desconhecida, e tal como já foi referido

anteriormente, há duas situações importantes a considerar, dependendo da

dimensão da amostra.

Situação 1: Amostra de grande dimensão ( n 30)

Quando a amostra é grande, usa-se:

ˆ

S

=

n 2 ∑ X 2 nX i i = 1 n 1
n
2
X
2 nX
i
i
= 1
n
1

como valor estimado do desvio padrão populacional e procede-se tal como

no caso anterior, recorrendo à distribuição normal. Uma estatística

adequada para o estabelecimento de um critério de decisão será, com

base numa amostra de dimensão n:

Z =

n(x 0 ) sˆ
n(x
0 )

O procedimento do teste e a regra de decisão segue exactamente o mesmo

critério que para o caso anterior, em que a variância é conhecida.

Situação 2:

Amostra de pequena dimensão

Em situações de amostras de pequena dimensão (n<30) e em que a

variância populacional é desconhecida, recorre-se à distribuição t-de-

87

ˆ

Student, com n-1 graus de liberdade, e escolhe-se S

, de valor observado na amostra:

=

n 2 2 ∑ x nx i i = 1 n 1
n
2
2
x
nx
i
i
= 1
n
1

como estimador de

Uma estatística adequada para o estabelecimento de um critério de

decisão, com base numa amostra de dimensão n, é dada por:

T

=

X n(X ) 0 0 = ˆ ˆ
X
n(X
)
0
0
=
ˆ ˆ

S S

n
n

Regra de decisão: Determina-se o nível de significância do teste e

compara-se o valor observado da estatística de teste, t, com o valor

tabelado correspondente a n-1 graus de liberdade na tabela t-de-Student.

Para os três tipos de alternativas, tem-se respectivamente:

Teste bilateral:

Não se rejeita

H

0 se o valor observado do teste pertencer ao intervalo

t

n

1,1

/ 2

<

t

<

t

n

1,1

/ 2

, região não crítica .

Rejeita-se

H

0 caso contrário, ou seja caso t pertença à região crítica,

t

<

t

n

1,1

/ 2

ou

t

>

t

n

1,1

/ 2

.

Teste unilateral direito: O procedimento do teste consiste em não rejeitar

0 caso contrário, ou seja caso t pertença à

H

0

se

t

<

t

n

1,1

. Rejeitar

H

região crítica,

t

>

t

n

1,1

.

Teste unilateral esquerdo:

O procedimento do teste consiste em não rejeitar H

0

se

t

>

Rejeitar H

0

caso contrário, caso t pertença à região crítica,

t

t

<

n

1,1

t

n

.

1,1

.

88

3.5 Testes de hipóteses para a diferença entre médias

Admitam-se duas populações com médias

1

e

2

e variâncias

2

1

e

2

2

,

respectivamente, sendo

dimensão

extraídas a partir de populações normais, e se qualquer uma das amostras tiver dimensão mínima de 30 observações, sabe-se que:

X a média de amostras aleatórias de

X

1

e

2

n

1

e

n , respectivamente. Se as amostras independentes são

2

X

1

N(

1

,

2

1

n 1

)

,

X

2

N(

2

,

2

2

)

n 2

e

(X

1

X

2

)

N(

1

2

,

2 2

2

1

+

1 n

n

2

).

Ao realizar-se um teste de hipóteses para a diferença entre médias

populacionais, o objectivo será testar a hipótese nula:

H

0

:

1

2

=

k

,

sendo k um valor constante, contra três possíveis

tipos de hipóteses alternativas:

H

H

H

: π k 11 1 2 > k 12 : 1 2 < k 13
:
π
k
11
1
2
>
k
12 :
1
2
<
k
13 :
1
2

Teste bilateral

Teste unilateral direito

Teste unilateral esquerdo

3.5.1 Caso 1: Variâncias populacionais conhecidas

Uma estatística adequada para o estabelecimento de um critério de

decisão é dada por:

Z =

(X X ) ( ) 1 2 1 2 2 2 1 + 2 n
(X
X
)
(
)
1
2
1
2
2 2
1
+ 2
n
1 n
2

=

(X X ) k 1 2 2 2 1 + 2 n 1 n 2
(X
X
)
k
1
2
2 2
1
+ 2
n
1 n
2

.

Regra de decisão:

compara-se o valor observado da estatística de teste, z,

Determina-se o nível de significância do teste e

com o valor

89

tabelado correspondente, na tabela da distribuição normal reduzida. Para

os três tipos de alternativas, tem-se respectivamente:

Teste bilateral:

Não

se rejeita

H

0

se o valor observado do teste pertencer ao intervalo

z

/ 2

<

z

Rejeita-se

<

z

H

0

/ 2

, região não crítica .

caso contrário, ou seja caso z

pertença à região crítica,

z

<

z

/ 2

ou

z

>

z

/ 2

.

Teste unilateral direito:

O procedimento do teste consiste em não rejeitar H

0

se

z < z

.

Rejeitar H

0

caso contrário, caso z pertença à região crítica ou seja

Teste unilateral esquerdo:

O procedimento do teste consiste em não rejeitar H

0

se

z > z

.

Rejeitar H

0

caso contrário, caso z pertença à região crítica,

z < z

z > z

.

.

3.5.2 Caso 2: Amostras pequenas e variâncias populacionais desconhecidas, porém iguais

Tal como no caso da média simples, é também para a diferença entre

médias, necessário recorrer à distribuição t-de-Student para estabelecer a

regra de decisão.

Uma estatística adequada para o estabelecimento de um critério de

decisão será:

T =

(X X ) k 1 2 1 1 ˆ S c + n 1 n
(X
X
)
k
1
2
1
1
ˆ
S
c +
n 1
n 2

90

Recorde-se que:

ˆ

S

2

c

=

(n

1

ˆ

1) S

2

1

+

(n

2

ˆ

1) S

2

2

 

n

1

+

n

2

2

Regra de decisão: Determina-se o nível de significância do teste e

compara-se o valor observado da estatística de teste, t, com o valor

graus de liberdade na tabela t-de-

Student. Para os três tipos de alternativas, tem-se respectivamente:

tabelado correspondente a n

1

+

n

2

2

Teste bilateral:

Não se rejeita

H

0 se o valor observado do teste pertencer ao intervalo

t

n

+

1

n

2

2,1

Rejeita-se

/ 2

H

<

t

<

t

n

+

1

n

2

2,1

/ 2

, região não crítica .

0 caso contrário, ou seja caso t pertença à região crítica,

t

<

t

n

+

1

n

2

2,1

/ 2

ou

t

>

t

n

+

1

n

2

2,1

/ 2

.

Teste unilateral direito:

O procedimento do teste consiste em não rejeitar H

0

se

t

<

t

n

+

1

n

2

2,1

.

Rejeitar

H

0

caso contrário, ou seja caso t pertença à região crítica,

t

>

t

n

+

1

n

2

2,1

.

Teste unilateral esquerdo:

O procedimento do teste consiste em não rejeitar H

0

se

t

>

t

n

+

1

n

2

2,1

Rejeitar H

caso

0 caso contrário, caso t pertença à região crítica, ou seja no

t

<

t

n

1

+

n

2

2,1

.

de

.

3.5.3 Caso 3: Variâncias populacionais desconhecidas e diferentes entre si, amostras pequenas e de diferentes dimensões

Tal como para os intervalos de confiança, também quando se pretende

91

testar a diferença entre duas médias populacionais, dispondo de

pequenas amostras independentes, com dimensões diferentes e

variâncias populacionais desconhecidas e diferentes entre si, a

estatística mais frequentemente usada é:

T =

(X

1

X

2

)

(

1

2

)

 

ˆ

S

2

ˆ

S

2

1

+

2

 
     
   

n

1

n

2

Como já se viu, T obedece a uma distribuição t-de-Student com graus

de liberdade, sendo obtido pela expressão a seguir apresentada,

arredondando ao inteiro mais próximo:

 

ˆ

ˆ

2

=

S

n

2

1

1

+

S

n

2

2

2

 
 

ˆ

ˆ

S

4

1 +

S

4

2

   
 

n

2

1

(n

1)

n

2

(n

1

2

2

1)

Regra de decisão: Determina-se o nível de significância do teste e

compara-se o valor observado da estatística de teste, t, com o valor

tabelado correspondente a graus de liberdade na tabela t-de-Student.

Para os três tipos de alternativas, tem-se respectivamente:

Teste bilateral:

Não se rejeita

t

,1

/ 2

<

t

<

t

H

,1

0

se o valor observado do teste pertencer ao intervalo

/ 2

, região não crítica . Rejeita-se

H

0 caso contrário, ou

seja caso t pertença à região crítica,

t

<

t

,1

/ 2

ou

t

>

t

,1

/ 2

.

Teste unilateral direito:

92

O procedimento do teste consiste em não rejeitar H

0

se

t

<

t

,1

.

Rejeitar H

0 caso contrário, ou seja caso t pertença à região crítica,

t

>

t

,1

.

Teste unilateral esquerdo:

O procedimento do teste consiste em não rejeitar H

t

0

se

>

t

Rejeitar H

0 caso contrário, caso t pertença à região crítica,

t

<

,1 t
,1
t

.

,1

.

3.5.4 Caso 4: Variâncias populacionais desconhecidas e diferentes entre si, amostras com a mesma dimensão e dependentes, extraídas de populações normais

Para testar a diferença entre duas médias populacionais dispondo de

amostras não independentes com a mesma dimensão, de variâncias

não necessariamente iguais, são usadas observações são relacionadas,

ou emparelhadas. Considere-se

diferenças entre amostras) de dimensão n, seleccionada a partir de uma

população

D , uma amostra aleatória (de

ˆ

S

D , D

1

2

D

2

,

,

n

N(

D

,

2

D

)

e seja

o estimador da variância.

A

H

hipótese nula a testar será:

0

:

=

D

k

, com k constante, e

D

=

1

de hipóteses alternativas:

2

, e os três possíveis tipos

H

H

11 Teste bilateral

:

D

π

k

12 Teste unilateral direito

:

D

>

k

93

H

13

:

D

<

k

Teste unilateral esquerdo

A estatística apropriada a este teste será:

T =

(D n D ) ˆ S D
(D
n
D )
ˆ
S
D

Regra de decisão: Determina-se o nível de significância do teste e

compara-se o valor observado da estatística de teste com o valor tabelado

correspondente a n-1 graus de liberdade na tabela t-de-Student. Para os

três tipos de alternativas, tem-se respectivamente:

Teste bilateral:

Não se rejeita

t

n

1,1

/ 2

Rejeita-se

<

t

H

0

<

H

0

t

n

se o valor observado do teste pertencer ao intervalo

1,1

/ 2

, região não crítica .

caso contrário, ou seja caso t pertença à região crítica,

t

<

t

n

1,1

/ 2

ou

t

>

t

n

1,1

/ 2

.

Teste unilateral direito:

O procedimento do teste consiste em não rejeitar H

0

se

t

<

t

n

1,1

.

Rejeitar

H

0 caso contrário, ou seja caso t pertença à região crítica,

t

>

t

n

1,1

.

Teste unilateral esquerdo:

O procedimento do teste consiste em não rejeitar H

0

se

t

>

Rejeitar H

0

caso contrário, caso t pertença à região crítica,

t

t

<

n

1,1

t

n

.

1,1

.

3.6 Testes de hipóteses para a variância

Pretende-se testar a hipótese de que a variância é igual a um determinado

94

valor fixo e conhecido, diga-se

dimensão n.

A

2

0

, com base numa amostra aleatória de

hipótese nula a testar será então:

H

0

:

2 2

0

=

e os três possíveis tipos de hipóteses alternativas:

H

H

H

11

12

13

:

:

:

2

2

2

π

>

<

2

0 Teste bilateral

2

0

2

0

Teste unilateral direito

Teste unilateral esquerdo

A estatística apropriada a este teste é dada por:

(n

ˆ

1) S

2

2 =
2
=

2

0

Regra de decisão: Determina-se o nível de significância do teste e

compara-se o valor observado da estatística de teste com o valor tabelado

correspondente a n-1 graus de liberdade na tabela do Qui-Quadrado. Para

os três tipos de alternativas, tem-se respectivamente:

Teste bilateral:

Não se rejeita

H

2

n

1,

/ 2

<

2

<

2

n

0 se o valor observado do teste pertencer ao intervalo

1,1

/ 2

, região não crítica.

Rejeita-se

H

0

caso contrário.

Teste unilateral direito:

O procedimento do teste consiste em não rejeitar H

Rejeitar H

0

caso contrário

0

se

2 <

2

n

1,1

.

95

Teste unilateral esquerdo:

O procedimento do teste consiste em não rejeitar H

Rejeitar H

0

caso contrário.

0

se

2 >

2

n

1,

.

3.7 Testes de hipóteses para a razão de variâncias

Pretende-se testar a hipótese de igualdade entre variâncias, com base em

retiradas de duas populações normais, com

amostras de dimensão

n

1

e

n

2

variâncias respectivamente

2

1

e

2

2

. A hipótese nula a testar será então:

H

0

:

2 2

2

1

=

e os três possíveis tipos de hipóteses alternativas:

H

H

H

11

12

13

:

:

:

2

1

π

2

2

Teste bilateral

1 2 Teste unilateral direito

>

2

2

1 2 Teste unilateral esquerdo

<

2

2

A estatística apropriada a este teste é dada por:

ˆ 2 S 1 F = ˆ 2 S 2
ˆ
2
S
1
F =
ˆ
2
S
2

Regra de decisão:

compara-se o valor observado da estatística de teste com o valor tabelado

correspondente a (

numerador e do denominador respectivamente, na tabela F. Para os três tipos de alternativas, tem-se:

) graus de liberdade, do

Determina-se o nível de significância do teste e

1

=

n

1

1,

2

=

n

2

1

Teste bilateral:

Não se rejeita

H

0 se o valor observado do teste pertencer ao intervalo

96

F

n

F

1

1

,

1,n

2

2

,1

1,1

/ 2

Rejeita-se

/ 2

<

H

<

F

<

F

n

1

1,n

2

1,

/ 2

, ou equivalentemente de forma simplificada

F

<

F

1

,

2

,

/ 2

, região não crítica.

0

caso contrário.

Teste unilateral direito:

Não se rejeita H

0

se

F

<

F

n

Rejeitar H

0

caso contrário

1

1,n

2

1,

Teste unilateral esquerdo:

Não rejeitar H

0

se

F

>

F

n

1

Rejeitar H

0

caso contrário.

1,n

2

1,1

ou equivalentemente se

ou equivalentemente se

F

<

F

F

>

F

1

,

1

,

2

2

,

,1

.

.

3.8 Erros do Tipo I e Erros do Tipo II

3.8.1 Introdução

Seja o nível de significância de um teste estatístico e c o valor crítico

(valor a partir do qual rejeitamos

valores para os quais a hipótese nula é rejeitada designa-se por região crítica ou região de rejeição. A região de valores para os quais não se rejeita a hipótese nula é conhecida por região de aceitação (apesar de esta designação não ser a mais correcta – seria preferível talvez usar região de não rejeição, como já foi anteriormente explicado). De um modo geral os valores adoptados para são 1% ou 5%. Seja X uma variável aleatória cuja distribuição envolve um parâmetro desconhecido.

contra

H ). A região que contém todos os

0

Admitamos que se pretende testar a hipótese nula de que =

0

uma das alternativas seguintes:

(i)

π

0 (hipótese alternativa bilateral)

97

(ii)

(iii)

>

<

0

0

(hipótese alternativa unilateral direita)

( hipótese alternativa unilateral esquerda)

“Teste bilateral”

alternativa unilateral esquerda) “Teste bilateral” - Região de aceitação ; - Região de rejeição RA c

- Região de aceitação ;

esquerda) “Teste bilateral” - Região de aceitação ; - Região de rejeição RA c 1 0

- Região de rejeição

RA
RA
RA
RA
RA
RA

RA

RA
RA
RA
RA
RA
RA
RA
RA
RA

c

1

0

“Teste unilateral direito”

de rejeição RA c 1 0 “Teste unilateral direito” - Região de aceitação ; c 2

- Região de aceitação ;

c

2

- Região de rejeiçãounilateral direito” - Região de aceitação ; c 2 0 c “Teste unilateral esquerdo” - Região

- Região de aceitação ; c 2 - Região de rejeição 0 c “Teste unilateral esquerdo”
- Região de aceitação ; c 2 - Região de rejeição 0 c “Teste unilateral esquerdo”
- Região de aceitação ; c 2 - Região de rejeição 0 c “Teste unilateral esquerdo”
- Região de aceitação ; c 2 - Região de rejeição 0 c “Teste unilateral esquerdo”
- Região de aceitação ; c 2 - Região de rejeição 0 c “Teste unilateral esquerdo”
- Região de aceitação ; c 2 - Região de rejeição 0 c “Teste unilateral esquerdo”
- Região de aceitação ; c 2 - Região de rejeição 0 c “Teste unilateral esquerdo”
- Região de aceitação ; c 2 - Região de rejeição 0 c “Teste unilateral esquerdo”
- Região de aceitação ; c 2 - Região de rejeição 0 c “Teste unilateral esquerdo”
- Região de aceitação ; c 2 - Região de rejeição 0 c “Teste unilateral esquerdo”
- Região de aceitação ; c 2 - Região de rejeição 0 c “Teste unilateral esquerdo”
- Região de aceitação ; c 2 - Região de rejeição 0 c “Teste unilateral esquerdo”
- Região de aceitação ; c 2 - Região de rejeição 0 c “Teste unilateral esquerdo”
- Região de aceitação ; c 2 - Região de rejeição 0 c “Teste unilateral esquerdo”

0 c

“Teste unilateral esquerdo”

c 2 - Região de rejeição 0 c “Teste unilateral esquerdo” - Região de aceitação; -

- Região de aceitação;

- Região de rejeiçãoRegião de aceitação ; c 2 - Região de rejeição 0 c “Teste unilateral esquerdo” -

c 2 - Região de rejeição 0 c “Teste unilateral esquerdo” - Região de aceitação; -
c 2 - Região de rejeição 0 c “Teste unilateral esquerdo” - Região de aceitação; -
c 2 - Região de rejeição 0 c “Teste unilateral esquerdo” - Região de aceitação; -
c 2 - Região de rejeição 0 c “Teste unilateral esquerdo” - Região de aceitação; -
c 2 - Região de rejeição 0 c “Teste unilateral esquerdo” - Região de aceitação; -
c 2 - Região de rejeição 0 c “Teste unilateral esquerdo” - Região de aceitação; -
c 2 - Região de rejeição 0 c “Teste unilateral esquerdo” - Região de aceitação; -
c 2 - Região de rejeição 0 c “Teste unilateral esquerdo” - Região de aceitação; -
c 2 - Região de rejeição 0 c “Teste unilateral esquerdo” - Região de aceitação; -
c 2 - Região de rejeição 0 c “Teste unilateral esquerdo” - Região de aceitação; -
c 2 - Região de rejeição 0 c “Teste unilateral esquerdo” - Região de aceitação; -
c 2 - Região de rejeição 0 c “Teste unilateral esquerdo” - Região de aceitação; -

98

c

0

3.8.2 Tipos de erros

Há riscos inerentes à tomada de decisão, de rejeitar ou não a hipótese nula, que obviamente se pretende que sejam mínimos. Considere-se a título de exemplo um teste de hipótese unilateral esquerdo, podendo esta análise ser extrapolada para os outros tipos de testes:

H

o

:

=

0

H

1

:

=

1

, com

1

<

0

.

O valor crítico c e a região de rejeição situam-se à esquerda de

0 .

Com base numa amostra de dimensão n,

x

1

, x

2

,

,x

n

, retirada de uma

população em estudo determine-se um valor para ˆ .

A regra de decisão consiste em rejeitar

H

0

se ˆ <c e não rejeitar

H

0

se

ˆ c . Passamos a enunciar dois tipos de erros passíveis de ser cometidos com esta regra:

Erro Tipo I

Quando se toma a decisão de rejeitar a hipótese nula quando ela é verdadeira comete-se um erro do tipo I ou erro do produtor.

A hipótese nula é verdadeira mas é rejeitada porque ˆ >c.

A probabilidade de cometer esse erro é igual a , nível de significância do

teste.

Erro Tipo II

Quando se toma a decisão de não rejeitar a hipótese nula quando ela é falsa comete-se um erro do tipo II, ou erro do consumidor. A hipótese nula é falsa mas não é rejeitada, sendo a probabilidade de

99

cometer tal erro dada por . Esta probabilidade depende do valor da

alternativa,

Definição:

1 .

A probabilidade de evitar um erro do tipo II representa-se por . Esta

quantidade representa a potência do teste:

Exemplo:

= 1

Voltando ao problema inicial da fábrica CD-Logics, admita-se que ao inspeccionar a produção de CDs foi retirada uma amostra e com base nesta se pretende testar a hipótese de que todo o lote produzido satisfaz as condições exigidas. Se neste processo o lote for rejeitado mesmo que satisfaça as condições de qualidade, então comete-se um erro do Tipo I (risco do produtor). Se o lote for aceite quando na realidade não satisfaz as condições de qualidade é cometido um erro do Tipo II (risco do consumidor). A tabela a seguir representa as probabilidades dos erros tipo I e tipo II.

“Erros Tipo I e Tipo II”

 

Decisão

Não rejeitar

Rejeitar H

0

Realidade

H

0

:

=

0

 

H

0

verdadeira

Decisão correcta

Erro Tipo I

 

Probabilidade=

Probabilidade =

 

=1-

 

100

H

0

falsa

Erro Tipo II

Decisão correcta

 

Probabilidade =

Probabilidade =

 

= 1

Interpretação da tabela:

Sendo

H

0 verdadeira, a probabilidade de tomar a decisão correcta, ou seja

não rejeitar a hipótese nula , é igual a 1 ; a probabilidade de rejeitar H

sendo esta verdadeira é igual a , tamanho do erro do Tipo I;

Sendo

0

H

0

falsa, a probabilidade de tomar a decisão correcta, ou seja

rejeitar

esta falsa é igual a , tamanho do erro do Tipo II.

Como já foi referido, nos testes de hipóteses o objectivo é definir as regras de decisão por forma a minimizar estes erros. Este não é um assunto simples, pois em geral para uma dada dimensão da amostra, quando se tenta diminuir um tipo de erro o outro aumenta. Note-se que quer quer dependem do ponto crítico c.

H sendo

H

0

, é igual a

= 1 ; a probabilidade de não rejeitar

0

Considere agora um teste unilateral direito. Observe as figuras:

c 0 1
c
0
1

101

H 0 verdadeira (região de aceitação); Região crítica ( H 1 verdadeira ) c 0

H

0

verdadeira (região de aceitação); Região crítica ( H 1 verdadeira ) c 0 1
verdadeira (região de aceitação); Região crítica (
H 1 verdadeira )
c
0
1

H verdadeira (região de aceitação); Região crítica ( H 1 verdadeira ) 0
H
verdadeira (região de aceitação); Região crítica (
H 1 verdadeira )
0

Como se pode constatar, da deslocação de c para a direita resulta a

e consequente aumento de . Só é possível reduzir

diminuição de

simultaneamente os dois tipos de erro, aumentando a dimensão da amostra, o que por vezes é impraticável. Assim, deve procurar-se uma solução que conduza à redução do tipo de erro que se considere mais grave. É prática vulgar escolher-se primeiro o valor de , 1% ou 5%, como já foi referido. Determina-se então o valor de c sendo finalmente calculado o valor de correspondente.

Quando a hipótese alternativa não é um número simples, mas assume uma das formas:

(i)

π

0

(hipótese alternativa bilateral)

(ii)

>

0

(hipótese alternativa unilateral direita)

(iii)

então torna-se uma função de , ( ) , função esta conhecida como

Curva Característica Operacional.

<

0

( hipótese alternativa unilateral esquerda)

102

Conclui-se ainda acerca da existência da função ( ) = 1 ( ) , conhecida

como Função Potência do Teste. São apresentados em seguida os métodos adequados para a obtenção dos testes mais potentes.

3.9 Construção de testes mais potentes

3.9.1 O Lema de Neyman-Pearson

Pretende-se agora comparar a qualidade do teste de uma dada hipótese simples contra uma dada hipótese alternativa simples. Na maior parte das vezes, o estatístico ao ver-se confrontado com um problema que envolve um teste, define antecipadamente o tamanho do erro do tipo I passível de usar no teste, estabelecendo também a dimensão n da amostra a recolher. O objectivo do estatístico é tentar construir o teste que minimiza o tamanho do erro tipo II, . O melhor teste ou teste mais potente, será

aquele para o qual é mínimo no conjunto de testes que correspondem aos valores de e n previamente estabelecidos. A região crítica correspondente ao melhor teste designa-se por melhor região crítica. No presente caso, a região crítica de um teste vem a ser a região definida num espaço n-dimensional, consistindo de todos os pontos amostrais, para a qual o teste conduz à rejeição da hipótese nula. Um teste para o qual o tamanho do erro do tipo I é , é conhecido como o teste de dimensão , sendo o Lema de Neyman-Pearson o critério mais adequado à obtenção do teste mais potente com esta dimensão.

Lema de Neyman-Pearson

Consideremos testes de tamanho

de uma hipótese simples,

H

0

:

=

0

,

103

versus

população com função densidade f (x; ) .

Seja

correspondente.

C é a melhor região crítica de dimensão

simples

constante k tal que:

H

1

L(

:

)

=

=

1

, baseados numa amostra de dimensão n extraída de uma

=

f (x ;

1

) f (x

2

;

)

f

(x

n

;

)

,

a

função

de

verosimilhança

0

para testar a hipótese nula

, se existir uma

contra a hipótese alternativa simples

=

1

(i)

L(

1)

L(

0

)

k

, quando x , x

1

2

,

,

x

n

C

(ii)

L(

1)

L(

0

)

k

, quando x , x

1

2

,

,

x

n

C

,

Demonstração do Lema:

Um valor da amostra,

x , pode ser considerado como um valor observado

j

de uma variável aleatória

X

j

, com função densidade f (x ; )

j

. Dado que

L( ) é a

densidade da variável aleatória (

assumir

qualquer valor em C, quando = , é igual a . O objectivo é agora

crítica C, a probabilidade de a variável aleatória

estas variáveis aleatórias

X ). Por definição da região

X

X , X

1

2

,

,

X

1

n

, X

0

são independentes então

2

,

,

n

X

1

, X

2

,

,

X

n

demonstrar que a melhor região crítica para o erro tipo I é C.

Para C pode-se escrever então:

C

L(

0

)dx

=

, onde dx =

dx

1

, dx

2

,

,

dx

n

Seja C* outra região crítica qualquer de dimensão . Assim tem-se:

C*

L(

0

)dx

=

.

Sejam

críticas C e C* respectivamente.

Uma vez que

e * os tamanhos dos erros do tipo II correspondentes às regiões

é a probabilidade de

X

1

, X

2

,

,

X assumir qualquer valor

n

104

fora da região crítica C quando = 1 verdadeira, tem-se: = 1 ∫ L( 1
fora da região crítica C quando
=
1 verdadeira, tem-se:
=
1
L(
1 )dx ,
dx =
dx 1
, dx
,
,
dx . Analogamente,
2
n
C
* =
1
L(
1 )dx .
C*
Seja B =
C
C * ,
A =C-B e A*=C*-B .
C
C*
A
B
A*
Uma vez que
L(
0 )dx
=
, e
L(
0 )dx
=
, pode-se escrever
C
C*
L(