Sei sulla pagina 1di 26
Universidade Federal do Piauí Campus Universitário “Prof a . Cinobelina Elvas” – Bom Jesus, PI

Universidade Federal do Piauí Campus Universitário “Prof a . Cinobelina Elvas” – Bom Jesus, PI Profa. Gisele

VI - TESTES DE HIPÓTESES

1. Introdução A Inferência Estatística é a parte da estatística que trata das condições sob as quais se faz inferências (ou pressuposições ou generalizações) sobre uma população, com base em dados amostrais. Se uma amostra é representativa de uma população, possui as mesmas características básicas da mesma, e os resultados amostrais podem ser inferidos como resultados válidos para a população estudada. A inferência estatística envolve questões de dois tipos: a estimação de parâmetros populacionais e os testes de hipóteses. Os TESTES DE HIPÓTESES (ou testes de significância ou teoria da decisão estatística) constituem procedimentos estatísticos cujo objetivo é tomar decisões baseadas nas evidências fornecidas pelos dados amostrais. Supondo que seja levanta uma hipótese sobre o valor do parâmetro, essa hipótese será considerada verdadeira até que prove o contrário. Portanto, o teste de hipótese é o procedimento que nos levará a rejeitar ou na essa hipótese a partir das evidências obtidas nos resultados amostrais. Exemplo:

Podemos estar interessados em verificar se as seguintes afirmações são verdadeiras:

1. a produtividade média de leite em Bom Jesus é de 2,3 kg/animal;

2. a produtividade média de leite em Bom Jesus e em Cristino Castro são, ambas, de 2,3

kg/animal. Aplicando-se o teste de hipóteses adequado poderemos rejeitar ou não a hipótese de que a produtividade média de leite em Bom Jesus é realmente de 2,3 kg/animal, e rejeitar ou não a hipótese de que a produtividade média de leite em Bom Jesus e em Cristino Castro são, ambas, de 2,3 kg/animal. Observa-se que se podem fazer inferências sobre os parâmetros de apenas uma população, ou sobre os parâmetros de duas populações diferentes, no exemplo sobre a média da produtividade de leite na população leiteira de Bom Jesus, e sobre as médias das produtividades nas populações leiteiras de Bom Jesus e Cristino Castro. Desenvolveremos, neste conteúdo, os testes de hipóteses para os parâmetros mais usuais que viemos estudando nos conteúdos anteriores, média e variância, para uma e duas populações.

Importante ressaltar que, os testes desenvolvidos neste conteúdo pressupõem que a característica

em análise é normalmente distribuída com média µ e variância

σ

2

.

2. Formulação das hipóteses

Hipótese nula (H o ): é a hipótese que sugere que a afirmação que estamos fazendo sobre o parâmetro populacional é verdadeira. Portanto, H o sempre inclui o sinal de igual, da não variação.

Hipótese alternativa (H a ): é a hipótese que sugere que a afirmação que estamos fazendo sobre o parâmetro populacional é falsa, ou seja, que o valor do parâmetro é diferente, menor ou maior que o estipulado. Portanto, H a sempre inclui o sentido da variação. Exemplo: Estamos interessados em verificar se as seguintes afirmações, em relação à produtividade média de leite, são verdadeiras:

- a produtividade média de leite em Bom Jesus é de 2,3 kg/animal;

- a produtividade média de leite em Bom Jesus e em Cristino Castro são ambas, de 2,3 kg/animal. Podemos testar então as seguintes hipóteses:

H

H

o : µ Bom Jesus = 2,3

a : µ Bom Jesus 2,3 ou

µ Bom Jesus < 2,3 ou

µ Bom Jesus > 2,3

Ou ainda, poderíamos testar, em relação às duas populações leiteiras, as seguintes hipóteses:

H

H

o : µ Bom Jesus = µ Cristino castro

a : µ Bom Jesus ≠ µ Cristino castro ou

µ Bom Jesus < µ Cristino castro ou

µ Bom Jesus > µ Cristino castro

De acordo com a hipótese alternativa utilizada no teste de hipótese, este pode ser classificado

em unilateral à esquerda (Ex.: µ Bom Jesus < 2,3 e µ Bom Jesus < µ Cristino castro ), unilateral à direita (Ex.: µ Bom

Jesus > 2,3 e µ Bom Jesus > µ Cristino castro ) e bilateral (Ex.: µ Bom Jesus 2,3 e µ Bom Jesus ≠ µ Cristino castro ).

3. Decisão em um teste estatístico

A decisão de um teste estatístico, ou seja, se devemos ou não rejeitar a hipótese de nulidade, é feita por meio da comparação do valor especificado para o parâmetro com aquele estimado a partir de

uma amostra da população. Raramente, o valor estimado será idêntico àquele especificado para o parâmetro. Para diferentes amostras, um estimador pode assumir diferentes valores, sendo que existem intervalos de

valores mais prováveis de ocorrer que outros. Este tipo de comportamento caracteriza uma distribuição de probabilidade. Do ponto de vista matemático, o valor dado pelo estimador pode diferir do valor esperado para o parâmetro. Esta diferença matemática nem sempre representa que a hipótese de nulidade deva ser rejeitada, pois como o estimador é uma variável aleatória, é esperado que ele assuma valores dentro de um intervalo. O que um teste de hipóteses faz é comparar o valor especificado para um parâmetro com a estimativa fornecida pelo estimador. Se a variação entre os dois valores for PEQUENA diz-se que a foi devido à amostragem (acaso), consequentemente o valor do parâmetro é realmente o especificado. Logo, a diferença entre o valor paramétrico e sua estimativa não é significativa e não se rejeita a hipótese de nulidade. Por outro lado, se a variação entre o valor paramétrico e sua estimativa for GRANDE, conclui- se que a diferença é significativa e rejeita-se a hipótese de nulidade. Nota-se que para a rejeição ou não da hipótese de nulidade é preciso estabelecer o que é uma PEQUENA ou GRANDE diferença entre o valor paramétrico e sua estimativa. Para isto, devemos conhecer a distribuição de probabilidade do estimador usado para estimar o parâmetro. Vamos ilustrar com o seguinte exemplo:

Suponha que, em uma fazenda, o tempo médio gasto pelos trabalhadores na execução de uma

tarefa é de 15 minutos (µ = 15 min). Sabe-se que o tempo de execução da tarefa é uma variável

aleatória que segue distribuição normal com variância igual a 2,5 min 2 [X N (15; 2,5)]. Um pesquisador implantou um novo sistema para diminuir o tempo médio de execução da tarefa e uma amostra de 10 trabalhadores foi obtida a qual forneceu uma estimativa de 14,9 minutos

( X = 14,9 min). Do ponto de vista matemático o número 14,9 é menor que o número 15, mas do ponto de vista estatístico, esse resultado 14,9 min é um resultado amostral e, portanto, está sujeito a variações. Faz-se então o seguinte questionamento: Esse resultado constitui uma evidência de que realmente o tempo médio diminuiu ou ele pode ter ocorrido por mero acaso? Para responder à pergunta têm-se duas opções: medir o tempo gasto por todos os trabalhadores na execução da tarefa com o novo sistema, ou então fazer uso de um teste de hipóteses. Na primeira opção é claro que nenhum teste de hipóteses seria necessário, pois o pesquisador teria condições de conhecer o verdadeiro valor do tempo médio na execução da tarefa com o novo sistema na população de trabalhadores. Na segunda opção, o pesquisador faz uso dos valores amostrais, despendendo menos trabalho, custo e tempo. Nesse caso teríamos as hipóteses a serem testadas:

Ho: µ = 15 minutos

H a : µ < 15 minutos

Em termos probabilísticos poderíamos dizer que existe GRANDE probabilidade de em uma população com média igual a 15 min existir grupos de 10 indivíduos que apresentem uma média na execução da tarefa igual ou inferior a 1,49. Justificativa semelhante poderia ser atribuída a médias amostrais que tivessem valores próximos ao valor suposto. Nesses casos, o pesquisador tem a

tendência de não rejeitar a hipótese de nulidade, isto porque há forte indício de que a amostra foi retirada de uma população que apresenta uma média próxima do que a suposta de 15 minutos. Por outro lado, daquela população de trabalhadores, poder-se-ia tirar um grande número de diferentes amostras de tamanho igual a 10, e cada uma forneceria um valor para a média amostral. Então se a média amostral apresentar um valor muito distante do valor suposto, como por exemplo, 6 minutos, o pesquisador tem a tendência de rejeitar a hipótese de nulidade, isto porque há forte indício de que a amostra foi retirada de uma população que apresenta uma média menor do que a suposta de 15 minutos. Em termos probabilísticos poderia se dizer que a probabilidade de encontrar um grupo de indivíduos com média igual ou inferior a 6 minutos é muito PEQUENA, em uma população que apresenta uma média igual a 15 min. É possível ao pesquisador estabelecer um valor crítico que o ajuda a decidir sobre rejeitar ou não a hipótese de nulidade. Este valor crítico pode a princípio ser estabelecido de duas maneiras:

1ª) O pesquisador de posse dos seus conhecimentos prévios sobre o assunto estabeleceria um valor crítico antes de coletar a amostra. Este valor seria um valor para a média amostral tal que acima dele o pesquisador não rejeitaria a hipótese de nulidade e abaixo dele rejeitaria a hipótese de nulidade. A desvantagem deste método é não poder estabelecer a princípio qual seria a probabilidade de se cometer o erro tipo I, ou seja, a que nível de significância que o teste de hipótese será realizado. Esta é uma informação importante em trabalhos científicos, pois com a mesma é possível comparar os resultados e conclusões de diferentes trabalhos de pesquisa. 2ª) O outro procedimento para definir o valor crítico em um teste de hipóteses é que este é conhecido a partir do nível de significância estabelecido e o uso de tabelas estatísticas. Existe uma tabela específica para cada tipo de teste de hipóteses. Estas tabelas fornecem valores críticos que delimitam regiões de rejeição e de não-rejeição da hipótese de nulidade. O valor obtido de uma ou mais amostras retiradas da população é então usado para calcular o valor de uma estatística que tem distribuição de probabilidade idêntica àquela usada para identificar o valor tabelado. A comparação entre o valor calculado e tabelado permite ao pesquisador decidir entre rejeitar ou não a hipótese Ho. Veremos mais adiante alguns testes que utilizam este método.

4. Erros Tipo I e Tipo II Quando utilizamos os testes de hipóteses podemos está cometendo dois tipos de erros, ou seja, quando rejeitamos a hipótese nula, corremos o risco de estarmos tomando uma decisão errônea, ou seja, nós rejeitamos a hipótese nula quando na verdade deveríamos aceitá-la. Este risco é o NÍVEL DE SIGNIFICÂNCIA do teste, também conhecido como erro do tipo I e, a probabilidade de sua ocorrência vale α. Um segundo tipo de erro que podemos cometer, é aceitar a hipótese nula, quando ela é falsa. Neste caso, temos o erro do tipo II, o qual é representado pela letra grega β. Esquematicamente, temos:

ação

Se H 0 é:

VERDADEIRA

FALSA

NÃO REJEITAR H 0 REJEITAR H 0

decisão correta (1-α) erro tipo I (α)

erro do tipo II (β) decisão correta (1-β)

Características dos erros tipos I e II:

(i)

Os erros tipo I e tipo II estão relacionados do seguinte modo: quando α decresce β cresce. Portanto, não é possível encontrar testes que tornem simultaneamente ambos os erros tão pequenos quanto queremos. Desse modo, é sempre necessário “privilegiar” uma das hipóteses de maneira que não seja rejeitada, amenos que sua falsidade se torne muito evidente. Nos testes a hipótese privilegiada é H o , que só será rejeitada quando a evidência

de sua falsidade superar o limite de 100.(1α )%

(ii)

Ao assumir α como muito pequeno, então β pode aproximar-se de 1. O ideal na hora de definir um teste é encontrar um compromisso satisfatório entre α e β (mesmo que sempre a favor de H o ). Denominamos o PODER DE UM TESTE a quantidade 1 – β, ou seja,

Poder de um teste 1 – β = P (rejeitar H o , dado que é falsa)

(iii)

Erro tipo I é controlado com a escolha de α.

(iv)

A única forma de causar uma redução de α e β simultaneamente é aumentar o tamanho da

amostra.

(v) Se H 0 for falso, β será maior quanto mais próximo o valor do parâmetro estiver do valor sob a hipótese H 0 . Na prática, é costume escolherem-se níveis tradicionais (5% e 1%) para α e ignorar o erro tipo

II, assim, iremos aqui nos preocupar em controlar apenas o erro tipo I.

5. Representação gráfica da decisão de um teste Uma vez que podemos ter três possibilidades para o teste de hipótese de acordo com a hipótese alternativa utilizada: teste unilateral à esquerda, unilateral à direita e bilateral, podemos representar a decisão do teste, em cada caso, da seguinte maneira (Figura 1):

Figura 1. Gráficos da curva de distribuição normal em Testes de hipóteses unilateral à esquerda

Figura 1. Gráficos da curva de distribuição normal em Testes de hipóteses unilateral à esquerda (a), unilateral à direita (b) e bilateral (c).

Observe as respectivas regiões de aceitação (RAH o ) e de rejeição (RRH o ) da hipótese de nulidade em cada caso. No teste bilateral, as áreas de rejeição correspondem a α/2, enquanto que nos testes unilaterais a área de rejeição corresponde a α. Em todos os casos a área de aceitação de H o corresponde a 1 – α. Observe que o sinal > ou < aponta para o lado da curva a ser utilizado no teste unilateral.

6. Passos para a construção de um teste de hipótese Vejamos agora uma seqüência que pode ser usada sistematicamente para qualquer Teste de Hipótese. Passo 1. Define-se a hipótese H 0 a ser testada e qual a hipótese alternativa H a ; Passo 2. Usa-se a teoria estatística e as informações disponíveis para decidir qual estatística (estimador) será usada para testar a hipótese H 0 . Obter as propriedades dessa estatística (média, desvio padrão, etc.). Com os dados amostrais, calcula-se o valor da estatística do teste; Passo 3. Fixa-se um nível de significância α (para teste bilaterais usa-se α/2) e obtém-se o valor tabelado ou ponto crítico. Passo 4. Compara-se o valor da estatística do teste (valor calculado) com o valor tabelado. Se o valor da estatística calculado pertence à região de aceitação (RAH 0 ), não se rejeita H 0 , caso contrário, rejeita H 0 .

7. Testes de Média Populacionais O objetivo de testarem-se hipóteses sobre médias verdadeiras é avaliar certas afirmações feitas

sobre as mesmas. Por exemplo, podemos desejar verificar a afirmação de que as alturas médias de plantas de feijão, para sementes de alto e baixo vigor, são iguais. Existem, basicamente, três tipos de afirmações que se podem fazer quando se estuda médias populacionais, no entanto, no nosso curso veremos duas, quais sejam:

1. a afirmação diz respeito a uma média populacional, então, temos o teste de uma média

populacional. Exemplo, o peso ao nascer de bezerros da raça nelore, é de 25,5 kg;

2. a firmação diz respeito as médias de duas populações (dois tratamentos) são iguais, temos

então, o teste de comparação de duas médias. Exemplo, a produção média de batatinhas de duas variedades são iguais. As técnicas que nós vamos estudar pressupõem uma distribuição normal da distribuição

). Essa suposição será valida se a distribuição da

variável em estudo seguir uma distribuição normal e a amostragem for aleatória e, em geral, com boa aproximação se a amostra for suficientemente grande (sugestão: n 30)

amostral da estatística ou estimadores (

X , X

1

, X

2

7. 1. Teste de uma média populacional (µµµµ) quando a variância populacional (σσσσ 2 ) for conhecida Como o teste é para média de populações normais com variância conhecida, usaremos a variável

Z N (0, 1). O valor calculado será:

X − µ = Z c σ / n
X − µ
=
Z c
σ /
n

Pois se X ~ N (µ, σ 2 ) X ~ N

 2 σ  σ   µ ,    X ~ N
2
σ
σ
µ ,
 
 X ~ N 
µ,
n
 n 

Vejamos, agora, uma aplicação dos 5 passos definidos na seção anterior, para testar a hipótese de que a média de uma população µ seja igual ao número fixado µ 0 , supondo-se a variância σ 2 dessa população seja conhecida. Exemplo:

Uma máquina automática para encher pacotes de sementes enche-os segundo uma distribuição normal, com média µ e variância sempre igual a 400 g 2 . A máquina foi regulada para µ = 500 g. Desejamos, periodicamente, colher uma amostra de 16 pacotes e verificar se a produção está sobre

controle, isto é, se µ = 500 ou não. Se uma dessas amostras apresentar uma média X = 492 g, você pararia ou não a produção para regular a máquina? Vejamos como testar essa hipótese. Passo 1. Indiquemos por X o peso de cada pacote; então X ~ N (µ, 400). E as hipóteses que nos interessam são:

H 0 :

µ = 500 g

H a :

µ ≠ 500 g

Pois a máquina pode desregular para mais ou para menos.

Passo 2. Pela afirmação do problema, σ 2 = 400 g será sempre a mesma; logo, para todo µ, a média

= 5. Em

X de 16 pacotes terá distribuição N (µ,400/16), de modo que o desvio padrão de X é

σ X

particular,

X ~N (500,25).

Passo 3. Vamos fixar α = 1%; pela hipótese alternativa, dizemos que temos um teste bilateral. Portanto nossa região crítica será como podemos observa na figura 10.

região crítica será como podemos observa na figura 10. Figura 2. Região crítica para o teste

Figura 2. Região crítica para o teste H 0 : µ = 500 g versus H a : µ ≠ 500 g

OBS: Os valores tabelados (“Z” tabelados) são obtidos da tabela de “Z” da seguinte forma:

Como se utilizou um α = 1%, tem-se que a região de aceitação equivale a 99%, ou seja, 1 - α = 1 – 0,01 = 0,99 Como o teste é bilateral, busca-se na tabela o valor de Z correspondente a esta probabilidade. Se for utilizada a tabela unilateral de Z (dada na aula do dia 30/05 à tarde), tem-se antes que dividir 0,99 por 2, e aí sim buscar o valor de Z referente a essa probabilidade. No caso, 0,495. Portanto, para esse valor de probabilidade o valor de Z é 2,57. Como a tabela é unilateral, mas a curva da distribuição Normal é simétrica, os pontos à esquerda e à direita da média µ =0 são, -2,57 e 2,57, respectivamente.

Por outro lado, se for utilizada a tabela bilateral de Z (dada junto com a apostila), deve-se buscar direto o valor de Z referente a essa probabilidade. No caso, esta probabilidade é 0,9911 e o valor de Z referente é também + 2,57.

Passo 4. A informação pertinente da amostra é sua média que nesse caso particular é X = 492, temos:

492 − 500 = − Z = 1,60 c 20 / 16
492
− 500 = −
Z
=
1,60
c
20 /
16

Passo 5. Como Z calc = -1,60 RAH 0 , aceita-se H 0 , ou seja, podemos concluir com um nível de significância de 1% que a produção está sobre controle com um peso médio de 500 g por pacote de sementes.

7. 2. Teste t para uma média populacional (µµµµ) quando a variância populacional (σσσσ 2 ) for desconhecida É muito freqüente na prática, o caso em que desejamos testar a hipóteses referentes à média de uma população cujo desvio padrão é desconhecido. Se dispusermos apenas de uma amostra de n elementos extraídos dessa população, com base na qual iremos realizar o teste, devemos então usar essa mesma amostra para estimar o desvio padrão σ da população.

Ao substituir σ por σˆ em σ =

2 σ n
2
σ
n

, a variável resultante terá distribuição t de Student com n

- 1 graus de liberdade (onde σˆ é a raiz quadrada da variância da amostra calculada com n - 1 no denominador). A expressão a ser usada será, portanto,

X − µ = t c σˆ / n
X − µ
=
t c
σˆ /
n

com n – 1 graus de liberdade

OBS: quando o tamanho da amostra e maior de 30 a população tende a ser distribuída normalmente.

Exemplo:

Um criador de coelhos afirma que seus coelhos abatidos aos 90 dias apresentam um peso médio de 2,701Kg. Uma amostra de 10 coelhos foi retirada aleatoriamente e calculou-se sua média e seu desvio padrão, que foram 2,584 Kg e 0,0675Kg, respectivamente. Utilizando o teste de hipótese podemos afirmar que o peso dos coelhos estão abaixo do que afirma o criador? Vejamos como testar essa hipótese. Passo 1. As hipóteses que nos interessam são:

H 0 : µ = 2,701Kg H 1 : µ < 2,701Kg Pois a máquina pode desregular para mais ou para menos.

Passo 2. Suponha que X, o peso dos coelhos, tenha distribuição N (µ ,σ 2 ).

t c

=

X − 2,701 00675 10
X
− 2,701
00675
10

Passo 3. Vamos fixar α = 5%; pela hipótese alternativa dizemos que temos um teste unilateral a esquerda. Portanto nossa região crítica será como a da figura 11.

Figura 3. Região crítica para o teste H 0 : µ = 2,701 Kg versus

Figura 3. Região crítica para o teste H 0 : µ = 2,701 Kg versus H 1 : µ < 2,701Kg

OBS: O valor tabelado (“t” tabelado) é obtido da tabela de “t” da seguinte forma:

Como se utilizou um α = 5%, basta olhar na tabela de “t” o valor referente a 5% com 9 graus de liberdade (n – 1 = 10 – 1 = 9), que é, portanto 1,83. Como o teste é unilateral e usou-se uma tabela bilateral, tem-se que olhar na tabela o valor tabelado para 2α, ou seja 10%. Logo, para α = 10% e 9 graus de liberdade o valor de “t” tabelado é 1,83, ou -1,83 já que a distribuição na tabela bilateral é simétrica.

já que a distribuição na tabela bilateral é simétrica. IMPORTANTE : Quanto se tem uma tabela

IMPORTANTE:

Quanto se tem uma tabela de “t” unilateral e o teste também é unilateral, ou quando se tem uma tabela de “t” bilateral e o teste também é bilateral, usa-se o nível de significância α. Porém, se tiver uma tabela unilateral e o teste for bilateral, usa-se 2α e, quando se tiver uma tabela bilateral e um teste unilateral,

usa-se α/2.

Ou seja:

Tabela

Teste (ou Hipótese alternativa)

Nível de significância (α)

Unilateral

Unilateral

α

Bilateral

Bilateral

α

Unilateral

Bilateral

2 α

Bilateral

Unilateral

α/2

Passo 4. A informação pertinente da amostra é sua média que nesse caso particular é X = 2,584, temos:

t c

2,584 − 2,701 = = − 5,481 0,0675 / 10
2,584
− 2,701
=
= − 5,481
0,0675 /
10

Passo 5. Como t c = -5,481 RRH 0 , rejeita-se H 0 , ou seja, ao nível de 5% de probabilidade pelo o

teste t a média dos pesos dos coelhos aos 90 dias é inferior a 2,701Kg, com 95% de confiança.

8. Teste para comparação de duas médias (µµµµ 1 e µµµµ 2 ) quando as variâncias populacionais (σσσσ 2 1 e σσσσ 2 2 )

forem desconhecidas

Vamos agora estender o procedimento anterior para o caso de comparação de duas médias

populacionais, quando as variâncias populacionais são desconhecidas. Nesse caso, conhecem-se as

estimativas das variâncias populacionais.

A fundamentação básica continua sendo a mesma dos testes anteriores, só se farão algumas

alterações quanto à estatística teste a ser utilizada. Neste caso testamos a hipótese de igualdade das

duas médias, ou seja:

H 0 : µ 1 = µ 2.

Como no caso do teste de uma média populacional, temos três possibilidades para a hipótese

alternativa, quais sejam:

H a : µ 1

H a : µ 1 > µ 2.

H a : µ 1 < µ 2.

µ 2.

Num teste de comparação de duas médias temos dois casos a considerar, quais sejam:

1. dados não pareados ou amostras independentes. Neste caso, os dados das duas

amostras não estão relacionados. Exemplo: o peso de bezerros de duas raças A e B.

2. dados pareados ou amostras dependentes. Quando os dados são relacionados dois a

dois, eles são denominados pareados. É comum na experimentação, tomar-se dados de uma

amostra de uma população antes e após a aplicação de um determinado tratamento. Como,

cada elemento da amostra é mensurado antes e depois o tratamento diz-se que os dados são

pareados. Exemplo: o peso de bezerros da raça A antes e após o tratamento com uma nova

ração.

8. 1. Dados não pareados ou amostras independentes

Aqui, também temos dois casos: quando a comparação é feita entre duas populações de

variâncias populacionais desconhecidas, mas supostamente iguais ou desiguais.

8. 1. 1. Teste para comparação de duas médias, de amostras independentes, de variâncias

populacionais desconhecidas e supostamente iguais.

O procedimento de teste de hipóteses sempre segue uma mesma seqüência, o que muda é a

estatística amostral de interesse do pesquisador e a estatística de teste a ser utilizada.

Vamos supor que as amostras sejam independentes, oriundas de duas populações com distribuição normal e que as variâncias das duas populações são desconhecidas e, portanto, precisam ser estimadas. Para sabermos se duas variâncias podem ser consideradas iguais, ou seja, se existe homogeneidade de variâncias, é necessário que se proceda a um teste de hipótese sobre as variâncias populacionais. Portanto, inicialmente, vamos testar a hipótese de homogeneidade de variâncias e, em seguida, dado que aceitamos que as variâncias são iguais, vamos testar a hipótese de igualdade entre as médias das duas populações. O teste de comparação de duas médias, quando as variâncias são desiguais ou heterogêneas, será apresentado na próxima seção. A comparação entre variâncias é feita com o uso do teste F, o qual veremos a seguir:

Teste F para comparação de variâncias populacionais Como qualquer outro teste, devemos sempre iniciar pela formulação das hipóteses, que nesse caso são dadas por,

H 0 :

σ 1 2 = σ

2

2

 

σ 1 2 > σ

2

H a :

2

Quando desejamos comparar variâncias devemos utilizar a estatística F (ou teste de Fisher-

,

Snedecor), dada pelo quociente entre as duas estimativas de variâncias,

respectivamente, distintas e supostas independentes. Temos,

2

σˆ e

1

σˆ

2

2

,

de

2

σ e

1

σ

2

1

2 σ ˆ 1 F = com n 1 – 1 e n 2 –
2
σ
ˆ
1
F
=
com n 1 – 1 e n 2 – 1 graus de liberdade
c
2
σ
ˆ
2
2
2
As variâncias
σˆ
e σˆ
são calculadas com os n 1 e n 2 dados das amostras, respectivamente.
1
2

Assim, dizemos que a

2 estão associados n 1 – 1 graus de liberdades (numerador) e, da mesma forma,

σˆ

1

para

2

σˆ

1

estão associados n 2 – 1 graus de liberdade (denominador). Vamos admitir SEMPRE que

é maior do que

σˆ

2

2

, ou seja, no numerador vamos sempre usar a maior variância, ou seja:

F =

maior

var

iância

menor variância

com n 1 -1 e n 2 - 1

graus de liberdade do numerador e do

denominador, respectivamente.

2

σˆ

1

A conclusão do teste pode ser feita comparando o valor de F calculado com os dados da amostra (F calculado ), e o valor de F tabelado ou crítico, obtido na tabela da distribuição F dada em anexo, com n 1 – 1 graus de liberdade no numerador e n 2 – 1 graus de liberdade no denominador, e com um nível de probabilidade α fixado. Então por esse procedimento rejeitamos H 0 se F calculado > F n1 1, n2 1,α .

Exemplo:

As produções de duas variedades de milho, em toneladas por hectare, foram as seguintes:

Variedade A

1,3

1,4

 

1,1

1,4

 

1,5

Variedade B

1,8

1,6

 

1,9

1,9

 

1,8

 

x A = 1,34,

x

=1,80,

ˆ

σ

2

   

B

A

Dos dados das amostras obtemos,

= 0,231,

ˆ

σ

2 = 0,0150.

B

Inicialmente vamos testar a hipótese de homogeneidade das variâncias com α = 5%. Assim o valor da estatística F é,

F =

0,0231 =

0,0150

1,54

Com o auxilio da tabela da distribuição F, com o nível de significância de 5%, com 4 e 4 graus de liberdade no numerador e denominador, respectivamente, obtemos F 4,4,5% = 6,39,. Como F calculado = 1,54, temos que F calculado < F n1 1, n2 1,α ., logo, aceitamos H 0 , ou seja, as variâncias são iguais, ao nível de 5% de probabilidade. Voltemos, agora, ao nosso objetivo, que é verificar se duas médias populacionais podem ser

consideradas iguais ou não.

No exemplo, as hipóteses são dadas por:

H 0 : µ A = µ B versus

H a : µ A

µ B

Para estudar se duas médias populacionais são iguais ou não, a estatística teste a ser utilizada é dada por:

t c

=

(

X

1

X

2

)

 

(

n

1

1) ˆ

σ

1

2

+

(

n

2

1) ˆ

σ

2

2

1

n

+

n

1

1

2

 
  n 1 + n 2 − 2  

n

1

+

n

2

2

 

A qual tem distribuição t de Student com n 1 + n 2 – 2 graus de liberdade.

A conclusão do teste pode ser feita comparando o valor de t com os dados da amostra (t calculado ), e o valor de t tabelado ou crítico, obtido na tabela da distribuição de “t” dada em anexo, com n 1 + n 2 - 2 graus de liberdade, e com um nível de probabilidade α fixado. Então por esse procedimento

rejeitamos H 0 se

t

calculado

t

tabelado

.

Para o nosso exemplo temos,

t

=

( 1,34

1,80 )

 

( 5

1 )0,0231

+

( 5

1 )0,0150 1

+

1

5 + 5 − 2   5 5  

5

+

5

2

5

5

=

− 0,46 0,0191( 0,40 )
− 0,46
0,0191( 0,40 )

= − 5,236

Com o auxilio da tabela da distribuição t, com o nível de significância de 5%, com 8 graus de

, rejeitamos H 0 ,

liberdade, obtemos t 8,5% = 2,306, como t calculado = -5,236, temos que

t

calculado

t

tabelado

ou seja, as duas variedades de milho têm produção diferentes, ao nível de 5% de probabilidade.

8. 1. 2. Teste para comparação de duas médias, de amostras independentes e variâncias desconhecidas e supostamente desiguais. Suponhamos que as amostras sejam oriundas de duas populações com distribuições normais, independentes e variâncias heterogêneas e desconhecidas, portanto, precisam ser estimadas com base na amostra. Como no item anterior, testa-se a homogeneidade das variâncias pelo teste F, mas, como neste caso, rejeita-se a hipótese de nulidade de igualdade entre as variâncias, o procedimento de teste de médias entre as duas populações sofre algumas modificações. Neste caso, a estatística de teste da diferença entre duas médias, é dada por:

( X − X ) 1 2 = t c 2 2 σ ˆ σ
(
X
− X
)
1
2
=
t c
2
2
σ
ˆ
σ
ˆ
1
2
+
n
1 n
2

Onde, esta variável tem uma distribuição aproximada de Student, com grau de liberdade corrigido, dado por:

v =

2

ˆ

σ

1

n

1

+

2

2

ˆ

σ

n

2

2

2

ˆ

σ

1

n

1

2

n

1

1

+

ˆ

σ

2

2

n

2

2

n

2

1

Exemplo:

Em um centro agrícola, deseja-se testar o efeito de determinado fertilizante sobre a produção de trigo. Para isso, escolheram-se 24 áreas de terra, cada uma 10 m 2 , de uma grande área homogênea. Metades dessas unidades são tratadas com o fertilizante, enquanto a outra metade não recebe o fertilizante, este é denominado de tratamento controle. A produção média do trigo sem fertilizante foi de 1260 Kg/ha com desvio padrão de 280 Kg/ha, enquanto que a produção média com fertilizante foi de 1710 Kg/ha com desvio padrão de 730 Kg/ha. Podemos afirma que houve aumento significativo na produção de trigo ao nível de 5% de significância devido à utilização do fertilizante? Antes de fazermos os testes sobre as médias populacionais deveremos verificar se as variâncias

são homogêneas ou não. Dos dados das amostras obtemos,

σ ˆ = 78400. Inicialmente

σ

F

= 532900,

ˆ

2

2

C

vamos testar a hipótese de homogeneidade das variâncias com α = 5%. Assim o valor da estatística F é:

F

=

532900 =

78400

6 ,7972

.

Com o auxilio da tabela da distribuição F, com o nível de significância de 5%, com 11 e 11 graus de liberdade no numerador e denominador, respectivamente, obtemos F 11,11,5% = 2,82 como

F calculado = 6,7972, temos que F calculado > F n1 1, n2 1,α ., rejeitamos H 0 , ou seja, as variâncias são diferentes. As hipóteses, sobre as médias populacionais, são formuladas do seguinte modo:

H 0 : µ F = µ C

versus

H a : µ F > µ C

De acordo com a hipótese alternativa, nosso teste é unilateral. O valor da estatística t é:

t

c

=

(1710

1260)

O valor da estatística t é: t c = (1710 − 1260) 532900 12 78400 +

532900

12

78400

+

12

=

1,99

com 12 graus de liberdade e,

v =

532900

78400

12

12

+

2

532900

12

2

+

78400

12

2

11

11

=

14,17

14

Com o auxilio da tabela da distribuição t, com o nível de significância de 5%, com 14 graus de liberdade (grau de liberdade corrigido), obtemos t 14,5% = 1,761, como t calculado = 1,99, temos que

. Rejeitamos H 0 , conseqüentemente, podemos afirma, ao nível de 5%, que o uso de

t

calculado

t

tabelado

fertilizante causa um acréscimo significativo na produção.

8. 2. Dados pareados ou dependentes Como o objetivo, é verificar se duas médias populacionais pareadas podem ser consideradas

iguais ou não se testa a hipótese em relação ao desvio médio ( D ), ou seja, em relação à diferença média do antes e depois. As hipóteses são dadas por:

OBS: O

D

o

H 0 :

D =

D versus

o

H a : D

H a :

D

>

D

o

D

o

H a :

D

<

D

o

pode ser igual a zero ou não!!!! Se

D = 0, então teríamos:

o

H 0 : D = 0 versus

H a :

D

H a :

H a :

0

D

> 0

D

< 0

Para estudar se duas médias populacionais são iguais ou não, a estatística teste a ser utilizada é

dada por:

D − D o t = σˆ D n
D
− D
o
t =
σˆ
D
n

Em que:

n

e

ˆ

σ

D

=

 

n

n

 

D

2

(

D

 

)

2

/

 

i

i

n

i = 1 i = 1

i =

1

i

=

1

 

n

1

 

D i

D =

i =

1

n

Com distribuição “t” de Student e n - 1 graus de liberdade.

A conclusão do teste é feita comparando o valor de t calculado a partir dos dados amostrais (t calculado ), com o valor de t tabelado ou crítico, obtido na tabela da distribuição t, com n - 1 graus de liberdade, no nível de probabilidade α% fixado. Então por esse procedimento rejeitamos H 0 se

t

calculado

t

tabelado

.

Exemplo. Os dados de peso de bezerros foram obtidos antes e depois da aplicação de uma nova ração (tratamento), em uma amostra de tamanho n = 5. Ao nível de 5% de probabilidade podemos afirmar que a aplicação da ração causou acréscimo de peso nos bezerros? Seja, X: peso antes do tratamento; Y: peso após tratamento;

Bezerros

1

2

3

4

5

X

i

100

105

108

106

110

Y

i

120

115

130

140

112

 

-20

-10

-22

-34

-2

D i = Y i - X i

As hipóteses, sobre as médias populacionais, são formuladas do seguinte modo:

H 0 :

D = 0

versus

H a :

D

> 0

Vamos calcular as estatísticas básicas:

ˆ

σ

D

=

 

D =

 

20

+

(

10)

+

(

22)

+

(

34)

+ −

(2) =

17,6

   

5

 

[(

20)

2

+

(

10)

2

+

(

22)

2

+

(

34)

2

+

(

2)

2

]

(

88

)

2

          5
         

5

 

5

1

=

12,1984

Logo, o valor da estatística t é:

t =

− 17,6 − 0 = − 3,226 12,1984 5
17,6
0 = − 3,226
12,1984
5

Com o auxilio da tabela da distribuição t, com o nível de significância de 5% e com 4 graus de liberdade, obtemos t 4,5% = 2,132 (Se a tabela for bilateral, olha-se α% = 10%).

= 2,13
= 2,13

Como t calculado = -3,226, temos que

t

calculado

t

tabelado

. Logo, rejeita-se H 0 ao nível de 5% de

significância, ou seja, o uso da ração causa um acréscimo no peso dos bezerros.

Este conteúdo é resultado de pesquisa em vários livros e apostilas de estatística e bioestatística, portanto, ainda deve ser revisado. Qualquer crítica, erro de digitação (ou outro qualquer), etc., por favor, me comunique. Obrigada.

Profa. Gisele

Tabela I - Distribuição Normal Padrão Z~N(0,1) Corpo da tabela dá a probabilidade p, tal que p = P(0< Z < Z c )

p , tal que p = P (0< Z < Z c ) Parte inteira da

Parte inteira da primeira decimal de Z c

 

Segunda decimal de Z c

 

0

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

0,00

0,0000

0,0040

0,0080

0,0120

0,0160

0,0199

0,0239

0,0279

0,0319

0,0359

0,10

0,0398

0,0438

0,0478

0,0517

0,0557

0,0596

0,0636

0,0675

0,0714

0,0753

0,20

0,0793

0,0832

0,0871

0,0910

0,0948

0,0987

0,1026

0,1064

0,1103

0,1141

0,30

0,1179

0,1217

0,1255

0,1293

0,1331

0,1368

0,1406

0,1443

0,1480

0,1517

0,40

0,1554

0,1591

0,1628

0,1664

0,1700

0,1736

0,1772

0,1808

0,1844

0,1879

0,50

0,1915

0,1950

0,1985

0,2019

0,2054

0,2088

0,2123

0,2157

0,2190

0,2224

0,60

0,2257

0,2291

0,2324

0,2357

0,2389

0,2422

0,2454

0,2486

0,2517

0,2549

0,70

0,2580

0,2611

0,2642

0,2673

0,2704

0,2734

0,2764

0,2794

0,2823

0,2852

0,80

0,2881

0,2910

0,2939

0,2967

0,2995

0,3023

0,3051

0,3078

0,3106

0,3133

0,90

0,3159

0,3186

0,3212

0,3238

0,3264

0,3289

0,3315

0,3340

0,3365

0,3389

1,00

0,3413

0,3438

0,3461

0,3485

0,3508

0,3531

0,3554

0,3577

0,3599

0,3621

1,10

0,3643

0,3665

0,3686

0,3708

0,3729

0,3749

0,3770

0,3790

0,3810

0,3830

1,20

0,3849

0,3869

0,3888

0,3907

0,3925

0,3944

0,3962

0,3980

0,3997

0,4015

1,30

0,4032

0,4049

0,4066

0,4082

0,4099

0,4115

0,4131

0,4147

0,4162

0,4177

1,40

0,4192

0,4207

0,4222

0,4236

0,4251

0,4265

0,4279

0,4292

0,4306

0,4319

1,50

0,4332

0,4345

0,4357

0,4370

0,4382

0,4394

0,4406

0,4418

0,4429

0,4441

1,60

0,4452

0,4463

0,4474

0,4484

0,4495

0,4505

0,4515

0,4525

0,4535

0,4545

1,70

0,4554

0,4564

0,4573

0,4582

0,4591

0,4599

0,4608

0,4616

0,4625

0,4633

1,80

0,4641

0,4649

0,4656

0,4664

0,4671

0,4678

0,4686

0,4693

0,4699

0,4706

1,90

0,4713

0,4719

0,4726

0,4732

0,4738

0,4744

0,4750

0,4756

0,4761

0,4767

2,00

0,4772

0,4778

0,4783

0,4788

0,4793

0,4798

0,4803

0,4808

0,4812

0,4817

2,10

0,4821

0,4826

0,4830

0,4834

0,4838

0,4842

0,4846

0,4850

0,4854

0,4857

2,20

0,4861

0,4864

0,4868

0,4871

0,4875

0,4878

0,4881

0,4884

0,4887

0,4890

2,30

0,4893

0,4896

0,4898

0,4901

0,4904

0,4906

0,4909

0,4911

0,4913

0,4916

2,40

0,4918

0,4920

0,4922

0,4925

0,4927

0,4929

0,4931

0,4932

0,4934

0,4936

2,50

0,4938

0,4940

0,4941

0,4943

0,4945

0,4946

0,4948

0,4949

0,4951

0,4952

2,60

0,4953

0,4955

0,4956

0,4957

0,4959

0,4960

0,4961

0,4962

0,4963

0,4964

2,70

0,4965

0,4966

0,4967

0,4968

0,4969

0,4970

0,4971

0,4972

0,4973

0,4974

2,80

0,4974

0,4975

0,4976

0,4977

0,4977

0,4978

0,4979

0,4979

0,4980

0,4981

2,90

0,4981

0,4982

0,4982

0,4983

0,4984

0,4984

0,4985

0,4985

0,4986

0,4986

3,00

0,4987

0,4987

0,4987

0,4988

0,4988

0,4989

0,4989

0,4989

0,4990

0,4990

3,10

0,4990

0,4991

0,4991

0,4991

0,4992

0,4992

0,4992

0,4992

0,4993

0,4993

3,20

0,4993

0,4993

0,4994

0,4994

0,4994

0,4994

0,4994

0,4995

0,4995

0,4995

3,30

0,4995

0,4995

0,4995

0,4996

0,4996

0,4996

0,4996

0,4996

0,4996

0,4997

3,40

0,4997

0,4997

0,4997

0,4997

0,4997

0,4997

0,4997

0,4997

0,4997

0,4998

3,50

0,4998

0,4998

0,4998

0,4998

0,4998

0,4998

0,4998

0,4998

0,4998

0,4998

3,60

0,4998

0,4998

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

3,70

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

3,80

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

3,90

0,5000

0,5000

0,5000

0,5000

0,5000

0,5000

0,5000

0,5000

0,5000

0,5000

4,00

0,5000

0,5000

0,5000

0,5000

0,5000

0,5000

0,5000

0,5000

0,5000

0,5000

Tabela II Distribuição t de Student

   

Nível de Significância αααα

 

Graus de Liberdade (n-1)

Área em DUAS caudas (Teste bilateral)

0,20

0,10

0,05

0,025

0,01

   

Área em UMA cauda (Teste unilateral)

 

0,10

0,05

0,025

0,01

0,005

1 3,078

 

6,314

12,706

31,821

63,656

2 1,886

 

2,920

4,303

6,965

9,925

3 1,638

 

2,353

3,182

4,541

5,841

4 1,533

 

2,132

2,776

3,747

4,604

5 1,476

 

2,015

2,571

3,365

4,032

6 1,440

 

1,943

2,447

3,143

3,707

7 1,415

 

1,895

2,365

2,998

3,499

8 1,397

 

1,860

2,306

2,896

3,355

9 1,383

 

1,833

2,262

2,821

3,250

10 1,372

 

1,812

2,228

2,764

3,169

11 1,363

 

1,796

2,201

2,718

3,106

12 1,356

 

1,782

2,179

2,681

3,055

13 1,350

 

1,771

2,160

2,650

3,012

14 1,345

 

1,761

2,145

2,624

2,977

15 1,341

 

1,753

2,131

2,602

2,947

16 1,337

 

1,746

2,120

2,583

2,921

17 1,333

 

1,740

2,110

2,567

2,898

18 1,330

 

1,734

2,101

2,552

2,878

19 1,328

 

1,729

2,093

2,539

2,861

20 1,325

 

1,725

2,086

2,528

2,845

21 1,323

 

1,721

2,080

2,518

2,831

22 1,321

 

1,717

2,074

2,508

2,819

23 1,319

 

1,714

2,069

2,500

2,807

24 1,318

 

1,711

2,064

2,492

2,797

25 1,316

 

1,708

2,060

2,485

2,787

26 1,315

 

1,706

2,056

2,479

2,779

27 1,314

 

1,703

2,052

2,473

2,771

28 1,313

 

1,701

2,048

2,467

2,763

29 1,311

 

1,699

2,045

2,462

2,756

30 1,310

 

1,697

2,042

2,457

2,750

2,763 29 1,311   1,699 2,045 2,462 2,756 30 1,310   1,697 2,042 2,457 2,750 19

19

Tabela IIIaDistribuição F de Fisher (αααα = 0,01 ou 1%)

Colunas: Graus de Liberdade Numerador. Linhas: Graus de Liberdade Denominador. 1 2 3 4 5
Colunas: Graus de Liberdade Numerador. Linhas: Graus de Liberdade Denominador.
1
2
3
4
5
6
7
8
9
10
11
12
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
500
1000

Tabela IIIbDistribuição F de Fisher (αααα = 0,01 ou 1%)

Colunas: Graus de Liberdade Numerador. Linhas: Graus de Liberdade Denominador. 13 14 15 20 25
Colunas: Graus de Liberdade Numerador. Linhas: Graus de Liberdade Denominador.
13
14
15
20
25
30
40
50
60
120
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
500
1000

Tabela IVaDistribuição F de Fisher (αααα = 0,05 ou 5%)

 

Colunas: Graus de Liberdade Numerador. Linhas: Graus de Liberdade Denominador.

1

2

3

4

5

6

7

8

9

10

11

12

1

161

199

216

225

230

234

237

239

241

242

243

244

2

18,51

19,00

19,16

19,25

19,30

19,33

19,35

19,37

19,38

19,40

19,40

19,41

3

10,13

9,55

9,28

9,12

9,01

8,94

8,89

8,85

8,81

8,79

8,76

8,74

4

7,71

6,94

6,59

6,39

6,26

6,16

6,09

6,04

6,00

5,96

5,94

5,91

5

6,61

5,79

5,41

5,19

5,05

4,95

4,88

4,82

4,77

4,74

4,70

4,68

6

5,99

5,14

4,76

4,53

4,39

4,28

4,21

4,15

4,10

4,06

4,03

4,00

7

5,59

4,74

4,35

4,12

3,97

3,87

3,79

3,73

3,68

3,64

3,60

3,57

8

5,32

4,46

4,07

3,84

3,69

3,58

3,50

3,44

3,39

3,35

3,31

3,28

9

5,12

4,26

3,86

3,63

3,48

3,37

3,29

3,23