Sei sulla pagina 1di 26

Universidade Federal do Piauí

Campus Universitário “Profa. Cinobelina Elvas” – Bom Jesus, PI


Profa. Gisele

VI - TESTES DE HIPÓTESES

1. Introdução
A Inferência Estatística é a parte da estatística que trata das condições sob as quais se faz
inferências (ou pressuposições ou generalizações) sobre uma população, com base em dados
amostrais. Se uma amostra é representativa de uma população, possui as mesmas características
básicas da mesma, e os resultados amostrais podem ser inferidos como resultados válidos para a
população estudada. A inferência estatística envolve questões de dois tipos: a estimação de parâmetros
populacionais e os testes de hipóteses.
Os TESTES DE HIPÓTESES (ou testes de significância ou teoria da decisão estatística)
constituem procedimentos estatísticos cujo objetivo é tomar decisões baseadas nas evidências
fornecidas pelos dados amostrais. Supondo que seja levanta uma hipótese sobre o valor do parâmetro,
essa hipótese será considerada verdadeira até que prove o contrário. Portanto, o teste de hipótese é o
procedimento que nos levará a rejeitar ou na essa hipótese a partir das evidências obtidas nos
resultados amostrais.
Exemplo:
Podemos estar interessados em verificar se as seguintes afirmações são verdadeiras:
1. a produtividade média de leite em Bom Jesus é de 2,3 kg/animal;
2. a produtividade média de leite em Bom Jesus e em Cristino Castro são, ambas, de 2,3
kg/animal.
Aplicando-se o teste de hipóteses adequado poderemos rejeitar ou não a hipótese de que a
produtividade média de leite em Bom Jesus é realmente de 2,3 kg/animal, e rejeitar ou não a hipótese
de que a produtividade média de leite em Bom Jesus e em Cristino Castro são, ambas, de 2,3
kg/animal.
Observa-se que se podem fazer inferências sobre os parâmetros de apenas uma população, ou
sobre os parâmetros de duas populações diferentes, no exemplo sobre a média da produtividade de
leite na população leiteira de Bom Jesus, e sobre as médias das produtividades nas populações leiteiras
de Bom Jesus e Cristino Castro.
Desenvolveremos, neste conteúdo, os testes de hipóteses para os parâmetros mais usuais que
viemos estudando nos conteúdos anteriores, média e variância, para uma e duas populações.

1
Importante ressaltar que, os testes desenvolvidos neste conteúdo pressupõem que a característica
em análise é normalmente distribuída com média µ e variância σ 2 .

2. Formulação das hipóteses


Hipótese nula (Ho): é a hipótese que sugere que a afirmação que estamos fazendo sobre o
parâmetro populacional é verdadeira. Portanto, Ho sempre inclui o sinal de igual, da não variação.

Hipótese alternativa (Ha): é a hipótese que sugere que a afirmação que estamos fazendo
sobre o parâmetro populacional é falsa, ou seja, que o valor do parâmetro é diferente, menor ou maior
que o estipulado. Portanto, Ha sempre inclui o sentido da variação.
Exemplo: Estamos interessados em verificar se as seguintes afirmações, em relação à produtividade
média de leite, são verdadeiras:
- a produtividade média de leite em Bom Jesus é de 2,3 kg/animal;
- a produtividade média de leite em Bom Jesus e em Cristino Castro são ambas, de 2,3 kg/animal.
Podemos testar então as seguintes hipóteses:
Ho: µBom Jesus = 2,3
Ha: µBom Jesus ≠ 2,3 ou
µBom Jesus < 2,3 ou
µBom Jesus > 2,3

Ou ainda, poderíamos testar, em relação às duas populações leiteiras, as seguintes hipóteses:


Ho: µBom Jesus = µCristino castro
Ha: µBom Jesus ≠ µCristino castro ou
µBom Jesus < µCristino castro ou
µBom Jesus > µCristino castro

De acordo com a hipótese alternativa utilizada no teste de hipótese, este pode ser classificado
em unilateral à esquerda (Ex.: µBom Jesus < 2,3 e µBom Jesus < µCristino castro), unilateral à direita (Ex.: µBom
Jesus > 2,3 e µBom Jesus > µCristino castro) e bilateral (Ex.: µBom Jesus ≠ 2,3 e µBom Jesus ≠ µCristino castro).

3. Decisão em um teste estatístico


A decisão de um teste estatístico, ou seja, se devemos ou não rejeitar a hipótese de nulidade, é
feita por meio da comparação do valor especificado para o parâmetro com aquele estimado a partir de
uma amostra da população.
Raramente, o valor estimado será idêntico àquele especificado para o parâmetro. Para
diferentes amostras, um estimador pode assumir diferentes valores, sendo que existem intervalos de

2
valores mais prováveis de ocorrer que outros. Este tipo de comportamento caracteriza uma
distribuição de probabilidade.
Do ponto de vista matemático, o valor dado pelo estimador pode diferir do valor esperado
para o parâmetro. Esta diferença matemática nem sempre representa que a hipótese de nulidade deva
ser rejeitada, pois como o estimador é uma variável aleatória, é esperado que ele assuma valores
dentro de um intervalo. O que um teste de hipóteses faz é comparar o valor especificado para um
parâmetro com a estimativa fornecida pelo estimador. Se a variação entre os dois valores for
PEQUENA diz-se que a foi devido à amostragem (acaso), consequentemente o valor do parâmetro é
realmente o especificado. Logo, a diferença entre o valor paramétrico e sua estimativa não é
significativa e não se rejeita a hipótese de nulidade.
Por outro lado, se a variação entre o valor paramétrico e sua estimativa for GRANDE, conclui-
se que a diferença é significativa e rejeita-se a hipótese de nulidade.
Nota-se que para a rejeição ou não da hipótese de nulidade é preciso estabelecer o que é uma
PEQUENA ou GRANDE diferença entre o valor paramétrico e sua estimativa. Para isto, devemos
conhecer a distribuição de probabilidade do estimador usado para estimar o parâmetro. Vamos ilustrar
com o seguinte exemplo:
Suponha que, em uma fazenda, o tempo médio gasto pelos trabalhadores na execução de uma
tarefa é de 15 minutos (µ = 15 min). Sabe-se que o tempo de execução da tarefa é uma variável
aleatória que segue distribuição normal com variância igual a 2,5 min2 [X ∼ N (15; 2,5)].
Um pesquisador implantou um novo sistema para diminuir o tempo médio de execução da
tarefa e uma amostra de 10 trabalhadores foi obtida a qual forneceu uma estimativa de 14,9 minutos
( X = 14,9 min). Do ponto de vista matemático o número 14,9 é menor que o número 15, mas do
ponto de vista estatístico, esse resultado 14,9 min é um resultado amostral e, portanto, está sujeito a
variações. Faz-se então o seguinte questionamento: Esse resultado constitui uma evidência de que
realmente o tempo médio diminuiu ou ele pode ter ocorrido por mero acaso?
Para responder à pergunta têm-se duas opções: medir o tempo gasto por todos os trabalhadores
na execução da tarefa com o novo sistema, ou então fazer uso de um teste de hipóteses. Na primeira
opção é claro que nenhum teste de hipóteses seria necessário, pois o pesquisador teria condições de
conhecer o verdadeiro valor do tempo médio na execução da tarefa com o novo sistema na população
de trabalhadores. Na segunda opção, o pesquisador faz uso dos valores amostrais, despendendo menos
trabalho, custo e tempo. Nesse caso teríamos as hipóteses a serem testadas:
Ho: µ = 15 minutos
Ha: µ < 15 minutos

Em termos probabilísticos poderíamos dizer que existe GRANDE probabilidade de em uma


população com média igual a 15 min existir grupos de 10 indivíduos que apresentem uma média na
execução da tarefa igual ou inferior a 1,49. Justificativa semelhante poderia ser atribuída a médias
amostrais que tivessem valores próximos ao valor suposto. Nesses casos, o pesquisador tem a
3
tendência de não rejeitar a hipótese de nulidade, isto porque há forte indício de que a amostra foi
retirada de uma população que apresenta uma média próxima do que a suposta de 15 minutos.
Por outro lado, daquela população de trabalhadores, poder-se-ia tirar um grande número de
diferentes amostras de tamanho igual a 10, e cada uma forneceria um valor para a média amostral.
Então se a média amostral apresentar um valor muito distante do valor suposto, como por exemplo, 6
minutos, o pesquisador tem a tendência de rejeitar a hipótese de nulidade, isto porque há forte indício
de que a amostra foi retirada de uma população que apresenta uma média menor do que a suposta de
15 minutos. Em termos probabilísticos poderia se dizer que a probabilidade de encontrar um grupo de
indivíduos com média igual ou inferior a 6 minutos é muito PEQUENA, em uma população que
apresenta uma média igual a 15 min.
É possível ao pesquisador estabelecer um valor crítico que o ajuda a decidir sobre rejeitar ou
não a hipótese de nulidade. Este valor crítico pode a princípio ser estabelecido de duas maneiras:
1ª) O pesquisador de posse dos seus conhecimentos prévios sobre o assunto estabeleceria um valor
crítico antes de coletar a amostra. Este valor seria um valor para a média amostral tal que acima dele o
pesquisador não rejeitaria a hipótese de nulidade e abaixo dele rejeitaria a hipótese de nulidade. A
desvantagem deste método é não poder estabelecer a princípio qual seria a probabilidade de se
cometer o erro tipo I, ou seja, a que nível de significância que o teste de hipótese será realizado. Esta é
uma informação importante em trabalhos científicos, pois com a mesma é possível comparar os
resultados e conclusões de diferentes trabalhos de pesquisa.
2ª) O outro procedimento para definir o valor crítico em um teste de hipóteses é que este é conhecido a
partir do nível de significância estabelecido e o uso de tabelas estatísticas. Existe uma tabela específica
para cada tipo de teste de hipóteses. Estas tabelas fornecem valores críticos que delimitam regiões de
rejeição e de não-rejeição da hipótese de nulidade. O valor obtido de uma ou mais amostras retiradas
da população é então usado para calcular o valor de uma estatística que tem distribuição de
probabilidade idêntica àquela usada para identificar o valor tabelado. A comparação entre o valor
calculado e tabelado permite ao pesquisador decidir entre rejeitar ou não a hipótese Ho. Veremos mais
adiante alguns testes que utilizam este método.

4. Erros Tipo I e Tipo II


Quando utilizamos os testes de hipóteses podemos está cometendo dois tipos de erros, ou seja,
quando rejeitamos a hipótese nula, corremos o risco de estarmos tomando uma decisão errônea, ou
seja, nós rejeitamos a hipótese nula quando na verdade deveríamos aceitá-la. Este risco é o NÍVEL DE
SIGNIFICÂNCIA do teste, também conhecido como erro do tipo I e, a probabilidade de sua
ocorrência vale α.
Um segundo tipo de erro que podemos cometer, é aceitar a hipótese nula, quando ela é falsa.
Neste caso, temos o erro do tipo II, o qual é representado pela letra grega β. Esquematicamente,
temos:

4
Se H0 é:
ação
VERDADEIRA FALSA
NÃO REJEITAR H0 decisão correta (1-α) erro do tipo II (β)
REJEITAR H0 erro tipo I (α) decisão correta (1-β)

Características dos erros tipos I e II:

(i) Os erros tipo I e tipo II estão relacionados do seguinte modo: quando α decresce β cresce.
Portanto, não é possível encontrar testes que tornem simultaneamente ambos os erros tão
pequenos quanto queremos. Desse modo, é sempre necessário “privilegiar” uma das
hipóteses de maneira que não seja rejeitada, amenos que sua falsidade se torne muito
evidente. Nos testes a hipótese privilegiada é Ho, que só será rejeitada quando a evidência
de sua falsidade superar o limite de 100.(1 − α )%
(ii) Ao assumir α como muito pequeno, então β pode aproximar-se de 1. O ideal na hora de
definir um teste é encontrar um compromisso satisfatório entre α e β (mesmo que sempre
a favor de Ho). Denominamos o PODER DE UM TESTE a quantidade 1 – β, ou seja,
Poder de um teste ≡ 1 – β = P (rejeitar Ho, dado que é falsa)
(iii) Erro tipo I é controlado com a escolha de α.
(iv) A única forma de causar uma redução de α e β simultaneamente é aumentar o tamanho da
amostra.
(v) Se H0 for falso, β será maior quanto mais próximo o valor do parâmetro estiver do valor
sob a hipótese H0.
Na prática, é costume escolherem-se níveis tradicionais (5% e 1%) para α e ignorar o erro tipo
II, assim, iremos aqui nos preocupar em controlar apenas o erro tipo I.

5. Representação gráfica da decisão de um teste


Uma vez que podemos ter três possibilidades para o teste de hipótese de acordo com a
hipótese alternativa utilizada: teste unilateral à esquerda, unilateral à direita e bilateral, podemos
representar a decisão do teste, em cada caso, da seguinte maneira (Figura 1):

5
Figura 1. Gráficos da curva de distribuição normal em Testes de hipóteses unilateral à esquerda (a),
unilateral à direita (b) e bilateral (c).

Observe as respectivas regiões de aceitação (RAHo) e de rejeição (RRHo) da hipótese de nulidade


em cada caso. No teste bilateral, as áreas de rejeição correspondem a α/2, enquanto que nos testes
unilaterais a área de rejeição corresponde a α. Em todos os casos a área de aceitação de Ho
corresponde a 1 – α. Observe que o sinal > ou < aponta para o lado da curva a ser utilizado no teste
unilateral.

6. Passos para a construção de um teste de hipótese


Vejamos agora uma seqüência que pode ser usada sistematicamente para qualquer Teste de
Hipótese.
Passo 1. Define-se a hipótese H0 a ser testada e qual a hipótese alternativa Ha;
Passo 2. Usa-se a teoria estatística e as informações disponíveis para decidir qual estatística
(estimador) será usada para testar a hipótese H0. Obter as propriedades dessa estatística (média,
desvio padrão, etc.). Com os dados amostrais, calcula-se o valor da estatística do teste;
Passo 3. Fixa-se um nível de significância α (para teste bilaterais usa-se α/2) e obtém-se o valor
tabelado ou ponto crítico.
Passo 4. Compara-se o valor da estatística do teste (valor calculado) com o valor tabelado. Se o
valor da estatística calculado pertence à região de aceitação (RAH0), não se rejeita H0, caso
contrário, rejeita H0.

6
7. Testes de Média Populacionais
O objetivo de testarem-se hipóteses sobre médias verdadeiras é avaliar certas afirmações feitas
sobre as mesmas. Por exemplo, podemos desejar verificar a afirmação de que as alturas médias de
plantas de feijão, para sementes de alto e baixo vigor, são iguais.
Existem, basicamente, três tipos de afirmações que se podem fazer quando se estuda médias
populacionais, no entanto, no nosso curso veremos duas, quais sejam:
1. a afirmação diz respeito a uma média populacional, então, temos o teste de uma média
populacional. Exemplo, o peso ao nascer de bezerros da raça nelore, é de 25,5 kg;
2. a firmação diz respeito as médias de duas populações (dois tratamentos) são iguais, temos
então, o teste de comparação de duas médias. Exemplo, a produção média de batatinhas de
duas variedades são iguais.
As técnicas que nós vamos estudar pressupõem uma distribuição normal da distribuição
amostral da estatística ou estimadores ( X , X 1 , X 2 ). Essa suposição será valida se a distribuição da
variável em estudo seguir uma distribuição normal e a amostragem for aleatória e, em geral, com boa
aproximação se a amostra for suficientemente grande (sugestão: n ≥ 30)

7. 1. Teste de uma média populacional (µ σ2) for conhecida


µ) quando a variância populacional (σ
Como o teste é para média de populações normais com variância conhecida, usaremos a variável
Z ∼ N (0, 1). O valor calculado será:
X −µ
Zc =
σ/ n
 σ 2   σ 
Pois se X ~ N (µ, σ2) ⇒ X ~ N  µ , ⇒ X ~ N  µ, 
 n   n

Vejamos, agora, uma aplicação dos 5 passos definidos na seção anterior, para testar a hipótese
de que a média de uma população µ seja igual ao número fixado µ0 , supondo-se a variância σ2 dessa
população seja conhecida.
Exemplo:
Uma máquina automática para encher pacotes de sementes enche-os segundo uma distribuição
normal, com média µ e variância sempre igual a 400 g2. A máquina foi regulada para µ = 500 g.
Desejamos, periodicamente, colher uma amostra de 16 pacotes e verificar se a produção está sobre
controle, isto é, se µ = 500 ou não. Se uma dessas amostras apresentar uma média X = 492 g, você
pararia ou não a produção para regular a máquina?
Vejamos como testar essa hipótese.
Passo 1. Indiquemos por X o peso de cada pacote; então X ~ N (µ, 400). E as hipóteses que nos
interessam são:
H0 : µ = 500 g
Ha : µ ≠ 500 g

7
Pois a máquina pode desregular para mais ou para menos.

Passo 2. Pela afirmação do problema, σ2 = 400 g será sempre a mesma; logo, para todo µ, a média
X de 16 pacotes terá distribuição N (µ,400/16), de modo que o desvio padrão de X é σ X = 5. Em

particular, X ~N (500,25).

Passo 3. Vamos fixar α = 1%; pela hipótese alternativa, dizemos que temos um teste bilateral.
Portanto nossa região crítica será como podemos observa na figura 10.

Figura 2. Região crítica para o teste H0 : µ = 500 g versus Ha : µ ≠ 500 g

OBS: Os valores tabelados (“Z” tabelados) são obtidos da tabela de “Z” da seguinte forma:
Como se utilizou um α = 1%, tem-se que a região de aceitação equivale a 99%, ou seja,
1 - α = 1 – 0,01 = 0,99
Como o teste é bilateral, busca-se na tabela o valor de Z correspondente a esta probabilidade. Se
for utilizada a tabela unilateral de Z (dada na aula do dia 30/05 à tarde), tem-se antes que dividir 0,99
por 2, e aí sim buscar o valor de Z referente a essa probabilidade. No caso, 0,495. Portanto, para esse
valor de probabilidade o valor de Z é 2,57. Como a tabela é unilateral, mas a curva da distribuição
Normal é simétrica, os pontos à esquerda e à direita da média µ =0 são, -2,57 e 2,57, respectivamente.
Por outro lado, se for utilizada a tabela bilateral de Z (dada junto com a apostila), deve-se buscar
direto o valor de Z referente a essa probabilidade. No caso, esta probabilidade é 0,9911 e o valor de Z
referente é também + 2,57.

Passo 4. A informação pertinente da amostra é sua média que nesse caso particular é X = 492,
temos:
492 − 500
Zc = = −1,60
20 / 16

8
Passo 5. Como Zcalc = -1,60 ∈ RAH0 , aceita-se H0, ou seja, podemos concluir com um nível de
significância de 1% que a produção está sobre controle com um peso médio de 500 g por pacote de
sementes.

7. 2. Teste t para uma média populacional (µ σ2) for


µ) quando a variância populacional (σ
desconhecida
É muito freqüente na prática, o caso em que desejamos testar a hipóteses referentes à média de
uma população cujo desvio padrão é desconhecido. Se dispusermos apenas de uma amostra de n
elementos extraídos dessa população, com base na qual iremos realizar o teste, devemos então usar
essa mesma amostra para estimar o desvio padrão σ da população.

σ2
Ao substituir σ por σˆ em σ = , a variável resultante terá distribuição t de Student com n
n
- 1 graus de liberdade (onde σˆ é a raiz quadrada da variância da amostra calculada com n - 1 no
denominador). A expressão a ser usada será, portanto,

X −µ
tc = com n – 1 graus de liberdade
σˆ / n
OBS: quando o tamanho da amostra e maior de 30 a população tende a ser distribuída
normalmente.

Exemplo:
Um criador de coelhos afirma que seus coelhos abatidos aos 90 dias apresentam um peso médio
de 2,701Kg. Uma amostra de 10 coelhos foi retirada aleatoriamente e calculou-se sua média e seu
desvio padrão, que foram 2,584 Kg e 0,0675Kg, respectivamente. Utilizando o teste de hipótese
podemos afirmar que o peso dos coelhos estão abaixo do que afirma o criador?
Vejamos como testar essa hipótese.
Passo 1. As hipóteses que nos interessam são:
H0 : µ = 2,701Kg
H1 : µ < 2,701Kg
Pois a máquina pode desregular para mais ou para menos.

Passo 2. Suponha que X, o peso dos coelhos, tenha distribuição N (µ ,σ2).


X − 2,701
tc =
00675
10
Passo 3. Vamos fixar α = 5%; pela hipótese alternativa dizemos que temos um teste unilateral a
esquerda. Portanto nossa região crítica será como a da figura 11.

9
Figura 3. Região crítica para o teste H0 : µ = 2,701 Kg versus H1 : µ < 2,701Kg

OBS: O valor tabelado (“t” tabelado) é obtido da tabela de “t” da seguinte forma:
Como se utilizou um α = 5%, basta olhar na tabela de “t” o valor referente a 5% com 9 graus de
liberdade (n – 1 = 10 – 1 = 9), que é, portanto 1,83. Como o teste é unilateral e usou-se uma tabela
bilateral, tem-se que olhar na tabela o valor tabelado para 2α, ou seja 10%. Logo, para α = 10% e 9
graus de liberdade o valor de “t” tabelado é 1,83, ou -1,83 já que a distribuição na tabela bilateral é
simétrica.

IMPORTANTE:
Quanto se tem uma tabela de “t” unilateral e o teste também é unilateral, ou
quando se tem uma tabela de “t” bilateral e o teste também é bilateral, usa-se o
nível de significância α. Porém, se tiver uma tabela unilateral e o teste for
bilateral, usa-se 2α e, quando se tiver uma tabela bilateral e um teste unilateral,
usa-se α/2.
Ou seja:

Tabela Teste (ou Hipótese alternativa) Nível de significância (α)


Unilateral Unilateral α
Bilateral Bilateral α
Unilateral Bilateral 2α
Bilateral Unilateral α/2

Passo 4. A informação pertinente da amostra é sua média que nesse caso particular é X = 2,584,
temos:
2 ,584 − 2 ,701
tc = = −5 ,481
0 ,0675 / 10

10
Passo 5. Como tc = -5,481 ∈ RRH0 , rejeita-se H0, ou seja, ao nível de 5% de probabilidade pelo o
teste t a média dos pesos dos coelhos aos 90 dias é inferior a 2,701Kg, com 95% de confiança.

σ21 e σ22)
µ1 e µ2) quando as variâncias populacionais (σ
8. Teste para comparação de duas médias (µ
forem desconhecidas
Vamos agora estender o procedimento anterior para o caso de comparação de duas médias
populacionais, quando as variâncias populacionais são desconhecidas. Nesse caso, conhecem-se as
estimativas das variâncias populacionais.
A fundamentação básica continua sendo a mesma dos testes anteriores, só se farão algumas
alterações quanto à estatística teste a ser utilizada. Neste caso testamos a hipótese de igualdade das
duas médias, ou seja:
H0: µ1 = µ2.
Como no caso do teste de uma média populacional, temos três possibilidades para a hipótese
alternativa, quais sejam:
Ha: µ1 ≠ µ2.
Ha: µ1 > µ2.
Ha : µ1 < µ2.

Num teste de comparação de duas médias temos dois casos a considerar, quais sejam:
1. dados não pareados ou amostras independentes. Neste caso, os dados das duas
amostras não estão relacionados. Exemplo: o peso de bezerros de duas raças A e B.

2. dados pareados ou amostras dependentes. Quando os dados são relacionados dois a


dois, eles são denominados pareados. É comum na experimentação, tomar-se dados de uma
amostra de uma população antes e após a aplicação de um determinado tratamento. Como,
cada elemento da amostra é mensurado antes e depois o tratamento diz-se que os dados são
pareados. Exemplo: o peso de bezerros da raça A antes e após o tratamento com uma nova
ração.

8. 1. Dados não pareados ou amostras independentes


Aqui, também temos dois casos: quando a comparação é feita entre duas populações de
variâncias populacionais desconhecidas, mas supostamente iguais ou desiguais.

8. 1. 1. Teste para comparação de duas médias, de amostras independentes, de variâncias


populacionais desconhecidas e supostamente iguais.
O procedimento de teste de hipóteses sempre segue uma mesma seqüência, o que muda é a
estatística amostral de interesse do pesquisador e a estatística de teste a ser utilizada.

11
Vamos supor que as amostras sejam independentes, oriundas de duas populações com
distribuição normal e que as variâncias das duas populações são desconhecidas e, portanto, precisam
ser estimadas.
Para sabermos se duas variâncias podem ser consideradas iguais, ou seja, se existe
homogeneidade de variâncias, é necessário que se proceda a um teste de hipótese sobre as variâncias
populacionais. Portanto, inicialmente, vamos testar a hipótese de homogeneidade de variâncias e, em
seguida, dado que aceitamos que as variâncias são iguais, vamos testar a hipótese de igualdade entre as
médias das duas populações. O teste de comparação de duas médias, quando as variâncias são
desiguais ou heterogêneas, será apresentado na próxima seção. A comparação entre variâncias é feita
com o uso do teste F, o qual veremos a seguir:

Teste F para comparação de variâncias populacionais


Como qualquer outro teste, devemos sempre iniciar pela formulação das hipóteses, que nesse
caso são dadas por,
H0 : σ12 = σ 22

Ha: σ12 > σ 22


Quando desejamos comparar variâncias devemos utilizar a estatística F (ou teste de Fisher-
Snedecor), dada pelo quociente entre as duas estimativas de variâncias, σˆ12 e σˆ 22 , de σ12 e σ12 ,
respectivamente, distintas e supostas independentes. Temos,

σˆ12
Fc = com n1 – 1 e n2 – 1 graus de liberdade
σˆ 22

As variâncias σˆ12 e σˆ 22 são calculadas com os n1 e n2 dados das amostras, respectivamente.

Assim, dizemos que a σˆ12 estão associados n1 – 1 graus de liberdades (numerador) e, da mesma forma,

para σˆ12 estão associados n2 – 1 graus de liberdade (denominador). Vamos admitir SEMPRE que σˆ12

é maior do que σˆ 22 , ou seja, no numerador vamos sempre usar a maior variância, ou seja:

maior var iância


F= com n1 -1 e n2 - 1 graus de liberdade do numerador e do
menor variância
denominador, respectivamente.

A conclusão do teste pode ser feita comparando o valor de F calculado com os dados da amostra
(Fcalculado), e o valor de F tabelado ou crítico, obtido na tabela da distribuição F dada em anexo, com n1
– 1 graus de liberdade no numerador e n2 – 1 graus de liberdade no denominador, e com um nível de
probabilidade α fixado. Então por esse procedimento rejeitamos H0 se Fcalculado > Fn1 – 1, n2 – 1,α.

12
Exemplo:
As produções de duas variedades de milho, em toneladas por hectare, foram as seguintes:
Variedade A 1,3 1,4 1,1 1,4 1,5
Variedade B 1,8 1,6 1,9 1,9 1,8

Dos dados das amostras obtemos, x A = 1,34, x B =1,80, σˆ A2 = 0,231, σˆ B2 = 0,0150.


Inicialmente vamos testar a hipótese de homogeneidade das variâncias com α = 5%. Assim o valor da
estatística F é,
0,0231
F= = 1,54
0,0150
Com o auxilio da tabela da distribuição F, com o nível de significância de 5%, com 4 e 4 graus
de liberdade no numerador e denominador, respectivamente, obtemos F4,4,5% = 6,39,. Como Fcalculado =
1,54, temos que Fcalculado < Fn1 – 1, n2 – 1,α., logo, aceitamos H0, ou seja, as variâncias são iguais, ao nível
de 5% de probabilidade.
Voltemos, agora, ao nosso objetivo, que é verificar se duas médias populacionais podem ser
consideradas iguais ou não. No exemplo, as hipóteses são dadas por:
H0 : µA = µB versus Ha : µA ≠ µB

Para estudar se duas médias populacionais são iguais ou não, a estatística teste a ser utilizada
é dada por:
( X1 − X 2 )
tc =
(n1 − 1)σˆ 12 + (n2 − 1)σˆ 22 1 1
 + 
n1 + n2 − 2  n1 n2 
A qual tem distribuição t de Student com n1 + n2 – 2 graus de liberdade.

A conclusão do teste pode ser feita comparando o valor de t com os dados da amostra (tcalculado),
e o valor de t tabelado ou crítico, obtido na tabela da distribuição de “t” dada em anexo, com n1 + n2 -
2 graus de liberdade, e com um nível de probabilidade α fixado. Então por esse procedimento
rejeitamos H0 se t calculado ≥ t tabelado .

Para o nosso exemplo temos,


( 1,34 − 1,80 ) − 0 ,46
t= = = −5 ,236
( 5 − 1 )0 ,0231 + ( 5 − 1 )0 ,0150  1 1  0 ,0191( 0 ,40 )
5+5−2  5 + 5 

13
Com o auxilio da tabela da distribuição t, com o nível de significância de 5%, com 8 graus de

liberdade, obtemos t8,5% = 2,306, como tcalculado = -5,236, temos que t calculado ≥ t tabelado , rejeitamos H0,

ou seja, as duas variedades de milho têm produção diferentes, ao nível de 5% de probabilidade.

8. 1. 2. Teste para comparação de duas médias, de amostras independentes e variâncias


desconhecidas e supostamente desiguais.
Suponhamos que as amostras sejam oriundas de duas populações com distribuições normais,
independentes e variâncias heterogêneas e desconhecidas, portanto, precisam ser estimadas com base
na amostra. Como no item anterior, testa-se a homogeneidade das variâncias pelo teste F, mas, como
neste caso, rejeita-se a hipótese de nulidade de igualdade entre as variâncias, o procedimento de teste
de médias entre as duas populações sofre algumas modificações.
Neste caso, a estatística de teste da diferença entre duas médias, é dada por:
( X1 − X 2 )
tc =
σˆ12 σˆ 22
+
n1 n2
Onde, esta variável tem uma distribuição aproximada de Student, com grau de liberdade
corrigido, dado por:
2
 σˆ12 σˆ 22 
 + 
 n1 n2 
v= 2 2
 σˆ12   σˆ 22 
   
 n1  +  n2 
n1 − 1 n2 − 1
Exemplo:
Em um centro agrícola, deseja-se testar o efeito de determinado fertilizante sobre a produção de
trigo. Para isso, escolheram-se 24 áreas de terra, cada uma 10 m2, de uma grande área homogênea.
Metades dessas unidades são tratadas com o fertilizante, enquanto a outra metade não recebe o
fertilizante, este é denominado de tratamento controle. A produção média do trigo sem fertilizante foi
de 1260 Kg/ha com desvio padrão de 280 Kg/ha, enquanto que a produção média com fertilizante foi
de 1710 Kg/ha com desvio padrão de 730 Kg/ha. Podemos afirma que houve aumento significativo na
produção de trigo ao nível de 5% de significância devido à utilização do fertilizante?
Antes de fazermos os testes sobre as médias populacionais deveremos verificar se as variâncias
são homogêneas ou não. Dos dados das amostras obtemos, σˆ F2 = 532900, σˆ C2 = 78400. Inicialmente

vamos testar a hipótese de homogeneidade das variâncias com α = 5%. Assim o valor da estatística F
é:
532900
F= = 6 ,7972 .
78400

14
Com o auxilio da tabela da distribuição F, com o nível de significância de 5%, com 11 e 11
graus de liberdade no numerador e denominador, respectivamente, obtemos F11,11,5% = 2,82 como
Fcalculado = 6,7972, temos que Fcalculado > Fn1 – 1, n2 – 1,α., rejeitamos H0, ou seja, as variâncias são
diferentes.
As hipóteses, sobre as médias populacionais, são formuladas do seguinte modo:
H0 : µF = µC versus Ha : µF > µC
De acordo com a hipótese alternativa, nosso teste é unilateral. O valor da estatística t é:
(1710 − 1260)
tc = = 1,99
532900 78400
+
12 12

com 12 graus de liberdade e,


2
 532900 78400 
 + 
v=  12 12 
= 14 ,17 ≅ 14
2 2
 532900   78400 
   
 12  +  12 
11 11
Com o auxilio da tabela da distribuição t, com o nível de significância de 5%, com 14 graus de
liberdade (grau de liberdade corrigido), obtemos t14,5% = 1,761, como tcalculado = 1,99, temos que
t calculado ≥ t tabelado . Rejeitamos H0, conseqüentemente, podemos afirma, ao nível de 5%, que o uso de
fertilizante causa um acréscimo significativo na produção.

8. 2. Dados pareados ou dependentes


Como o objetivo, é verificar se duas médias populacionais pareadas podem ser consideradas
iguais ou não se testa a hipótese em relação ao desvio médio ( D ), ou seja, em relação à diferença
média do antes e depois. As hipóteses são dadas por:
H0: D = Do versus Ha: D ≠ Do

Ha: D > Do

Ha: D < Do

OBS: O Do pode ser igual a zero ou não!!!! Se Do = 0, então teríamos:

H0: D = 0 versus Ha: D ≠ 0


Ha: D > 0
Ha: D < 0
Para estudar se duas médias populacionais são iguais ou não, a estatística teste a ser utilizada é
dada por:
15
D − Do
t=
σ̂ D
n
Em que:
n n n

∑ Di ∑ Di2 − (∑ Di ) 2 / n
i =1 i =1
D= i =1
e σˆ D =
n n −1

Com distribuição “t” de Student e n - 1 graus de liberdade.

A conclusão do teste é feita comparando o valor de t calculado a partir dos dados amostrais
(tcalculado), com o valor de t tabelado ou crítico, obtido na tabela da distribuição t, com n - 1 graus de
liberdade, no nível de probabilidade α% fixado. Então por esse procedimento rejeitamos H0 se
t calculado ≥ t tabelado .

Exemplo.
Os dados de peso de bezerros foram obtidos antes e depois da aplicação de uma nova ração
(tratamento), em uma amostra de tamanho n = 5. Ao nível de 5% de probabilidade podemos afirmar
que a aplicação da ração causou acréscimo de peso nos bezerros?
Seja,
X: peso antes do tratamento;
Y: peso após tratamento;
Bezerros 1 2 3 4 5
Xi 100 105 108 106 110
Yi 120 115 130 140 112

Di = Yi - Xi -20 -10 -22 -34 -2

As hipóteses, sobre as médias populacionais, são formuladas do seguinte modo:


H0 : D = 0 versus Ha: D > 0

Vamos calcular as estatísticas básicas:


− 20 + (−10) + (−22) + (−34) + −(2)
D= = −17,6
5

[(−20) 2 + (−10) 2 + (−22) 2 + (−34) 2 + (−2) 2 ] −


(− 88)2
σˆ D = 5 = 12,1984
5 −1

16
Logo, o valor da estatística t é:
− 17,6 − 0
t= = −3,226
12,1984
5
Com o auxilio da tabela da distribuição t, com o nível de significância de 5% e com 4 graus de
liberdade, obtemos t4,5% = 2,132 (Se a tabela for bilateral, olha-se α% = 10%).

= 2,13

Como tcalculado = -3,226, temos que t calculado ≥ t tabelado . Logo, rejeita-se H0 ao nível de 5% de

significância, ou seja, o uso da ração causa um acréscimo no peso dos bezerros.

Este conteúdo é resultado de pesquisa em vários livros e apostilas de estatística e bioestatística, portanto,
ainda deve ser revisado. Qualquer crítica, erro de digitação (ou outro qualquer), etc., por favor, me comunique.
Obrigada.
Profa. Gisele

17
Tabela I - Distribuição Normal Padrão Z~N(0,1)
Corpo da tabela dá a probabilidade p, tal que p = P(0< Z < Zc)

Parte inteira da primeira Segunda decimal de Zc


decimal de Zc 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,00 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,10 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,20 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,30 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,40 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,50 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,60 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,70 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,80 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,90 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,00 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,10 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,20 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,30 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,40 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,50 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,60 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,70 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,80 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,90 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,00 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,10 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,20 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,30 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,40 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,50 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,60 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,70 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,80 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,90 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,00 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,10 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,20 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,30 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,40 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998
3,50 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,60 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,70 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,80 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,90 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000
4,00 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000

18
Tabela II – Distribuição t de Student

Nível de Significância α

Graus de Liberdade (n-1) Área em DUAS caudas (Teste bilateral)


0,20 0,10 0,05 0,025 0,01
Área em UMA cauda (Teste unilateral)
0,10 0,05 0,025 0,01 0,005
1 3,078 6,314 12,706 31,821 63,656
2 1,886 2,920 4,303 6,965 9,925
3 1,638 2,353 3,182 4,541 5,841
4 1,533 2,132 2,776 3,747 4,604
5 1,476 2,015 2,571 3,365 4,032
6 1,440 1,943 2,447 3,143 3,707
7 1,415 1,895 2,365 2,998 3,499
8 1,397 1,860 2,306 2,896 3,355
9 1,383 1,833 2,262 2,821 3,250
10 1,372 1,812 2,228 2,764 3,169
11 1,363 1,796 2,201 2,718 3,106
12 1,356 1,782 2,179 2,681 3,055
13 1,350 1,771 2,160 2,650 3,012
14 1,345 1,761 2,145 2,624 2,977
15 1,341 1,753 2,131 2,602 2,947
16 1,337 1,746 2,120 2,583 2,921
17 1,333 1,740 2,110 2,567 2,898
18 1,330 1,734 2,101 2,552 2,878
19 1,328 1,729 2,093 2,539 2,861
20 1,325 1,725 2,086 2,528 2,845
21 1,323 1,721 2,080 2,518 2,831
22 1,321 1,717 2,074 2,508 2,819
23 1,319 1,714 2,069 2,500 2,807
24 1,318 1,711 2,064 2,492 2,797
25 1,316 1,708 2,060 2,485 2,787
26 1,315 1,706 2,056 2,479 2,779
27 1,314 1,703 2,052 2,473 2,771
28 1,313 1,701 2,048 2,467 2,763
29 1,311 1,699 2,045 2,462 2,756
30 1,310 1,697 2,042 2,457 2,750

19
Tabela IIIa– Distribuição F de Fisher (α = 0,01 ou 1%)

Colunas: Graus de Liberdade Numerador. Linhas: Graus de Liberdade Denominador.


1 2 3 4 5 6 7 8 9 10 11 12
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
500
1000

20
Tabela IIIb– Distribuição F de Fisher (α = 0,01 ou 1%)

Colunas: Graus de Liberdade Numerador. Linhas: Graus de Liberdade Denominador.


13 14 15 20 25 30 40 50 60 120 ∞
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
500
1000

21
Tabela IVa– Distribuição F de Fisher (α = 0,05 ou 5%)

Colunas: Graus de Liberdade Numerador. Linhas: Graus de Liberdade Denominador.


1 2 3 4 5 6 7 8 9 10 11 12
1 161 199 216 225 230 234 237 239 241 242 243 244
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,40 19,41
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,76 8,74
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,94 5,91
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,70 4,68
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,03 4,00
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,60 3,57
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,31 3,28
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,10 3,07
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,94 2,91
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,82 2,79
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,72 2,69
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,63 2,60
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,57 2,53
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,51 2,48
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,46 2,42
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,41 2,38
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,37 2,34
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,34 2,31
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,31 2,28
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,28 2,25
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,26 2,23
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,24 2,20
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,22 2,18
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,20 2,16
26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,18 2,15
27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,17 2,13
28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,15 2,12
29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,14 2,10
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,13 2,09
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,04 2,00
50 4,03 3,18 2,79 2,56 2,40 2,29 2,20 2,13 2,07 2,03 1,99 1,95
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,95 1,92
70 3,98 3,13 2,74 2,50 2,35 2,23 2,14 2,07 2,02 1,97 1,93 1,89
80 3,96 3,11 2,72 2,49 2,33 2,21 2,13 2,06 2,00 1,95 1,91 1,88
90 3,95 3,10 2,71 2,47 2,32 2,20 2,11 2,04 1,99 1,94 1,90 1,86
100 3,94 3,09 2,70 2,46 2,31 2,19 2,10 2,03 1,97 1,93 1,89 1,85
500 3,86 3,01 2,62 2,39 2,23 2,12 2,03 1,96 1,90 1,85 1,81 1,77
1000 3,85 3,00 2,61 2,38 2,22 2,11 2,02 1,95 1,89 1,84 1,80 1,76

22
Tabela IVb– Distribuição F de Fisher (α = 0,05 ou 5%)

Colunas: Graus de Liberdade Numerador. Linhas: Graus de Liberdade Denominador.


13 14 15 20 25 30 40 50 60 120 ∞
1 246 248 246 248 249 250
2 19,43 19,45 19,43 19,45 19,46 19,46
3 8,70 8,66 8,70 8,66 8,63 8,62
4 5,86 5,80 5,86 5,80 5,77 5,75
5 4,62 4,56 4,62 4,56 4,52 4,50
6 3,94 3,87 3,94 3,87 3,83 3,81
7 3,51 3,44 3,51 3,44 3,40 3,38
8 3,22 3,15 3,22 3,15 3,11 3,08
9 3,01 2,94 3,01 2,94 2,89 2,86
10 2,85 2,77 2,85 2,77 2,73 2,70
11 2,72 2,65 2,72 2,65 2,60 2,57
12 2,62 2,54 2,62 2,54 2,50 2,47
13 2,53 2,46 2,53 2,46 2,41 2,38
14 2,46 2,39 2,46 2,39 2,34 2,31
15 2,40 2,33 2,40 2,33 2,28 2,25
16 2,35 2,28 2,35 2,28 2,23 2,19
17 2,31 2,23 2,31 2,23 2,18 2,15
18 2,27 2,19 2,27 2,19 2,14 2,11
19 2,23 2,16 2,23 2,16 2,11 2,07
20 2,20 2,12 2,20 2,12 2,07 2,04
21 2,18 2,10 2,18 2,10 2,05 2,01
22 2,15 2,07 2,15 2,07 2,02 1,98
23 2,13 2,05 2,13 2,05 2,00 1,96
24 2,11 2,03 2,11 2,03 1,97 1,94
25 2,09 2,01 2,09 2,01 1,96 1,92
26 2,07 1,99 2,07 1,99 1,94 1,90
27 2,06 1,97 2,06 1,97 1,92 1,88
28 2,04 1,96 2,04 1,96 1,91 1,87
29 2,03 1,94 2,03 1,94 1,89 1,85
30 2,01 1,93 2,01 1,93 1,88 1,84
40 1,92 1,84 1,92 1,84 1,78 1,74
50 1,87 1,78 1,87 1,78 1,73 1,69
60 1,84 1,75 1,84 1,75 1,69 1,65
70 1,81 1,72 1,81 1,72 1,66 1,62
80 1,79 1,70 1,79 1,70 1,64 1,60
90 1,78 1,69 1,78 1,69 1,63 1,59
100 1,77 1,68 1,77 1,68 1,62 1,57
500 1,69 1,59 1,69 1,59 1,53 1,48
1000 1,68 1,58 1,68 1,58 1,52 1,47

23
UNIVERSIDADE FEDERAL DO PIAUÍ
Campus Universitário “Profa. Cinobelina Elvas” – Bom Jesus, PI
Lista de exercícios: Testes de hipóteses

1. O cálcio apresenta-se normalmente no sangue de mamíferos em concentrações ao redor de


6 mg por 100 ml do total de sangue. O desvio padrão normal dessa variável é 1 mg de cálcio
por 100 ml do volume total de sangue. Uma variabilidade maior que essa pode ocasionar
graves transtornos na coagulação do sangue. Uma série de nove provas sobreo paciente
revelou uma média de amostral de 2 mg por 100 ml do volume total de sangue. Existe alguma
evidência, para um nível α = 5%, de que o nível médio de cálcio para esse paciente seja
diferente do normal?

2. O cálcio apresenta-se normalmente no sangue de mamíferos em concentrações ao redor de


6 mg por 100 ml do total de sangue. Uma variabilidade maior que essa pode ocasionar graves
transtornos na coagulação do sangue. Uma série de nove provas sobreo paciente revelou uma
média de amostral de 2 mg por 100 ml do volume total de sangue e variância amostral de 2
mg de cálcio por 100 ml do volume total de sangue. Existe alguma evidência, para um nível α
= 5%, de que o nível médio de cálcio para esse paciente seja mais baixo do normal?

3. Duas espécies de pernilongos são morfologicamente tão similares que, por muitos anos,
elas foram consideradas como se fossem a mesma. Diferenças biológicas, no entanto, existem.
Estão apresentados a seguir os dados de tamanhos de palpo (apêndice do maxilar do inseto)
das duas espécies consideradas em uma amostra de 20 insetos de cada espécie: Leptoconops
carteri e L. torrens. Verificar se com os dados apresentados é possível determinar alguma
evidência significativa de diferença entre as duas espécies. Testar a hipótese de igualdade de
médias das duas espécies usando um nível de significância de 5%.

Espécies Tamanho do palpo


31 32 36 32 35
36 36 36 36 35
L. carteri
38 34 34 35 36
36 35 34 37 37
37 38 39 35 42
40 44 40 42 43
L. torrens
38 41 35 38 36
38 40 37 40 39

4. Em uma pequena experiência foi executado um trabalho de por dez técnicos, de acordo
com o método I, e por vinte técnicos, de acordo com o método II. Os resultados levaram aos
seguintes dados sobre a duração média e variabilidade do tempo necessário à execução do
trabalho:
MÉTODO I – X 1 = 53 min ; σˆ 12 = 6 min
MÉTODO II – X 2 = 57 min ; σˆ 22 = 15 min
É possível afirmar que o método I fornece um tempo médio menor que o método II?
Use α = 5%.

5. Para investigar a influência da opção profissional sobre o salário inicial de recém formados,
investigaram-se dois grupos de profissionais: um de liberais em geral e outro de formados em
Medicina Veterinária. Com os resultados abaixo, expressos em salários mínimos, quais suas
conclusões ao nível de 5% de significância?

24
Liberais (X) – 6,6 10,3 10,8 12,9 9,2 12,3 7,0
Médicos Veterinários (Y) – 8,1 9,8 8,7 10,0 10,2 10,8 8,7 10,1

6. Em um estudo para comparar os efeitos de duas dietas, A e B, sobre o crescimento, 6 ratos


foram submetido à dieta A, e 9 ratos à dieta B. Após 5 semanas, os ganhos em peso foram:

A 15 18 12 11 14 15
B 11 11 12 16 12 13 8 10 13

Admitindo que tenham duas amostras independentes de populações normais, teste a hipótese
de que não há diferença entre as duas dietas, contra a alternativa que a dieta A é mais eficaz,
ao nível de 1% de probabilidade.

7. As amostras (X1, X2, ..., X10) e (Y1, Y2, ..., Y10) de duas populações normais com médias
µ1 e µ 2 e mesma variância σ 2 fornecem as estatísticas:
X = 80; σˆ 12 = 16
Y = 83; σˆ 22 = 18
Teste ao nível de 5% de significância a hipótese H0: µ 1 = µ 2 contra a alternativa Ha: µ 1 < µ 2 .

8. Foram as seguintes as produções médias de duas variedades de soja, em t/ha: variedade A:


média=3,8 t/ha com variância = 0,36 (t=ha)2; variedade B: média=4,6 t/ha com variância = 0,04
(t=ha)2. As informações obtidas, para as variedades A e B, foram baseadas em amostras de tamanhos
30 e 35 respectivamente. Teste a hipótese de que não há diferença significativa entre as produções
médias, ao nível de 1% de probabilidade.

9. Um agrônomo realizou um levantamento para estudar o desenvolvimento de duas espécies


de árvores, a bracatinga (Mimosa scabrella) e Canafístula (Peltophorum dubium). Para esta
finalidade foram coletadas duas amostras de tamanho igual a 30 árvores. Os resultados para
altura (dados fictícios), em metros, foram:

A hipótese levantada pelo pesquisador é que a Canafístula deve apresentar uma altura média
maior do que a Bracatinga. Esses dados indicam evidência suficiente para suportar a hipótese do
pesquisador?

10. Doze galinhas adultas foram submetidas ao tratamento com certa ração durante uma
semana. Os animais foram perfeitamente identificados tendo sido mantidos, para tanto, em
baias individuais. Os pesos, em gramas, antes e ao término da semana, são apresentados a
seguir:

25
Peso (g) antes e após o tratamento
Cobaia
Antes Após
1 635 640
2 703 711
3 660 673
4 550 548
5 602 609
6 735 730
7 678 687
8 565 575
9 623 625
10 629 642
11 620 618
12 725 735

Ao nível de 1% de probabilidade podemos concluir que o uso da ração contribuiu para o


aumento do peso médio dos animais?

11. Para comparar o peso vivo e peso jejum do gado crioulo Lageano, um pesquisador
selecionou aleatoriamente uma maostra de 15 animais e anoitou os seus pesos. Os dados
resultantes estão descritos abaixo. Esses dados têm evidência suficiente para garantir que
existe diferença entre peso vivo e peso jejum? Compare os resultados utilizando α = 1% e
5%.
Animal Peso vivo Peso jejum
1 498 453
2 510 466
3 540 491
4 580 480
5 440 405
6 350 315
7 595 557
8 513 477
9 398 353
10 410 380
11 450 412
12 495 453
13 508 462
14 515 477
15 560 505

26

Potrebbero piacerti anche