Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
VI - TESTES DE HIPÓTESES
1. Introdução
A Inferência Estatística é a parte da estatística que trata das condições sob as quais se faz
inferências (ou pressuposições ou generalizações) sobre uma população, com base em dados
amostrais. Se uma amostra é representativa de uma população, possui as mesmas características
básicas da mesma, e os resultados amostrais podem ser inferidos como resultados válidos para a
população estudada. A inferência estatística envolve questões de dois tipos: a estimação de parâmetros
populacionais e os testes de hipóteses.
Os TESTES DE HIPÓTESES (ou testes de significância ou teoria da decisão estatística)
constituem procedimentos estatísticos cujo objetivo é tomar decisões baseadas nas evidências
fornecidas pelos dados amostrais. Supondo que seja levanta uma hipótese sobre o valor do parâmetro,
essa hipótese será considerada verdadeira até que prove o contrário. Portanto, o teste de hipótese é o
procedimento que nos levará a rejeitar ou na essa hipótese a partir das evidências obtidas nos
resultados amostrais.
Exemplo:
Podemos estar interessados em verificar se as seguintes afirmações são verdadeiras:
1. a produtividade média de leite em Bom Jesus é de 2,3 kg/animal;
2. a produtividade média de leite em Bom Jesus e em Cristino Castro são, ambas, de 2,3
kg/animal.
Aplicando-se o teste de hipóteses adequado poderemos rejeitar ou não a hipótese de que a
produtividade média de leite em Bom Jesus é realmente de 2,3 kg/animal, e rejeitar ou não a hipótese
de que a produtividade média de leite em Bom Jesus e em Cristino Castro são, ambas, de 2,3
kg/animal.
Observa-se que se podem fazer inferências sobre os parâmetros de apenas uma população, ou
sobre os parâmetros de duas populações diferentes, no exemplo sobre a média da produtividade de
leite na população leiteira de Bom Jesus, e sobre as médias das produtividades nas populações leiteiras
de Bom Jesus e Cristino Castro.
Desenvolveremos, neste conteúdo, os testes de hipóteses para os parâmetros mais usuais que
viemos estudando nos conteúdos anteriores, média e variância, para uma e duas populações.
1
Importante ressaltar que, os testes desenvolvidos neste conteúdo pressupõem que a característica
em análise é normalmente distribuída com média µ e variância σ 2 .
Hipótese alternativa (Ha): é a hipótese que sugere que a afirmação que estamos fazendo
sobre o parâmetro populacional é falsa, ou seja, que o valor do parâmetro é diferente, menor ou maior
que o estipulado. Portanto, Ha sempre inclui o sentido da variação.
Exemplo: Estamos interessados em verificar se as seguintes afirmações, em relação à produtividade
média de leite, são verdadeiras:
- a produtividade média de leite em Bom Jesus é de 2,3 kg/animal;
- a produtividade média de leite em Bom Jesus e em Cristino Castro são ambas, de 2,3 kg/animal.
Podemos testar então as seguintes hipóteses:
Ho: µBom Jesus = 2,3
Ha: µBom Jesus ≠ 2,3 ou
µBom Jesus < 2,3 ou
µBom Jesus > 2,3
De acordo com a hipótese alternativa utilizada no teste de hipótese, este pode ser classificado
em unilateral à esquerda (Ex.: µBom Jesus < 2,3 e µBom Jesus < µCristino castro), unilateral à direita (Ex.: µBom
Jesus > 2,3 e µBom Jesus > µCristino castro) e bilateral (Ex.: µBom Jesus ≠ 2,3 e µBom Jesus ≠ µCristino castro).
2
valores mais prováveis de ocorrer que outros. Este tipo de comportamento caracteriza uma
distribuição de probabilidade.
Do ponto de vista matemático, o valor dado pelo estimador pode diferir do valor esperado
para o parâmetro. Esta diferença matemática nem sempre representa que a hipótese de nulidade deva
ser rejeitada, pois como o estimador é uma variável aleatória, é esperado que ele assuma valores
dentro de um intervalo. O que um teste de hipóteses faz é comparar o valor especificado para um
parâmetro com a estimativa fornecida pelo estimador. Se a variação entre os dois valores for
PEQUENA diz-se que a foi devido à amostragem (acaso), consequentemente o valor do parâmetro é
realmente o especificado. Logo, a diferença entre o valor paramétrico e sua estimativa não é
significativa e não se rejeita a hipótese de nulidade.
Por outro lado, se a variação entre o valor paramétrico e sua estimativa for GRANDE, conclui-
se que a diferença é significativa e rejeita-se a hipótese de nulidade.
Nota-se que para a rejeição ou não da hipótese de nulidade é preciso estabelecer o que é uma
PEQUENA ou GRANDE diferença entre o valor paramétrico e sua estimativa. Para isto, devemos
conhecer a distribuição de probabilidade do estimador usado para estimar o parâmetro. Vamos ilustrar
com o seguinte exemplo:
Suponha que, em uma fazenda, o tempo médio gasto pelos trabalhadores na execução de uma
tarefa é de 15 minutos (µ = 15 min). Sabe-se que o tempo de execução da tarefa é uma variável
aleatória que segue distribuição normal com variância igual a 2,5 min2 [X ∼ N (15; 2,5)].
Um pesquisador implantou um novo sistema para diminuir o tempo médio de execução da
tarefa e uma amostra de 10 trabalhadores foi obtida a qual forneceu uma estimativa de 14,9 minutos
( X = 14,9 min). Do ponto de vista matemático o número 14,9 é menor que o número 15, mas do
ponto de vista estatístico, esse resultado 14,9 min é um resultado amostral e, portanto, está sujeito a
variações. Faz-se então o seguinte questionamento: Esse resultado constitui uma evidência de que
realmente o tempo médio diminuiu ou ele pode ter ocorrido por mero acaso?
Para responder à pergunta têm-se duas opções: medir o tempo gasto por todos os trabalhadores
na execução da tarefa com o novo sistema, ou então fazer uso de um teste de hipóteses. Na primeira
opção é claro que nenhum teste de hipóteses seria necessário, pois o pesquisador teria condições de
conhecer o verdadeiro valor do tempo médio na execução da tarefa com o novo sistema na população
de trabalhadores. Na segunda opção, o pesquisador faz uso dos valores amostrais, despendendo menos
trabalho, custo e tempo. Nesse caso teríamos as hipóteses a serem testadas:
Ho: µ = 15 minutos
Ha: µ < 15 minutos
4
Se H0 é:
ação
VERDADEIRA FALSA
NÃO REJEITAR H0 decisão correta (1-α) erro do tipo II (β)
REJEITAR H0 erro tipo I (α) decisão correta (1-β)
(i) Os erros tipo I e tipo II estão relacionados do seguinte modo: quando α decresce β cresce.
Portanto, não é possível encontrar testes que tornem simultaneamente ambos os erros tão
pequenos quanto queremos. Desse modo, é sempre necessário “privilegiar” uma das
hipóteses de maneira que não seja rejeitada, amenos que sua falsidade se torne muito
evidente. Nos testes a hipótese privilegiada é Ho, que só será rejeitada quando a evidência
de sua falsidade superar o limite de 100.(1 − α )%
(ii) Ao assumir α como muito pequeno, então β pode aproximar-se de 1. O ideal na hora de
definir um teste é encontrar um compromisso satisfatório entre α e β (mesmo que sempre
a favor de Ho). Denominamos o PODER DE UM TESTE a quantidade 1 – β, ou seja,
Poder de um teste ≡ 1 – β = P (rejeitar Ho, dado que é falsa)
(iii) Erro tipo I é controlado com a escolha de α.
(iv) A única forma de causar uma redução de α e β simultaneamente é aumentar o tamanho da
amostra.
(v) Se H0 for falso, β será maior quanto mais próximo o valor do parâmetro estiver do valor
sob a hipótese H0.
Na prática, é costume escolherem-se níveis tradicionais (5% e 1%) para α e ignorar o erro tipo
II, assim, iremos aqui nos preocupar em controlar apenas o erro tipo I.
5
Figura 1. Gráficos da curva de distribuição normal em Testes de hipóteses unilateral à esquerda (a),
unilateral à direita (b) e bilateral (c).
6
7. Testes de Média Populacionais
O objetivo de testarem-se hipóteses sobre médias verdadeiras é avaliar certas afirmações feitas
sobre as mesmas. Por exemplo, podemos desejar verificar a afirmação de que as alturas médias de
plantas de feijão, para sementes de alto e baixo vigor, são iguais.
Existem, basicamente, três tipos de afirmações que se podem fazer quando se estuda médias
populacionais, no entanto, no nosso curso veremos duas, quais sejam:
1. a afirmação diz respeito a uma média populacional, então, temos o teste de uma média
populacional. Exemplo, o peso ao nascer de bezerros da raça nelore, é de 25,5 kg;
2. a firmação diz respeito as médias de duas populações (dois tratamentos) são iguais, temos
então, o teste de comparação de duas médias. Exemplo, a produção média de batatinhas de
duas variedades são iguais.
As técnicas que nós vamos estudar pressupõem uma distribuição normal da distribuição
amostral da estatística ou estimadores ( X , X 1 , X 2 ). Essa suposição será valida se a distribuição da
variável em estudo seguir uma distribuição normal e a amostragem for aleatória e, em geral, com boa
aproximação se a amostra for suficientemente grande (sugestão: n ≥ 30)
7
Pois a máquina pode desregular para mais ou para menos.
Passo 2. Pela afirmação do problema, σ2 = 400 g será sempre a mesma; logo, para todo µ, a média
X de 16 pacotes terá distribuição N (µ,400/16), de modo que o desvio padrão de X é σ X = 5. Em
particular, X ~N (500,25).
Passo 3. Vamos fixar α = 1%; pela hipótese alternativa, dizemos que temos um teste bilateral.
Portanto nossa região crítica será como podemos observa na figura 10.
OBS: Os valores tabelados (“Z” tabelados) são obtidos da tabela de “Z” da seguinte forma:
Como se utilizou um α = 1%, tem-se que a região de aceitação equivale a 99%, ou seja,
1 - α = 1 – 0,01 = 0,99
Como o teste é bilateral, busca-se na tabela o valor de Z correspondente a esta probabilidade. Se
for utilizada a tabela unilateral de Z (dada na aula do dia 30/05 à tarde), tem-se antes que dividir 0,99
por 2, e aí sim buscar o valor de Z referente a essa probabilidade. No caso, 0,495. Portanto, para esse
valor de probabilidade o valor de Z é 2,57. Como a tabela é unilateral, mas a curva da distribuição
Normal é simétrica, os pontos à esquerda e à direita da média µ =0 são, -2,57 e 2,57, respectivamente.
Por outro lado, se for utilizada a tabela bilateral de Z (dada junto com a apostila), deve-se buscar
direto o valor de Z referente a essa probabilidade. No caso, esta probabilidade é 0,9911 e o valor de Z
referente é também + 2,57.
Passo 4. A informação pertinente da amostra é sua média que nesse caso particular é X = 492,
temos:
492 − 500
Zc = = −1,60
20 / 16
8
Passo 5. Como Zcalc = -1,60 ∈ RAH0 , aceita-se H0, ou seja, podemos concluir com um nível de
significância de 1% que a produção está sobre controle com um peso médio de 500 g por pacote de
sementes.
σ2
Ao substituir σ por σˆ em σ = , a variável resultante terá distribuição t de Student com n
n
- 1 graus de liberdade (onde σˆ é a raiz quadrada da variância da amostra calculada com n - 1 no
denominador). A expressão a ser usada será, portanto,
X −µ
tc = com n – 1 graus de liberdade
σˆ / n
OBS: quando o tamanho da amostra e maior de 30 a população tende a ser distribuída
normalmente.
Exemplo:
Um criador de coelhos afirma que seus coelhos abatidos aos 90 dias apresentam um peso médio
de 2,701Kg. Uma amostra de 10 coelhos foi retirada aleatoriamente e calculou-se sua média e seu
desvio padrão, que foram 2,584 Kg e 0,0675Kg, respectivamente. Utilizando o teste de hipótese
podemos afirmar que o peso dos coelhos estão abaixo do que afirma o criador?
Vejamos como testar essa hipótese.
Passo 1. As hipóteses que nos interessam são:
H0 : µ = 2,701Kg
H1 : µ < 2,701Kg
Pois a máquina pode desregular para mais ou para menos.
9
Figura 3. Região crítica para o teste H0 : µ = 2,701 Kg versus H1 : µ < 2,701Kg
OBS: O valor tabelado (“t” tabelado) é obtido da tabela de “t” da seguinte forma:
Como se utilizou um α = 5%, basta olhar na tabela de “t” o valor referente a 5% com 9 graus de
liberdade (n – 1 = 10 – 1 = 9), que é, portanto 1,83. Como o teste é unilateral e usou-se uma tabela
bilateral, tem-se que olhar na tabela o valor tabelado para 2α, ou seja 10%. Logo, para α = 10% e 9
graus de liberdade o valor de “t” tabelado é 1,83, ou -1,83 já que a distribuição na tabela bilateral é
simétrica.
IMPORTANTE:
Quanto se tem uma tabela de “t” unilateral e o teste também é unilateral, ou
quando se tem uma tabela de “t” bilateral e o teste também é bilateral, usa-se o
nível de significância α. Porém, se tiver uma tabela unilateral e o teste for
bilateral, usa-se 2α e, quando se tiver uma tabela bilateral e um teste unilateral,
usa-se α/2.
Ou seja:
Passo 4. A informação pertinente da amostra é sua média que nesse caso particular é X = 2,584,
temos:
2 ,584 − 2 ,701
tc = = −5 ,481
0 ,0675 / 10
10
Passo 5. Como tc = -5,481 ∈ RRH0 , rejeita-se H0, ou seja, ao nível de 5% de probabilidade pelo o
teste t a média dos pesos dos coelhos aos 90 dias é inferior a 2,701Kg, com 95% de confiança.
σ21 e σ22)
µ1 e µ2) quando as variâncias populacionais (σ
8. Teste para comparação de duas médias (µ
forem desconhecidas
Vamos agora estender o procedimento anterior para o caso de comparação de duas médias
populacionais, quando as variâncias populacionais são desconhecidas. Nesse caso, conhecem-se as
estimativas das variâncias populacionais.
A fundamentação básica continua sendo a mesma dos testes anteriores, só se farão algumas
alterações quanto à estatística teste a ser utilizada. Neste caso testamos a hipótese de igualdade das
duas médias, ou seja:
H0: µ1 = µ2.
Como no caso do teste de uma média populacional, temos três possibilidades para a hipótese
alternativa, quais sejam:
Ha: µ1 ≠ µ2.
Ha: µ1 > µ2.
Ha : µ1 < µ2.
Num teste de comparação de duas médias temos dois casos a considerar, quais sejam:
1. dados não pareados ou amostras independentes. Neste caso, os dados das duas
amostras não estão relacionados. Exemplo: o peso de bezerros de duas raças A e B.
11
Vamos supor que as amostras sejam independentes, oriundas de duas populações com
distribuição normal e que as variâncias das duas populações são desconhecidas e, portanto, precisam
ser estimadas.
Para sabermos se duas variâncias podem ser consideradas iguais, ou seja, se existe
homogeneidade de variâncias, é necessário que se proceda a um teste de hipótese sobre as variâncias
populacionais. Portanto, inicialmente, vamos testar a hipótese de homogeneidade de variâncias e, em
seguida, dado que aceitamos que as variâncias são iguais, vamos testar a hipótese de igualdade entre as
médias das duas populações. O teste de comparação de duas médias, quando as variâncias são
desiguais ou heterogêneas, será apresentado na próxima seção. A comparação entre variâncias é feita
com o uso do teste F, o qual veremos a seguir:
σˆ12
Fc = com n1 – 1 e n2 – 1 graus de liberdade
σˆ 22
Assim, dizemos que a σˆ12 estão associados n1 – 1 graus de liberdades (numerador) e, da mesma forma,
para σˆ12 estão associados n2 – 1 graus de liberdade (denominador). Vamos admitir SEMPRE que σˆ12
é maior do que σˆ 22 , ou seja, no numerador vamos sempre usar a maior variância, ou seja:
A conclusão do teste pode ser feita comparando o valor de F calculado com os dados da amostra
(Fcalculado), e o valor de F tabelado ou crítico, obtido na tabela da distribuição F dada em anexo, com n1
– 1 graus de liberdade no numerador e n2 – 1 graus de liberdade no denominador, e com um nível de
probabilidade α fixado. Então por esse procedimento rejeitamos H0 se Fcalculado > Fn1 – 1, n2 – 1,α.
12
Exemplo:
As produções de duas variedades de milho, em toneladas por hectare, foram as seguintes:
Variedade A 1,3 1,4 1,1 1,4 1,5
Variedade B 1,8 1,6 1,9 1,9 1,8
Para estudar se duas médias populacionais são iguais ou não, a estatística teste a ser utilizada
é dada por:
( X1 − X 2 )
tc =
(n1 − 1)σˆ 12 + (n2 − 1)σˆ 22 1 1
+
n1 + n2 − 2 n1 n2
A qual tem distribuição t de Student com n1 + n2 – 2 graus de liberdade.
A conclusão do teste pode ser feita comparando o valor de t com os dados da amostra (tcalculado),
e o valor de t tabelado ou crítico, obtido na tabela da distribuição de “t” dada em anexo, com n1 + n2 -
2 graus de liberdade, e com um nível de probabilidade α fixado. Então por esse procedimento
rejeitamos H0 se t calculado ≥ t tabelado .
13
Com o auxilio da tabela da distribuição t, com o nível de significância de 5%, com 8 graus de
liberdade, obtemos t8,5% = 2,306, como tcalculado = -5,236, temos que t calculado ≥ t tabelado , rejeitamos H0,
vamos testar a hipótese de homogeneidade das variâncias com α = 5%. Assim o valor da estatística F
é:
532900
F= = 6 ,7972 .
78400
14
Com o auxilio da tabela da distribuição F, com o nível de significância de 5%, com 11 e 11
graus de liberdade no numerador e denominador, respectivamente, obtemos F11,11,5% = 2,82 como
Fcalculado = 6,7972, temos que Fcalculado > Fn1 – 1, n2 – 1,α., rejeitamos H0, ou seja, as variâncias são
diferentes.
As hipóteses, sobre as médias populacionais, são formuladas do seguinte modo:
H0 : µF = µC versus Ha : µF > µC
De acordo com a hipótese alternativa, nosso teste é unilateral. O valor da estatística t é:
(1710 − 1260)
tc = = 1,99
532900 78400
+
12 12
Ha: D > Do
Ha: D < Do
∑ Di ∑ Di2 − (∑ Di ) 2 / n
i =1 i =1
D= i =1
e σˆ D =
n n −1
A conclusão do teste é feita comparando o valor de t calculado a partir dos dados amostrais
(tcalculado), com o valor de t tabelado ou crítico, obtido na tabela da distribuição t, com n - 1 graus de
liberdade, no nível de probabilidade α% fixado. Então por esse procedimento rejeitamos H0 se
t calculado ≥ t tabelado .
Exemplo.
Os dados de peso de bezerros foram obtidos antes e depois da aplicação de uma nova ração
(tratamento), em uma amostra de tamanho n = 5. Ao nível de 5% de probabilidade podemos afirmar
que a aplicação da ração causou acréscimo de peso nos bezerros?
Seja,
X: peso antes do tratamento;
Y: peso após tratamento;
Bezerros 1 2 3 4 5
Xi 100 105 108 106 110
Yi 120 115 130 140 112
16
Logo, o valor da estatística t é:
− 17,6 − 0
t= = −3,226
12,1984
5
Com o auxilio da tabela da distribuição t, com o nível de significância de 5% e com 4 graus de
liberdade, obtemos t4,5% = 2,132 (Se a tabela for bilateral, olha-se α% = 10%).
= 2,13
Como tcalculado = -3,226, temos que t calculado ≥ t tabelado . Logo, rejeita-se H0 ao nível de 5% de
Este conteúdo é resultado de pesquisa em vários livros e apostilas de estatística e bioestatística, portanto,
ainda deve ser revisado. Qualquer crítica, erro de digitação (ou outro qualquer), etc., por favor, me comunique.
Obrigada.
Profa. Gisele
17
Tabela I - Distribuição Normal Padrão Z~N(0,1)
Corpo da tabela dá a probabilidade p, tal que p = P(0< Z < Zc)
18
Tabela II – Distribuição t de Student
Nível de Significância α
19
Tabela IIIa– Distribuição F de Fisher (α = 0,01 ou 1%)
20
Tabela IIIb– Distribuição F de Fisher (α = 0,01 ou 1%)
21
Tabela IVa– Distribuição F de Fisher (α = 0,05 ou 5%)
22
Tabela IVb– Distribuição F de Fisher (α = 0,05 ou 5%)
23
UNIVERSIDADE FEDERAL DO PIAUÍ
Campus Universitário “Profa. Cinobelina Elvas” – Bom Jesus, PI
Lista de exercícios: Testes de hipóteses
3. Duas espécies de pernilongos são morfologicamente tão similares que, por muitos anos,
elas foram consideradas como se fossem a mesma. Diferenças biológicas, no entanto, existem.
Estão apresentados a seguir os dados de tamanhos de palpo (apêndice do maxilar do inseto)
das duas espécies consideradas em uma amostra de 20 insetos de cada espécie: Leptoconops
carteri e L. torrens. Verificar se com os dados apresentados é possível determinar alguma
evidência significativa de diferença entre as duas espécies. Testar a hipótese de igualdade de
médias das duas espécies usando um nível de significância de 5%.
4. Em uma pequena experiência foi executado um trabalho de por dez técnicos, de acordo
com o método I, e por vinte técnicos, de acordo com o método II. Os resultados levaram aos
seguintes dados sobre a duração média e variabilidade do tempo necessário à execução do
trabalho:
MÉTODO I – X 1 = 53 min ; σˆ 12 = 6 min
MÉTODO II – X 2 = 57 min ; σˆ 22 = 15 min
É possível afirmar que o método I fornece um tempo médio menor que o método II?
Use α = 5%.
5. Para investigar a influência da opção profissional sobre o salário inicial de recém formados,
investigaram-se dois grupos de profissionais: um de liberais em geral e outro de formados em
Medicina Veterinária. Com os resultados abaixo, expressos em salários mínimos, quais suas
conclusões ao nível de 5% de significância?
24
Liberais (X) – 6,6 10,3 10,8 12,9 9,2 12,3 7,0
Médicos Veterinários (Y) – 8,1 9,8 8,7 10,0 10,2 10,8 8,7 10,1
A 15 18 12 11 14 15
B 11 11 12 16 12 13 8 10 13
Admitindo que tenham duas amostras independentes de populações normais, teste a hipótese
de que não há diferença entre as duas dietas, contra a alternativa que a dieta A é mais eficaz,
ao nível de 1% de probabilidade.
7. As amostras (X1, X2, ..., X10) e (Y1, Y2, ..., Y10) de duas populações normais com médias
µ1 e µ 2 e mesma variância σ 2 fornecem as estatísticas:
X = 80; σˆ 12 = 16
Y = 83; σˆ 22 = 18
Teste ao nível de 5% de significância a hipótese H0: µ 1 = µ 2 contra a alternativa Ha: µ 1 < µ 2 .
A hipótese levantada pelo pesquisador é que a Canafístula deve apresentar uma altura média
maior do que a Bracatinga. Esses dados indicam evidência suficiente para suportar a hipótese do
pesquisador?
10. Doze galinhas adultas foram submetidas ao tratamento com certa ração durante uma
semana. Os animais foram perfeitamente identificados tendo sido mantidos, para tanto, em
baias individuais. Os pesos, em gramas, antes e ao término da semana, são apresentados a
seguir:
25
Peso (g) antes e após o tratamento
Cobaia
Antes Após
1 635 640
2 703 711
3 660 673
4 550 548
5 602 609
6 735 730
7 678 687
8 565 575
9 623 625
10 629 642
11 620 618
12 725 735
11. Para comparar o peso vivo e peso jejum do gado crioulo Lageano, um pesquisador
selecionou aleatoriamente uma maostra de 15 animais e anoitou os seus pesos. Os dados
resultantes estão descritos abaixo. Esses dados têm evidência suficiente para garantir que
existe diferença entre peso vivo e peso jejum? Compare os resultados utilizando α = 1% e
5%.
Animal Peso vivo Peso jejum
1 498 453
2 510 466
3 540 491
4 580 480
5 440 405
6 350 315
7 595 557
8 513 477
9 398 353
10 410 380
11 450 412
12 495 453
13 508 462
14 515 477
15 560 505
26