Sei sulla pagina 1di 126

Inferência

Fábio Azevedo de Souza

Amostragem, Estimação Pontual, Intervalar e Testes de Hipóteses

Material em construção
19 de outubro de 2017

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 1 / 108


Sumário

1 Amostragem
Distribuição amostral da média
Distribuição Amostral da Proporção
Determinação do tamanho da amostra

2 Estimação
Intervalos de Conança
Testes de Hipóteses

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 2 / 108


Amostragem

Introdução

Figura: População em estudo

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 3 / 108


Amostragem

Introdução

Figura: População em estudo

Denição
É o conjunto de todos os elementos ou resultados sob investigação que apresenta pelo menos
uma variável em comum e observável. Será denotada por N.
Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 3 / 108
Amostragem

Exemplo

Figura: Amostra da população em estudo

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 4 / 108


Amostragem

Exemplo

Figura: Amostra da população em estudo

Denição
É qualquer subconjunto da população. Será denotado por n.

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 4 / 108


Amostragem

Exemplo

Consideremos uma pesquisa para estudar os salários dos 500 funcionários da Companhia MB.
Seleciona-se uma amostra de 30 indivíduos, e anotam-se os seus salários.
1 População
2 Amostra

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 5 / 108


Amostragem

Exemplo

Consideremos uma pesquisa para estudar os salários dos 500 funcionários da Companhia MB.
Seleciona-se uma amostra de 30 indivíduos, e anotam-se os seus salários.
1 População
2 Amostra
Podemos está interessado em estudar a distribuição dos salários na amostra, e esperamos que
esta reita a distribuição de todos os salários.

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 5 / 108


Amostragem

Distribuição dos salários

Fábio Azevedo (UFPB-DE) Figura: Histograma da variável salário


Inferência 19 de outubro de 2017 6 / 108
Amostragem

Conceitos

Os procedimentos utilizados para se fazer uma amostragem é tão importante, que constituem
especialidades dentro da estatística.

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 7 / 108


Amostragem

Conceitos

Os procedimentos utilizados para se fazer uma amostragem é tão importante, que constituem
especialidades dentro da estatística.

1 Levantamento Amostrais
2 Planejamento de Experimentos
3 Levantamentos Observacionais

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 7 / 108


Amostragem

Amostragem Aleatória Simples

Figura: Amostra Aleatória Simples

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 8 / 108


Amostragem

Exemplo

Numa urna tem tem 5 tiras de papel numeradas 1, 3, 5, 5, 7. Uma tira é sorteada e recolocada
na urna; então, uma segunda tira é sorteada.Sejam x1 e x2 o primeiro e o segundo número
sorteado. Considere todas as amostras possíveis de tamanho 2, com reposição,dessa população.
Seja X: valor assumido pelo elemento na população.
Função de Distribuição

Tabela: Distribuição da v.a. X para o exemplo acima

X 1 3 5 7
P (X = x) 1/5 1/5 2/5 1/5

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 9 / 108


Amostragem

Amostragem Aleatória Simples

Denição
Uma amostra aleatória simples de tamanho n de uma variável aleatória X, com dada
distribuição, é conjunto de n variáveis aleatórias independentes X1 , X2 , . . . , Xn , cada uma com
a mesma distribuição.

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 10 / 108


Amostragem

Amostragem Aleatória Simples

Denição
Uma amostra aleatória simples de tamanho n de uma variável aleatória X, com dada
distribuição, é conjunto de n variáveis aleatórias independentes X1 , X2 , . . . , Xn , cada uma com
a mesma distribuição.

Ou seja, será a n-upla ordenada.

(X1 , X2 , . . . , Xn )

em X − i indica cada observação do i-ésimo elemento sorteado.

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 10 / 108


Amostragem

Denições

Denição
Um Estimador (estatística) é uma característica da amostra, ou seja, um estimador T é uma
função de X1 , X2 , . . . , Xn ,.

Denição
Uma Estimativa é o valor assumido pelo estimador T .

Exemplo
n
Xi : média amostral
X
X̄ = 1/n
i=1

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 11 / 108


Amostragem

Denições

Denição
Um parâmetro é uma medida usada para descrever uma característica da população.

Exemplo
µ = E[X] : média populacional

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 12 / 108


Amostragem

Resumo

Tabela: Tabela com Parâmetros e Estimadores

Denominação População Amostra


Média
P
µ = E[X] x̄ = Xi /n
mediana Md md
Variância σ 2 = var(X) S2 = (Xi − X̄ 2 /(n − 1))
P
Número de elementos N n
Proporção P p̂
Quantil Q(p) q(p)
Quartis Q1 , Q2 , Q3 q1 , q2 , q3
Intervalo inter-quartil dq = Q3 − Q1 dq = q3 − q1
Função de densidade f (x) histograma
Função de distribuição F (x) Fe (x)

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 13 / 108


Amostragem Distribuição amostral da média

Distribuição amostral da média

Consideremos uma população em que o nosso interesse é estudar uma variável X, cujos parâmetros
média populacional µ = E[X] e variância populacional σ 2 = V ar(X) são supostos conhecidos.
Deveremos:

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 14 / 108


Amostragem Distribuição amostral da média

Distribuição amostral da média

Consideremos uma população em que o nosso interesse é estudar uma variável X, cujos parâmetros
média populacional µ = E[X] e variância populacional σ 2 = V ar(X) são supostos conhecidos.
Deveremos:

1 Retirar todas as possíveis amostras de tamanho n dessa população;


2 Calcular a média amostral X̄ ;
3 Considerar a distribuição amostral e estudar suas propriedades.

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 14 / 108


Amostragem Distribuição amostral da média

Distribuição amostral da média

Consideremos uma população em que o nosso interesse é estudar uma variável X, cujos parâmetros
média populacional µ = E[X] e variância populacional σ 2 = V ar(X) são supostos conhecidos.
Deveremos:

1 Retirar todas as possíveis amostras de tamanho n dessa população;


2 Calcular a média amostral X̄ ;
3 Considerar a distribuição amostral e estudar suas propriedades.

Exemplo
A população {1, 3, 5, 5, 7} tem média µ = 4, 2 e variância σ 2 = 4, 16.

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 14 / 108


Amostragem Distribuição amostral da média

Distribuição amostral da média

Tabela: Distribuição das probabilidades das possíveis amostras de tamanho 2 do {1, 3, 5, 5, 7}

X2
1 3 5 7 Total
X1
1 1/25 1/25 2/25 1/25 1/5
3 1/25 1/25 2/25 1/25 1/5
5 2/25 2/25 4/25 2/25 2/5
7 1/25 1/25 2/25 1/25 1/5
Total 1/5 1/5 2/5 1/5 1

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 15 / 108


Amostragem Distribuição amostral da média

Distribuição amostral da média

Tabela: Distribuição das probabilidades das possíveis amostras de tamanho 2 do {1, 3, 5, 5, 7}

X2
1 3 5 7 Total
X1
1 1/25 1/25 2/25 1/25 1/5
3 1/25 1/25 2/25 1/25 1/5
5 2/25 2/25 4/25 2/25 2/5
7 1/25 1/25 2/25 1/25 1/5
Total 1/5 1/5 2/5 1/5 1

Tabela: Distribuição amostral da estatística X̄

X̄ 1 2 3 4 5 6 7 Total
P (X̄ = x̄) 1/25 2/25 5/25 6/25 6/25 4/25 1/25 1,00
Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 15 / 108
Amostragem Distribuição amostral da média

Distribuição Amostral da Média X̄

Estudaremos agora, a distribuição amostral da estatística X̄ , a média amostral. Seja X uma


variável de uma determinada população, cujos parâmetros são: E[X] = µ e V ar(X) = σ 2 .

E[X̄] = E[X] = µ
e
σ2
V ar[X̄] =
n
.
Teorema: Se X ∼ N µ, σ 2 e se retirarmos dessa população amostras (AAS) de tamanho n ,


teremos que

σ2
 
X̄ ∼ N µ,
n

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 16 / 108


Amostragem Distribuição amostral da média

Corolários

Se (X1 , X2 , . . . , Xn ) for uma amostra aleatória simples da população X, com média µ e


variância σ 2 nita, e X̄ = (X1 + . . . + Xn )/n, então

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 17 / 108


Amostragem Distribuição amostral da média

Corolários

Se (X1 , X2 , . . . , Xn ) for uma amostra aleatória simples da população X, com média µ e


variância σ 2 nita, e X̄ = (X1 + . . . + Xn )/n, então

X̄ − µ
Z= √ ∼ N (0, 1). (1)
σ/ n

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 17 / 108


Amostragem Distribuição amostral da média

Corolários

Se (X1 , X2 , . . . , Xn ) for uma amostra aleatória simples da população X, com média µ e


variância σ 2 nita, e X̄ = (X1 + . . . + Xn )/n, então

X̄ − µ
Z= √ ∼ N (0, 1). (1)
σ/ n

Reescrevendo (1) temos

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 17 / 108


Amostragem Distribuição amostral da média

Corolários

Se (X1 , X2 , . . . , Xn ) for uma amostra aleatória simples da população X, com média µ e


variância σ 2 nita, e X̄ = (X1 + . . . + Xn )/n, então

X̄ − µ
Z= √ ∼ N (0, 1). (1)
σ/ n

Reescrevendo (1) temos



n(X̄ − µ)
Z= ∼ N (0, 1). (2)
σ

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 17 / 108


Amostragem Distribuição amostral da média

Corolários

Se (X1 , X2 , . . . , Xn ) for uma amostra aleatória simples da população X, com média µ e


variância σ 2 nita, e X̄ = (X1 + . . . + Xn )/n, então

X̄ − µ
Z= √ ∼ N (0, 1). (1)
σ/ n

Reescrevendo (1) temos



n(X̄ − µ)
Z= ∼ N (0, 1). (2)
σ
Seja e = X̄ − µ o erro amostral da média. Então,

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 17 / 108


Amostragem Distribuição amostral da média

Corolários

A distribuição de e aproxima-se de uma distribuição normal com média 0 e variância σ 2 /n, isto
é,

ne
∼ N (0, 1). (3)
σ

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 18 / 108


Amostragem Distribuição amostral da média

Corolários

A distribuição de e aproxima-se de uma distribuição normal com média 0 e variância σ 2 /n, isto
é,

ne
∼ N (0, 1). (3)
σ

O TLC arma que X̄ aproxima-se de uma normal quando n tende para o innito, e a rapidez
dessa convergência depende da distribuição da população da qual a mostra foi retirada.

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 18 / 108


Amostragem Distribuição amostral da média

Corolários

Figura: Histogramas para diferentes valores de n.


Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 19 / 108
Amostragem Distribuição amostral da média

Exemplos

1 Uma v.a. X tem distribuição normal, com média 100 e desvio padrão 10.
(a) Qual a P (90 < X < 110)?
(b)Se X̄ for a média de uma amostra de 16 elementos retirados dessa população, calcule
P (90 < X̄ < 110);
(c) Que tamanho deveria ter a amostra para que P (90 < X̄ < 110) = 0, 95.
2 (Bussab, O. B., 5 ed., 2003)A capacidade máxima de um elevador é de 500Kg. Se a
distribuição X dos pesos dos usuários for suposta N(70, 100):
(a) Qual é a probabilidade de sete passageiros ultrapassarem esse limite?
(b) E seis passageiros?

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 20 / 108


Amostragem Distribuição Amostral da Proporção

Consideremos uma população em que a proporção de indivíduos com determinada característica


é p. Logo, podemos denir uma v.a. X, da seguinte maneira:

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 21 / 108


Amostragem Distribuição Amostral da Proporção

Consideremos uma população em que a proporção de indivíduos com determinada característica


é p. Logo, podemos denir uma v.a. X, da seguinte maneira:

1,
 se o indivíduo é portador da característica;
X= (4)
se o indivíduo não é portador de característica.

0,

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 21 / 108


Amostragem Distribuição Amostral da Proporção

Consideremos uma população em que a proporção de indivíduos com determinada característica


é p. Logo, podemos denir uma v.a. X, da seguinte maneira:

1,
 se o indivíduo é portador da característica;
X= (4)
se o indivíduo não é portador de característica.

0,

Assim, X é uma variável discreta, com distribuição de Bernoulli, tal que

µ = E(X) = p, σ 2 = Var(X) = p(1 − p).

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 21 / 108


Amostragem Distribuição Amostral da Proporção

Figura: Retiradas de amostras aleatórias simples

Retirada uma AAS X1 , X2 , . . . , Xn sem reposição de tamanho n dessa população, e indicando


por Yn o total de indivíduos portadores da característica na amostra, teremos que

Yn ∼ Binomial(n, p)
ou seja,
 
n
P(Yn = k) = pk (1 − p)n−k .
k
Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 22 / 108
Amostragem Distribuição Amostral da Proporção

Exemplo

Vamos denir por p̂ a proporção de indivíduos portadores da característica na amostra, isto é,


Yn
p̂ = .
n
Então,

P(Yn = k) = P(Yn /n = k/n) = P(p̂ = k/n),


ou seja, a distribuição amostral de p̂ é obtida da distribuição de Yn .
Notemos que

Yn = X1 + X2 + . . . + Xn

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 23 / 108


Amostragem Distribuição Amostral da Proporção

Exemplo

onde cada Xi tem distribuição de Bernoulli com média µ = p e variância σ 2 = p(1 − p), e são
duas a duas independentes. Podemos escrever que
n n
X X Xi
Yn = Xi = n = nX
n
i=1 i=1

mas, pelo Teorema Central do Limite, X terá distribuição aproximadamente normal, com média
p e variância p(1 − p)/n, ou seja
 
p(1 − p)
X∼N p, .
n

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 24 / 108


Amostragem Distribuição Amostral da Proporção

Exemplo

Logo, a transformação Yn = nX terá a distribuição

Yn ∼ N (np, np(1 − p)).


Perceba que X , na expressão acima, é a própria variável p̂ e, desse modo, para n grande podemos
considerar a distribuição amostral de p como aproximadamente normal
 
p(1 − p)
p̂ ∼ N p,
n
e
 
p(1 − p)
p̂ − p ∼ N 0, .
n

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 25 / 108


Amostragem Distribuição Amostral da Proporção

Exemplos

1 Suponha que queremos saber a porcentagem de casamentos que terminam em divórcio


entre casais que vivem em São Paulo. Como não temos recursos sucientes para checar
todos os arquivos, vamos estimar esta porcentagem baseados em alguns dados disponíveis.
Suponha que temos dados sobre 10 casais:

X1 = 1, X2 = 0, X3 = 0, X4 = 0, X5 = 1,
X6 = 0, X7 = 0, X8 = 0, X9 = 0, X10 = 1.
2 Suponha que p = 30% dos estudantes de uma escola sejam mulheres. Colhemos uma AAS
de n = 10 estudantes e calculamos p̂ = proporção de mulheres na amostra. Qual a
probabilidade de que p̂ dira de p em menos de 0,01?

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 26 / 108


Amostragem Distribuição Amostral da Proporção

Solução

1 então a probabilidade estimada de um divórcio é


3
p̂ = = 0, 3.
10
Como estamos tratando de distribuição binomial e, supondo conhecer a real probabilidade
de divórcio, p, podemos encontrar P (p̂ = 0, 3)

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 27 / 108


Amostragem Distribuição Amostral da Proporção

Solução

1 então a probabilidade estimada de um divórcio é


3
p̂ = = 0, 3.
10
Como estamos tratando de distribuição binomial e, supondo conhecer a real probabilidade
de divórcio, p, podemos encontrar P (p̂ = 0, 3)
 
10
P (X = 3) = p3 (1 − p)7 .
3

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 27 / 108


Amostragem Determinação do tamanho da amostra

Denição

Nosso interesse agora é determinar o tamanho da amostra, de modo a obter um erro de estimação
previamente estipulado, com um certo grau de conança.
Por exemplo, suponha que estejamos estimando a média µ populacional e para tanto usaremos a
média amostral, X̄ , baseada numa amostra de tamanho n. Suponha que queiramos determinar
o valor de n de modo que

(5)

P X̄ − µ ≤  ≥ γ,
Sabemos que X̄ ∼ N µ, σ 2 /n , logo X̄ − µ ∼ N 0, σ 2 /n e portanto (4) pode ser escrita
 

 √ √ 
 − n n
P − ≤ X̄ − µ ≤  = P ≤Z≤ ≈γ
σ σ
Com Z = X̄ − µ /σx̄ .


Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 28 / 108


Amostragem Determinação do tamanho da amostra

Amostras

Dado um γ , podemos obter zγ da N(0,1), tal que P (−zγ < Z < zγ ) = γ , de modo que

n
= zγ ,
σ
do que obtemos nalmente

σ 2 zγ2
n= (6)
2
No caso de proporções, podemos obter pela aproximação normal que

zγ2 p(1 − p) zγ2


n= . Para p desconhecido, temos n ≈ (7)
2 42

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 29 / 108


Amostragem Determinação do tamanho da amostra

Exemplos

1 Suponha que uma va.a X:N(1200, 840). Qual deverá ser o tamanho da amostra, de tal
forma que P (1196 < x̄ < 1204) = 0, 90?

2 Suponha que uma pequena amostra piloto de n=10, extraída de uma população, forneceu
os valores X̄ = 15 e S 2 = 16. Fixando  = 0, 5 e γ = 0, 95, encontre n.

3 Suponha que numa pesquisa de mercado estima-se que no mínimo 60% das pessoas
entrevistadas preferirão a marca A de um produto. Essa informação é baseada em
pesquisas anteriores. Se quisermos que o erro amostral de p̂ seja menos do que  = 0, 03,
com probabilidade γ = 0, 95, qual deve ser o tamanho de n?
Solução:

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 30 / 108


Amostragem Determinação do tamanho da amostra

Exemplo

Numa população, queremos saber a proporção de pessoas acima de 40 anos que sofre de artrite.
Vamos imaginar que, de uma amostra de 200 pessoas acima de 40 anos, foi vericado que 12
pessoas têm artrite.
Generalizando para o caso geral, em que temos uma amostra de n elementos, teremos

1, se a i-ésima pessoa na amostra possui artrite



Xi =
0, caso contrário

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 31 / 108


Amostragem Determinação do tamanho da amostra

Exemplo

Numa população, queremos saber a proporção de pessoas acima de 40 anos que sofre de artrite.
Vamos imaginar que, de uma amostra de 200 pessoas acima de 40 anos, foi vericado que 12
pessoas têm artrite.
Generalizando para o caso geral, em que temos uma amostra de n elementos, teremos

1, se a i-ésima pessoa na amostra possui artrite



Xi =
0, caso contrário
n
X
Yn = Xi
i=1

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 31 / 108


Amostragem Determinação do tamanho da amostra

Exemplo

Desta forma, um possível estimador para a proporção é dado por


200
Yn X Xi pessoas com artrite na amostra
p̂ = = = .
n 200
i=1
tamanho amostral

Assim, se Yn = k, temos que p̂ = nk é uma estimativa para a proporção p. Se considerarmos a


amostra extraída acima, temos que a estimativa é dada por
12
p̂ = = 0, 06
200
.

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 32 / 108


Estimação

Tipos de estimação

1 Por ponto
Na estimação por ponto, é possível calcular uma estimativa a partir de um
estimador.Porém não é possível mensurar o erro cometido na estimação.
2 Por intervalo
Na estimação por intervalo, dois limites inferior e superior, tal que (1 − α) seja a
probabilidade de que o intervalo, contenha o verdadeiro valor do parâmetro.

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 33 / 108


Estimação

Qualidades de um estimador

Figura: Resultados de 15 disparos por 4 ries.


Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 34 / 108
Estimação

Propriedades dos estimadores

Vício
Denição:
Um estimador T = T (X1 , X2 , · · · , Xn ) é dito não viciado (não viesado) para algum parâmetro
populacional θ se

E(T ) = θ,
para todo θ. Se a igualdade acima não ocorre, dizemos que T é um estimador viciado (viesado)
e a diferença V (T, θ) = E(T ) − θ é chamada de vício (viés) de T .

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 35 / 108


Estimação

Propriedades dos estimadores

Consistência
Denição:
Seja {Tn } uma sequência de estimadores de um parâmetro de interesse θ. Dizemos que esta
sequência de estimadores é consistente se, dado  > 0 arbitrário

P (|Tn − θ| > ) → 0, n → ∞.
Proposição:
A sequência de estimadores {Tn } de um parâmetro θ é consistente se

lim E (Tn ) = θ e lim Var (Tn ) = 0.


n→∞ n→∞

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 36 / 108


Estimação

Propriedades dos estimadores

Eciência
Denição:
Suponha que T e T ' sejam dois estimadores não viciados de um mesmo parâmetro θ. Se

Var (T ) < Var T 0




então dizemos que T é um estimador mais eciente do que T '.

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 37 / 108


Estimação

Propriedades dos estimadores

Erro
Denição:
Denimos o erro quadrático médio (EQM) do estimador T como sendo o valor esperado do
erro amostral ao quadrado, isto é,

EQM(T ; θ) = E(e2 ) = E (T − θ)2 .




De onde segue que

EQM(T, θ) = Var(T ) + V (T, θ)2


onde V (T, θ) é o vício do estimador T .

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 38 / 108


Estimação

Propriedades dos estimadores


• Estimadores de mínimos quadrados
Tem por objetivo minimizar o quadrado das diferenças entre os valores observados de uma
amostra e seus respectivos valores esperados.

Exemplo
Suponha que um engenheiro está interessado em estudar a resistência Y de uma cabo de aço
em função de seu diâmetro X e notou que as variáveis são proporcionais, ou seja, obedecem à
relação
Y ≈ θX.

Tabela: Resistências Y medidas de uma cabo de aço em função de seu diâmetro X .

X 0,5 0,6 0,75 0,8 0,9 1,05 1.20 1,3 1,5 1,65
Y 2,07 2,24 2,28 3,35 3,81 4,14 4,64 5,13 6,05 6,57

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 39 / 108


Estimação

Propriedades dos estimadores

Tabela: Análise do modelo Ŷ = 4x

X Y 4X Y-4X (Y − 4X)2
0,5 2,07 2 0,07 0,0049
0,6 2,24 2,4 −0, 16 0,0256
0,75 3,28 3 0,28 0,0784
0,8 3,35 3,2 0,15 0,0225
0,9 3,81 3,6 0,21 0,0441
1,05 4,14 4,2 −0, 06 0,0036
1,2 4,64 4,8 −0, 16 0,0256
1,3 5,13 5,2 −0, 07 0,0049
1,5 6,05 6 0,05 0,0025
1,65 6,57 6,6 −0, 03 0,0009
Total 0,28 0,213
Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 40 / 108
Estimação

Propriedades dos estimadores


Minimizando a função
10
X
S(θ) = (Yi − θXi )2 .
i=1

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 41 / 108


Estimação

Propriedades dos estimadores


Minimizando a função
10
X
S(θ) = (Yi − θXi )2 .
i=1
10
dS(θ) X
= (Yi − θ̂Xi )(−2Xi ) = 0.

i=1

E, resolvendo esta equação, obtemos o estimador


P10
Xi Yi
θ̂M Q = Pi=1
10 2
.
i=1 Xi

θ̂M Q = 4, 011625

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 41 / 108


Estimação

Propriedades dos estimadores

• Estimadores de máxima verossimilhança


O princípio da verossimilhança arma que devemos escolher aquele parâmetro
desconhecido que maximiza a probabilidade de obter uma particular amostra observada.
Consideremos uma população. f (x, θ), sendo θ o parâmetro desconhecido. Retiremos uma
amostra aleatória simples de X , de tamanho n, X1 , . . . , Xn , e sejam x1 , . . . , xn os valores
efetivamente observados.
A função de verossimilhança L é denida por
n
Y
L(θ; x1 , . . . , xn ) = f (x1 ; θ) × . . . × f (xn ; θ) = f (xi ; θ).
i=1

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 42 / 108


Estimação

Propriedades dos estimadores


Se X é uma variável aleatória discreta com função de distribuição p(x,?), a função de
verossimilhança é dada por
n
Y
L(θ; x1 , . . . , xn ) = p(x1 ; θ) × . . . × p(xn ; θ) = p(xi ; θ).
i=1
que deve ser interpretada como uma função de θ. O estimador de máxima verossimilhança de θ
é o valor que maximiza L(θ; x1 , . . . , x − n).

Procedimento:
1 Encontrar a função de verossimilhança;
2 Aplicar a função ln;
3 Derivar em relação ao parâmetro θ;
4 Igualar o resultado a zero.
5 Vericar que este estimador é ponto de máximo.
Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 43 / 108
Estimação

Propriedades dos estimadores


Exemplo
Seja X uma variável aleatória com distribuição de Poisson e parâmetro λ.

λx e−λ
fλ (x) = , x ∈ N.
x!
Desta forma, a função de verossimilhança é dada por
n
Y λxi e−λ
L(λ; x1 , . . . , xn ) =
xi !
i=1

Ou seja,
1 Pn
xi −nλ
L(λ; x1 , . . . , xn ) = Qn λ i=1 e .
i=1 xi !

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 44 / 108


Estimação

Propriedades dos estimadores

Aplicamos a função logaritmo natural (ln) na função de verossimilhança L(λ; x1 , . . . , xn ).


  n
1 X
ln L(λ; x1 , . . . , xn ) = ln Qn + xi ln λ − nλ
i=1 x1 ! i=1

e, derivando em relação a λ, segue que


n
d ln L(λ; x1 , . . . , xn ) 1X
= xi − n.
dλ λ
i=1

Igualando o resultado a zero, segue que


n Pn
1X i=1 xi
xi − n = 0 ⇔ λ̂ = = x.
λ̂ n
i=1

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 45 / 108


Estimação Intervalos de Conança

Introdução

Uma estimativa do intervalo de conança de um parâmetro desconhecido θ é um intervalo da


forma l ≤ θ ≤ u, em que os limites l e u dependem do valor numérico da estatística Θ da
amostra para uma particular amostra.
Uma vez que diferentes amostras produzirão valores diferentes de θ̂ e, e consequentemente limites
diferentes, esses limites são variáveis aleatórias, L e U respectivamente.

P (L ≤ θ ≤ U ) = 1 − α (8)

IC (θ, 100 (1 − α) %) = (l ≤ θ ≤ u) (9)

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 46 / 108


Estimação Intervalos de Conança

Motivação

Figura: Signicado de um intervalo de conança para θ

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 47 / 108


Estimação Intervalos de Conança

Média com variância conhecida

σ2
 
X ∼ N µ, .
n
Logo,

X −µ
Z= ∼ N (0, 1),
√σ
n

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 48 / 108


Estimação Intervalos de Conança

Média com variância conhecida

Figura: Região crítica

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 49 / 108


Estimação Intervalos de Conança

Média com variância conhecida

P[−Zα/2 ≤ Z ≤ Zα/2 ] = 1 − α
" #
X −µ
P −Zα/2 ≤ ≤ Zα/2 = (1 − α)
√σ
n
 
σ σ
P X − Zα/2 √ ≤ µ ≤ X + Zα/2 √ = 1 − α.
n n
 
σ σ
IC(µ, 1 − α) = X − Zα/2 √ ; X + Zα/2 √ .
n n
Caso os dados não tenham distribuição normal, podemos aplicar o teorema central do limite e
construir um intervalo de conança aproximado.

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 50 / 108


Estimação Intervalos de Conança

Média com variância conhecida

Exemplo
1 suponha que queiramos estimar a média µ de uma população qualquer,e para tanto usamos
a média X̄ de uma amostra de tamanho n. Considere γ = 1 − α = 0, 95. Do TLC temos
que

e = X̄ − µ ∼ N 0, σx̄2
 

2 O projetista de uma indústria tomou uma amostra de 36 funcionários para vericar o tempo
médio gasto para montar um determinado brinquedo. Lembrando que foi vericado que
x = 19, 9 e σ = 5, 73, construir um intervalo de conança de nível 95% para µ.

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 51 / 108


Estimação Intervalos de Conança

Média com variância desconhecida


√ √
Quando não conhecemos σ 2 , podemos substituir σ/ n por s/ n, em que S 2 é a variância
amostral. Para n grande, (≥ 100), ainda podemos usar o intervalo dado anteriormente com essa
modicação. Caso contrário, usaremos a estatística T, dada por

X −µ
T = √ ∼ t(n−1)
s/ n
.
em que T tem distribuição t de Student com n − 1 graus de liberdade.
Fixando um nível de signicância α, obtemos

P −t((n−1),α/2) ≤ T ≤ t((n−1),α/2) = 1 − α
ou gracamente

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 52 / 108


Estimação Intervalos de Conança

Média com variância desconhecida

Figura: Distribuição t-student


Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 53 / 108
Estimação Intervalos de Conança

Média com variância desconhecida

assim, teremos
 
X −µ
P −t((n−1),α/2) ≤ √ ≤ t((n−1),α/2) = 1 − α
s/ n
ou seja,
 
s s
P X − t((n−1),α/2) √ ≤ µ ≤ X + t((n−1),α/2) √ = 1 − α.
n n
logo,
 
s s
IC(µ, 1 − α) = X − tα/2 √ ; X + tα/2 √ .
n n

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 54 / 108


Estimação Intervalos de Conança

Média com variância desconhecida

Exemplo
1 Consideremos que o projetista de uma indústria tomou uma amostra de 36 funcionários para
vericar o tempo médio gasto para montar um determinado brinquedo. Os tempos estão
colocados na Tabela a seguir. Dado que o projetista não tem conhecimento da variabilidade
da população, construir um intervalo de conança com (1 − α) = 0, 95 para a média µ.

2 Uma máquina enche pacotes de café com uma variância igual a 100 g 2 . Ela estava regulada
para encher os pacotes com 500 g, em média. Agora, ela se desregulou, e queremos saber
qual a nova média µ. Uma amostra de 25 pacotes apresentou uma média igual a 485 g 2 .
Construa o intervalo de conança com 95% para µ.

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 55 / 108


Estimação Intervalos de Conança

Média com variância desconhecida

Tabela: amostra de 36 funcionários para vericar o tempo médio gasto para montar um determinado
brinquedo.

17,1 16,893 14,6004 13,0053


29,6269 19,25 17,7504 24,6337
29,3567 25,0798 16,7914 29,4087
23,8807 15,2133 19,1536 30,3199
13,005 24,6795 29,3308 20,7309
16,4541 26,2017 21,7857 19,7393
24,6042 18,6442 21,2594 26,9123
16,9896 32,8977 21,3627 15,4958
18,3113 23,6931 19,5429 16,3855

x̄ = 21, 3 e s = 5, 38
Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 56 / 108
Estimação Intervalos de Conança

IC para proporção

 
p(1 − p)
p̂ ∼ N p, .
n

p̂ − p
q ∼ N (0, 1).
p̂(1−p̂)
n

r r !
p̂(1 − p̂) p̂(1 − p̂)
IC(p, 1 − α) = p̂ − Zα/2 , p̂ + Zα/2 .
n n

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 57 / 108


Estimação Intervalos de Conança

IC para proporção

Exemplo
1 Numa amostra aleatória de tamanho n = 700 foram encontrados 68 elementos defeituosos.
Achar um intervalo de conança de nível 95% para a proporção p de defeituosos.

2 Em uma amostra aleatória de 85 mancais de eixos de manivela de motores de automóveis,


10 têm um acabamento de supercial mais rugoso do que as especicações permitidas.
Consequentemente uma estimativa da proporção de mancais na população que excede a
especicação de rugosidade é p̂ = 0, 12. Construir um IC com 5% de signicância para p.

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 58 / 108


Estimação Intervalos de Conança

IC para Variância com µ desconhecida


Seja X1 , . . . , Xn com distribuição normal com média µ e variância σ 2 . Assim, sabemos que a
quantidade pivotal

(n − 1)s2
Q= ∼ χ2n−1 .
σ2

Figura: Gráco da distribuição χ


Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 59 / 108
Estimação Intervalos de Conança

IC para Variância com µ desconhecida


Note que

Qα/2 ≤ Q ≤ Q1−α/2

(n − 1)s2
Qα/2 ≤ ≤ Q1−α/2 .
σ2
(n − 1)s2 (n − 1)s2
< σ2 < .
Q1−α/2 Qα/2
Assim,

(n − 1)s2 (n − 1)s2
 
2
P < σ < = 1 − α.
Q1−α/2 Qα
(n − 1)s2 (n − 1)s2
 
2
IC(σ , 1 − α) = , .
Q1−α/2 Qα/2
Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 60 / 108
Estimação Intervalos de Conança

IC para Variância com µ desconhecida

Exemplo
1 O peso de componentes mecânicos produzidos por uma determinada empresa é uma variável
aleatória que se supõe ter distribuição normal. Pretende-se estudar a variabilidade do peso
dos referidos componentes. Para isso, uma amostra de tamanho 11 foi obtida,cujos valores
em grama são: 98 97 102 100 98 101 102 105 95 102 100. Construa um intervalo de
conança para a variância do peso, com um grau de conança igual a 95%.

2 (Morettin, L. G.,2010) Sabe-se que o tempo de vida de certa lâmpada t em distribuição


aproximadamente normal, Pcom média de 500 horas e variância desconhecida. Uma amostra
de 25 lâmpadas forneceu 25 i=1 (xi − µ) = 62.500. Construir um IC para σ ao nível de
2 2

5%.

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 61 / 108


Estimação Intervalos de Conança

IC para razão entre duas Variâncias

Sejam X1 , X2 , . . . , Xn1 e Y1 , Y2 , . . . , Yn2 amostras das populações 1 e 2 respectivamente.

(n1 − 1) 2
Q1 = s1 ∼ χ2n1 −1 (Qui-quadrado com n1 − 1 graus de liberdade)
σ12

(n2 − 1) 2
Q2 = s2 ∼ χ2n2 −1 (Qui-quadrado com n2 − 1 graus de liberdade)
σ22

Q1 s21
n −1 σ12 s21 σ22
F = 1 = = 2 2
Q2 s22 s 2 σ1
n2 − 1 σ22

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 62 / 108


Estimação Intervalos de Conança

IC para razão entre duas Variâncias

Figura: gráco da Distribuição F


Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 63 / 108
Estimação Intervalos de Conança

IC para razão entre duas Variâncias

Percebam que

Fα/2 < F < F(1−α/2)

s21 σ22
Fα/2 < < F(1−α/2) .
s22 σ12

1 s21 σ12 1 s21


< < .
F(1−α/2) s22 σ22 Fα/2 s22
Assim,

s21 σ12 1 s21


 
1
P < < = 1 − α.
F(1−α/2) s22 σ22 Fα/2 s22

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 64 / 108


Estimação Intervalos de Conança

IC para razão entre duas Variâncias


Observe que F(1−α/2,n1 −1,n2 −1) = 1
F(α/2,n2 −1,n1 −1) e

F(1−α/2,n2 −1,n1 −1) .


1
F(α/2,n1 −1,n2 −1) =

Logo, o IC será dado por

s21 1 s21
 
1
IC(σ12 /σ22 , 1 − α) = ; .
F(1−α/2) s22 F(α/2) s22

Exemplo
(Morettin, L. G., 2010, pg. 327) De duas populações normais levantaram-se amostras de
tamanhos 9 e 11, respectivamente, obtendo-se S12 = 7, 114 e S22 = 3, 21. construir um IC para
o quociente das duas populações ao nível de 10%.
Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 65 / 108
Estimação Intervalos de Conança

IC para a diferença de médias com Variâncias conhecidas

Sejam X1 , X2 , . . . , Xn1 e Y1 , Y2 , . . . , Yn2 duas amostras.

σ12 σ22
   
X ∼ N µ1 , e Y ∼ N µ2 , .
n1 n2
Segue que

σ2 σ2
 
X −Y ∼N µ1 − µ2 , 1 + 2
n1 n2
.
Assim,

(X − Y ) − (µ1 − µ2 )
Z= q 2 ∼ N (0, 1).
σ1 σ22
n1 + n2

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 66 / 108


Estimação Intervalos de Conança

IC para a diferença de médias com Variâncias conhecidas

O IC de conança obtido é
 v  v 
u 2 2 u 2 2
uσ σ uσ σ
t 1 2 t 1 2 
IC(µ1 −µ2 ,1−α)=(X̄−Ȳ )−Zα/2  + ;(X̄−Ȳ )+Zα/2  +

n1 n2 n1 n2


Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 67 / 108


Estimação Intervalos de Conança

IC para a diferença de médias com variâncias desconhecidas


• Variâncias desconhecidas - porém iguais

Consideremos duas amostras aleatórias, X1 , X2 , . . . , Xn1 de tamanho n1 e Y1 , Y2 , . . . , Yn2 com

(n1 − 1)s21 (n2 − 1)s22


∼ χ2n1 −1 e ∼ χ2n2 −1
σ2 σ2
.
Então,

(X − Y ) − (µ1 − µ2 )
T = q ∼ tn1 +n2 −2 , em que
sp n11 + n12
s
(n1 − 1)s21 + (n2 − 1)s22
sp = .
n1 + n2 − 2
Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 68 / 108
Estimação Intervalos de Conança

IC para a diferença de médias com variâncias desconhecidas

Note que

−t(a,α/2) ≤ T ≤ t(a,α/2) .

q q
1
(X−Y )−t(a,α/2) sp n1
+ n1 ≤µ1 −µ2 ≤(X−Y +t(a,α/2) sp 1
n1
+ n1
2 2

ou seja,

IC(µ1 −µ2 ,1−α)=


 q q 
1
(X−Y )−t(a,α/2) sp n1
+ n1 ;(X−Y )+t(a,α/2) sp 1
n1
+ n1
2 2

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 69 / 108


Estimação Intervalos de Conança

IC para a diferença de médias com variâncias desconhecidas

• Variâncias desconhecidas e diferentes


Sejam X1 , X2 , . . . , Xn1 de tamanho n1 e Y1 , Y2 , . . . , Yn2 de tamanho n2

(X − Y ) − (µ1 − µ2 )
T = q 2 ∼ tν
s1 s22
n1 + n2
2
s21 s22

n1 + n2
ν=  2 2 2 .
s2

s1 2
n1 n2
n1 −1 + n2 −1

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 70 / 108


Estimação Intervalos de Conança

IC para a diferença de médias com variâncias desconhecidas

Analogamente a construção anterior, obtemos

r r !
s2 2 s2 2
IC(µ1 −µ2 ,1−α)= (X−Y )−t(ν,α/2) 1 + s2 ;(X−Y
n1 n2
)+t(ν,α/2) 1 + s2
n1 n2
.

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 71 / 108


Estimação Intervalos de Conança

IC para a diferença de médias com Variâncias conhecidas

Exemplo
Os dados a seguir correspondem a teores de um elemento indicador da qualidade de um certo
produto. Foram coletadas 2 amostras referente a 2 métodos de produção. Construa um intervalo
de conança para a diferença das médias dos dois métodos.

Método 1 0,9 2,5 9,2 3,2 3,7 1,3 1,2 2,4 3,6 8,3
Método 2 5,3 6,3 5,5 3,6 4,1 2,7 2,0 1,5 5,1 3,5

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 72 / 108


Estimação Testes de Hipóteses

Introdução

Figura: Testando uma armação

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 73 / 108


Estimação Testes de Hipóteses

Introdução

Denição
1 Uma hipótese estatística é uma armação sobre os parâmetros de uma ou mais populações.

2 Uma hipótese estatística é uma armação ou conjetura sobre o parâmetro, ou parâmetros,


da distribuição de probabilidades de uma característica, X, da população ou de uma variável
aleatória.

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 74 / 108


Estimação Testes de Hipóteses

Introdução

Exemplo
Vamos supor uma situação em que um fabricante quer saber se um determinado tipo de barra
produzido por sua fábrica atende a exigência de ter um comprimento médio de 70 cm.
Em português:
H0 : O comprimento médio da barrra é 70 cm;


H1 : O comprimento médio da barrra é diferente de 70 cm.

Em estatística:

H0 : µ = 70;
H1 : µ 6= 70.

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 75 / 108


Estimação Testes de Hipóteses

Tipos de hipóteses
Bilateral

H0 : µ = µ0 ;
H1 : µ 6= µ0 .

Figura: Teste de hipótese bilateral


Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 76 / 108
Estimação Testes de Hipóteses

Tipos de hipóteses
Unilateral à direita

H0 : µ = µ0 ;
H1 : µ > µ0 .

Figura: Teste de hipótese unilateral à direita


Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 77 / 108
Estimação Testes de Hipóteses

Tipos de hipóteses
Unilateral à esquerda

H0 : µ = µ0 ;
H1 : µ < µ0 .

Figura: Teste de hipótese unilateral à esquerda


Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 78 / 108
Estimação Testes de Hipóteses

Tipos de hipóteses

Exemplo
1 Um gerente de produção está estudando a possibilidade de comprar uma nova máquina de
estampar partes metálicas. Seja µ0 o número médio de partes estampadas por hora pela
máquina velha e µ a média da máquina nova. O gerente não quer comprar a máquina nova
a menos que ela seja mais produtiva que a máquina velha. Vamos encontrar as hipóteses.

2 Um operador de uma máquina de empacotar cereais, monitora o peso das caixas pesando
um determinado número de caixas periodicamente. A norma diz que a máquina deve
continuar operando a menos que a amostra indique que a máquina não esteja funcionando
normalmente. Neste caso, a máquina deve ser desligada e ajustada. A condição requerida
para a máquina continuar funcionando é que µ = 453g .

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 79 / 108


Estimação Testes de Hipóteses

Tipos de erro

Tabela: Tipo de decisão

Aceita H0 Rejeita H0
H0 Verdadeiro Decisão correta erro do tipo I
H0 Falso erro do tipo II Decisão correta

α = P(Erro do tipo I) = P (rejeitar H0 dado que H0 verdadeira);

β = P(Erro do tipo II) = P (aceitar H0 dado que H0 falsa).

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 80 / 108


Estimação Testes de Hipóteses

Tipos de erro

Considere um teste unilateral dado pelas hipóteses:



H0 : µ = µ0 ;
H1 : µ < µ0 .
{X < XC }
,

α = P(X < XC |µ = µ0 );

β = P(X > XC |µ < µ0 ).

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 81 / 108


Estimação Testes de Hipóteses

Tipos de erro

Figura: Região de relação entre os erros

X − µ0
Z= ,
σ

Fábio Azevedo (UFPB-DE) Inferêncian 19 de outubro de 2017 82 / 108
Estimação Testes de Hipóteses

Procedimento geral para um teste de hipótese

1 Fixar quais as hipótese H0 e H1 .


2 Escolher qual estatística será usada para testar a hipótese H0 .
3 Fixar a probabilidade de cometer o erro tipo I e usar esse valor para construir a região
crítica.
4 Usar as observações para calcular o valor da estatística de teste.
5 Tomar a decisão de rejeitar ou não H0 , com base no valor da estatística calculada, ou seja,
pertence ou não pertence a região crítica.

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 83 / 108


Estimação Testes de Hipóteses

Estatística de teste

Tabela: Critérios para o teste de hipótese

Hipótese alternativa Rejeita H0 Não rejeita H0


µ < µ0 Z < −Zα Z ≥ −Zα
µ > µ0 Z > Zα Z ≤ Zα
µ 6= µ0 Z < −Zα/2 ou Z > Zα/2 −Zα/2 ≤ Z ≤ Zα/2

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 84 / 108


Estimação Testes de Hipóteses

P-valor

Figura: Bilateral
Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 85 / 108
Estimação Testes de Hipóteses

P-valor

Figura: Unilateral
Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 86 / 108
Estimação Testes de Hipóteses

Exemplo para o P-valor

Figura: Gráco para interpretação do P-valor

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 87 / 108


Estimação Testes de Hipóteses

Poder do teste

π(θ)=P[rejeitar H0 |θ]=P[T ∈C|θ],

para todo valor de θ.

Figura: Gráco da função poder


Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 88 / 108
Estimação Testes de Hipóteses

Poder do teste

O poder de um teste de hipóteses é afetado por três fatores:


1 Tamanho da amostra: Mantendo todos os outros parâmetros iguais, quanto maior o
tamanho da amostra, maior o poder do teste.
2 Nível de Signicância: Quanto maior o nível de signicância, maior o poder do teste. Se
você aumenta o nível de signicância, você reduz a região de aceitação. Como resultado,
você tem maior chance de rejeitar a hipótese nula. Isto signica que você tem menos
chance de aceitar a hipótese nula quando ela é falsa, isto é, menor chance de cometer um
erro do tipo II. Então, o poder do teste aumenta.
3 O verdadeiro valor do parâmetro a ser testado: Quanto maior a diferença entre o
"verdadeiro"valor do parâmetro e o valor especicado pela hipótese nula, maior o poder do
teste.

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 89 / 108


Estimação Testes de Hipóteses

Teste de hipótese para a média

Figura: Inferência

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 90 / 108


Estimação Testes de Hipóteses

Teste de hipótese para a média

• Variância conhecida

X − µ0
Z=
√σ
n

• Variância desconhecida

X − µ0
T =
√s
n

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 91 / 108


Estimação Testes de Hipóteses

Teste de hipótese para a média

• Passos para construção do teste.

1 1. Estabelecer as hipóteses:
Fixamos µ = µ0 (H0 : hipótese de nulidade) vs

µ 6= µ0 (teste bilateral)


H1 : (hipótese alternativa) = µ > µ0 (teste unilateral à direita)
µ < µ0 (teste unilateral à esquerda)

2 2. Fixar o nível de signicância α.


3 3. Determinar a região crítica.
4 4. Calcular, sob a hipótese nula, o valor da estatística de teste.
5 5. Critério:

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 92 / 108


Estimação Testes de Hipóteses

Teste de hipótese para a média


• Teste bilateral: se Tobs > tα/2 ou se Tobs < −t−α/2 , rejeitamos H0 . Caso contrário,
não rejeitamos H0 .

Figura: Teste bilateral


Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 93 / 108
Estimação Testes de Hipóteses

Teste de hipótese para a média


• Teste unilateral à direita: se Tobs > tα , rejeitamos H0 . Caso contrário, não rejeitamos H0 .

Figura: teste unilateral a direita


Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 94 / 108
Estimação Testes de Hipóteses

Teste de hipótese para a média


• Teste unilateral à esquerda: se Tobs < −tα , rejeitamos H0 . Caso contrário, não
rejeitamos H0 .

Figura: Teste unilateral a esquerda


Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 95 / 108
Estimação Testes de Hipóteses

Exemplo

Exemplo
Um supervisor da qualidade quer testar, com base numa amostra aleatória de tamanho n = 35 e
para um nível de signicância α = 0, 05, se a profundidade média de um furo numa determinada
peça é 72, 4mm. O que podemos dizer se ele obteve x = 73, 2mm e se sabe, de informações
anteriores, que σ = 2, 1mm?

Exemplo
Um engenheiro de produção quer testar, com base nos dados da tabela a seguir, e para um nível
de signicância α = 0, 05, se a altura média de uma haste está próxima do valor nominal de
1055 mm. Uma amostra de 20 hastes foi analisada as medidas obtidas são dadas a seguir.
903,88; 1036,92; 1098,04; 1011,26; 1020,70; 915,38; 1014,53; 1097,79; 934,52; 1214,08; 993,45;
1120,19; 860,41; 1039,19; 950,38; 941,83; 936,78; 1086,98; 1144,94; 1066,12.

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 96 / 108


Estimação Testes de Hipóteses

Teste de hipótese para proporção

 
p(1 − p)
X ∼ N p, .
n
 
p(1 − p)
p̂ ∼ N p, .
n
Daí, temos que
p̂ − p
Z=q ∼ N (0, 1).
p(1−p)
n

De modo análogo aos passos para os testes anteriores, prosseguimos para este.

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 97 / 108


Estimação Testes de Hipóteses

Teste de hipótese para proporção

Exemplo
Um fabricante garante que 90% das peças que fornece à linha de produção de uma determinada
fábrica estão de acordo com as especicações exigidas. A análise de uma amostra de 200 peças
revelou 25 defeituosas. A um nível de 5%, podemos dizer que é verdadeira a armação do
fabricante?

Exemplo
O consumidor de um certo produto acusou o fabricante, dizendo que mais de 20% das unidades
fabricadas apresentam defeito. Para conrmar sua acusação, ele usou uma amostra de tamanho
50, onde 27% das peças eram defeituosas. Mostre como o fabricante poderia refutar a
acusação. Utilize um nível de signicância de 10%. Fonte: Morettin & Bussab, Estatística
Básica 5a edição, pg. 337

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 98 / 108


Estimação Testes de Hipóteses

IC para proporção

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 99 / 108


Estimação Testes de Hipóteses

IC para proporção

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 100 / 108


Estimação Testes de Hipóteses

IC para proporção

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 101 / 108


Estimação Testes de Hipóteses

IC para proporção

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 102 / 108


Estimação Testes de Hipóteses

IC para razão entre duas Variâncias

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 103 / 108


Estimação Testes de Hipóteses

IC para razão entre duas Variâncias

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 104 / 108


Estimação Testes de Hipóteses

IC para razão entre duas Variâncias

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 105 / 108


Estimação Testes de Hipóteses

IC para razão entre duas Variâncias

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 106 / 108


Estimação Testes de Hipóteses

IC para razão entre duas Variâncias

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 107 / 108


Estimação Testes de Hipóteses

IC para razão entre duas Variâncias

Fábio Azevedo (UFPB-DE) Inferência 19 de outubro de 2017 108 / 108