Sei sulla pagina 1di 21

Estimação

Estimação Pontual
A estimação pontual procura encontrar um valor numérico único que
esteja bastante próximo do verdadeiro valor do parâmetro. Porém,
não é possível julgar a magnitude do erro cometido.

Os parâmetros média (µ), variância (σ2 ) e proporção (p ) tem como


estimadores pontuais
n
1X
X = Xi ,
i= n
1
Pn
(Xi − X )
= i=
2

S
2 1
e
−1 n
número de itens com a característica na amostra
^
p = ,
n
respectivamente, todos com boas propriedades.
(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 66 / 137

Estimação

Exemplo
Considere o problema de estimar a proporção p de empresas comer-
ciais que sonegaram o ICMS no último mês. Suponha que tenham
sido scalizadas n = 500 empresas e que 100 empresas sonegaram o
ICMS no último mês.

X = número de empresas que no processo de scalização foi


constatada a sonegação do imposto = 100

Então, a estimativa pontual ca dada por

100 X
b
p = = 0, 2.=
500 n
Ou seja, a estimativa pontual da proporção de empresas comerciais
que sonegaram o ICMS no último mês foi de 20%.

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 67 / 137

Estimação por Intervalo

Estimação por Intervalo

Muitas vezes, entretanto, queremos considerar, conjuntamente, o es-


timador e sua variabilidade, ou seja, indicar a precisão dessa estima-
tiva. Sendo assim, surge a ideia de construir um intervalo de con-
ança baseado na distribuição amostral do estimador pontual, isto é,
um intervalo de valores que deve conter o verdadeiro valor do parâ-
metro com uma probabilidade pré-determinada, referida por nível de
conança.

Na estimação por intervalo, acreditamos, com um certo nível de con-


ança, que o intervalo contém o valor do parâmetro. Um exemplo,
seria dizer que a proporção de empresas comerciais que sonegaram
o ICMS no último mês está estimada entre 16, 5% e 23, 5% com um
nível de 95% de conança.

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 68 / 137


Estimação por Intervalo

Estimação por Intervalo


Suponha que selecionássemos de uma população, diferentes amostras
de tamanho n , e construíssemos um intervalo de 100(1 − α)% de con-
ança para cada amostra, iríamos obter diferentes intervalos, porém,
apenas 100(1 − α)% desses intervalos irão conter o verdadeiro valor
do parâmetro populacional.

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 69 / 137

Estimação por Intervalo

Estimação por Intervalo

Para construirmos tais intervalos é preciso encontrar duas funções


dos dados amostrais tais que, antes da extração da amostra a seguinte
probabilidade seja válida:

P (I < θ < S) = 1 − α ,

em que I é o limite inferior, S o limite superior do intervalo de


conança e α é um valor pequeno denominado nível de signicância.
Logo, o valor (1−α) é próximo de 1 e é denominado nível de conança,
representa a probabilidade de que seja obtido um intervalo correto.

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 70 / 137

Estimação por Intervalo

Intervalo de Conança para a Média


O intervalo de conança para a média µ é construído com base na
distribuição amostral de X . Para tal, vimos anteriormente que para
2
um n sucientemente grande, X ∼ N(µ, σn ). Dessa forma, teremos
X −µ
então que: Z = √ .
σ/ n
Portanto:

P (−zα/2 ≤ Z ≤ zα/2 ) = 1 − α

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 71 / 137


Estimação por Intervalo

Intervalo de Conança para a Média

σ σ
P (X − z α2 √ ≤ µ ≤ X + z α2 √ ) = 1 − α.
n n

O intervalo de conança 100(1 − α)% para µ é dado por:


 
σ σ
X −z √ ; X +z √
α α ,
2 2
n n

em que E = z α2 √σn , erro amostral (margem de erro). Logo, temos que


o intervalo de conança é composto pelo estimador pontual e a mar-
gem de erro que é calculada a partir da distribuição de probabilidade
do estimador pontual,
h i
X − E; X + E .

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 72 / 137

Estimação por Intervalo

Intervalo de Conança para a Média


População Normal com variância conhecida

Seja uma população Normal com µ desconhecida e σ2 conhecida.


Retira-se uma amostra de tamanho n , o intervalo de conança
100(1 − α)% para µ será
h σ σ i
X − z α2 √ ; X + z α2 √ .
n n

Por  σ conhecido queremos dizer que há dados históricos ou outras


informações disponíveis que nos permitem obter uma boa estimativa
do desvio padrão da população antes de tomarmos a amostra que será
usada para desenvolver uma estimativa da média populacional. Não
necessariamente σ seja, de fato, conhecido com certeza.

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 73 / 137

Estimação por Intervalo

Exemplo

O lucro mensal de certa empresa distribui-se de acordo com uma


curva normal sendo o desvio padrão de $200. Uma amostra aleatória
de 36 meses apresentou lucro médio de $2.400. Estime, por intervalo,
o lucro médio mensal da empresa para uma conança de 95%.

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 74 / 137


Estimação por Intervalo

Intervalo de Conança para a Média

População Normal com variância desconhecida

Seja uma população Normal com µ e σ2 desconhecidas. Retira-se


uma amostra de tamanho n , o intervalo de conança 100(1 − α)%
para µ será
 
s s
X − t(α/2;n −1) √ ; X + t(α/2;n −1) √ ,
n n

pois como o desvio padrão populacional é desconhecido faz-se neces-


sário a utilização do seu estimador s (desvio padrão amostral).

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 75 / 137

Estimação por Intervalo

Distribuição t -Student
Para calcular o intervalo de conança é necessário denir uma nova
variável aleatória T dada por

X−µ
√s
T = ,
n
( )

e dizemos que T tem distribuição t de Student com (n − 1) graus de


liberdade (gl ).

Student é o pseudônimo de W. S. Gosset que, em 1908, propôs


a distribuição t .
Sua formulação matemática e sua aparência são parecidas com
a distribuição normal padronizada.

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 76 / 137

Estimação por Intervalo

Distribuição t -Student

A família de distribuições t é centrada no zero e possui formato


em sino. A curva não é tão alta quanto a curva da distribuição
normal.

O parâmetro que determina a altura e largura da distribuição


t depende do tamanho da amostra n e é denominado graus de
liberdade. Portanto, para cada valor diferente do tamanho da
amostra n existe uma distribuição especíca.

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 77 / 137


Estimação por Intervalo

Distribuição t -Student
A distribuição t é mais variável do que a Normal Padrão e esta vari-
abilidade adicional é o resultado da substituição do desvio padrão σ
por seu estimador s (o desvio padrão amostral).

A medida que aumenta o tamanho da amostra n , isto é, à medida


que aumenta o número de graus de liberdade (n − 1), a variabilidade
introduzida pela utilização de s diminui e a distribuição t se aproxima
da distribuição normal padronizada.

Exemplo: Se uma variável aleatória T tem distribuição de Student


com 10 graus de liberdade, calcule as abscissas t0 da distribuição
considerando as seguintes probabilidades:
a. P (−t0 < T < t0 ) = 0 , 9
b. P (T > t0 ) = 0, 975
c. P (T < t0 ) = 0, 995
(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 78 / 137

Estimação por Intervalo

Distribuição t -Student

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 79 / 137

Estimação por Intervalo

Exemplo

Deseja-se estimar o lucro médio mensal de certa empresa. Observou-


se uma amostra aleatória de 25 meses, cujos resultados foram: lucro
médio de $2.300 e desvio padrão de $220. Sabendo-se que o lucro
mensal comporta-se segundo uma distribuição normal, encontre o
intervalo de conança para o lucro médio com uma conança de 90%.

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 80 / 137


Estimação por Intervalo

Intervalo de Conança para a Média


População não Normal (grandes amostras)
Retira-se uma amostra de tamanho n (n > 30), o intervalo de con-
ança 100(1 − α)% para µ dependerá se a variância populacional é
conhecida ou não.
Variância conhecida

 
σ σ
X − z α2 √ ; X + z α2 √ ,
n n

Variância desconhecida

 
s s
X − z α2 √ ; X + z α2 √ .
n n

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 81 / 137

Estimação por Intervalo

Exemplo

Uma empresa de pesquisa mercadológica estava procurando estimar o


gasto médio de uma amostra de consumidores de determinada bebida
alcoólica no m de semana. Após analisar uma amostra aleatória de
100 clientes, encontrou uma média de $250, 00 e desvio padrão de
$32, 00. Determine a estimativa pontual da média da população e
construa um intervalo de 86% de conança para a média populacio-
nal.

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 82 / 137

Estimação por Intervalo

Intervalo de Conança para a Proporção

A construção de tal intervalo é análoga a do intervalo para média, e


para tal usaremos o estimador pb, que para um tamanho de amostra
sucientemente grande, tem distribuição aproximadamente normal.

Um intervalo de conança 100(1 −α)% para a proporção populacional


pé dado por:

" r r #
b (1 − p
p b) b (1 − p
p b)
b
p − z α2 b + zα
; p .
n 2 n

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 83 / 137


Estimação por Intervalo

Intervalo de Conança para a Proporção

Entre 500 pessoas inquiridas a respeito de suas preferências eleitorais,


260 mostraram-se favoráveis ao candidato W. Calcular um intervalo
de conança ao nível de 90% para a porcentagem dos eleitores favo-
ráveis a W.

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 84 / 137

Estimação por Intervalo

Escolha do nível de conança


O nível de conança (1 − α) representa a probabilidade, antes da
extração da amostra, de obtenção de um intervalo correto. Após a
extração da amostra o intervalo de conança poderá conter ou não o
verdadeiro valor do parâmetro e não poderemos ter certeza de qual
destas duas possibilidades é a verdadeira.
Se o nível de conança for sucientemente grande, considera-se que
o intervalo está correto pois o procedimento que utilizamos produz
intervalos corretos em (1 − α)100% das vezes.

Nível de Conança
α zα
(1 − α)100% 2
0, 10 90% 1, 645
0, 05 95% 1, 96
0, 01 99% 2, 575

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 85 / 137

Estimação por Intervalo

Escolha do nível de conança

Então, porque não aumentar cada vez mais o nível de conança???

Para um tamanho xo de amostra, aumentar o nível de conança


acarreta um aumento do comprimento do intervalo, implicando em
perda de precisão da estimativa.

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 86 / 137


Estimação por Intervalo

Escolha do nível de conança

Então, porque não aumentar cada vez mais o nível de conança???

Para um tamanho xo de amostra, aumentar o nível de conança


acarreta um aumento do comprimento do intervalo, implicando em
perda de precisão da estimativa.

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 86 / 137

Testes de Hipóteses

Inferência Estatística

Objetivo: fazer armações sobre características de uma população, com


base nos dados de uma amostra. Existem dois problemas básicos nesse
processo:
I Estimação;
I Teste de hipóteses.

A teoria da estimação visa identicar quais as estatísticas indicadas


para se fazer estimativas para alguns parâmetros populacionais.

O teste de hipóteses visa decidir se determinada armação sobre um


parâmetro populacional é, ou não, apoiada pela evidência obtida de
dados amostrais.

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 87 / 137

Testes de Hipóteses

Introdução - Continuação

Em geral, experimentos são realizados com o objetivo de tomar decisões


sobre uma população ou um processo.

E as decisões serão tomadas com base em dados coletados do experi-


mento (dados amostrais).

Baseados em experiências anteriores, em teoria cientíca ou na própria


intuição estabelece-se uma hipótese, a qual será submetida a um teste.

Observação: Antes de iniciar o experimento deve-se denir, de forma bem


clara, as questões objeto do experimento.

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 88 / 137


Testes de Hipóteses

Conceito

A teoria de Inferência Estatística fornece procedimentos sistemáticos


para testar se uma suposição (opinião com fundamento incerto) sobre
determinada característica de uma ou mais populações é apoiada ou não
pela evidência obtida com os dados amostrais.

Suposição ⇒ hipótese estatística

Regra de decisão ⇒ teste de hipóteses

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 89 / 137

Testes de Hipóteses

Alguns exemplos
Testar a hipótese da média do crescimento da renda familiar em
uma região ter sido diferente de zero.

Testar a armação de um fabricante de lâmpadas que alega que


seus produtos duram em média 400 horas.

Novo método de fabricação de lâmpadas aumentará o tempo de


vida das lâmpadas.

Testar se o faturamento médio de todas as empresas do setor


metal-mecânico localizadas na Bahia neste ano será superior a
R$200 milhões.

Determinar qual de dois tratamentos é mais eciente (problema


de duas amostras).
(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 90 / 137

Testes de Hipóteses

Noções de testes de hipóteses


Objetivo:
Testar o novo processo de fabricação.

Informação anterior:
Tempo de vida médio das lâmpadas fabricadas pelo processo padrão é
de 1.400 horas.

Pergunta:
O tempo de vida médio das lâmpadas fabricadas pelo novo processo é
maior que 1.400 horas?

Estabelecer as hipóteses:
- o novo processo não é melhor que o padrão;
- o novo processo é melhor que o padrão.

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 91 / 137


Testes de Hipóteses

Tipos de Hipóteses
Em geral devemos decidir entre duas hipóteses complementares. Deno-
minaremos essas hipóteses de

H0 → Hipótese nula
H1 → Hipótese alternativa

No exemplo das lâmpadas se µ representa a média do tempo de vida das


lâmpadas fabricadas pelo novo processo, então,

H0 : µ = 1.400
H1 : µ > 1.400

A decisão de rejeitar H0 é equivalente à opinião  H0 é falsa. A decisão


de aceitar H0 não é equivalente à opinião  H0 é verdadeira. Neste
caso a opinião adequada é a de que os dados não contêm evidência
sucientemente forte contra H0 .
(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 92 / 137

Testes de Hipóteses

Critério de decisão

É preciso estabelecer um critério de decisão para que a hipótese H0


seja julgada.

O critério de decisão, fundamentado pela Teoria Estatística, é baseado


na ESTATÍSTICA DE TESTE.

De forma bem genérica e intuitiva, a estatística do teste mede a


discrepância entre o que foi observado na amostra e o que seria
esperado se a hipótese nula fosse verdadeira.

Uma grande distância ou discrepância medida pela distribuição de


probabilidade é indicação de que H0 não é verdadeira, devendo,
portanto ser rejeitada.

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 93 / 137

Testes de Hipóteses

Tipos de Erros
Qualquer que seja a decisão a ser tomada em um teste de hipóteses,
existe a possibilidade de se cometer erros, devido à presença da incerteza.

Conclusão Situação real (na população)


do teste H0 verdadeira H0 falsa
Não rejeitar H0 Correto Erro tipo II
Rejeitar H0 Erro tipo I Correto

As probabilidades dos tipos de erros serão designadas por:

α = P (Erro tipo I)= P (Rejeitar H0 , sendo H0 verdadeira)


= P (Rejeitar H0 |H0 verdadeira)
β = P (Erro tipo II)= P (Não rejeitar H0 , sendo H0 falsa)
= P (Não rejeitar H0 |H0 falsa)

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 94 / 137


Testes de Hipóteses

Exemplicando os tipos de erros


No caso das lâmpadas,

Erro tipo I → Aprovar o novo processo de fabricação quando na


realidade ele não é superior;

Erro tipo II → Rejeitar o novo processo de fabricação quando é, de fato,


o melhor.

O erro tipo I é mais grave, pois acarretaria em um Investimento sem


retorno para a indústria.

É fundamental que, em cada caso, se saiba qual são os erros possíveis e


que se decida a priori qual é o mais sério. Não é possível controlar ambos
os erros ao mesmo tempo. Quando diminuímos muito a probabilidade
de erro tipo I, aumentamos a probabilidade do erro tipo II e vice-versa.
(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 95 / 137

Testes de Hipóteses

Exemplicando os tipos de erros


No caso das lâmpadas,

Erro tipo I → Aprovar o novo processo de fabricação quando na


realidade ele não é superior;

Erro tipo II → Rejeitar o novo processo de fabricação quando é, de fato,


o melhor.

O erro tipo I é mais grave, pois acarretaria em um Investimento sem


retorno para a indústria.

É fundamental que, em cada caso, se saiba qual são os erros possíveis e


que se decida a priori qual é o mais sério. Não é possível controlar ambos
os erros ao mesmo tempo. Quando diminuímos muito a probabilidade
de erro tipo I, aumentamos a probabilidade do erro tipo II e vice-versa.
(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 95 / 137

Testes de Hipóteses

Nível de signicância e Poder de Teste

α → Nível de signicância do teste


Valores usuais → 10%, 5%, 1%

1 − β → Poder do teste (capacidade de detectar que a hipótese nula é


falsa)

O procedimento geral para testes de hipóteses é especicar o valor da


probabilidade do erro tipo I (α) e, então, planejar um procedimento de
teste de forma a obter uma pequena probabilidade de erro do tipo II (β).
O risco β é geralmente função do tamanho da amostra e é controlado
indiretamente. Quanto maior o tamanho da amostra usada no teste
menor o risco β.

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 96 / 137


Testes de Hipóteses

Estatística de Teste, Região Crítica e Nível Descritivo


(valor de p )

Existem duas opções para expressar a conclusão nal de um teste de


hipótese:

Comparar o valor da estatística de teste com o valor obtido a


partir da distribuição teórica, especíca para o teste e xando um
nível de signicância (Procedimento Clássico);

Quanticar a probabilidade do resultado observado ou resultados


mais extremos, supondo a hipótese nula verdadeira (Valor de p ).

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 97 / 137

Testes de Hipóteses

Estatística de Teste
É um valor baseado nos dados amostrais, sendo utilizado para tomar
uma decisão sobre a rejeição da hipótese nula.

No exemplo das lâmpadas suspeita-se que o tempo de vida médio das


lâmpadas fabricadas pelo novo processo seja superior a 1.400 horas.

Ao selecionarmos uma amostra aleatória de 100 lâmpadas, por exemplo,


pode-se utilizar o valor do tempo de vida médio amostral para compro-
var ou refutar a hipótese nula através de uma regra de decisão, por
exemplo:

Rejeita-se H0 se X ≥ 1.800 horas.

Neste caso, estamos utilizando o valor de X como estatística de teste.

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 98 / 137

Testes de Hipóteses

Região Crítica e Valor Crítico


Região crítica é o conjunto de todos os valores da estatística de teste
que levam à rejeição da hipótese nula. Enquanto que o valor crítico
ou valores críticos separam a região crítica dos valores que não levam à
rejeição da hipótese nula.

Observação: Os valores críticos dependem da natureza da hipótese nula, da


distribuição amostral principal e do nível de signicância α.
(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 99 / 137
Testes de Hipóteses

Tipos de Testes
O tipo de teste será determinado pela hipótese alternativa H1 . Como
as caudas em uma distribuição são as regiões extremas delimitadas por
valores críticos, a cauda corresponderá à região crítica.
Teste Bilateral

H0 : θ = θ0 versus H1 : θ 6= θ0

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 100 / 137

Testes de Hipóteses

Tipos de Testes

Teste Unilateral Direito

H0 : θ = θ0 (ou θ ≤ θ0 ) versus H1 : θ > θ0

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 101 / 137

Testes de Hipóteses

Tipos de Testes

Teste Unilateral Esquerdo

H0 : θ = θ0 (ou θ ≥ θ0 ) versus H1 : θ < θ0

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 102 / 137


Testes de Hipóteses

Passos para a construção de um Teste de Hipóteses -


Morettin & Bussab (2002)
1 Fixe qual a hipótese H0 a ser testada e qual a hipótese alter-
nativa H1 ;
2 Use a teoria estatística e as informações disponíveis para decidir
qual estatística (estimador) será usada para testar a hipótese
H0 . Obter as propriedades dessa estatística (distribuição, mé-
dia, desvio padrão);
3 Fixe a probabilidade α de cometer o erro tipo I e use este valor
para construir a região crítica;
4 Use as observações da amostra para calcular o valor da estatís-
tica do teste;
5 Se o valor da estatística calculado com os dados da amostra não
pertencer à região crítica, não rejeite H0 ; caso contrário, rejeite
H0 .
(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 103 / 137

Testes de Hipóteses

Testes de hipóteses para a média (µ)

A média de uma população é uma de suas características mais impor-


tantes e frequentemente tem-se que tomar decisões a seu respeito.

Suponha que se deseja testar se a média de um processo é igual a um


valor padrão (alvo), digamos µ0 .

Estatística: T =X .

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 104 / 137

Testes de Hipóteses

Testes de hipóteses para a µ com população Normal e


desvio padrão conhecido (σ = σ0 )

X
X X
−µ
Teste Z: Z = σ0 /

n e Z ∼ N (0, 1)

a. Para o Teste bilateral

H0 : µ = µ0 versus H1 : µ 6= µ0

Rejeita H0 ao nível de signicância α se


x −µ

|z0 | = √ 0 > zα .
σ0 / n 2

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 105 / 137


Testes de Hipóteses

Testes de hipóteses para a µ com população Normal e


desvio padrão conhecido (σ = σ0 )

b. Para o Teste unilateral à esquerda

H0 : µ = µ0 (ou µ ≥ µ0 ) versus H1 : µ < µ0

Rejeita H0 ao nível de signicância α se

x − µ0
z0 = √ < −zα .
σ0 / n

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 106 / 137

Testes de Hipóteses

Testes de hipóteses para a µ com população Normal e


desvio padrão conhecido (σ = σ0 )

c. Para o Teste unilateral à direita

H0 : µ = µ0 (ou µ ≤ µ0 ) versus H1 : µ > µ0

Rejeita H0 ao nível de signicância α se

x − µ0
z0 = √ > zα .
σ0 / n

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 107 / 137

Testes de Hipóteses

Exemplo

Foi divulgado que a duração média de uma semana de trabalho para


a população de trabalhadores é de 39,2 horas (Investor's Business
Daily, 11 de setembro de 2000). Suponha que quiséssemos extrair uma
amostra atual de trabalhadores para vericar se a duração média de uma
semana de trabalho se modicou das 39,2 horas relatadas anteriormente.

a. Estabeleça as hipóteses que nos ajudem a determinar se ocorreu


uma alteração na duração média da semana de trabalho.
b. Suponha que um tamanho de amostra de 112 trabalhadores
tenha produzido uma média amostral de 38,5 horas. Use um
desvio padrão populacional σ = 4, 8 horas. Com α = 0, 05, a
hipótese nula pode ser rejeitada? Qual a sua conclusão?

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 108 / 137


Testes de Hipóteses

Testes de hipóteses para a média com população


Normal e desvio padrão desconhecido

Estatística: X

X −µ ∼ tn −1
Teste T: T X = s / √n e T X
a. Para o Teste bilateral

H0 : µ = µ0 versus H1 : µ 6= µ0

Rejeita H0 ao nível de signicância α se


x − µ
0
|T | = √ > tα/2;(n −1) .
s/ n

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 109 / 137

Testes de Hipóteses

Testes de hipóteses para a média com população


Normal e desvio padrão desconhecido

b. Para o Teste unilateral à esquerda

H0 : µ = µ0 (ou µ ≥ µ0 ) versus H1 : µ < µ0

Rejeita H0 ao nível de signicância α se

x − µ0
T = √ < −tα;(n −1) .
s/ n

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 110 / 137

Testes de Hipóteses

Testes de hipóteses para a média com população


Normal e desvio padrão desconhecido

c. Para o Teste unilateral à direita

H0 : µ = µ0 (ou µ ≤ µ0 ) versus H1 : µ > µ0

Rejeita H0 ao nível de signicância α se

x − µ0
T = √ > tα;(n −1) .
s/ n

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 111 / 137


Testes de Hipóteses

Exemplo

Sabe-se que o preço médio dos carros usados nos EUA é 10.192
dólares. O gerente de uma revendedora de carros usados revisou
uma amostra de 25 vendas recentes de carros em sua revendedora,
tentando determinar se o preço médio dos carros vendidos em sua
revendedora difere da média populacional dos EUA.

Usando α = 0, 05, qual a conclusão do teste com base em um


preço médio amostral 9.750 dólares e um desvio padrão amostral
de 1.400 dólares?

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 112 / 137

Testes de Hipóteses

Testes de hipóteses para a média com população não


Normal e grandes amostras

Estatística: X

Propriedades da estatística de teste:

X −µ X −µ
Z X =
s/

n
ou Z X = √
σ/ n
e X
Z ∼ N (0, 1)

devido ao Teorema Central do Limite que garante que se a amostra for


sucientemente grande (n > 30),

X ∼ N (µ, σ2 /n ).

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 113 / 137

Testes de Hipóteses

Testes de hipóteses para a média com população não


Normal e grandes amostras
a. Para o Teste bilateral
H0 : µ = µ0 versus H1 : µ 6= µ0
x − µ x − µ
Rejeita H0 : |Z | = √ 0 ≈ √ 0 > z 2
σ/ n s/ n
α .

b. Para o Teste unilateral à esquerda


H0 : µ = µ0 (ou µ ≥ µ0 ) versus H1 : µ < µ0
Rejeita H0 : Z = xσ/−√µn0 ≈ xs /−√µn0 < −zα .
c. Para o Teste unilateral à direita
H0 : µ = µ0 (ou µ ≤ µ0 ) versus
H1 : µ > µ0
x x
Rejeita H0 : Z = √ ≈ √ 0 > zα .
− µ0 −µ
σ/ n s/ n
(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 114 / 137
Testes de Hipóteses

Exemplo

O custo de manutenção de um tear possui média de 200 unidades


monetárias. Para vericar a hipótese de que o custo de manuten-
ção aumentou, analisou-se uma amostra de 35 teares e encontrou-
se um custo médio de 240 unidades monetárias e desvio padrão
de 80 unidades monetárias. Qual a sua decisão, ao nível de signi-
cância de 5%?

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 115 / 137

Testes de Hipóteses

Testes de hipóteses para uma proporção

Em muitas situações o objetivo pode ser avaliar a veracidade de


alguma hipótese sobre a proporção de elementos na população que
possuem alguma característica de interesse (p ).

Se o tamanho da amostra (n ) for sucientemente grande e se p


não for muito próximo de zero ou 1 (np ≥ 5 e nq ≥ 5), é possí-
vel realizar um teste de hipóteses para p baseado na distribuição
Normal.

Estatística de teste: p^
Propriedades da estatística de teste: p = qp^−1p
Z^
p( −p )
e p ∼ N (0, 1)
Z^
n

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 116 / 137

Testes de Hipóteses

Testes de hipóteses para uma proporção - bilateral

a. Para o Teste bilateral

H0 : p = p0 versus H1 : p 6= p0

O teste é dado por:

Rejeita H0 ao nível de signicância α se



p^ − p
0
|z0 | = q > z α2 .
p0 ·(1−p0 )
n

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 117 / 137


Testes de Hipóteses

Testes de hipóteses para uma proporção - unilateral à


direita

b. Para o Teste unilateral à direita

H0 : p ≤ p0 versus H1 : p > p0

O teste é dado por:

Rejeita H0 ao nível de signicância α se


^ − p0
p
z0 =q >z .
p0 ·(1−p0 ) α
n

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 118 / 137

Testes de Hipóteses

Testes de hipóteses para uma proporção - unilateral à


esquerda

c. Para o Teste unilateral à esquerda

H0 : p ≥ p0 versus H1 : p < p0

O teste é dado por:

Rejeita H0 ao nível de signicância α se


^ − p0
p
z0 =q < −zα .
p0 ·(1−p0 )
n

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 119 / 137

Testes de Hipóteses

Exemplo

A fábrica A de automóveis arma que 60% dos consumidores


compram carros produzidos por ela. Uma fábrica concorrente
deseja testar a veracidade desta armação. Para isso decide
realizar uma pesquisa por amostragem com 300 proprietários de
veículos. Suponha que os resultados da pesquisa apontaram 198
proprietários de carros da fábrica A.

Ao nível α = 6%, qual a conclusão?

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 120 / 137


Testes de Hipóteses

Nível descritivo ou valor p

Consiste na probabilidade de obter um valor da estatística (T ) maior


ou igual ao encontrado na amostra, supondo H0 verdadeira.

No caso da média, o valor p ou p -valor é calculado da seguinte forma


p -valor =P X ≥T | H0 é verdadeira .

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 121 / 137

Testes de Hipóteses

Exemplo

Utilizando o exemplo das lâmpadas, vamos supor que na amostra de


100 lâmpadas, a média amostral foi de 1.550 horas.

Assim a referida probabilidade seria:



p -valor =P X ≥ 1.800 | µ = 1.400 ,

que representa a probabilidade de uma população com média de 1.400


horas gerar uma amostra de tamanho 100 que tenha média igual ou
maior que o resultado observado.

Lembrete: No exemplo das lâmpadas utilizamos as hipóteses

H0 : µ = 1.400 contra H1 : µ > 1.400.

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 122 / 137

Testes de Hipóteses

Regra de decisão
Caso o valor de p seja muito pequeno devemos suspeitar da veraci-
dade de H0 . Ou seja, quanto menor o valor de p maior evidência
para se rejeitar H0 .

Procedimento para decisão com base no valor de p

a. Escolhe-se um valor tolerável para a probabilidade de erro tipo


I (α) - xando-o;

b. Se o valor p for menor ou igual a α, temos forte evidência


para rejeitar H0 , indicando que o resultado é estatisticamente
signicante.

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 123 / 137


Testes de Hipóteses

Interpretação gráca - valor p

Observação: Em geral a probabilidade representada pelo valor p é


calculada nos softwares estatísticos. Assim a ideia é comparar esse
valor calculado com a probabilidade de erro tipo I, α, xado previa-
mente.
(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 124 / 137

Testes de Hipóteses

Conclusão

Além da conclusão do tipo rejeita/não rejeita, os p -valores dão o


grau de conança ao rejeitarmos uma hipótese nula.
Por exemplo, para α = 5%,

p-valor Interpretação
Elevada signicância estatística ou
Inferior a 0,01
Evidência muito forte contra a hipótese nula (H0 )
Estatisticamente signicante ou
Entre 0,01 a 0,05
Evidência adequada contra a hipótese nula (H0 )
Superior a 0,05 Evidência insuciente contra a hipótese nula (H0 )

(UFBA - DEST) Inferência Estatística MATF15 - 2017.1 125 / 137

Potrebbero piacerti anche