Sei sulla pagina 1di 25
Estatística e Métodos Quantitativos Marcelo Virginio de Melo
Estatística e Métodos Quantitativos Marcelo Virginio de Melo
Estatística e Métodos Quantitativos Marcelo Virginio de Melo
Estatística e Métodos Quantitativos Marcelo Virginio de Melo
Estatística e Métodos Quantitativos Marcelo Virginio de Melo
Estatística e Métodos Quantitativos Marcelo Virginio de Melo
Estatística e Métodos Quantitativos Marcelo Virginio de Melo
Estatística e Métodos Quantitativos Marcelo Virginio de Melo

Estatística e Métodos Quantitativos

Marcelo Virginio de Melo

Estatística e Métodos Quantitativos Marcelo Virginio de Melo
Estatística e Métodos Quantitativos Marcelo Virginio de Melo
Estatística e Métodos Quantitativos Marcelo Virginio de Melo
Estatística e Métodos Quantitativos Marcelo Virginio de Melo
Estatística e Métodos Quantitativos Marcelo Virginio de Melo
Estatística e Métodos Quantitativos Marcelo Virginio de Melo
Universidade de Ensino Superior Dom Bosco Estatística e Métodos Quantitativos Marcelo Virginio de Melo são
Universidade de Ensino Superior Dom Bosco Estatística e Métodos Quantitativos Marcelo Virginio de Melo são

Universidade de Ensino Superior Dom Bosco

Universidade de Ensino Superior Dom Bosco Estatística e Métodos Quantitativos Marcelo Virginio de Melo são luís

Estatística e Métodos Quantitativos

Marcelo Virginio de Melo

Universidade de Ensino Superior Dom Bosco Estatística e Métodos Quantitativos Marcelo Virginio de Melo são luís

são luís

2016

ÍCONES

ÍCONES Orientação para estudantes CAPÍTULO 1 Ao longo deste apostila, serão encontrados alguns ícones utilizados

Orientação para estudantes

CAPÍTULO

1

Ao longo deste apostila, serão encontrados alguns ícones utilizados para facilitar a leitura do conteúdo. Saiba o que eles siginifição.

Saiba o que cada um significa.

facilitar a leitura do conteúdo. Saiba o que eles siginifição. Saiba o que cada um significa.

Referências

facilitar a leitura do conteúdo. Saiba o que eles siginifição. Saiba o que cada um significa.

Dica de site

Sumário

APRESENTAÇÃO

MÓDULO 4 –INFERÊNCIA ESTATÍSTICA

59

4.1

Estimativas

59

4.2

Intervalo de Confiança para a Média Aritmética

(com o desvio-padrão populacional conhecido)

60

4.3

Intervalo de confiança para a proporção

66

5

Testes de Hipótese

67

5.1

Testes Significância para Médias (com Variância Conhecida)

70

5.2

Testes Significância para

Proporções

74

REFERÊNCIAS

78

INFERÊNCIA ESTATÍSTICA

4.1

estimativas

CAPÍTULO

4 4
4
4

C ontinuando o nosso estudo da inferência estatística, ou seja,

do conjunto de métodos que nos permite tirar conclusões de

uma população a partir dos dados de uma amostra, veremos os

métodos de estimativas.

Existem dois tipos de estimativas: estimativas de ponto e estimativas no intervalo.

Estimativas de ponto consistem no cálculo de medidas de uma amostra utilizadas como parâmetros para os reais valores das mesmas para a

população. Assim, a média aritmética amostral é uma estimativa de

ponto para a média aritmética populacional μ. Assim como S (desvio- padrão amostral) é a estimativa de ponto para σ (desvio-padrão populacional). Ou seja, esse tipo de estimativa já foi nosso objeto de estudo no Módulo II, que tratou da estatística descritiva.

X

Entretanto, temos que entender que tais medidas serão boas estimativas dos valores para a população APENAS se a amostra com a qual foi retirada a base de dados para seus respectivos cálculos seja representativa da população. Isso quer dizer que a amostra deverá conter as mesmas características da população, senão os valores da média, moda, variância, etc. não serão próximos dos valores populacionais.

etc. não serão próximos dos valores populacionais. Estatística e Métodos Quantitativos Marcelo Virginio de

Estatística e Métodos Quantitativos Marcelo Virginio de Melo

59

MÓDULO 4 Inferência Estatística anotaçôes 60
MÓDULO 4
Inferência Estatística
anotaçôes
60

Como, também, para cada amostra temos um valor de uma medida, mesmo que este valor não seja muito diferente dos valores obtidos para esta medida em outras amostras da mesma população, surge a necessidade de estimarmos um intervalo em que o valor desta medida (média, por exemplo) seja aceitável, e não apenas um valor numérico isolado. Temos, nesse sentido, o conceito de uma estimativa de intervalo. Este intervalo terá um determinado nível de confiança, ou seja, uma probabilidade de ter sido estimado corretamente em relação ao valor real da população.

Assim, para um parâmetro populacional θ (que pode ser uma média, uma

ˆ

variância, dentre outros), e seja o estimador de θ (que foi calculado

a partir de uma amostra), então o intervalo de confiança para este estimador será dado por:

θ

ˆ

ˆ

θθθ

1

2

Admite-se, então, que o valor real do parâmetro populacional (θ) esteja dentro do intervalo acima, para um nível de confiança pré-determinado. Se esse nível de confiança for de 95%, por exemplo, temos 95% de certeza de que o parâmetro populacional está no intervalo acima, ou

ˆ

seja, entre e

θ

1

ˆ

θ

2

Neste Módulo estudaremos os intervalos de confiança mais utilizados em pesquisas estatísticas:

• O Intervalo de Confiança para a Média Aritmética (com o desvio- padrão populacional conhecido);

• O Intervalo de Confiança para a Proporção.

Ambas as estimativas de intervalos de confiança utilizarão nos seus procedimentos de cálculo a distribuição normal padronizada, cuja tabela está disponibilizada no final deste Módulo.

4.2 Intervalo de Confiança para a Média Aritmética (com o desvio-padrão populacional conhecido)

Antes de iniciarmos, cabe informá-los que trabalharemos com o caso de populações infinitas ou de amostras grandes (maiores que 30 observações).

Estatística e Métodos Quantitativos Marcelo Virginio de Melo

ou de amostras grandes (maiores que 30 observações). Estatística e Métodos Quantitativos Marcelo Virginio de Melo
MÓDULO 4
MÓDULO 4

Inferência Estatística

Dado o estimador definido como a média aritmética amostral,

X

calculado a partir de uma amostra com n observações, com 1-α de nível

de confiança, e dada à distribuição normal padronizada N(0,1).

A estimativa intervalar média aritmética populacional μ, com o σ

conhecido é dada por:

Onde:

  X Z

σ

n
n
σ  ≤ µ ≤ X + Z → 1 − α n 
σ
µ ≤
X
+
Z
→ 1 −
α
n

X = Média aritmética amostral;

Z

= Abscissa da distribuição normal padronizada;

σ

= Desvio-padrão populacional;

n

= número de observações da amostra;

μ = média aritmética populacional; 1-α = nível de confiança.

Percebe-se, olhando a expressão acima, que “algo” é subtraído à

X para

se

achar o limite inferior do intervalo, e que esse mesmo “algo” é somado

ao

mesmo

X

para encontrarmos o limite superior.

Tudo isso para um nível de confiança 1-α. Vemos, então, que o cálculo do intervalo de confiança é bem simples. Precisamos apenas dos valores

da expressão.

Desses

previamente, e os valores de

valores,

o

σ

(desvio-padrão

populacional)

é

conhecido

X e n são calculados a partir da amostra.

Resta apenas o valor de Z, que será obtido a partir do nível de confiança que se quer para o intervalo.

Para saber mais o que significa esse “nível de confiança”, abaixo temos um exemplo quando ele é 95%, ou seja, 1-α = 95%.

temos um exemplo quando ele é 95%, ou seja, 1-α = 95%. Estatística e Métodos Quantitativos
temos um exemplo quando ele é 95%, ou seja, 1-α = 95%. Estatística e Métodos Quantitativos

Estatística e Métodos Quantitativos Marcelo Virginio de Melo

anotaçôes 61
anotaçôes
61
MÓDULO 4 Inferência Estatística anotaçôes rascunho 62
MÓDULO 4
Inferência Estatística
anotaçôes rascunho
62

O valor de 1 – α corresponde à área em branco no gráfico (entre -1,96 e

1,96) e é o nível de confiança, com valor de 95%. As caudas (extremidades) possuem área de é 5%, somadas. Este é o valor de α. Como α tem que ser repartido, dada a simetria da curva normal, a área de cada cauda é dada por α/2, ou seja, 2,5%.

Entretanto, precisamos da área que corresponde a 95%. A tabela normal padrão nos dá a metade deste valor, ou seja, de 0 a um valor positivo de

Z, conforme podemos ver a seguir:

0 a um valor positivo de Z, conforme podemos ver a seguir: A metade do valor

A metade do valor de 1- α é 0,475. Verificando este valor no corpo da

tabela encontramos a abscissa 1,96 (1,9 encontrado a partir da linha e 0,06 a partir da coluna). Assim, encontramos o valor de Z para um nível de confiança de 95%.

Agora, façamos um exemplo que envolva todos os conceitos.

EXEMPLO 1: Suponha que um banco queira estimar a quantidade média de dinheiro devida por seus clientes inadimplentes. Para isso, pegou uma amostra de 100 clientes inadimplentes e estimou sua média = R$ 1.300,00. O desvio-padrão populacional é igual a R$ 452,00. Em qual intervalo estaria a verdadeira média populacional (valor médio devido ao banco), para um nível de confiança de 95%?

O primeiro passo para responder é extrair os dados da questão.

passo para responder é extrair os dados da questão. Estatística e Métodos Quantitativos Marcelo Virginio de

Estatística e Métodos Quantitativos Marcelo Virginio de Melo

passo para responder é extrair os dados da questão. Estatística e Métodos Quantitativos Marcelo Virginio de
MÓDULO 4
MÓDULO 4

Inferência Estatística

X

= 1300

σ

n

1 – α = 95%

= 452

= 100

Sabemos, também, que o intervalo de confiança em questão é dado por:

  X Z

σ
σ ≤

µ

X

+

Z

σ  → 1 − n 
σ
→ 1 −
n

α

Analisando a expressão, o único dado que não temos é o Z. Mas esse já foi calculado anteriormente para 1- α = 95%, sendo igual a 1,96 (figura abaixo):

para 1- α = 95%, sendo igual a 1,96 (figura abaixo): Então, só nos resta montar

Então, só nos resta montar a expressão para acharmos o intervalo de

confiança:

µ ≤ µ

1300

+

1,96 *

452   → 95% 100 
452
 → 95%
100

(1.211,41 µ 1.388,60) 95%

Ou seja, o verdadeiro valor da dívida média que os clientes possuem com o banco está entre R$ 1.211.41 e R$ 1.388,60, para um nível de confiança de 95%.

EXEMPLO 2: Suponha agora a duração de uma bateria de celular é tal que o desvio-padrão é de 5 horas. Buscando saber qual seria o intervalo em que varia a média populacional, um engenheiro de produção da fábrica de celulares selecionou uma amostra de 150 baterias. Para esta

amostra, a média estimada de duração foi de 80 horas. Qual seria, então,

o intervalo de confiança da média de duração da bateria, para um nível de confiança de 90%?

duração da bateria, para um nível de confiança de 90%? Estatística e Métodos Quantitativos Marcelo Virginio

Estatística e Métodos Quantitativos Marcelo Virginio de Melo

anotaçôes 63
anotaçôes
63
MÓDULO 4 Inferência Estatística anotaçôes 64
MÓDULO 4
Inferência Estatística
anotaçôes
64

X

= 80

σ =

5

n = 150

1 – α = 90%

Para acharmos o Z de um nível de confiança de 90%, ou 0,9. Quando dividimos 0,9 por 2 achamos a área correspondente à abscissa de 0 a Z. (Veja a figura abaixo):

Área = 0,45 Área = 0,45
Área = 0,45
Área = 0,45

O valor aproximado que achamos para a área igual a 0,45 na tabela é 0,449, e a abscissa dessa área corresponde a 1,64.

é 0,449, e a abscissa dessa área corresponde a 1,64. Estatística e Métodos Quantitativos Marcelo Virginio
é 0,449, e a abscissa dessa área corresponde a 1,64. Estatística e Métodos Quantitativos Marcelo Virginio

Estatística e Métodos Quantitativos Marcelo Virginio de Melo

é 0,449, e a abscissa dessa área corresponde a 1,64. Estatística e Métodos Quantitativos Marcelo Virginio
MÓDULO 4
MÓDULO 4

Inferência Estatística

Agora, montamos a expressão para acharmos o intervalo de confiança:

 5  80 − 1,64 *  150
5
80
1,64 *
150

80

µ≤ +

1,64 *

5   → 90% 150 
5
 → 90%
150

(79,33 µ 80,67) 90%

Ou seja, o verdadeiro valor da dívida média de duração da bateria do celular varia entre 79,33 horas e 80,67 horas, com um nível de confiança de 90%.

4.3 Intervalo de confiança para a proporção

Esse intervalo é utilizado em situações em que se necessita avaliar a validade de uma proporção ou porcentagem, retirada de uma amostra. Podemos dar como exemplo, as pesquisas de opinião pública, que sempre se referem a um percentual da população entrevistada que exibe determinado comportamento, ou mesmo nos casos de pesquisas de intenção de votos.

Para darmos início à construção desse intervalo, precisamos definir “f “ como sendo o estimador de uma proporção ou porcentagem “p”:

Onde:

f =

x

n

x

= sucessos

n

= número total de observações

O intervalo de confiança para a proporção p será dado por:

 f ( 1 − f )  f − Z  n 
f
(
1
− f
)
f − Z
n

p

f + Z

1 − α 1 α

EXEMPLO: Ao se examinar 500 peças de uma empresa encontrou-se 260 defeituosas. Para um nível de confiança de 90%, construir o intervalo de confiança para a verdadeira proporção de peças defeituosas.

para a verdadeira proporção de peças defeituosas. Estatística e Métodos Quantitativos Marcelo Virginio de

Estatística e Métodos Quantitativos Marcelo Virginio de Melo

anotaçôes 65
anotaçôes
65
MÓDULO 4 Inferência Estatística anotaçôes 66
MÓDULO 4
Inferência Estatística
anotaçôes
66

Extraindo os dados da questão, temos:

x = 260

O f é dado por:

x

260

f = =

n 500

= 0,52

n =500

1 - α = 90%

Já vimos que para o nível de confiança de 90%, ou 0,9, o Z é igual a 1,64.

Área = 0,45 Área = 0,45
Área = 0,45
Área = 0,45

Daí, o intervalo para a proporção será:

   0,52

1,64

0,52 1 − 0,52 ( ) 500
0,52 1 − 0,52
(
)
500

p

0,52

+

1,64

0,52 1 ( − 0,52 ) 500
0,52 1
(
− 0,52
)
500

 

(0,488 µ 0,552)90%

90%

Ou seja, o intervalo [0,488; 0,552] contém a verdadeira proporção de peças defeituosas, com um nível de confiança de 90%.

Fácil, não é mesmo ?

Estatística e Métodos Quantitativos Marcelo Virginio de Melo

com um nível de confiança de 90%. Fácil, não é mesmo ? Estatística e Métodos Quantitativos
MÓDULO 4
MÓDULO 4

Inferência Estatística

5 Testes de Hipótese

Modelo de um Teste de hipótese

Acho que a idade média da população é 50 (hipótese).
Acho que a
idade média da
população é 50
(hipótese).
Hipótese rejeitada! Nem perto.
Hipótese
rejeitada! Nem
perto.

População

J J J J J J J J
J
J
J
J
J J
J
J
rejeitada! Nem perto. População J J J J J J J J Amostra aleatória J J
rejeitada! Nem perto. População J J J J J J J J Amostra aleatória J J

Amostra aleatória

J J J Média Média `X = 20
J J
J
Média
Média
`X = 20

Fonte: McClave; Benson, Sincich (2009

Suponha que você queira estimar se a idade média de uma população é igual a 50 anos. Ou seja, você está interessado em fazer uma inferência sobre como o valor de um parâmetro, (no caso, a média populacional) se relaciona com um valor específico (no caso, a idade média estipulada de 50 anos). Este parâmetro poderá ser igual, menor ou maior que o valor por você especulado, concorda?

Quando fazemos esse tipo de inferência, estamos trabalhando com uma área da estatística chamada Teste de Hipóteses. Trata-se de um procedimento que se inicia com alguma teoria, afirmativa ou pesquisa sobre um determinado parâmetro da população e é realizado a partir da construção de duas hipóteses:

i. Hipótese Nula (H0)

É a afirmação que se tem inicialmente como correta ou a ser testada. Em outras palavras, é a hipótese de que o parâmetro populacional seja igual a um valor inicialmente estipulado. São características das hipóteses nulas:

estipulado. São características das hipóteses nulas: Estatística e Métodos Quantitativos Marcelo Virginio de

Estatística e Métodos Quantitativos Marcelo Virginio de Melo

anotaçôes 67
anotaçôes
67
MÓDULO 4 Inferência Estatística anotaçôes 68
MÓDULO 4
Inferência Estatística
anotaçôes
68

A.

B.

Sempre ter sinal de igualdade: =�,

Ser escrita como H0: � � algum valor numérico.

, ou ��

µ

Hipótese é uma crença sobre um parâmetro da população.

ii.

Hipótese Alternativa (H1):

É aquela que nega a hipótese nula, ou seja, a hipótese que será aceita se apenas se os dados do teste propiciarem evidência convincente de sua veracidade. Isso acontecendo, a hipótese nula é rejeitada. São características das hipóteses alternativas:

A. Sempre tem sinal de desigualdade: � ,�� < ou >

B. Escrita como H1: � ���

µ

,

< ou >� algum valor.

No caso da página anterior:

H0: � = 50

µ

H1: � �

µ

50

Como a média amostral foi igual a 20, rejeitamos a hipótese nula!

Outro aspecto sobre os testes de hipóteses é que existem dois tipos de erros ao testarmos uma hipótese estatística:

Erro Tipo I: � Consiste em rejeitar uma hipótese nula H 0 quando ela é, de fato, verdadeira. Existe um nível de risco de se cometer esse tipo de erro, que é uma probabilidade denominada de nível de significância, e designada por � (alfa). A probabilidade complementar, ou seja, 1- �, seria a decisão (correta) de aceitar H 0 quando esta é verdadeira.

α

α

Erro tipo II: Comete-se esse tipo de erro quando aceitamos (não rejeitamos) a hipótese nula H 0 quando ela é, na verdade, falsa. A probabilidade de se cometer um erro do Tipo II é dada por � (beta). A probabilidade complementar, ou seja, 1- �, seria a decisão (correta) de aceitar H 0 quando esta é verdadeira.

β

β

Estatística e Métodos Quantitativos Marcelo Virginio de Melo

de aceitar H 0 quando esta é verdadeira. β β Estatística e Métodos Quantitativos Marcelo Virginio
MÓDULO 4
MÓDULO 4

Inferência Estatística

A tabela abaixo resume as situações:

   

Realidade

   

H 0 verdadeira

H 0 falsa

Aceitar H 0

1- (OK) (Decisão

(Erro Tipo II)

Decisão

correta)

Rejeitar H 0

(Erro Tipo I)

1- (Decisão correta)

Veremos ainda neste tópico os testes que consideram apenas o Erro Tipo I, ou seja, �. Eles são chamados de testes de significância.

Por fim, é importante salientar que, dependendo do parâmetro a ser

testado (média, variância, proporção, etc.), sempre teremos uma fórmula ou um procedimento de cálculo que nos permite avaliar a hipótese nula

e a alternativa. A essa fórmula damos o nome de estatística do teste.

Esta fórmula varia, dependendo do parâmetro que está sendo testado.

A partir dos resultados encontrados pela estatística do teste, aceitamos

ou rejeitamos H 0 .

α

A seguir, veremos os mais importantes testes de significância. São eles:

- Teste de Significância para Médias;

- Teste de Significância para Proporções.

Os procedimentos utilizados nesses testes podem ser resumidos nos seguintes passos:

Passo 1: Definir quem seria o H 0 e o H 1 ;

Passo 2: Fixar o limite do erro Tipo I (�α ) e a distribuição que será utilizada (no caso do nosso curso, utilizaremos apenas a distribuição normal; no entanto, existem outras distribuições que são utilizadas em testes para outros parâmetros);

Passo 3: Com o auxílio das tabelas estatísticas, determinar a região crítica (RC), ou seja, aquela de rejeição de H 0 , e a região de aceitação (RA) para H 0 ;

Passo 4: A partir dos dados retirados da amostra, calcular o valor da área do teste. Isso seria bem similar ao cálculo dos intervalos de confiança que vimos anteriormente;

dos intervalos de confiança que vimos anteriormente; Estatística e Métodos Quantitativos Marcelo Virginio de

Estatística e Métodos Quantitativos Marcelo Virginio de Melo

anotaçôes 69
anotaçôes
69
MÓDULO 4 Inferência Estatística anotaçôes 70
MÓDULO 4
Inferência Estatística
anotaçôes
70

Passo 5: Concluir pela aceitação ou rejeição de H 0 , comparando o valor obtido no passo 4, com a região de aceitação e a região crítica.

Parece difícil ? Não se preocupe!

Com o desenvolvimento dos próximos tópicos, vamos refazer esses passos, de forma que você entenderá e, quem sabe, os utilizará em artigos científicos, pesquisas e na sua monografia?

5.1 Testes Significância para Médias (com Variância Conhecida)

Para facilitar o entendimento, vemos desenvolver o teste a partir de um exemplo. Suponha que a altura média dos jogadores da liga brasileira de basquete seja de 1,95m. Em uma amostra de 36 jogadores, foi encontrada uma média de 1,93m. Sabe-se que a variância da altura dos jogadores é de 1,44m. Teste, com um nível de significância de 10%, se a afirmação é verdadeira.

Seguindo os passos anteriormente citados:

Passo 1: Definir quem seria o H 0 e o H 1

H 0 : � H 1 : �

µ

µ

= 1,95

1,95

Ou seja, a hipótese nula afirma que a média populacional é 1,95m. E a alternativa supõe que seja diferente desse valor (maior ou menor).

Passo 2: Fixar o limite do erro Tipo I (� ) e a distribuição que será utilizada

α

Bom, como sabemos que o teste é para a média, com variância

populacional conhecida, temos a informação, lá do tópico de intervalos

de confiança (vai lá dar uma olhada é a distribuição normal.

que a distribuição a ser utilizada

)

O nível de significância é de � = 10%. Isso significa dizer que a decisão correta de aceitar H 0 seria 1- � = 90%.

α

α

Estatística e Métodos Quantitativos Marcelo Virginio de Melo

correta de aceitar H 0 seria 1- � = 90% . α α Estatística e Métodos
MÓDULO 4
MÓDULO 4

Inferência Estatística

Passo 3: Com o auxílio da tabela estatística (que, no caso, é a normal), determinar a região crítica (RC), ou seja, aquela de rejeição de H 0 , e a região de aceitação (RA) para H 0 ;

Região de Aceitação (RA)

(90%)

(5%) (5%)
(5%)
(5%)

Região de Crítica (RC)

Região Crítica (RC)

Perceba que o nível de significância � = 10% reparte a região crítica em duas áreas de 5% cada. Para estes valores de área, temos Z = 1,645 (obtido pela tabela normal padronizada).

α

Passo 4: A partir dos dados retirados da amostra, calcular o valor da área do teste.

Esse procedimento é semelhante ao utilizado na construção do intervalo de confiança para a média, que vimos anteriormente. Com uma única diferença: Como estamos testando uma média amostral, o intervalo construído como região de aceitação será definido para esta média amostral.

Assim, para a região de aceitação, ou seja, 90% da área, vamos usar a expressão:

 σ  µ − Z ≤ X  n
σ
µ
Z
X
n

µ +

Z

σ  → 1 − n 
σ
→ 1 −
n

α

Note que a única mudança, quando comparamos a expressão acima

com aquela vista no Tópico 2 são os lugares de

µ

e de

X

.

Nossos dados são:

µ

= 1,95 (média populacional)

Z

= 1,645

σ

= 0,12

1,95 (média populacional) Z = 1,645 σ = 0,12 Estatística e Métodos Quantitativos Marcelo Virginio de

Estatística e Métodos Quantitativos Marcelo Virginio de Melo

anotaçôes 71
anotaçôes
71
MÓDULO 4
MÓDULO 4

Inferência Estatística

n = 36

1 – α = 90% anotaçôes  0,12  µ− 1,645 ≤ X ≤µ+ 1,645
1 – α = 90%
anotaçôes
0,12
 µ− 1,645
X ≤µ+ 1,645
0,12   → 90%
36
36
Resolvendo:
(µ − 0,0329 ≤ X ≤ µ + 0,329)→ 90%
Isso significa que a média amostral, para ser aceita, deve variar entre
1,95 (média populacional) menos 0,0329 e 1,95 mais 0,329, ou seja, a
região de aceitação será:
RA = [1,9171; 1,9829]
Passo 5: Concluir pela aceitação ou rejeição de H 0 , comparando o valor
obtido no passo 4, com a região de aceitação e a região crítica.
Como a média amostral obtida foi de 1,93m, temos um valor dentro da
região de aceitação e, portanto, aceitamos H 0 !
Exemplo 2: Uma empresa que produz cereais matinais afirma que uma
caixa normal de cereal contém 368 gramas do produto. Uma amostra
aleatória de 25 caixas mostrou que o peso amostral médio foi de = 372,5
X
gramas. A empresa especificou � como 25 gramas. Teste a afirmação da
empresa, em um nível de confiança de 5%.
Passo 1: Definir quem seria o H 0 e o H 1
µ
H 0 : �
H 1 : �
= 368
µ
368
Passo 2: Fixar o limite do erro Tipo I (� ) e a distribuição que será utilizada
α
O nível de significância é de � = 5%. Isso significa dizer que a decisão
correta de aceitar H0 seria 1- � = 95%.
α
α
Passo 3: Com o auxílio da tabela estatística (que, no caso, é a normal),
determinar a região crítica (RC), ou seja, aquela de rejeição de H 0 , e a
região de aceitação (RA) para H 0 ;
72
72

Estatística e Métodos Quantitativos Marcelo Virginio de Melo

de H 0 , e a região de aceitação (RA) para H 0 ; 72 Estatística
MÓDULO 4
MÓDULO 4

Inferência Estatística

Região de Aceitação (RA)

Região Crítica (RC) = (2,5%) -1,96 0
Região
Crítica
(RC) =
(2,5%)
-1,96
0
Aceitação (RA) Região Crítica (RC) = (2,5%) -1,96 0 1,96 (95%) Região de Crítica (RC) (2,5%)

1,96

(95%)

Região de Crítica (RC) (2,5%)

Perceba que o nível de significância � = 5% reparte a região crítica em duas áreas de 2,5% cada. Ou seja, a área de 0 a 1,96 corresponde a 0,475. Para estes valores de área, temos Z = 1,96 (obtido pela tabela normal padronizada).

α

Passo 4: A partir dos dados retirados da amostra, calcular o valor da área do teste.

Para a região de aceitação, ou seja, 90% da área, vamos usar a expressão:

 σ  µ − Z ≤ X  n
σ
µ
Z
X
n

Nossos dados são:

σ  ≤ µ + Z → 1 − α n 
σ
µ +
Z
→ 1 −
α
n

µ

= 368 (média populacional)

Z

= 1,96

σ

=

25

n

= 25

1 – α = 95%

 25 25   µ− 1,96 ≤ X ≤µ+ 1,96  → 95% 
25
25
 µ−
1,96
≤ X ≤µ+ 1,96
 → 95%
25
25

Resolvendo:

(µ 9,8 X µ + 9,8)95%

Isso significa que a média amostral, para ser aceita, deve variar entre 368 (média populacional) menos 9,8 e 368 mais 9,8, ou seja, a região de

Estatística e Métodos Quantitativos Marcelo Virginio de Meloser aceita, deve variar entre 368 (média populacional) menos 9,8 e 368 mais 9,8, ou seja,

anotaçôes 73
anotaçôes
73
MÓDULO 4 Inferência Estatística anotaçôes 74
MÓDULO 4
Inferência Estatística
anotaçôes
74

aceitação será:

RA = [358,2; 377,8]

Passo 5: Concluir pela aceitação ou rejeição de H 0 , comparando o valor obtido no passo 4, com a região de aceitação e a região crítica.

Como a média amostral obtida foi de = 372,5 gramas, não há evidências

de que a estimativa não seja 368, pois temos um valor dentro da região de aceitação e, portanto, aceitamos H 0 !

X

5.2 Testes Significância para Proporções

Esse tipo de teste é o que deve ser usado para testar a veracidade (significância) das proporções.

Os 5 passos utilizados no teste de significância para as médias deverão ser usados também aqui. A única diferença está no cálculo da estatística do teste, que é dada por:

Z cal

=

f − p 0 p 0 (1 − p 0 ) n
f
− p
0
p
0 (1
p
0 )
n

Lê-se: “Z calculado”

Onde:

f = proporção do evento na amostra p 0 = valor da hipótese nula n = número de observações.

Após a obtenção do Z calculado, devemos estabelecer as seguintes regras de decisão:

1. Se

2. Se

3. Se

Z

Z

cal

Z

cal

α

2

Z

cal

Z

≤+ →

α

2

Aceita-se H 0

Z

<− →

α

2

Rejeita -se H 0

Z

>+ →

α

2

Rejeita -se H 0

Estatística e Métodos Quantitativos Marcelo Virginio de Melo

α 2 Rejeita -se H 0 Z >+ → α 2 Rejeita -se H 0 Estatística
MÓDULO 4
MÓDULO 4

Inferência Estatística

Como sempre, faremos um exemplo para aplicar e fixar o conhecimento.

Exemplo: A proporção de mortalidade de um Estado brasileiro é tal que 60% da população não sobrevive até os 60 anos. Testar essa hipótese, ao nível de significância de 5%, dado que em uma amostra aleatória de 1000 nascimentos verificou-se que existiam 530 sobreviventes com idade de até 60 anos.

Passo 1: Definir quem seria o H 0 e o H 1

H 0 : p = 0,6

H 1 :

Ou seja, estamos testando a hipótese que a proporção populacional é, de fato, de 0,6 ou 60%.

µ

� � 0,6

Passo 2: Fixar o limite do erro Tipo I (� ) e a distribuição que será utilizada

α

O nível de significância é de � = 5%. Isso significa dizer que a decisão correta de aceitar H0 seria 1- � = 95%.

α

α

Passo 3: Com o auxílio da tabela estatística (que, no caso, é a normal), determinar a região crítica (RC), ou seja, aquela de rejeição de H 0 , e a região de aceitação (RA) para H 0 ;

Região de Aceitação (RA)

(95%) Região Crítica (RC) = (2,5%) Região de Crítica (RC) (2,5%) -1,96 0 1,96
(95%)
Região
Crítica
(RC) =
(2,5%)
Região de Crítica
(RC) (2,5%)
-1,96
0
1,96

Passo 4: A partir dos dados retirados da amostra, calcular a estatística do teste. Nossos dados são:

n = 1000

f

530 sobreviventes

=

1000 nascimentos

= 0,53

n = 1000 f 530 sobreviventes = 1000 nascimentos = 0,53 Estatística e Métodos Quantitativos Marcelo

Estatística e Métodos Quantitativos Marcelo Virginio de Melo

anotaçôes 75
anotaçôes
75
MÓDULO 4 Inferência Estatística anotaçôes 76
MÓDULO 4
Inferência Estatística
anotaçôes
76

p0 = 0,6

Assim,

0,53 − 0,6 Z = =− 4,42 cal 0,6(1 − 0,6) 1000
0,53
− 0,6
Z
=
=−
4,42
cal
0,6(1
− 0,6)
1000

O

fixado em 5%) é 1,96 (veja o gráfico acima), temos como intervalo de

aceitação:

Z obtido para o intervalo de aceitação 1- � = 95% (isso porque � foi

α

α

1,96

Z

cal

≤ +1,96

Passo 5: Concluir pela aceitação ou rejeição de H0, comparando o valor obtido no passo 4, com a região de aceitação e a região crítica.

Como o Z calculado, que é -4,42, é menor que o limite inferior do Z da

tabela, ou seja, -1,96, usamos a regra de decisão 2 ou seja,

rejeitamos H 0 !

Z

cal <

Z

α

2

O objetivo aqui foi dar uma visão geral nos intervalos de confiança e

testes de significância mais usados.

Existem outros intervalos e testes que utilizam outras distribuições de probabilidade e outras estatísticas de teste. Cabe a você se aprofundar nesses assuntos, caso necessite no futuro. Entretanto, com as bases vistas aqui, seu trabalho será sensivelmente facilitado.

Até o próximo Módulo!

Estatística e Métodos Quantitativos Marcelo Virginio de Melo

será sensivelmente facilitado. Até o próximo Módulo! Estatística e Métodos Quantitativos Marcelo Virginio de Melo
MÓDULO 4
MÓDULO 4

Inferência Estatística

TABELA DA DISTRIBUIÇÃO NORMAL PADRONIZADA

Estatística TABELA DA DISTRIBUIÇÃO NORMAL PADRONIZADA anotaçôes rascunho Videoaulas para consultas Intervalo
anotaçôes rascunho
anotaçôes rascunho
DA DISTRIBUIÇÃO NORMAL PADRONIZADA anotaçôes rascunho Videoaulas para consultas Intervalo de Confiança para a
DA DISTRIBUIÇÃO NORMAL PADRONIZADA anotaçôes rascunho Videoaulas para consultas Intervalo de Confiança para a

Videoaulas para consultas

Intervalo de Confiança para a média: Disponível em <https://www.youtube.com/watch?v=mrJFdexNiB0

<https://www.youtube.com/watch?v=BTsamy09-DE>

Intervalo de Confiança para a proporção: Disponível em <https://www.youtube.com/watch?v=Xk3yJSD- 4a8 > https://www.youtube.com/watch?v=g0le8oMuWRM> Teste de Hipótese para a Média: Disponível em <https://www.youtube.com/watch?v=fQO1lje8kKY>

TestedeHipóteseparaaProporção:Disponívelem<https://www.youtube.com/watch?v=XsfhOGPMe44>

Estatística e Métodos Quantitativos Marcelo Virginio de MeloTestedeHipóteseparaaProporção :Disponívelem<https://www.youtube.com/watch?v=XsfhOGPMe44> 77

77
77
REFERÊNCIAS BUSSAR, Wilton de O. MORETTIN, Pedro A. Estatística básic a. São Paulo: Saraiva, 2004.

REFERÊNCIAS

BUSSAR, Wilton de O. MORETTIN, Pedro A. Estatística básica. São Paulo:

Saraiva, 2004.

LEVINE, D. M. et al. Estatística: teoria e aplicações. Rio de Janeiro: LTC,

2000.

OLIVEIRA, F. E. M. Estatística e Probabilidade . São Paulo: Atlas, 1999.

DOWNING, D.; CLARK, J. Estatística Aplicada. São Paulo: Saraiva, 1999.

FONSECA , Jairo. S; MARTINS, Gilberto de A. Curso de Estatística. 6ª Edição. São Paulo: Atlas, 2012.

McCLAVE, James T.; BENSON, P. George; SINCICH, Terry. Estatística para administração e economia. 10ª Edição. São Paulo: Pearson, 2009.

TRIOLA, Mario F. Introdução à estatística. Rio de Janeiro: LTC, 2004.