Sei sulla pagina 1di 17

EST001 – Elementos de Estatística

Cap. 4 - Estimação por Intervalo

 Amostragem e inferência estatística

População: consiste na totalidade das observações em que estamos


interessados.
 Nº de observações na população é denominado tamanho=N.
Amostra: um subconjunto de observações selecionadas a partir de uma
população. Tamanho da amostra: n.
Definição: As variáveis aleatórias (X1, X2,..., Xn) são uma amostra
aleatória (aa ou iid) de tamanho n se
a) Os Xi’s forem variáveis aleatórias independentes e
b) Cada Xi tiver a mesma distribuição de probabilidades.
Quando a amostragem é aleatória podemos fazer inferências sobre a
população a partir de uma amostra.
Estatística: é qualquer função das observações em uma amostra aleatória.

Parâmetro: descrição numérica de uma característica da população,


geralmente desconhecida.
Exemplos de parâmetros: média de altura de uma população; variância,
proporção de peças defeituosas, etc...

Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 1


EST001 – Elementos de Estatística

Estimação de Parâmetros

Estimador: é uma estatística usada para estimar um parâmetro


populacional, a partir de uma amostra aleatória.

Exemplos de estimadores:
a) X (média amostral): estimador da média populacional;
b) S2 (variância amostral): estimador da variância populacional;
c) S (desvio padrão amostral): estimador do desvio padrão
populacional

Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 2


EST001 – Elementos de Estatística
d) p (proporção amostral): estimador da proporção populacional, etc.

O valor que um estimador assume uma determinada amostra é denominado


estimativa do parâmetro.

Objetivo: Estimar um parâmetro de uma população de uma variável X


(que pode ser a média , a variância  2, o desvio padrão , a proporção 
de objetos com determinada característica de interesse, etc) de uma
população em estudo consiste na determinação do valor numérico do
mesmo a partir de uma estatística adequada definida numa amostra
aleatória extraída da população em estudo.

 Na prática selecionamos apenas uma amostra, produzindo apenas uma


estimativa.
 Como um estimador é uma variável aleatória, o mesmo tem média e
variância.
 Assim, mesmo que o estimador seja não tendencioso a estimativa obtida
pode estar muito distante da verdadeira média populacional.
 Então, outra propriedade desejável é que o estimador tenha uma
variância pequena, reduzindo assim a possibilidade da estimativa ser
muito diferente do valor do parâmetro.

Acurácia: observações próximas (em torno) do valor alvo, real ou


esperado.
Precisão: observações próximas da média do conjunto de observações
(baixa variabilidade).

Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 3


EST001 – Elementos de Estatística

Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 4


EST001 – Elementos de Estatística
Estimação pontual
No processo de estimação por ponto admite-se como valor numérico
do parâmetro a estimativa calculada a partir de uma amostra aleatória
extraída da população em estudo.
Exemplo: Na estimação por ponto da média populacional  de uma
variável X admite-se que   x , onde x é uma estimativa de  dada por
 xi
n

x  i 1
n
sendo x1, x2, ..., xn observações da variável X uma amostra de tamanho n
extraída da população de observações desta variável para estimar a média
populacional .

Existem outros processos de estimação pontual, não


abordados aqui.

 No processo de estimação por intervalo, usa-se a distribuição


amostral do estimador para a construção de um intervalo, sendo que
este intervalo tem uma probabilidade =1- α, especificada a priori, de
conter o verdadeiro valor do parâmetro estimado.
 O intervalo é denominado intervalo de confiança de 100% e a
probabilidade  é denominada nível de confiança. Os níveis de
confiança usuais são 0,95 (95%) e 0,99(99%).

Intervalo de Confiança:
 Expressa o grau de incerteza associado com uma estimativa.
 Intervalo com 100(1- α)% de confiança para o parâmetro θ:

Interpretação: Se K amostras aleatórias de mesmo tamanho n forem


coletadas e um IC de 100(1- α)% for calculado para cada amostra, então
100(1- α)% desses K intervalos contem o valor verdadeiro do parâmetro θ.

Observações:
 Quanto maior for o IC, menor é sua precisão.
 A metade do IC é sua precisão.

Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 5


EST001 – Elementos de Estatística
Distribuições Amostrais
o A seleção da amostra a partir de um plano amostral probabilístico
faz com qualquer estimador (estatística) seja uma VA. Por que?
 Por causa da aleatoriedade introduzida pelo sorteio realizado
no processo de amostragem.
o Uma estatística é uma VA aleatória e a sua distribuição de
probabilidades é chamada de distribuição amostral.

o Consideraremos um plano amostral por amostragem aleatória


simples (AAS) com reposição com n = 2.

1 2 3 4 3 2 1


E X   2   2,5   3   3,5   4   4,5   5   3,5  
 16   16   16   16   16   16   16 

1 2 2 2 1 1,25  2
V ( X )  (2  3,5)
2
 (2,5  3,5)  ...  (5  3,5)  0,625  
16 16 16 2 n

Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 6


EST001 – Elementos de Estatística

o Observe que a distribuição da população e a distribuição da média


amostral têm a mesma média (valor esperado).

o A distribuição da média amostral é mais concentrada e é


parecida com a distribuição Normal.

Distribuição Amostral da Média

o O esquema abaixo resume o que vimos até agora:

Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 7


EST001 – Elementos de Estatística

o Se consideramos uma AAS X 1 , X 2 ,..., X n  e o estimador X , a


distribuição de X terá as seguintes propriedades:

o E (X )  

2
o V (X )  .
n

Teorema Central do Limite: Se X1, X2,..., Xn for uma aa de tamanho de


uma população (finita ou infinita), com média µ e variância σ 2 finita, então
a forma limite da distribuição de
,
onde Z é a distribuição normal padrão.

 Em geral para n  30 a aproximação é boa.

A distribuição T de Student com =n1 graus de liberdade.


A distribuição T é simétrica, tem esperança matemática igual a zero e
variância igual a n /( n  2). A forma da desta distribuição depende de seu
número de graus de liberdade da mesma. O gráfico a seguir ilustra esta
distribuição para  = 1,  = 4 e  = 20.

(a)  = 1 (b)  = 4 (c)  = 20


Figura 1
Se  é suficientemente grande (na prática,   30) a distribuição t se
aproxima da distribuição normal padrão.
As probabilidades dos valores da distribuição t de Student se
encontram no apêndice. Os valores t>0 da variável T nesta tabela são tais
que P(Tt)=,

Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 8


EST001 – Elementos de Estatística
Intervalos de Confiança para parâmetros populacionais

1) Intervalo de confiança para a média populacional

Suponha que a população de uma variável X tenha distribuição


normal com média igual a  e desvio padrão .

Figura 2
O intervalo de confiança de 100 % para a média populacional  é dado
por
,
onde é o quantil da distribuição T(n-1).

Para n grande (n>30), pode-se utilizar o quantil da normal no lugar


do quantil da T de Student. Ou seja,
,
onde é o quantil da normal padrão.

Exemplo: Um pesquisador observou o custo de produção, em R$, numa


amostra de 10 unidades de um artigo produzido por certo fabricante
escolhidas aleatoriamente da produção, encontrando os seguintes valores:
10, 11, 7, 9, 6, 7, 10, 7, 6 e 8. Construa e interprete um intervalo de 95%
para o custo médio de produção do artigo considerado.

Solução

10
x 81
x i 1 i
  8,1
10 10

s

10
x 2
i 1 i

 x 
10
i 1 i
2


685 812
  1,79
10  1 10(10  1) 9 90

Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 9


EST001 – Elementos de Estatística
Sendo =0,95, =0,05, o coeficiente de confiança, t 0,95 , é um valor da
variável T tal que P(t 0,025  T  t 0,025 )  0,95 como ilustra o gráfico a seguir.

Figura 3
A variável T tem distribuição t de Student com
=n1=101=9 graus de liberdade. Pela tabela da T de Student tem-
se para  = 9 e  = 0,05 que t 0,025 = 2,26.
Assim sendo, o intervalo de confiança de 95% para o custo médio
deste artigo é
8,1  2,26  0,57    8,1  2,26  0,57  R$6,81    R$9,39
Com este resultado acredita-se que a probabilidade de que o intervalo
acima contenha o custo médio das unidades deste artigo é de 0,95.

1.1) Determinação do tamanho da amostra para estimação da média

Na construção de um intervalo de confiança de 100% para a média


da população de uma variável X deve-se inicialmente estipular a precisão
do intervalo de confiança desejado e em função desta precisão dimensionar
o tamanho da amostra. Na amostragem com reposição constata-se que a
precisão deste intervalo é
  t s X
Considerando amostragem com reposição
sX  s
n
Logo,
  t s
n
Então
t2 S 2
n 2

Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 10


EST001 – Elementos de Estatística
A estimativa S é determinada a partir de uma amostra inicial
denominada amostra piloto com n’ elementos (sendo n’ arbitrário e nunca
inferior a 30) e considera-se  =  para se determinar o valor t. Se n for
maior que n’, o tamanho da amostra definitiva será n e deve-se acrescentar
às n’ observações da amostra piloto novas observações até completar a
amostra de tamanho n; se o valor n calculado for menor ou igual a n’, a
amostra piloto já é suficiente e o tamanho da amostra definitiva será n =
n’.

Exemplo: Um pesquisador deseja estimar o preço médio de um produto


nos pontos de venda de certa região, de modo que o erro de estimação seja
no máximo igual a R$2,00, admitindo-se um nível de confiança de 95%. O
pesquisador dispõe de uma amostra piloto de 40 pontos de venda nos quais
o desvio padrão do preço do produto é igual a R$12,00. Qual deve ser o
tamanho da amostra?

Solução
Não tendo sido informado o tamanho da população (número de
pontos de venda da região) admite-se amostragem com reposição ou
amostragem sem reposição de uma população muito infinita ou população
finita muito maior que a amostra e assim sendo, o tamanho da amostra é
t2 s 2
n 2

Pelos dados do problema, tem-se que  = 2 e  = 12. Sendo  =
0,95 e  = , tem-se da tabela t de Student tem-se que t0,95 =1,96. Então, o
tamanho da amostra para estimar o preço médio do produto nos pontos de
venda da região é
1,96 2  12 2
n  n  139
22

2) Intervalo de confiança para a proporção populacional

Suponha que certa população tenha uma proporção  de objetos com


uma característica de interesse para o pesquisador (por exemplo,  pode
ser a proporção de unidades defeituosas de certo artigo numa linha de
produção).

Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 11


EST001 – Elementos de Estatística
Neste caso, o estimador não tendencioso de  é a proporção amostral
p, que é uma variável aleatória que associa a uma amostra de n objetos a
proporção p de objetos na amostra com a característica de interesse.
Para grandes amostras (n  30), a variável aleatória que associa a
uma amostra o valor da expressão
p 
sP
tem distribuição aproximadamente normal padronizada, sendo sP uma
estimativa do erro padrão, dada por
p(1  p)
sP 
n
se a amostragem é com reposição.

Para um dado nível de confiança , tem-se que


 p  
P  z    z   
 sP 
onde z é um valor da variável normal padronizada. Assim, o Intervalo de
confiança de nível  para  é dado por
IC ( )  ( p  z / 2 sP , p  z / 2 sP )
ou
p(1  p) p(1  p)
IC ( )  [ p  z / 2 , p  z / 2 ]
n n

A equação acima constitui o intervalo de confiança de 100% para a


proporção populacional .

Exemplo: Um produtor deseja estimar a proporção de itens de certo artigo


na linha de produção de sua empresa que apresentam defeito de fabricação.
Para esta finalidade, retirou uma amostra de 200 itens retirados
aleatoriamente da linha de produção, constatando que 16 destes
apresentam defeito de fabricação.
Construa e interprete um intervalo de confiança de 95% para a
proporção de itens na linha de produção que apresentam defeito de
fabricação.

Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 12


EST001 – Elementos de Estatística
Solução: Não tendo sido informado o tamanho da população (número
de itens produzidos) admite-se amostragem com reposição ou
amostragem sem reposição de uma população infinita ou população
finita muito maior que a amostra e o intervalo de confiança para a
proporção de itens defeituosos na linha de produção é
p(1  p) p(1  p)
p  z / 2    p  z / 2
n n
onde p = x/n. Na amostra de tamanho n = 200 foram observados x = 16
itens defeituosos. Então a estimativa da proporção  de itens defeituosos
na linha de produção é
16
p  0,08
200
A estimativa do erro padrão da proporção é
p(1  p) 0,08(1  0,08)
sP    0,019
n 200
Sendo =0,95 tem-se que P( z0,95  Z  z0,95 )  0,95 onde Z é a variável
normal padronizada. O gráfico a seguir ilustra esta situação.

Figura 4
Observando-se o gráfico acima tem-se que, da tabela da normal padrão, z
=1,96. Então o intervalo de confiança de 95% para a proporção de itens
defeituosos na linha de produção é
0,08  1,96  0,019    0,08  1,96  0,019  0,043    0,117
Com este resultado, acredita-se que a probabilidade de que o
intervalo acima contenha a proporção de itens defeituosos na linha de
produção é de 0,95.

3.1) Determinação do tamanho da amostra para a estimação da


proporção

Como no caso da média, para se construir um intervalo de confiança


de 100 % para a proporção populacional  deve-se dimensionar o tamanho
Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 13
EST001 – Elementos de Estatística
da amostra para uma precisão preestabelecida do intervalo de confiança
desejado.
A precisão do intervalo é
  z sP
Se a amostragem é com reposição, então
p(1  p)
sP  .
n
Logo,
p(1  p)
  z
n
Resolvendo-se a equação para n tem-se que
z2 p (1  p)
n
 2

A estimativa p da proporção populacional pode ser obtida a partir de


uma amostra piloto como no caso da média. Caso seja muito difícil obter
uma estimativa inicial da proporção  e considerando-se que n atinge um
valor máximo quando p = 0.5, pode-se arbitrar este valor para a estimativa
inicial de .
Neste caso existe o risco de que, em determinadas situações, sejam
obtidas amostras de tamanho muito maior que o necessário.

Exemplo: Com o objetivo de estimar a proporção de itens defeituosos


numa produção, um administrador de produção deseja extrair uma amostra
aleatória de itens da referida produção para tal fim. Uma amostra piloto de
40 itens apresentou 4 defeituosos. Qual deve ser o tamanho da amostra
definitiva para que o erro de estimação da proporção de defeituosos na
população seja de no máximo 3% a um nível de confiança de 95%?

Solução: Não tendo sido informado o tamanho da população (número de


itens produzidos), admite-se amostragem com reposição ou amostragem
sem reposição de uma população infinita ou muito maior que a amostra e,
assim sendo, o tamanho da amostra é
z2 (1   )
n
2
A estimativa de  obtida a partir da amostra piloto é p
4
 0,1 .
40

Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 14


EST001 – Elementos de Estatística
Pelos dados do problema, tem-se que  = 0,03. Sendo  = 0,95
tem-se, pela tabela da normal padrão, que z 0,95 =1,96. Então, o tamanho da
amostra para estimar a proporção de itens defeituosos na produção é
1,96  0,1(1  0,1)
n 2
 n  385
0,03
Neste caso deve-se acrescentar 345 itens à amostra piloto antes de se
construir o intervalo de confiança para a proporção.

Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 15


EST001 – Elementos de Estatística
Apêndice
TABELA: Distribuição normal padrão.
área
P(Z>z) tabulada

0 z

segunda decimal de z
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641
0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121

0,5 0,3085 0 ,3050 0 ,3015 0 ,2981 0 ,2946 0 ,2912 0 ,2877 0 ,2842 0 ,2810 0 ,2776
0,6 0,2743 0 ,2709 0 ,2676 0 ,2643 0 ,2611 0 ,2578 0 ,2546 0 ,2514 0 ,2483 0 ,2451
0,7 0,2420 0 ,2389 0 ,2358 0 ,2327 0 ,2296 0 ,2266 0 ,2236 0 ,2206 0 ,2177 0 ,2148
0,8 0,2119 0 ,2090 0 ,2061 0 ,2033 0 ,2005 0 ,1977 0 ,1949 0 ,1922 0 ,1894 0 ,1867
0,9 0,1841 0 ,1814 0 ,1788 0 ,1762 0 ,1736 0 ,1711 0 ,1685 0 ,1660 0 ,1635 0 ,1611

1,0 0,1587 0 ,1562 0 ,1539 0 ,1515 0 ,1492 0 ,1469 0 ,1446 0 ,1423 0 ,1401 0 ,1379
1,1 0,1357 0 ,1335 0 ,1314 0 ,1292 0 ,1271 0 ,1251 0 ,1230 0 ,1210 0 ,1190 0 ,1170
1,2 0 ,1151 0 ,1131 0 ,1112 0 ,1093 0 ,1075 0 ,1056 0 ,1038 0 ,1020 0 ,1003 0 ,0985
1,3 0 ,0968 0 ,0951 0 ,0934 0 ,0918 0 ,0901 0 ,0885 0 ,0869 0 ,0853 0 ,0838 0 ,0823
1,4 0 ,0808 0 ,0793 0 ,0778 0 ,0764 0 ,0749 0 ,0735 0 ,0722 0 ,0708 0 ,0694 0 ,0681

1,5 0 ,0668 0 ,0655 0 ,0643 0 ,0630 0 ,0618 0 ,0606 0 ,0594 0 ,0582 0 ,0571 0 ,0559
1,6 0 ,0548 0 ,0537 0 ,0526 0 ,0516 0 ,0505 0 ,0495 0 ,0485 0 ,0475 0 ,0465 0 ,0455
1,7 0 ,0446 0 ,0436 0 ,0427 0 ,0418 0 ,0409 0 ,0401 0 ,0392 0 ,0384 0 ,0375 0 ,0367
1,8 0 ,0359 0 ,0352 0 ,0344 0 ,0336 0 ,0329 0 ,0322 0 ,0314 0 ,0307 0 ,0301 0 ,0294
1,9 0 ,0287 0 ,0281 0 ,0274 0 ,0268 0 ,0262 0 ,0256 0 ,0250 0 ,0244 0 ,0239 0 ,0233

2,0 0 ,0228 0 ,0222 0 ,0217 0 ,0212 0 ,0207 0 ,0202 0 ,0197 0 ,0192 0 ,0188 0 ,0183
2,1 0 ,0179 0 ,0174 0 ,0170 0 ,0166 0 ,0162 0 ,0158 0 ,0154 0 ,0150 0 ,0146 0 ,0143
2,2 0 ,0139 0 ,0136 0 ,0132 0 ,0129 0 ,0125 0 ,0122 0 ,0119 0 ,0116 0 ,0113 0 ,0110
2,3 0 ,0107 0 ,0104 0 ,0102 0 ,0099 0 ,0096 0 ,0094 0 ,0091 0 ,0089 0 ,0087 0 ,0084
2,4 0 ,0082 0 ,0080 0 ,0078 0 ,0075 0 ,0073 0 ,0071 0 ,0069 0 ,0068 0 ,0066 0 ,0064

2,5 0 ,0062 0 ,0060 0 ,0059 0 ,0057 0 ,0055 0 ,0054 0 ,0052 0 ,0051 0 ,0049 0 ,0048
2,6 0 ,0047 0 ,0045 0 ,0044 0 ,0043 0 ,0041 0 ,0040 0 ,0039 0 ,0038 0 ,0037 0 ,0036
2,7 0 ,0035 0 ,0034 0 ,0033 0 ,0032 0 ,0031 0 ,0030 0 ,0029 0 ,0028 0 ,0027 0 ,0026
2,8 0 ,0026 0 ,0025 0 ,0024 0 ,0023 0 ,0023 0 ,0022 0 ,0021 0 ,0021 0 ,0020 0 ,0019
2,9 0 ,0019 0 ,0018 0 ,0017 0 ,0017 0 ,0016 0 ,0016 0 ,0015 0 ,0015 0 ,0014 0 ,0014

3,0 0,00135
3,5 0,000 233
4,0 0,000 031 7
4,5 0,000 003 40
5,0 0,000 000 287

Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 16


EST001 – Elementos de Estatística

Prof. Dr. Clécio da Silva Ferreira - Departamento de Estatística - UFJF 17