Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
=
ou, ainda,
( )
(
(
n
x . f
x . f
1 n
1
s
2
i i 2
i i
2
um estimador da varincia populacional
2
.
4.4.3. Estimador do desvio padro populacional
O desvio padro amostral, que a raiz quadrada da varincia amostral
2
s s =
um estimador do desvio padro populacional .
4.4.4. Estimador da proporo populacional
A freqncia relativa f
ri
, que passaremos a chamar de p
(lse: p chapu)
amostra da casos de total nmero
amostra na evento o determinad a favorveis casos de nmero
p
=
um estimador da proporo, ou probabilidade p do evento na populao.
4.5. Estimativa
O valor numrico de um estimador chamado estimativa de seu respectivo
parmetro.
Por exemplo: uma pesquisa socioeconmica em uma amostra aleatria de 80
estudantes universitrios revelou que 60% eram mulheres. Podemos afirmar
que a estimativa da proporo de mulheres estudantes dessa populao de
60%.
4.6. Distribuio Amostral
Como voc pode observar, o parmetro populacional (por exemplo, a mdia )
constante (embora normalmente seja desconhecido), seu valor no se altera
de amostra para amostra. Contudo, o valor de uma amostra (por exemplo, a
mdia x ) dependente da amostra selecionada; cada amostra revelar um
diferente valor de x .
Como os valores do estimador (as estimativas) variam de amostra para
amostra e a inferncia estatstica baseia-se no estimador, precisamos conhecer
como se d a distribuio de probabilidade do parmetro.
72
Conhecida a distribuio de probabilidade do parmetro, teremos condies de
avaliar o grau de incerteza das inferncias estatsticas realizadas a partir de
amostras aleatrias selecionadas da populao que se est estudando.
Assim, a distribuio amostrai de um parmetro obtida, empiricamente,
pela distribuio de freqncia dos valores de
.
4.7. Distribuio Amostral das Mdias
Vimos que
n
x . f
x
i i
= um estimador da mdia populacional . O estimador
x uma varivel aleatria. Portanto, buscamos conhecer sua distribuio de
probabilidade.
4.7.1. Teorema 1
A mdia da distribuio amostral das mdias, denotada por ) x ( igual
mdia populacional . Isto :
= = ) x ( ) x ( E .
Logo, a mdia das mdias amostrais igual mdia populacional, tanto para
uma populao finita como infinita.
4.7.2. Teorema 2
Se a populao infinita, ou se a amostragem com reposio, a
varincia da distribuio amostral das mdias :
73
n
) x (
2
2
= .
Ou seja, a varincia da distribuio das mdias igual varincia da
populao dividida pelo tamanho da amostra (n).
Logo, o desvio padro das mdias dado por:
n
) x (
= .
O desvio padro das mdias ) x ( tambm chamado de erro padro de x .
4.7.3. Teorema 3
Se a populao finita, ou se a amostragem sem reposio, a varincia
da distribuio amostral das mdias :
|
\
|
=
1 N
n N
n
) x (
2
2
.
E o desvio padro :
|
\
|
=
1 N
n N
.
n
1
. ) x ( ou
1 N
n N
.
n
) x (
= .
Onde n o tamanho da amostra e N o tamanho da populao.
Importante: o fator de correo finita
1 N
n N
com Z ~ N(0,1), que uma varivel Normal Padro.
Em palavras, o teorema garante que para n grande a distribuio da mdia
amostral, devidamente padronizada, se comporta segundo um modelo Normal
com mdia 0 e varincia 1. De imediato, podemos notar a importncia do
Teorema Central do Limite, pois em muitas situaes prticas, em que o
interesse reside na mdia amostral, o teorema permite que utilizemos a
distribuio Normal para estudar X probabilisticamente. Pelo teorema temos
que quanto maior o tamanho da amostra, melhor a aproximao.
Estudos, envolvendo simulaes, mostram que em muitos casos valores de n
ao redor de 30 fornecem aproximaes bastante boas para as aplicaes
prticas. Em casos em que a verdadeira distribuio dos dados
simtrica, excelentes aproximaes so obtidas, mesmo com valores de n
inferiores a 30.
Para verificar o efeito do tamanho da amostra sobre a distribuio de X, vamos
considerar diversos modelos de variveis aleatrias e vrios tamanhos de
amostra. Com o auxlio do computador, simulamos a coleta de amostras de um
determinado tamanho do modelo escolhido. Repetindo essa coleta um nmero
grande de vezes e calculando as correspondentes mdias amostrais, podemos
obter um histograma dessas realizaes que ficaria muito prximo da funo
de probabilidade de X.
Por exemplo, fixe um tamanho da amostra e repita a coleta 100 vezes. Como
cada amostra fornece uma mdia amostral, temos 100 mdias amostrais
observadas e com elas construmos um histograma. claro que, quanto maior
for a coleta e as repeties, mais aproximado ser o histograma, da densidade
de X. Teremos, ento, atravs dessa simulao, uma idia de como X se
comportaria numa amostra grande e poderemos perceber sua semelhana
com a distribuio Normal, conforme assegura o Teorema Central do
Limite.
Na figura seguinte, apresentamos uma aplicao do procedimento descrito
acima. Procuramos escolher modelos bem diferentes de modo a ilustrar a
rapidez, no sentido do tamanho da amostra, e a qualidade da aproximao. Os
modelos escolhidos foram um Uniforme Discreto, um Binomial, um Exponencial
e um modelo contnuo.
75
Pode-se observar que, mesmo partindo de distribuio assimtricas, discretas
ou contnuas, medida que o tamanho da amostra cresce, a distribuio de X
vai se aproximando para a forma de um modelo Normal. A velocidade da
convergncia depende da distribuio inicial, sendo mais rpida nas
distribuies simtricas.
Em resumo: independente de a populao ter ou no ter distribuio normal
com mdia e varincia
2
, a distribuio das mdias amostrais ser
normalmente distribuda para um valor de n grande.
4.8. Distribuio Amostral das Propores
Seja p um parmetro que expressa a probabilidade, ou proporo, de
determinado evento da populao. O estimador de p , como j vimos, p
.
Como as variveis possuem uma distribuio de Bernoulli, conclumos que a
mdia e varincia do estimador : E(p
)=p e
n
) p 1 ( p
) p
( Var
= .
Para n suficientemente grande (n>30), pelo Teorema do Limite Central temos
que:
) 1 , 0 ( N
n
) p 1 ( p
p p
.
76
A figura a seguir apresenta vrios histogramas obtidos a partir de uma
simulao de uma Binomial com parmetros n e p, considerando alguns
valores para n (um para cada coluna) e para p (um para cada linha).
Exemplo 1: as alturas de rvores de carvalho adultas so normalmente
distribudas, com uma mdia de 90 ps e desvio padro de 3,5 ps. Amostras
aleatrias de tamanho 4 so tiradas de uma populao e a mdia de cada
amostra determinada. Encontre a mdia e o erro padro da mdia da
distribuio amostral.
A mdia da distribuio amostral igual mdia da populao e o erro padro
igual ao desvio padro da populao dividido por n . Ento,
90 ) x ( = = ps e 75 , 1
4
5 , 3
n
) x ( = =
= ps.
Interpretao: com base no teorema do limite central, como a populao
normalmente distribuda, a distribuio amostral de mdias das amostras
tambm normalmente distribuda.
Compare os grficos da distribuio da populao e da distribuio amostral:
77
Exemplo 2: O grfico a seguir mostra o perodo que as pessoas passam
dirigindo todos os dias. Voc seleciona aleatoriamente 50 motoristas com idade
entre 15 e 19 anos. Qual a probabilidade de que a mdia de tempo que eles
passam dirigindo todos os dias esteja entre 24,7 e 25,5 minutos? Suponha que
=1,5 minutos.
Como o tamanho da amostra maior que 30, ento podemos usar o teorema
do limite central para concluir que a distribuio de mdias das amostras
aproximadamente normal com uma mdia e um desvio padro de:
25 ) x ( = = minutos e 21213 , 0
50
5 , 1
n
) x ( =
= minutos.
Escrevendo a probabilidade procurada e fazendo a padronizao da varivel
temos:
78
) 36 , 2 Z 41 , 1 ( P
50
5 , 1
25 5 , 25
Z
50
5 , 1
25 7 , 24
P ) 5 , 25 X 7 , 24 ( P < < =
|
|
|
|
\
|
< <
= < < .
Graficamente:
Utilizando a tabela da Normal Padro, temos que:
P(1,41<Z<2,36) = 0,4207 + 0,4909 = 0,9116.
Interpretao: na amostra de 50 motoristas de idade entre 15 e 19 anos,
91,16% ter uma mdia entre 24,7 e 25,5 minutos dirigindo. Isso implica que,
supondo que um valor de =25 minutos esteja correto, somente 8,84% da
amostra estar fora do intervalo dado.
4.9. Exerccios
1) Os gastos mdios com quarto e refeio por ano de faculdades de quatro
anos so de $ 6803. Voc seleciona aleatoriamente 9 faculdades de quatro
anos. Qual a probabilidade de que a mdia de quarto e refeio seja menor
que $ 7088? Suponha que os gastos com quarto e refeio sejam normalmente
distribudos, com desvio padro de $ 1125.
2) Um auditor de banco declara que as contas de cartes de crdito so
normalmente distribudas com mdia de $ 2870 e um desvio padro de $ 900.
a) Qual a probabilidade de que um titular de carto de crdito aleatoriamente
selecionado tenha uma conta menor que $ 2500?
b) Voc seleciona 25 titulares de cartes de crdito de forma aleatria. Qual a
probabilidade de que a mdia da conta deles seja menor que $ 2500?
c) Compare as probabilidades anteriores e interprete a resposta nos termos da
declarao do auditor.
79
3) Uma populao constituda pelos nmeros 2,3,4,5. Considerar todas as
amostras possveis, de tamanho 2, que podem ser extradas dessa populao
com reposio. Determinar:
a) a mdia da populao;
b) o desvio padro da populao;
c) a mdia da distribuio amostral das mdias;
d) o desvio padro da distribuio amostral das mdias;
e) verifique que = ) x ( e
n
) x (
= .
4) Coletase uma amostra de 10 observaes independentes de uma
distribuio normal N(2,2) (ou seja, com mdia 2 e varincia 2). Determine a
probabilidade de a mdia amostral:
a) ser inferior a 1;
b) ser superior a 2,5;
c) estar entre 0 e 2.
5) Supese que o consumo mensal de gua por residncia em certo bairro
paulistano tem distribuio Normal com mdia 10 e desvio padro 2 (em m
3
).
Para uma amostra de 25 dessas residncias, qual a probabilidade de a mdia
amostral no se afastar da verdadeira mdia por mais de 1 m
3
?
6) Em uma amostra de 800 postos de gasolina, o preo mdio da gasolina
comum na bomba era $ 2,876 por galo e o desvio mdio era de $ 0,009 por
galo. Uma amostra aleatria de tamanho 55 extrada da populao.
a) necessrio utilizar o fator de correo finita, ou seja, trabalhar com
1 N
n N
.
n
) x (
= ?
b) Qual a probabilidade de que o preo mdio por galo seja menor que
$2,871?
Respostas
1) 0,7764
2) a) 0,3409 b) 0,0197
c) Embora haja uma chance de 34% de que um indivduo tenha uma conta menor que $2500,
h somente uma chance de 2% de que a mdia de uma amostra de 25 pessoas tenha uma
conta menor que $2500, o que um evento incomum. Ento, possvel que a amostra seja
incomum ou possvel que a declarao do auditor de que a mdia $2870 esteja incorreta.
3) a) =3,5 b) =1,1180 c) ) x ( =3,5 d) 7906 , 0 ) x ( =
e) = ) x ( pois 3,5 = 3,5 e
n
) x (
=
pois
2
1180 , 1
7906 , 0 =
.
4) a) 0,0125 b) 0,1315 c) 0,5
5) 0,9876
6) a) Sim, pois n/N = 0,06 > 0,05.
b) P(Z<4,26) = 0
80
5. Intervalos de Confiana
5.1. Introduo
Neste captulo, comearemos a estudar efetivamente a Inferncia Estatstica.
At agora, estudamos alguns estimadores pontuais. O problema de uma
estimativa pontual que ela raramente se iguala ao parmetro exato (mdia,
desvio padro ou proporo) de uma populao. Da surge a necessidade de
fazer estimativas mais significativas, especificando um intervalo de valores em
uma linha de nmero juntamente com a afirmao de quo confiante voc est
de que seu intervalo contm o parmetro populacional.
5.2. Estimativa por intervalo, o nvel de confiana e de significncia
Uma estimativa por intervalo para um parmetro populacional um intervalo
determinado por dois nmeros, obtidos a partir de elementos amostrais, que se
espera que contenham o valor do parmetro (populacional) com um dado nvel
de confiana
99%. Valores menores que 90% para o nvel de confiana no so utilizados,
pois possuem pouca preciso, ou seja, a confiabilidade muito pequena.
Valores acima de 99%, embora consistam em uma confiana elevada,
acarretam problemas de clculo: ou obtemos intervalos muito grandes ou
necessitamos de amostras muito grandes, o que pode inviabilizar a pesquisa, a
coleta de dados, elevando o seu custo.
Em algumas situaes, pode ser dado, ao invs do nvel de confiana, o nvel
de significncia . A relao entre eles que
= 1 .
importante atentar para o risco do erro, quando se constri um intervalo de
confiana. Se o nvel de confiana de 95%, o risco do erro da inferncia
estatstica ser de 5%. Assim: se construssemos 100 intervalos, baseados em
100 amostras de tamanhos iguais, poderamos esperar que 95 desses
intervalos (95% deles) iriam conter o parmetro populacional sob estudo,
enquanto cinco intervalos (5% deles) no iriam conter o parmetro.
Para exemplificar, vamos supor um parmetro populacional. Vamos admitir a
seleo de 10 amostras de mesmo tamanho e um nvel de confiana de 90%.
A figura seguinte mostra os intervalos obtidos.
Os segmentos horizontais representam os 10 intervalos, e a reta vertical
representa a localizao do parmetro . Nota-se que o parmetro fixo e que
a localizao do intervalo varia de amostra para amostra. Por conseguinte,
podemos falar em termos da "probabilidade de o intervalo incluir ", e
no em termos da "probabilidade de pertencer ao intervalo", j que
fixo. O intervalo aleatrio. Na prtica, somente um intervalo construdo
por meio da amostra aleatria obtida. Como utilizamos uma confiana igual a
90%, perceba que apenas 9 dos 10 intervalos construdos contm o
verdadeiro parmetro :
81
Dessa forma, podemos fazer uma interpretao genrica de um intervalo de
confiana: se obtivermos vrias amostras de mesmo tamanho e para cada
uma calcularmos os correspondentes intervalos de confiana com coeficiente
(ou nvel) de confiana , esperamos que a proporo de intervalos que
contenham o valor do parmetro seja igual a .
5.3. Intervalo de Confiana para a Mdia Populacional quando a
Varincia Conhecida
Neste primeiro tpico, mostraremos a lgica para se obter um intervalo de
confiana. Nos casos seguintes, a tcnica a mesma e, por isso, seremos
mais breves nas explicaes tericas.
Como vimos anteriormente, a distribuio de probabilidade da mdia amostral
|
|
\
|
n
; N ~ X
2
para populaes infinitas e
|
|
\
|
1 N
n N
n
; N ~ X
2
para populaes finitas.
Assim, para populaes infinitas, a varivel normal padro de X ser
denominada Z
observado
:
n
X
Z
obs
= .
Para populaes finitas, devese acrescentar o fator de correo populacional
ao clculo de Z
observado
:
82
1 N
n N
n
X
Z
obs
=
Fixado um nvel de confiana , devemos utilizar a tabela da Normal Padro
para determinar os valores crticos da varivel Z, ou seja, z
crtico
, conforme
mostra a figura:
O intervalo de confiana para a mdia populacional tal que:
=
|
|
\
|
+
n
. z x
n
. z x P
c c
.
De forma mais simples, podemos escrever que o intervalo de confiana para a
mdia populacional, quando a varincia for conhecida :
n
. z x IC
c
=
onde o termo
n
. z
c
=
onde o termo
1 N
n N
n
. z
c
chamado de erro (ou erro mximo da
estimativa ou tolerncia de erro).
Lembrese: o fator
de correo deve ser
usado sempre que
tivermos
05 , 0
N
n
>
.
0
z
c
z
c
2
83
Exemplo 1: a durao da vida de uma pea de equipamento tal que
5 = horas. Foram amostradas aleatoriamente 100 dessas peas, obtendose
mdia de 500 horas. Desejamos construir um intervalo de confiana para a
verdadeira durao mdia da pea com um nvel de 95% de confiana.
Inicialmente, vamos obter o valor crtico da distribuio utilizando a tabela da
Normal Padro: queremos encontrar os valores z
c
e z
c
de modo que a
probabilidade dos valores compreendidos entre z
c
e z
c
seja igual a 95%, ou
seja, ao nvel de confiana. Como a curva simtrica, temos que a rea
compreendida entre 0 e z
c
vale 95% / 2 = 47,5%. Logo, devemos buscar o valor
que mais se aproxima de 0,475 na tabela:
Assim, percebemos que, coincidentemente, h o valor 0,475 exato,
correspondendo a um valor crtico z
c
=1,96. Agora, basta aplicarmos a frmula:
98 , 0 500
100
5
. 96 , 1 500
n
. z x IC
c
= =
= .
Portanto, os limites do nosso intervalo sero:
500 + 0,98 = 500,98 e
500 0,98 = 499,02.
Ou seja,
95 , 0 ) 98 , 500 02 , 499 ( P = .
Ou, ainda, de maneira mais simples:
IC = [499,02 ; 500,98].
84
Interpretao: o intervalo [499,02 ; 500,98] contm a verdadeira durao
mdia da pea com 95% de confiana. Isso significa que, se forem construdos
intervalos dessa mesma maneira, 95% desses intervalos devem conter .
Exemplo 2: vamos considerar o exemplo anterior, mas, agora, suponha que
tenhamos uma populao de 1000 peas.
Nesse caso, o intervalo para a mdia ser:
93 , 0 500
1 1000
100 1000
100
5
. 96 , 1 500
1 N
n N
n
. z x IC
c
=
= .
Logo, o intervalo procurado : IC = [499,07 ; 500,93].
Exemplo 3: suponha que os comprimentos de jacars adultos de uma certa
raa siga o modelo Normal com mdia desconhecida e varincia igual a 0,01
m
2
. Uma amostra de dez animais foi sorteada e forneceu mdia 1,69 m.
Obtenha uma estimativa para o parmetro com uma confiana de 98%.
Inicialmente, devemos observar que foi dado que
2
=0,01 m
2
. Logo, =0,1 m.
Utilizando a tabela da normal para encontrar z
c
temos:
0,49 0,49
98%
0
z
c
z
c
85
Ou seja, z
c
= 2,33.
Aplicando a frmula, temos:
07 , 0 69 , 1
10
1 , 0
. 33 , 2 69 , 1
n
. z x IC
c
= =
=
Calculando os limites inferior e superior do IC, obtemos:
1,69 0,07 = 1,62 e 1,69 + 0,07 = 1,76.
Assim: IC = [1,62 ; 1,76].
Alternativamente, poderamos escrever: 98 , 0 ) 76 , 1 62 , 1 ( P = .
Exemplo 4: desejase estimar o nmero mdio de frases em anncios de
revistas. De estudos anteriores, saberse que a distribuio Normal com
desvio padro igual a 5 frases. Quantos anncios de revista devem ser
includos na amostra se voc quer ter 95% de confiana e no errar mais do
que 1 frase da mdia populacional?
Vimos que o erro dado por
n
. z E
c
\
|
= |
\
|
= = .
Quando necessrio, o resultado deve ser arredondado para o primeiro valor
inteiro maior que o valor de n calculado.
86
Neste caso, n=97, ou seja, devemos incluir pelo menos 97 anncios de revista
na amostra.
5.4. Intervalo de Confiana para a Mdia Populacional quando a
Varincia Desconhecida
Quando temos pequenas amostras e no conhecemos o valor do desvio
padro populacional, construmos intervalos de confiana para a mdia
populacional utilizando a distribuio t de Student para encontrar os valores
crticos (t
c
) com (n1) graus de liberdade.
Populaes infinitas:
n
s
. t x IC
c
= .
Populaes finitas:
1 N
n N
n
s
. t x IC
c
= .
Note que, agora, trabalhamos com o desvio padro amostral s, visto que o
populacional desconhecido.
5.4.1. A distribuio t de Student
Possui as seguintes caractersticas:
1) A distribuio t tem a forma de sino e simtrica em relao mdia.
2) A distribuio t uma famlia de curvas, cada uma determinada por um
parmetro chamado de grau de liberdade. Os graus de liberdade so o
nmero de escolhas livres deixadas depois que uma amostra estatstica tal
como x calculada. Quando usamos a distribuio t para estimar a mdia da
populao, os graus de liberdade so iguais ao tamanho da amostra menos
um: g.l. = n 1.
3) A rea total sob a curva 1 ou 100%.
4) A mdia, moda e mediana da distribuio t so iguais a zero.
5) Conforme os graus de liberdade aumentam, a distribuio t se aproxima da
distribuio Normal. Para mais de 30 graus de liberdade, a distribuio t est
to prxima da Normal, que podemos trabalhar diretamente com a tabela da
Normal Padro.
87
5.4.2. Nota histrica
William S. Gosset desenvolveu a distribuio t enquanto trabalhava na indstria
de cervejas Guinness, em Dublin, na Irlanda. Gosset publicou suas
descobertas usando o pseudnimo de Student. A distribuio t s vezes
chamada de distribuio t de Student.
5.4.2. A tabela da distribuio t de Student
Na tabela, alm dos graus de liberdade, voc dever procurar a coluna
correspondente a p, conforme ilustra a figura seguinte:
A soma das duas caudas da curva igual ao valor de p.
Ou seja, o nvel de significncia corresponde ao valor 1 p.
2
p
1p
0
t
c
t
c
2
p
88
Exemplo 5: a amostra 9, 8, 12, 7, 9, 6, 11, 6, 10, 9 foi extrada de uma
populao Normal. Construa um intervalo de confiana para a mdia ao nvel
de 95%.
89
Resoluo
Inicialmente, utilizando as frmulas da Estatstica Descritiva, devemos calcular
a mdia e o desvio padro dessa amostra.
7 , 8
10
87
n
x
x
i
= = =
e 00 , 2
1 n
) x x (
s
2
i
=
=
.
Os graus de liberdade da distribuio so: g.l.= n1 = 101 = 9.
Para usarmos a tabela, devemos observar a coluna correspondente a p=5%
(pois 100% 95% = 5%):
Logo, o valor crtico procurado t
c
=2,262. Substituindo na frmula temos:
43 , 1 7 , 8
10
00 , 2
. 262 , 2 7 , 8
n
s
. t x IC
c
= = = .
Assim, calculando o limite inferior e superior do intervalo, obtemos:
IC = [7,27 ; 10,13], que o intervalo que contm a verdadeira mdia
(populacional) com 95% de confiana.
Exemplo 6: voc seleciona aleatoriamente 20 instituies que realizam
financiamento para compra da casa prpria e determina o atual ndice de juros
do financiamento em cada uma delas. A mdia da amostra dos juros de
6,22%, com desvio padro de 0,42%. Encontre o intervalo de confiana de 99%
para a mdia populacional do ndice de juros do financiamento. Assuma que os
ndices de juros so aproximadamente normalmente distribudos.
90
Resoluo
Inicialmente, podemos verificar, a partir do enunciado, que x =6,22 e s=0,42.
Sendo n=20 temos g.l.=201=19.
Observando a tabela t para g.l.=19 e p=1%, encontramos t
c
=2,861. Aplicando a
frmula:
27 , 0 22 , 6
20
42 , 0
. 861 , 2 22 , 6
n
s
. t x IC
c
= = = .
Logo: IC = [5,95 ; 6,49].
Interpretao: com 99% de confiana, podemos dizer que a mdia
populacional do ndice de juros do financiamento est entre 5,95% e 6,49%.
5.5. Intervalo de Confiana para a Proporo Populacional
Agora, queremos construir um intervalo de confiana para a proporo
populacional p. Lembrando que a estimativa pontual de p dada pela
proporo de sucessos em uma amostra e denotada por
amostra da total tamanho
amostra uma em sucessos de nmero
p
= . E, ainda, p
1 q
= , que a
proporo amostral de fracassos.
Antes de construir um intervalo para a proporo, devemos verificar se a
distribuio de amostragem de p
. n e
II. 5 q
. n .
Se essas duas condies ocorrerem, podemos construir o intervalo de
confiana para a proporo, que utilizar, para a determinao do valor crtico,
a tabela da Normal:
Populaes infinitas:
n
) p
1 ( p
. z p
IC
c
= .
Populaes finitas:
1 N
n N
.
n
) p
1 ( p
. z p
IC
c
= .
Lembrese: uma populao considerada finita quando 05 , 0
N
n
> .
Importante: quando no possumos uma estimativa prvia do valor de p
,
utilizamos uma abordagem conservativa para o clculo do intervalo de
confiana, baseada no fato de que a expresso p(1p) possui valor mximo
91
igual a quando 1 p 0 . Voc pode verificar isso construindo o grfico da
funo p(1p) e achando o seu valor mximo no intervalo [0;1]. Neste caso, a
margem de erro :
n 4
1
. z E
c
= .
Exemplo 7: pretendese estimar a proporo de cura, atravs do uso de um
certo medicamento em doentes contaminados com cercaria, que uma das
formas do verme da esquistossomose. Um experimento consistiu em aplicar o
medicamento em 200 pacientes, escolhidos ao acaso, e observar que 160
deles foram curados. O que podemos dizer da proporo da populao em
geral para um nvel de confiana de 95%?
Inicialmente, vamos calcular a proporo amostral:
8 , 0
200
160
p
= = .
Utilizando a tabela da Normal, obtemos o valor crtico para 95% de confiana:
z
c
=1,96.
Aplicando a frmula:
055 , 0 8 , 0
200
) 8 , 0 1 .( 8 , 0
. 96 , 1 8 , 0
n
) p
1 ( p
. z p
IC
c
=
= .
Logo, o intervalo de confiana : IC = [0,745 ; 0,855].
Exemplo 8: o grfico a seguir foi feito com base em uma pesquisa entre 900
norteamericanos adultos. Construa um intervalo de 99% de confiana para a
populao de adultos que acham que os adolescentes so os motoristas mais
perigosos.
A partir do grfico temos que 63 , 0 p
1 ( p
. z p
IC
c
=
= .
O intervalo de confiana : IC=[0,589 ; 0,671].
Interpretao: com 99% de confiana, a proporo de adultos que acham que
os adolescentes so os motoristas mais perigosos est entre 58,9% e 67,1%.
Exemplo 9: voc est analisando uma campanha poltica e quer estimar, com
95% de confiana, a proporo dos eleitores que iro votar em um determinado
candidato. Sua estimativa deve ter uma margem de erro de 3% da populao
real. Encontre o nmero mnimo da amostra necessria se:
a) no h nenhuma estimativa prvia;
b) h uma estimativa prvia de 31 , 0 p
= ;
c) compare os resultados obtidos.
Resoluo
a) No havendo nenhuma estimativa de p
\
|
= |
\
|
= = = =
Logo, temos que o tamanho mnimo da amostra de 1068 eleitores.
b) Como temos a estimativa 31 , 0 p
= , fazemos:
|
\
|
= =
=
2
c
96 , 1
03 , 0
n
2139 , 0
96 , 1
03 , 0
n
2139 , 0
n
) 31 , 0 1 .( 31 , 0
96 , 1 03 , 0
n
) p
1 ( p
. z E
02 , 913 n .
Portanto, o tamanho mnimo da amostra, neste caso, de 914 eleitores.
c) Sem nenhuma estimativa prvia, o tamanho mnimo da amostra de 1068
eleitores. Havendo a estimativa prvia, o tamanho da amostra necessria
passa a ser de 914 eleitores. Isso ocorre por que na falta de uma estimativa
prvia, maximizamos o valor de p(1p), fazendo com que o tamanho da
amostra aumente.
5.6. Intervalo de Confiana para a Varincia e Desvio Padro
Para construirmos intervalos para a varincia e desvio padro, devemos
lembrar que a estimativa pontual para
2
s
2
e que a estimativa pontual para
s. Alm disso, devemos trabalhar com uma outra distribuio que no a
Normal nem a t-Student: usamos a qui-quadrado.
93
5.6.1. A distribuio qui-quadrado
A distribuio qui-quadrado (representa-se por
2
) uma famlia de curvas,
cada uma determinada pelos graus de liberdade. Para formar um intervalo de
confiana para
2
, usa-se a distribuio
2
com graus de liberdade iguais a
um a menos do que o tamanho da amostra, ou seja, g.l. = n 1 .
Alm disso, a rea abaixo da curva da distribuio
2
igual a 1 e as
distribuies qui-quadrado so assimtricas positivas. A distribuio qui-
quadrado utilizada quando estamos analisando a varincia de uma amostra
quando essa amostra proveniente de uma populao normalmente
distribuda.
5.6.2. A tabela da distribuio qui-quadrado
Para a construo de intervalos de confiana para a varincia e o desvio
padro, devemos obter dois valores na tabela da qui-quadrado, que
chamaremos de
2
inf
e
2
sup
. Note que a tabela nos fornece a rea direita do
valor observado.
94
Exemplo 10: vamos encontrar os valores crticos
2
inf
e
2
sup
para um intervalo
de confiana de 90%, quando o tamanho da amostra for igual a 20.
Resoluo
Os graus de liberdade so: g.l. = n 1 = 20 1 = 19.
Para um intervalo de 90%, teremos uma rea de 5% esquerda de
2
inf
e de
5% direita de
2
sup
. Mas, para utilizarmos a tabela, devemos pensar em
95
valores direita e, portanto, temos de 95% direita de
2
inf
e 5% direita de
2
sup
, conforme ilustra a figura:
Assim, os valores procurados so:
2
inf
=10,117 e
2
sup
=30,144.
5.6.3. Intervalo de confiana para a Varincia
(
(
=
2
inf
2
2
sup
2
s ). 1 n (
;
s ). 1 n (
IC
5.6.4. Intervalo de confiana para o Desvio Padro
(
(
=
2
inf
2
2
sup
2
s ). 1 n (
;
s ). 1 n (
IC
96
Exemplo 11: um farmacutico seleciona aleatoriamente 30 amostras de um
antialrgico e as pesa. O desvio padro da amostra 1,20 miligramas.
Supondo que os pesos so normalmente distribudos, construa um intervalo de
confiana de 99% para a varincia e o desvio padro da populao.
Resoluo
Devemos considerar uma rea direita de
2
inf
igual a 0,995 e uma rea
direita de
2
sup
igual a 0,005. Para g.l. = n 1 = 30 1 = 29, os valores crticos
obtidos na tabela so:
2
inf
= 13,121 e
2
sup
= 52,336.
O intervalo para a varincia :
[ ] 18 , 3 ; 80 , 0
121 , 13
) 20 , 1 ).( 1 30 (
;
336 , 52
) 20 , 1 ).( 1 30 (
IC
2 2
=
(
= .
O intervalo para o desvio padro :
[ ] 78 , 1 ; 89 , 0
121 , 13
) 20 , 1 ).( 1 30 (
;
336 , 52
) 20 , 1 ).( 1 30 (
IC
2 2
=
(
(
= .
Assim, podemos dizer com 99% de confiana que a varincia populacional est
entre 0,80 e 3,18 miligramas
2
, enquanto que o desvio padro fica entre 0,89 e
1,78 miligramas.
5.7. Exerccios
1) Em um teste com um tipo de fusvel, 9 peas foram analisadas. O tempo
mdio at queimar dessa amostra foi 19,2 minutos, com desvio-padro
populacional conhecido 2,4 minutos. Sabe-se que a populao Normal ou
Gaussiana. Calcule o intervalo de confiana de 95% para a verdadeira mdia
da populao.
2) Os pulsos em repouso de 920 pessoas sadias foram tomados, e uma mdia
de 72,9 batidas por minuto (bpm) e uma varincia de 121,0 bpm foram obtidos.
Construa um intervalo de confiana de 96% para a pulsao mdia em repouso
de pessoas sadias com base nesses dados.
3) Os QIs de 181 meninos com idades entre 6-7 anos de Curitiba foram
medidos. O QI mdio foi 108,08, e o desvio padro foi 14,38.
a) Calcule um intervalo de confiana de 95% para o QI mdio populacional dos
meninos entre 6-7 anos de idade em Curitiba usando estes dados.
b) Interprete o intervalo de confiana com palavras.
4) Seleciona-se uma amostra de 200 pixels da regio A de uma imagem,
chegando-se a uma mdia e varincia amostrais de 187,3 e 53,1
respectivamente. Construa o intervalo de confiana de 97% para a mdia
populacional.
97
5) O consumo de combustvel uma varivel aleatria com parmetros
dependendo do tipo de veculo. Suponha que para um certo automvel A, o
desvio padro do consumo seja 2 km/l, enquanto que para um automvel B, o
desvio padro de 3 km/l. A partir de uma amostra de 40 veculos do tipo A e
36 veculos do tipo B, verificamos que o consumo mdio de cada veculo foi de
9,3 km/l para o tipo A e de 11,2 km/l para o B. Ao nvel de 95% pode-se afirmar
que o veculo B mais econmico?
6) Num grupo de pacientes, o nvel de colesterol uma varivel aleatria com
distribuio Normal com varincia 64 (mg/ml)
2
. Para uma amostra de 46
indivduos que forneceu nvel mdio de colesterol de 120 mg/ml, construa o
intervalo de confiana de 88%.
7) Da experincia passada, sabe-se que o desvio padro da altura de crianas
da 5 srie 5 cm. Colhendo uma amostra de 36 dessas crianas, observou-se
a mdia de 150cm. Qual o intervalo de confiana de 95% para a mdia
populacional? Interprete.
8) Um pesquisador est estudando a resistncia de um determinado material
sob determinadas condies. Ele sabe que essa varivel normalmente
distribuda com desvio padro de 2 unidades. Utilizando os valores 4,9 ; 7,0 ;
8,1 ; 4,5 ; 5,6 ; 6,8 ; 7,2 ; 5,7 ; 6,2 unidades, obtidos de uma amostra de
tamanho 9, determine o intervalo de confiana para a resistncia mdia com
uma confiana de 90%.
9) Em uma empresa de vendas, as comisses de uma amostra de 130
vendedores so apresentadas na tabela a seguir:
R$ f
i
300 500 10
500 700 30
700 900 50
900 1100 40
Construa um intervalo de confiana de 95% para o verdadeiro salrio mdio
dos vendedores dessa empresa.
10) Foram retiradas 25 peas da produo diria de uma mquina,
encontrandose para uma determinada medida uma mdia de 5,2 mm.
Sabendo que as medidas tem distribuio Normal com desvio padro
populacional de 1,2 mm, construir intervalos de confiana para a mdia aos
nveis de 90%, 95% e 99%.
11) A partir de uma amostra de 10 indivduos, mediuse o tempo que
demoravam para a execuo de certa tarefa. Essa amostra nos revelou que o
tempo mdio gasto foi de 110 segundos com desvio padro de 10 segundos.
Construa um intervalo com 95% de confiana para a mdia populacional. Qual
hiptese devemos admitir quanto distribuio de probabilidade da populao?
12) Em quatro leituras experimentais de um comercial de 30 segundos, um
locutor levou em mdia 29,2 segundos com uma varincia de 5,76 segundos
ao quadrado. Construa um intervalo de confiana para o tempo mdio com
95% de confiabilidade.
98
13) Determine o tamanho mnimo da amostra necessrio para se estar 95%
confiante de que a mdia amostral esteja a uma unidade da mdia
populacional dado que o desvio padro populacional 4,8. Assuma que a
populao normalmente distribuda.
14) Uma amostra aleatria de 400 domiclios mostranos que 25% deles so
casas de aluguel. Construa um intervalo de confiana para a proporo de
casas de aluguem com um nvel de confiana de 98%.
15) Em 50 lances de uma moeda, foram obtidas 30 caras. Com base em um
intervalo de confiana de 96%, podese dizer que a moeda honesta?
16) Para verificar se um dado era viciado, jogouse o mesmo 120 vezes,
obtendose 25 vezes o nmero cinco. Determinar um intervalo de confiana de
99% para a proporo de nmeros cinco. Podese dizer que o dado viciado?
17) Suponha que as alturas dos alunos de uma faculdade tenham distribuio
normal com desvio padro de 15 cm. Foi retirada uma amostra aleatria de 100
alunos, obtendose uma mdia de 175 cm. Construir, ao nvel de 95%, o
intervalo para a verdadeira altura mdia dos alunos.
18) Uma mquina corta plstico em folhas que tem 50 ps de comprimento
(600 polegadas). Assuma que a populao dos comprimentos normalmente
distribuda.
a) A empresa quer estimar o comprimento mdio que a mquina est cortando
dentro de 0,125 polegada. Determine o tamanho mnimo da amostra
necessrio para construir um intervalo de confiana de 95% para a mdia
populacional. Assuma o desvio padro da populao como sendo 0,25
polegada.
b) Repita o item anterior usando uma tolerncia de erro de 0,0625 polegada.
c) Compare os itens a e b.
19) Uma amostra aleatria de 200 habitantes de uma cidade mostrou que 180
desejavam gua fluorada. Encontrar os limites de confiana de 90% para a
proporo da populao favorvel fluorao.
20) Uma amostra de 25 observaes de uma Normal ( ,16) foi coletada e
forneceu uma mdia amostral de 8. Construa um intervalo com confiana 90%
e 95% para a mdia populacional. Comente as diferenas encontradas.
21) Construa um intervalo de confiana para a mdia, ao nvel de 95%,
admitindo a seguinte distribuio amostral, oriunda de uma populao
normalmente distribuda:
Classes 0 | 5 5 | 10 10 | 15 15 | 20
f
i
2 3 5 2
22) Suponha que a varivel escolhida em um estudo seja o peso de certa pea
e que a populao seja infinita. Pelas especificaes do produto, o desvio
padro de 10kg. Logo, admitindo um nvel de confiana de 95% e um erro
amostral de 1,5kg, determine o tamanho da amostra necessria.
99
23) Ser coletada uma amostra de uma populao Normal com desvio padro
igual a 9. Pata uma confiana de 90%, determine a amplitude do intervalo de
confiana para a mdia populacional nos casos em que o tamanho da amostra
30, 50 ou 100. Comente as diferenas.
24) Suponha que uma amostra aleatria de 10 observaes aponte s
2
=2,25.
Quais os limites de confiana, a 80%, para a verdadeira varincia? Qual foi a
hiptese admitida para a distribuio de probabilidade da populao?
25) Supondo uma populao Normal, obteve-se a seguinte amostra:
44,9 44,1 43 42,9 43,2 44,5. Construa um intervalo de confiana para
a varincia ao nvel de 90%.
26) O tempo de espera, em minutos, na fila de um banco segue uma
distribuio Normal. Uma amostra de 22 pessoas foi obtida aleatoriamente e
verificou-se que o desvio padro dessa amostra foi de 3,6 minutos. Construa
um intervalo de confiana para a varincia e para o desvio padro ao nvel de
98% de confiana.
27) Um fabricante de mquinas para cortar grama est tentando determinar o
desvio padro da vida de um de seus modelos de mquinas. Para faz-lo, ele
seleciona aleatoriamente 12 mquinas que foram vendidas anos atrs e
descobre que o desvio padro da amostra 3,25 anos. Construa um intervalo
de confiana para o desvio padro ao nvel de 99% de confiana.
Respostas
1) IC = [17,6 ; 20,8]
2) IC = [72,2 ; 73,6]
3) a) IC = [105,99 ; 110,17]
b) Com uma confiana de 95%, a verdadeira mdia de QIs populacional de meninos entre 6
e 7 anos de idade que residem em Curitiba encontra-se no intervalo [105,99 ; 110,17], ou
ainda, se fossem retiradas 100 amostras de meninos e calculadas as mdias de seus QIs,
em 95 delas a mdia estaria dentro do intervalo apresentado.
4) IC = [186,2 ; 188,4]
5) Como IC
A
= [8,7 ; 9,9] e IC
B
= [10,2 ; 12,2], ou seja, no h uma interseco entre os dois
intervalos; ao nvel de 95% podemos afirmar que o automvel B mais econmico que o A
(empate tcnico).
6) IC = [118,2 ; 121,8]
7) IC = [148,4 ; 151,6]. Esse IC indica que com 95% de confiana a verdadeira mdia das
alturas de crianas de 5 srie est compreendida entre 148,4 cm e 151,6 cm. De outra
maneira, podemos dizer que se fossem retiradas 100 amostras de tamanho 36 dessas
crianas e calculadas as respectivas mdias, em 95 amostras a mdia estaria dentro do
intervalo [148,4 ; 151,6].
8) IC = [5,1 ; 7,3]
9) 62 , 784 x = e s = 184,04
IC = [752,98 ; 816,26]
10) Para 90%: IC = [4,81 ; 5,59]. Para 95%: IC = [4,73 ; 5,67]. Para 99%: IC = [4,58 ; 5,82].
11) IC=[102,84 ; 117,16]. Devese admitir a hiptese de que a distribuio de probabilidade
da populao seja Normal.
12) IC=[26,38 ; 32,02].
13) 89
14) IC=[20% ; 30%]
100
15) IC=[0,46 ; 0,74]. Logo, ao nvel de 96%, podese dizer que a moeda honesta, pois o
IC contm a proporo de 50% de caras.
16) No se pode dizer, ao nvel de 99%, que o dado seja viciado, pois o intervalo de
confiana para a proporo de nmeros cinco contm p=1/6=0,17, senco IC=[0,11 ; 0,31].
17) IC=[172,06cm ; 177,94cm].
18) a) 16 folhas.
b) 62 folhas.
c) E=0,0625 requer um tamanho de amostra maior. Conforme o tamanho do erro descresce,
uma amostra maior tem que ser retirada para obter informao suficiente a partir da
populao para assegurar a correo desejada.
19) IC=[0,56; 0,65].
20) Para 90%: IC=[6,688 ; 9,312]. Para 95%: IC=[6,432 ; 9,568]. Quanto maior for a
confiana, maior ser o tamanho do intervalo.
21) IC=[7,26 ; 13,58].
22) 178 peas.
23) Com n=30, a amplitude 5,39; para n=50 4,17 e para n=100 a amplitude 2,95;
quanto maior for o n, menor ser a amplitude.
24) IC=[1,38 ; 4,86]. Admite-se que a distribuio de probabilidade da populao seja
Normal.
25) IC=[0,32 ; 3,13].
26) Varincia: IC=[7,0 ; 30,6]. Desvio padro: IC=[2,6 ; 5,5].
27) IC=[2,08 ; 6,68].