Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
No captulo anterior, procuramos conhecer a variabilidade de algum processo com base em observaes das variveis pertinentes. Nestes trs prximos
captulos, continuaremos a estudar os processos que envolvem variabilidade,
aleatoriedade ou incerteza, mas procuraremos construir modelos matemticos
para facilitar a anlise. Esses modelos normalmente so construdos a partir de
suposies sobre o processo, mas podem tambm basear-se em dados observados no passado.
O leitor j deve ter ouvido falar de probabilidade ou de modelos probabilsticos. H dois aspectos a considerar. O primeiro que intuitivamente as pessoas
procuram tomar decises em funo dos fatos que tm maior probabilidade de
ocorrer. Veja os seguintes exemplos:
a) se o cu est nublado, ento h chance considervel de chover.
Deve-se levar um guarda-chuva ao sair de casa!;
b) se um inspetor de qualidade est observando as peas produzidas
por uma mquina, e verifica que elas esto saindo fora do padro,
ento ele pode deduzir que existe alta chance de essa mquina continuar produzindo peas fora do padro. Logo, a mquina dever receber ateno especial;
c)
O segundo aspecto a incerteza inerente s decises que podem ser tomadas sobre determinado problema.
a) por mais nublado que o cu esteja, pode no chover, ao menos durante o perodo de tempo em que a pessoa estiver fora de casa;
b) algumas peas poderiam estar fora do padro por motivos meramente casuais. O processo pode estar funcionando bem;
c)
Se for possvel quantificar a incerteza associada a cada fato, algumas decises tornam-se mais fceis. Veja os casos a seguir:
a)
b)
a)
b)
c)
Nos casos em que os possveis resultados de um experimento aleatrio podem ser listados (caso discreto), um modelo probabilstico pode ser entendido
como a listagem desses resultados, acompanhados de suas respectivas probabi-
Figura 4.1
4.1
Exemplo 4.2 Seguem alguns experimentos aleatrios com os respectivos espaos amostrais:
a) lanamento de um dado e observao da face voltada para cima:
b) retirada de uma carta de um baralho comum (52 cartas) e observao do naipe: = {copas, espadas, ouros, paus};
c)
1
Note que no h um limite superior conhecido, mas somente possvel a ocorrncia de
valores inteiros.
2
3.
Os elementos para se tomar alguma deciso podem corresponder a um conjunto de resultados (ou evento) associados ao experimento aleatrio. Por exemplo, se o dimetro D de um eixo, em mm, que sai da linha de produo, pertencer ao conjunto (ou evento) A = {49,0 D 51,0}, ento se decide que ele
adequado.
AC
= {2, 4, 6};
A =
Algumas intersees:
A B = {4, 6};
A C = {6}; A = {} = 0 .
EXERCCIOS
1.
b)
c)
Contagem do nmero de clientes numa fila nica de banco, que chegam durante uma hora.
2.
b)
4.2
DEFINIES DE PROBABILIDADE
4.2.1
(4.1)
4.2.2
(4.2)
medida que o experimento repetido mais e mais vezes, sob as mesmas
condies, a freqncia relativa do evento A tender a ficar cada vez mais prxima da probabilidade de ocorrncia do evento A. Mais especificamente:
(4.3)
Exemplo 4.5 Um fabricante de lmpadas fluorescentes precisa especificar o
tempo de garantia de um de seus modelos. Embora os projetistas estimem que
o tempo mdio de vida do modelo seja de 5.000 horas, no se sabe exatamente
como as lmpadas iro comportar-se. E sem esse conhecimento seria temerrio
especificar o tempo de garantia.
Ao definir o experimento aleatrio como ligar a lmpada e registrar o tempo (em horas) que ela funciona, o espao amostrai formado pelo conjunto de
todos os valores maiores ou iguais a zero, ou seja:
Seja o evento:
At = a lmpada funcionar at o tempo t
Podemos repetir o experimento com um nmero n suficientemente grande
de lmpadas.4 Com os resultados do experimento, podemos calcular as freqncias relativas:
(4.4)
para diversos valores de t. Essas freqncias relativas podem ser usadas como
valores aproximados das probabilidades P(At) e, assim, definir adequadamente
o tempo de garantia, de tal forma que ele no seja demasiadamente longo, pois
a seria necessrio repor muitas lmpadas (custo financeiro alto), mas tambm
no seja muito curto, o que pode gerar a suspeita de um produto com baixa
qualidade, acarretando perda de mercado.
Em muitas situaes, impossvel realizar o experimento diversas vezes.
Veja o exemplo seguinte.
Exemplo 4.6 Quando estudamos o regime de vazes de um rio, com o objetivo de avaliar a viabilidade da construo de uma usina hidreltrica, no possvel replicarmos os diversos meses e anos, fenmenos climticos e eventual in4
H mtodos estatsticos para calcular n (tamanho da amostra), conforme ser visto no
Captulo 7.
4.2.3
(4.6)
Note que, ao unir A e A' temos o espao amostrai
, que tem probabilidade igual a 1. Pelo axioma (c),
temos a expresso do evento complementar.
No experimento do dado, temos, por exemplo, P(ocorrer seis)
= P({6}) = 1/6. Pela propriedade do evento complementar: P(no
ocorrer seis) = 1 - 1/6 = 5/6.
4.
EXERCCIOS
3.
Mostre que:
4.3
Condio do peso
Dentro das especificaes (D)
Fora das especificaes (F)
Total
B (B)
C CC)
UHT (U)
Total
500
4.500
1.500
6.500
30
270
50
350
530
4.770
1.550
6.850
b) Qual a probabilidade de o pacote de leite retirado estar fora das especificaes, sabendo-se que do tipo UHT?
Resp.: Nesse caso, o espao amostrai ficou restrito s 1.550 unidades
de leite UHT. Destas, 50 satisfazem ao evento. Ento:
(4.8)
Note que no denominador temos a probabilidade do evento que supostamente aconteceu, mas calculada nas condies originais do experimento.
Se houver interesse no oposto, isto , na probabilidade de ocorrncia de B
condicionada ocorrncia prvia de A, sendo P(A) > 0, temos:
(4.9)
importante ressaltar que a operao de interseco comutativa, impli-
I-
ESTATSTICA
(1,1)
(2,1)
(3,1)
(4,1)
(5,1)
(6,1)
(1,2)
(2,2)
(3,2)
(4,2)
(5,2)
(6,2)
(1,3)
(2,3)
(3,3)
(4,3)
(5,3)
(6,3)
(1,4)
(2,4)
(3,4)
(4,4)
(5,4)
(6,4)
(1,5)
(2,5)
(3,5)
(4,5)
(5,5)
(6,5)
(1,6)
(2,6)
(3,6)
(4,6)
(5,6)
(6,6)
Considere os eventos:
E1 = faces iguais = {(1,1), (2,2), (3,3), (4,4), (5,5), (6,6)} e
E2 = soma das faces menor ou igual a 5 =
= {(1,1), (1,2), (1,3), (1,4), (2,1), (2,2), (2,3), (3,1), (3,2), (4,1)}.
Calculando
a) A probabilidade de as faces serem iguais, sabendo que a soma menor ou igual a 5. Ou seja:
Note que, se o espao amostrai for restringido ao evento conhecido, E2, temos 10 resultados possveis, sendo que 2 satisfazem tambm ao evento de interesse, El1, o que torna natural a probabilidade
condicional ser 2 / 10 .
b) A probabilidade de a soma das faces ser menor ou igual a 5, sabendo que as faces so iguais. Ou seja:
4.3.1
A regra do produto
(4.12)
importante que seja observada a seqncia lgica dos eventos para montar as expresses precedentes.
Exemplo 4.9. Uma caixa contm 4 cartes amarelos e 8 vermelhos. Retiramos, ao acaso, 2 cartes, um aps o outro, sem reposio, e observamos as cores dos dois cartes.
a) Qual a probabilidade de que ambos sejam amarelos?
Chamando de Ai o evento que representa carto amarelo na
i-sima extrao e Vi o evento que representa carto vermelho na
i-sima extrao (i = 1, 2), temos o seguinte espao amostrai:
1- extrao
Figura 4.3
2- extrao
4.3.2
Eventos independentes
O Exemplo 4.10 parecido com o exemplo anterior, mas com a amostragem feita com reposio. Verifique que os clculos tornam-se mais simples, pois
a configurao da urna no se altera na segunda extrao.
Exemplo 4.10 Uma caixa contm 4 cartes amarelos e 8 vermelhos. Retiram-se, ao acaso, 2 cartes da caixa, um aps o outro, sendo que o primeiro
1- extrao
Figura 4.4
2- extrao
Embora a implicao seja dos dois lados, normalmente as condies do experimento permitem verificar se razovel supor independncia entre os eventos e, em caso afirmativo, o clculo da probabilidade da interseo pode ser fatorado nas probabilidades dos eventos independentes.
Quando a populao for bastante grande em relao ao tamanho da amostra, mesmo que a amostragem seja feita sem reposio, podemos supor independncia. Imagine que no experimento do Exemplo 4.9 haja 4.000 cartes
amarelos e 8.000 vermelhos. Ao extrair dois cartes, a probabilidade de sair
amarelo na segunda extrao de aproximadamente 4 / 12 , independentemente
de ter sado amarelo ou vermelho na primeira extrao.
Exemplo 4.11. Considere um sistema composto de n componentes ligados em
srie, de tal forma que, se um componente falhar, o sistema todo falha. Esquematicamente:
Se os componentes operam independentemente e cada um tem probabilidade p de falhar, qual a probabilidade de o sistema funcionar?
Resp.: (1 -p)n (verifique o porqu; use a regra do produto para eventos
independentes).
EXERCCIOS
8.
9.
4.4
Exemplo 4.12. Imagine que voc utiliza peas de quatro fornecedores, que
tm diferentes desempenhos quanto a sua qualidade. As peas so classificadas
como conformes ou no conformes e voc conhece a proporo de peas no
conformes de cada fornecedor (p l ,p 2 , p 3 e p 4 ). Considere a formao de um lote
com peas dos quatro fornecedores, conforme ilustra a Figura 4.5. Se voc selecionar, ao acaso, uma das peas do lote, qual a probabilidade de ela ser no
conforme?
Fornecedor:
(1)
(2)
(3)
(4)
A resposta seria simples se voc soubesse de qual fornecedor a pea selecionada, mas voc no sabe. O chamado teorema da probabilidade total permite
solucionar esse problema.
Considere o espao amostrai particionado em k eventos,
tisfazendo s seguintes condies:
E1
,E2,
Ek, sa-
Figura 4.6
ou
(4.16)
4.5
TEOREMA DE BAYES
O teorema de Bayes est intimamente relacionado ao teorema da probabilidade total. Supem-se as mesmas condies (eventos Et mutuamente exclusivos e exaustivos e um evento F qualquer). Basicamente, o teorema de Bayes
permite obter a probabilidade de que um dos eventos Et ocorra, sabendo-se que
o evento F ocorreu. Para o caso das peas dos quatro fornecedores, o Teorema
de Bayes permite responder a questes do tipo: "sabendo-se que a pea no
conforme, qual a probabilidade de que tenha vindo do fornecedor 4?"
De maneira geral, usando a expresso (4.8), temos:
EXERCCIOS
10. Uma caixa contm trs cartes verdes, quatro amarelos, cinco azuis e trs
vermelhos. Dois cartes so retirados da caixa, ao acaso, um aps o outro,
sem reposio. Anotam-se suas cores. Calcular a probabilidade de que:
a)
b)
11. Uma rede local de computadores composta por um servidor e cinco clientes (A, B, C, D e E). Registros anteriores indicam que dos pedidos de determinado tipo de processamento, realizados atravs de uma consulta, cerca
de 10% vm do cliente A, 15% do B, 15% do C, 40% do D e 20% do E. Se
o pedido no for feito de forma adequada, o processamento apresentar
erro. Usualmente, ocorrem os seguintes percentuais de pedidos inadequados: 1% do cliente A, 2% do cliente B, 0,5% do cliente C, 2% do cliente D e
8% do cliente E.
a)
b)
EXERCCIOS
COMPLEMENTARES
12. A probabilidade de que Joozinho resolva este problema 0,5. A probabilidade de que Mariazinha resolva este problema 0,7. Qual a probabilidade de o problema ser resolvido se ambos tentarem independentemente?
13. Um sistema tem dois componentes que operam independentemente. Suponha que as probabilidades de falha dos componentes 1 e 2 sejam 0,1 e 0,2,
respectivamente. Determinar a probabilidade de o sistema funcionar nos
dois casos seguintes:
a)
b)
14. Um sistema tem quatro componentes que operam independentemente, sendo que cada componente tem probabilidade 0,1 de no funcionar. O sistema ligado da seguinte forma:
b)
c)
construa o modelo probabilstico, considerando que se esteja observando o sexo (masculino ou feminino) dos sorteados;
b)
c)
17. Est sendo avaliada a qualidade de um lote de peas numa indstria cermica, onde esto misturados 30 pisos e 40 azulejos.
a)
b)
retiram-se duas peas ao acaso do lote, uma aps a outra, com reposio, e observa-se o tipo de cermica. Construa o modelo probabilstico
para esta situao;
c)
d)
e)
18. A caixa I tem 8 peas boas e 2 defeituosas; a caixa II tem 6 peas boas e 4
defeituosas; a caixa III tem 9 peas boas e 1 defeituosa.
a)
tira-se, aleatoriamente, uma pea de cada caixa. Determinar a probabilidade de serem todas boas;
b)
escolhe-se uma caixa ao acaso e tira-se uma pea. Determinar a probabilidade de ser defeituosa;
c)
escolhe-se uma caixa ao acaso e tira-se uma pea. Calcular a probabilidade de ter sido escolhida a caixa I, sabendo-se que a pea defeituosa.
19. A qualidade de CDs foi avaliada em termos da resistncia a arranho e adequao das trilhas. Os resultados de 1.000 CDs foram:
Resistncia a arranho
Reprovado
Alta
700
140,
Baixa
100
60
b)
c)
ser aprovado na avaliao das trilhas, dado que tem resistncia a arranho alta?
d)
ter resistncia a arranho alta, dado que foi aprovado na avaliao das
trilhas?
5.1
VARIVEL ALEATRIA
Formalmente, uma varivel aleatria uma funo que associa elementos do espao amostrai ao conjunto de nmeros reais.
As variveis aleatrias podem ser discretas ou contnuas, conforme mostra
a Figura 5.1.
5.1.1
Distribuio de probabilidades
0 = 1. 2, 3, 4, 5, 6).
1
Se houver mais de duas categorias (por exemplo, A, B e C), podemos usar mais de uma
varivel indicadora. No caso de trs categorias, podem ser empregadas as variveis aleatrias X e
Y, ondeX = 1 se ocorrer B, eX = 0 caso contrrio; Y = 1 se ocorrer C, e Y = 0 caso contrrio. A
ocorrncia de A estaria representada por X = 0 e Y = 0.
A distribuio de probabilidades de uma varivel aleatria X a descrio do conjunto de probabilidades associadas aos possveis valores de X, conforme foi ilustrado no exemplo precedente. Observe que a soma das probabilidades dos valores possveis de X igual a 1 (um).
Se X for discreta, com possveis valores {x1 , x2, ...}, ento a distribuio de
probabilidades de X pode ser apresentada pela chamada funo de probabilidade, que associa a cada valor possvel xt a sua probabilidade de
ocorrncia p(x) ou seja:
Existe certa similaridade entre as distribuies de probabilidades e as distribuies de freqncias vistas no Captulo 3. Contudo, na distribuio de probabilidades so mostrados os possveis valores e no os valores efetivamente observados. Alm disso, as probabilidades so, geralmente, alocadas a partir de
suposies a respeito do experimento aleatrio em questo, enquanto as freqncias so obtidas com efetivas realizaes do experimento.
A Figura 5.2 apresenta grficos que podem ser usados para representar a
distribuio de probabilidade de uma varivel aleatria discreta. O grfico em
hastes (do lado esquerdo) tpico para variveis aleatrias discretas. J o grfico em forma de histograma (do lado direito) construdo com o cuidado de a
rea total ser igual unidade.
5.1.2
Observe que os pontos em que a funo de probabilidade descreve probabilidades no nulas correspondem a saltos na funo de distribuio acumulada
e, tambm, que a altura de cada salto eqivale ao valor da probabilidade naquele ponto. Assim, para todo x e R, h uma relao direta entre p(x) e F(x).
5.1.3
Na anlise exploratria de dados, discutimos algumas medidas (particularmente, a mdia, a varincia e o desvio padro - Captulo 3) para sintetizar as
informaes sobre distribuies de freqncias de variveis quantitativas. De
forma anloga, essas medidas tambm podem ser definidas para as variveis
aleatrias, com o objetivo de sintetizar caractersticas relevantes de uma distribuio de probabilidades. Considere uma varivel aleatria X e sua distribuio
de probabilidades:
E a varincia por:
(5.3)
Alternativamente, a varincia pode ser calculada por:2
(5.4)
As relaes (b) e (g) mostram que ao somar uma constante a uma varivel
aleatria, a distribuio de probabilidades deslocada por esta constante, mas
a variabilidade preservada. Todavia, ao multiplicar a varivel aleatria por
uma constante - relaes (c) e (h) -, o centro da distribuio deslocado na
mesma proporo e a variabilidade tambm alterada (ver Figura 5.3).
5.1.4
Considere que um dado seja lanado duas vezes, sob as mesmas condies. Seja X( a varivel aleatria que representa o nmero de pontos obtido no
z-simo lanamento ( = 1, 2). Supondo que o dado seja perfeitamente equilibrado e o lanamento imparcial, ento X1 e X2 tm a mesma funo de probabilidade, que dada por:
P(j) =
/6
(j = 1, 2, 3, 4, 5, 6)
S = X1 + X2
A funo de probabilidade de S pode ser obtida com base em funes de
probabilidades de Xl e X2 , resultando em:
mos representar o evento sair nmero par nos dois lanamentos do dado por:
{X1 (2, 4, 6), X2 (2, 4, 6)}
E a probabilidade deste evento por:
(5.6)
(5.7)
EXERCCIOS
1.
b)
c)
Nmero de peas com defeito em uma amostra de duas peas, sorteadas aleatoriamente de um grande lote, em que 40% das peas so defeituosas;
d)
Nmero de peas com defeito em uma amostra de trs peas, sorteadas aleatoriamente de um grande lote, em que 40% das peas so defeituosas.
2.
3.
4.
5.
Considere que um produto pode estar perfeito (B), com defeito leve (DL)
ou com defeito grave (DG). Seja a seguinte distribuio do lucro (em R$),
por unidade vendida desse produto:
6.
a)
b)
c)
E se o lucro duplicou, qual o novo valor esperado e varincia do lucro por unidade?
Certo tipo de conserva tem peso lquido mdio de 900 g, com desvio padro de 10 g. A embalagem tem peso mdio de 100 g, com desvio padro
de 4 g. Suponha que o processo de enchimento das embalagens controla o
peso lquido, de tal forma que se possa supor independncia entre o peso
lquido e o peso da embalagem. Qual a mdia e o desvio padro do peso
bruto?
5.2
5.2.1
Distribuio de Bernoulli
5.2.2
Distribuio Binomial
Na maior parte das vezes, so realizados n ensaios de Bernoulli. O interesse est no nmero X de ocorrncias de sucesso, como nos exemplos a seguir:
a)
X = X1 + X2 + ... + Xn
(5.11)
onde Xl9 X2, ...,Xn so variveis aleatrias independentes, sendo cada uma delas
com distribuio de Bernoulli de parmetro p. Como Xt ser 0 ou 1, dependendo da ocorrncia ou no de sucesso no i-simo ensaio (i = 1, 2, ..., n), ento a
soma X corresponder ao nmero de sucessos. Para especificarmos a funo de
probabilidade de X, considere o seguinte exemplo:
Exemplo 5.1 Uma indstria processadora de suco classifica os carregamentos
de laranja que chegam a suas instalaes em A, B ou C. Suponha independncia
entre as chegadas dos carregamentos, isto , a classificao de um no altera a
classificao dos demais. Suponha tambm que a probabilidade p de classificao na classe A a mesma para todos os carregamentos. Para os prximos 4
carregamentos, seja X a varivel aleatria que representa o nmero de carregamentos classificados na classe A. Vamos calcular a probabilidade de que X assuma o valor x, isto , a probabilidade de que x carregamentos sejam classificados
na classe A (x = 0, 1, 2, 3, 4).
Para cada carregamento, seja S (sucesso) quando este for classificado na
classe A; e seja F (fracasso) quando este for classificado em outra classe. A Figura 5.4 mostra todas as possveis seqncias de resultados, os possveis valores
de X e as correspondentes probabilidades.
Resultados possveis de 4 carregamentos:
(1 - p ) ( 1 - p ) ( l - p ) ( 1 - p ) = (1 - p ) 4 . O evento X = 1 ocorre quando um carregamento for classificado na classe A (SFFF ou FSFF ou FFSF ou FFFS). Como
cada um desses resultados tem probabilidade p( 1 - p) 3 , a probabilidade do
evento X = 1 igual a 4p(l - p) 3 . As outras probabilidades podem ser obtidas
de forma anloga.
Coeficientes binomiais
Na Figura 5.4, podemos observar que no clculo da probabilidade do
evento X = 1, contamos de quantas maneiras poderia aparecer um sucesso entre as quatro possibilidades, assim encontramos a quantidade quatro, correspondente s seguintes seqncias de respostas: SFFF, FSFF, FFSF e FFFS.
Em geral, na distribuio binomial, para calcular a probabilidade do evento X = x, onde x um valor possvel da varivel aleatria X, precisamos conhecer o nmero de maneiras em que podemos combinar os x sucessos entre os n
ensaios. Esse valor, conhecido como coeficiente binomial, entra no clculo da
probabilidade como um coeficiente das potncias de p e 1 - p, como verificamos na Figura 5.4.
(5.13)
Exemplo 5.2 (continuao). Historicamente, 3 0 % dos carregamentos so classificados na classe A, em que podemos supor que a probabilidade p de um carregamento ser classificado na classe A 0,3. Entre os quatro prximos carregamentos, calculemos a probabilidade de exatamente dois serem classificados na
classe A.
T e m o s n = 4 e p = 0,3. Assim, a probabilidade de x carregamentos serem
classificados na classe A dada por:
Se X tem distribuio binomial de parmetros nep, ento seu valor esperado e sua varincia p o d e m ser calculados por:
E(X)
= n.p
V(X) = n.p. (1 - p)
(5.14)
(5.15)
A Figura 5.5 mostra duas distribuies binomiais com a indicao da posio dos respectivos valores esperados.
EXERCCIOS
7.
8.
b)
c)
d)
e)
e de itens bons?
5.2.3
Distribuio hipergeomtrica
Considere o problema bsico de inspeo por amostragem, em que observamos uma amostra de n itens de um lote com N itens, sendo r defeituosos.
Avaliamos o nmero X de itens defeituosos na amostra. A varivel aleatria X
aparenta ser binomial, mas s realmente binomial se:
a seleo da amostra for aleatria (para garantir a mesma probabilidade p de sair item defeituoso em todos os ensaios);
com reposio (para garantir independncia entre os ensaios).
A segunda condio no costuma ser satisfeita na prtica. Se a amostragem for aleatria, mas sem reposio, a distribuio de X conhecida como hipergeomtrica de parmetros N, n e r (ver Figura 5.6).
Amostra com n itens
Figura 5.6
Caso tpico de inspeo por amostragem. Varivel aleatria em estudo: X = nmero de defeituosos na amostra.
(5.16)
P(X 1) = 1 - P(X = 0)
Usando o modelo hipergeomtrico:
EXERCCIOS
9.
Qual a probabilidade do Exemplo 5.3, se a inspeo completa for feita somente quando forem encontradas mais do que uma placa defeituosa na
amostra?
5.2.4
Distribio de Poisson
Ento, sendo X a taxa mdia de consultas por unidade de tempo, as probabilidades de X p o d e m ser calculadas pela chamada distribuio de Poisson, cuja
funo de probabilidade dada por:
Exemplo 5.4 Supondo que as consultas n u m banco de dados ocorrem de forma independente e aleatria, c o m u m a taxa mdia de trs consultas por minuto, calculemos a probabilidade de que no prximo minuto ocorram menos do
que trs consultas.
(5.24)
EXERCCIOS
11. Mensagens chegam a um servidor de acordo com uma distribuio de
Poisson, com taxa mdia de cinco chegadas por minuto.
a)
b)
EXERCCIOS COMPLEMENTARES
13. Um armazm abastecido mensalmente, sendo que a taxa mdia de abastecimento 30 unidades/dia, com desvio padro de 3 unidades/dia. A demanda mdia de 25 unidades/dia, com desvio padro de 4 unidades/dia.
Suponha que o abastecimento e a demanda sejam independentes e, alm
disso, a demanda e o abastecimento num dia no alteram o abastecimento
e a demanda nos dias seguintes. Qual o valor esperado e o desvio padro
do excedente de produtos, no perodo de um ms?
14. Suponha que 10% dos clientes que compram a crdito em uma loja deixam
de pagar regularmente suas contas (prestaes). Se num particular dia, a
loja vende a crdito para 10 pessoas, qual a probabilidade de que mais de
20% delas deixem de pagar regularmente as contas? Suponha que as 10
pessoas que fizeram credirio nesse dia correspondam a uma amostra aleatria de clientes potenciais desta loja.
15. Em um sistema de transmisso de dados, existe uma probabilidade igual a
0,05 de um lote de dados ser transmitido erroneamente. Foram transmitidos 20 lotes de dados para a realizao de um teste de anlise da confiabilidade do sistema.
a)
Qual o modelo terico mais adequado para esse caso? Por qu?
b)
c)
Calcule a probabilidade de que haja erro na transmisso em exatamente 2 dos 20 lotes de dados.
d)
b)
a distribuio binomial;
b)
a distribuio de Poisson.
19. Uma central telefnica recebe, em mdia, 300 chamadas na hora de maior
movimento, e pode processar, no mximo, 10 ligaes por minuto. Utilizando a distribuio de Poisson, calcular a probabilidade de que a capacidade da mesa seja ultrapassada em dado minuto do horrio de pico.
20. Um piso cermico tem, em mdia, 0,01 defeito por m 2 . Em uma rea de
10 m x 10 m desse piso, calcule a probabilidade de ocorrer algum defeito.
2 1 . Placas de circuito integrado so avaliadas aps serem preenchidas com
chips semicondutores. Considere que foi produzido um lote de 20 placas e
selecionadas 5 para avaliao. Calcule a probabilidade de encontrar pelo
menos uma placa defeituosa, supondo que o lote tenha 4 defeituosas e que
tenha sido realizada:
a)
b)
22. Suponha que o nmero de falhas em certo tipo de placa plstica tenha distribuio de Poisson, com taxa mdia de 0,05 defeito por m 2 . Na construo de um barco, necessrio cobrir uma superfcie de 3 m x 2 m com essa
placa.
a)
b)
Qual a probabilidade de que haja mais que uma falha nessa superfcie?
c)
b)
c)
Qual a varincia da venda do fabricante, por milhar de rolhas vendidas, se ele aceitar a proposta do comprador?
b)
6.1
Exemplo 6.1a Um crculo dividido em dois setores de mesmo tamanho (180 cada um), aos quais so atribudos os nmeros 1 e 2. Um ponteiro preso ao centro do crculo e girado, conforme mostra a figura ao lado. Seja a varivel aleatria
discreta X = nmero do setor apontado quando o ponteiro pra
de girar. A distribuio de probabilidades de X, considerando
que todos os pontos sejam equiprovveis, pode ser especificada
pela funo de probabilidade da Figura 6.1.
Figura 6.1 Trs formas de apresentao da funo de probabilidade do experimento aleatrio do exemplo 6.1a.
Figura 6.2
Exemplo 6.1c Imagine que o crculo seja dividido em 8, 16 e 32 setores. A Figura 6.3 mostra a funo de probabilidade de X em cada caso.
Figura 6.3 Representaes grficas das funes de probabilidade dos experimentos aleatrios do Exemplo 6.1c.
fcil verificar que medida que aumentamos o nmero de divises no
crculo, o nmero de possveis setores (resultados de uma varivel aleatria discreta) vai aumentando, e a probabilidade de cada resultado ocorrer (representada pela rea de um retngulo) vai sendo reduzida. Teoricamente, o crculo
pode ser dividido em infinitos setores, o que torna invivel a representao tabular ou grfica da distribuio de probabilidades, da forma como fizemos no
Exemplo 6.1. Em termos matemticos, teramos:
6.1.1
Figura 6.4
Note que os eventos associados a uma varivel aleatria contnua so intervalos (ou coleo de
intervalos) dos nmeros reais. Com base na funo
densidade de probabilidade, podemos calcular probabilidades de eventos desse tipo. Por exemplo,
qual a probabilidade do ponteiro parar no intervalo [30, 60]? Tomando a rea do retngulo indicado na figura ao lado, temos:
Observe que a incluso ou excluso dos extremos no altera a probabilidade, pois uma linha tem rea nula. Ou seja, para uma varivel aleatria contnua, a probabilidade de ocorrer um particular valor igual a zero.
6.1.2
(6.2)
Considere a funo densidade de probabilidade do Exemplo 6.3:
Vamos obter a funo de distribuio acumulada. Como a expresso matemtica se altera no ponto zero, devemos considerar os dois seguintes casos:
Cabe observar que possvel obter qualquer probabilidade atravs da funo de distribuio acumulada. Para a < b, temos:
(6.3)
(6.4)
(6.5)
Retomando o Exemplo 6.3, o clculo de P(T > 3) pode ser feito aplicando (6.4):
Dada a funo de distribuio acumulada F, podemos obter a funo densidade de probabilidade f por:
(6.6)
para todo ponto x em que F derivvel.2 Assim, a funo F tambm caracteriza
a distribuio de probabilidades de uma varivel aleatria.
6.1.3
Uma varivel aleatria contnua X, com funo densidade de probabilidade f, tem valor esperado e varincia definidos por:
(6.7)
(6.8)
EXERCCIOS
1.
2.
b)
c)
[20, 24] tem a mesma probabilidade. Como pode ser descrita, grfica e algebricamente, a funo densidade de probabilidade? Sob essa densidade,
calcule:
3.
Calcule:
6.2
6.2.1
Distribuio uniforme
Relembremos o Exemplo 6.2, onde tnhamos um crculo e um ponteiro que era colocado a girar. A varivel
aleatria de interesse era X = ngulo formado entre a posio que o ponteiro pra e a linha horizontal do lado direito.
Sups-se, tambm, no existir regio de preferncia para o
ponteiro parar. Nessas codies, podemos considerar que
todo intervalo de mesma amplitude, contido em [0o, 360),
tem a mesma probabilidade de ocorrncia. um experimento tpico em que a chamada distribuio uniforme apropriada.
Uma varivel aleatria X tem distribuio uniforme de parmetros e ,
sendo > , se sua densidade especificada por:
(6.10)
Em conseqncia, sua distribuio acumulada dada por (ver Figura 6.5):
(6.11)
Figura 6.5
Representao grfica da funo densidade de probabilidade e da funo de distribuio acumulada de uma varivel aleatria com distribuio uniforme em [, ].
(6.12)
(6.13)
6.2.2
Distribuio exponencial
Para chegarmos formulao matemtica da distribuio exponencial, vamos considerar a equivalncia entre os dois seguintes eventos:
Figura 6.7
Em geral, mais fcil partir do complemento de F(t) para calcular as probabilidades, ou seja, para t > 0,
(6.16)
Exemplo 6.3 (continuao) Dada a varivel aleatria T = tempo de
resposta na consulta a um banco de dados por minutos) com funo densidade
de probabilidade
ou seja, uma exponencial com = 2, calcular a probabilidade da consulta demorar mais que 3 minutos, isto , P(T > 3). Podemos partir da funo de densidade, fazendo:
(6.18)
Um exemplo do clculo do valor esperado e da varincia de uma exponencial foi feito na Seo 6.1.3. Observe que podemos obter os mesmos resultados
com (6.17) e (6.18).
EXERCCIOS
6.
7.
b)
c)
Sabendo-se que o transistor j durou 500 horas, calcule a probabilidade de ele durar mais 500 horas.
t)
Essa propriedade conhecida como "falta de memria", pois no importa o que aconteceu no passado (T s), mas apenas a partir do momento
em que se inicia a observao, que pode ser considerado como o instante
zero. Nesse contexto, a distribuio exponencial inadequada para representar "tempo de vida" de itens que sofrem efeito de fadiga.
6.2.3
Distribuio normal
e a varincia da dis
Figura 6.10
(6.24)
tem distribuio normal com mdia zero e desvio padro unitrio, ou seja, Z :
N(0,1), que tambm conhecida como distribuio formal padro. Qualquer
rea (probabilidade) sob a densidade de X pode ser avaliada sob a densidade
de Z, conforme ilustra a Figura 6.11. Dessa forma, qualquer problema relativo a
uma distribuio normal pode ser pensado em termos da distribuio normal
padro.
Distribuio de X:
normal com = 170e = 10
Figura 6.11
Distribuio de Z:
normal padro
Transformao do evento {X > 180}, da distribuio normal de parmetros = 170 e = 10, em um evento da distribuio normal
padro: {Z > 1}.
Figura 6.12
Mais formalmente,
(0,42) = P(Z < 0,42) = 1 - P(Z > 0,42) = 1 - 0,3372 = 0,6628
b) P(Z < 0,42). O esquema seguinte mostra esta probabilidade em termos de rea e como podemos usar a simetria da curva para obt-la
na Tabela 3.
Ou seja,
P(Z < - 0,42) = P(Z > 0,41) = 0,3372
c) P ( - 0,42 < Z < 0,42).
Entrando com o valor de rea 0,025 na Tabela 3 do apndice, encontramos o valor de z igual a 1,96. Esse processo ilustrado a seguir.
Exemplo 6.6 Suponha que a absoro de gua (%) em certo tipo de piso cermico tenha distribuio normal com mdia 2,5 e desvio padro 0,6. Selecionando, aleatoriamente, uma unidade desse piso, qual a probabilidade de ele
acusar absoro de gua entre 2% e 3,5%?
x -
x - 2,5
0,6
Para x = 2, temos: z =
2-25
= - 0,83
0,6
3,5-2,5
e para x = 3,5, temos: z =
= 1,67.
0,6
Usando a Tabela 3 do apndice, encontramos
para 2 = 0,83 e z = 1,67 as respectivas reas nas extremidades da curva: 0,2033 e 0,0475 (lembrando
que para valores negativos de z, como - 0,83, procuramos na Tabela 3 seu valor absoluto, 0,83). fcil
observar, pela figura ao lado, que a probabilidade
desejada corresponde ao complemento da soma dessas reas, ou seja:
P(2 <X < 3,5) = P ( - 0,83 < Z < 1,67) = 1 - (0,2033 + 0,0475) =
= 0,7492.
EXERCCIOS
8.
9.
Suponha que o tempo de resposta na execuo de um algoritmo uma varivel aleatria com distribuio normal de mdia 23 segundos e desvio padro de 4 segundos. Calcule:
a)
b)
10. Certo tipo de conserva tem peso lquido (Xx) com mdia de 900 g e desvio padro de 10 g. A embalagem tem peso (X2) com mdia de 100 g e desvio
padro de 4 g. Suponha X1 e X2 independentes e com distribuies norfriais.
a)
b)
6.3
Muitas distribuies de probabilidade aproximam-se da distribuio normal. o caso da binomial quando n grande e da Poisson quando grande.
6.3.1
Figura 6.13
(6.25)
n ( l - p) 5
(6.26)
(6.28)
Exemplo 6.7 Historicamente, 10% dos pisos cermicos, que saem de uma linha de produo, tm algum defeito leve. Se a produo diria de 1000 unidades, qual a probabilidade de ocorrer mais de 120 itens defeituosos?
Correo de continuidade
Ao calcularmos probabilidades de eventos oriundos de experimentos binomiais como reas sob uma curva normal, estamos fazendo uma aproximao de
uma varivel aleatria discreta, que s assume valores inteiros, para uma varivel contnua, cujos eventos constituem intervalos de nmeros reais. Nesse contexto, devemos fazer alguns ajustes, como ilustra o exemplo seguinte.
Exemplo 6.8 Seja Y o nmero de caras obtido em dez lanamentos de uma
moeda honesta. Vamos calcular a probabilidade de obter quatro caras usando a
distribuio normal.
Pelas caractersticas do experimento, Y tem distribuio binomial com
n = 1 0 e p = 0,5. Ento, a mdia e o desvio padro so dados por:
Figura 6.14
Aproximao da probabilidade do evento {Y = 4} (em termos da distribuio binomial) para a probabilidade do evento {3,5 < X < 4,5}
(em termos da distribuio normal).
O procedimento de subtrair e somar meia unidade para construir um intervalo em torno de valores inteiros conhecido como correo de continuidade.
Esta correo deve ser usada ao aproximar um evento de uma varivel aleatria que s assume valores inteiros para um evento de uma varivel aleatria
contnua.
A Figura 6.15 ilustra as diversas situaes possveis de probabilidade associada a uma varivel aleatria discreta, assumindo valores em {0, 1, 2, ...},
aproximada por probabilidade associada a uma varivel aleatria contnua, a
qual pode assumir qualquer valor real.
Figura 6.15
6.3.2
Correo de continuidade ao aproximar uma varivel aleatria discreta por uma varivel aleatria contnua.
Figura 6.16
EXERCCIOS
11. De um lote de produtos manufaturados, extramos 100 itens ao acaso. Se
10% dos itens do lote so defeituosos, calcular a probabilidade de:
a)
b)
12. Uma empresa de auxlio lista telefnica recebe, em mdia, sete solicitaes por minuto, segundo uma distribuio de Poisson. Qual a probabilidade de ocorrer mais de 80 solicitaes nos prximos 10 minutos?
6.4
Figura 6.17
Podemos, tambm, calcular a mdia (x') e o desvio padro (s) dos dados e
verificar se os intervalos
3(5)
Configurao de cinco pontos com as posies relativas mais verossmeis possveis sob um modelo normal
Figura 6.19
Grfico de probabilidade normal referente a 40 leituras de temperatura de um pasteurizador e o efeito de um valor discrepante.
valor observado
Figura 6.20
EXERCCIOS COMPLEMENTARES
13. O setor de manuteno de uma empresa fez um levantamento das falhas
de um importante equipamento, constatando que h, em mdia, 0,75 falha
por ano e que o tempo entre falhas segue uma distribuio exponencial.
Qual a probabilidade de o equipamento no falhar no prximo ano?
b)
Quantos metros de linha podero ser percorridos para que a probabilidade de aparecimento de algum defeito seja de 10%?
17. Num laticnio, a temperatura do pasteurizador deve ser de 75C. Se a temperatura ficar inferior a 70C, o leite poder ficar com bactrias malficas
ao organismo humano. Observaes do processo mostram que valores da
temperatura seguem uma distribuio normal com mdia 75,4C e desvio
padro 2,2C.
a)
b)
b)
Se a tarefa colocada para execuo 200 vezes. Qual a probabilidade de ela demorar mais do que 325 segundos em pelo menos 50 vezes?
2 1 . Os dados histricos de uma rede de computadores sugerem que as conexes com essa rede, em horrio normal, seguem uma distribuio de Poisson
com mdia de cinco conexes por minuto. Calcule t0, tal que se tenha probabilidade igual a 0,90 de que ocorra pelo menos uma conexo antes do
tempo t0.
2 2 . O padro de qualidade recomenda que os pontos impressos por uma impressora estejam entre 3,7 e 4,3 mm. Uma impressora imprime pontos,
cujo dimetro mdio igual a 4 mm e o desvio padro 0,19 mm. Suponha que o dimetro dos pontos tenha distribuio normal.
a)
b)
Qual deveria ser o desvio padro para que a probabilidade do item (a)
atingisse 95%?
23. Certo tipo de cimento tem resistncia compresso com mdia de 5.800
kg/cm 2 , e desvio padro de 180 kg/cm 2 , segundo uma distribuio normal.
Dada uma amostra desse cimento, calcule as seguintes probabilidades:
a)
b)
c)
d)
se quer a garantia de que haja 95% de probabilidade de o cimento resistir a determinada presso, qual deve ser o valor mximo dessa presso?
24. Uma empresa fabrica dois tipos de monitores de vdeo. suposto que as
durabilidades deles seguem distribuies normais, sendo o monitor Ml
com mdia de 6 anos e desvio padro 2,3 anos; e o monitor M2 com mdia
de 8 anos e desvio padro 2,8 anos. Ml tem 2 anos de garantia e M2 tem 3
anos. A empresa lucra R$ 100,00 a cada Ml vendido e R$ 200,00 a cada
M2 vendido, mas se deixarem de funcionar no perodo de garantia, a empresa perde R$ 300,00 (no caso de M l ) e R$ 800,00 (no caso de M2). Em
mdia, qual o tipo de monitor que gera mais lucro?
Distribuies Amostrais e
Estimao de Parmetros
7.1
PARMETROS E ESTATSTICAS
Relembremos alguns conceitos bsicos:
Populao: conjunto de elementos que formam o universo de nosso estudo e que so passveis de ser observados, sob as mesmas condies.
Amostra: uma parte dos elementos de uma populao.
Amostragem: o processo de seleo da amostra.
Amostragem aleatria simples: o processo de seleo feito por sorteio, fazendo com que todos os elementos da populao tenham a mesma
chance de serem escolhidos e, alm disso, todo subconjunto de n elementos
tenha a mesma chance de fazer parte da amostra.
Quando a amostragem aleatria e, em especial, quando aleatria simples, podemos fazer inferncias sobre a populao, com base no estudo de uma
amostra (ver a Figura 7.1).
INFERENCIA
Em geral, estamos pesquisando uma ou mais variveis associadas aos elementos da populao ou da amostra. Nesse contexto, tambm podemos caracterizar a populao e a amostra em termos da varivel em estudo. Por exemplo,
ao verificar se cada consumidor potencial de uma revendedora de automveis
planeja (X = 1) ou no (X = 0) comprar um carro novo no prximo ano, podemos representar a populao pelo conjunto {x1, x2, x3,..., xN}, onde
= 0 ou 1,
A funo de probabilidade de P tambm chamada de distribuio da proporo amostrai ou distribuio amostrai da proporo, pois apresenta os possveis resultados de uma proporo, que calculada sobre os elementos de uma
amostra a ser extrada da populao em estudo. De maneira geral, temos:
Uma estatstica uma varivel aleatria e sua distribuio de probabilidades chamada de distribuio amostral
A Tabela 7.1 mostra a construo da distribuio da mdia amostrai, considerando uma amostragem aleatria simples com n = 2 elementos, extrada
com reposio.
Figura 7.3
EXERCCIOS
1.
Refaa o Exemplo 7.1c, considerando que a amostra seja retirada sem reposio.
2.
3.
7.2
DISTRIBUIES AMOSTRAIS
7.2.1
Figura 7.4
Seja uma amostra aleatria simples {X1 ,X 2 , ..., Xn} e a estatstica X. A distribuio de X (distribuio da mdia amostrai) apresenta as seguintes propriedades:
a)
(7.1)
ou
c)
7.2.2
Quando o interesse estudar uma proporo, tal como a proporo dos elementos que tm certo atributo A, a populao pode ser vista como dividida em
dois subgrupos:
1. o subgrupo dos elementos que tm o atributo A; e
2.
Figura 7.5
Esquema geral de uma amostragem aleatria simples quando se observa a proporo de certo atributo A.
A distribuio da populao pode ser representada por uma varivel aleatria de Bernoulli (tipo "0-1"), com funo de probabilidade:
x
P(x)
0
1-p
Como vimos no Captulo 5, o valor esperado e a varincia de uma distribuio desse tipo so dados, respectivamente, por:
(7.4)
(7.5)
Representando as observaes amostradas por
verificamos que
(7.6)
ou seja, a proporo eqivale a uma mdia aritmtica para dados de variveis
do tipo "0-1". Assim, as propriedades da distribuio amostrai da mdia tambm so aplicadas distribuio amostrai da proporo. Usando as notaes
prprias da proporo, temos:
a)
(7.8)
(7.9)
ou
c)
Se o tamanho da amostra for razoavelmente grande, ento a distribuio amostrai da proporo pode ser aproximada pela distribuio
normal.3
EXERCCIOS
4.
b)
Qual a probabilidade de a mdia amostrai diferir da mdia populacional (desconhecida) em mais do que 0,5 mm (para mais ou para
menos)?
c)
Qual a probabilidade de a mdia amostrai diferir da mdia populacional (desconhecida) em mais do que 1 mm (para mais ou para menos)?
d)
e)
5.
Uma empresa fabricante de pastilhas para freios efetua um teste para controle de qualidade de seus produtos. Supondo que 1% das pastilhas fabricadas pelo processo atual apresenta desempenho deficiente quanto ao nvel
de desgaste, qual a probabilidade, em uma amostra aleatria simples
com 10.000 pastilhas, de serem encontradas 85 ou menos pastilhas com
problemas?
6.
Sabe-se que 50% dos edifcios construdos em uma grande cidade apresentam problemas estticos relevantes em menos de cinco anos aps a entrega
3
Observamos que a distribuio exata a binomial (ou a hipergeomtrica se a amostragem for feita de populao pequena e sem reposio).
8.
a)
b)
c)
d)
e)
a)
b)
Figura 7.6
(7.10)
(7.11)
que so estimadores dos parmetros e 2, respectivamente.
De forma genrica, considere uma populao caracterizada pela distribuio de certa varivel aleatria X, com parmetro . E seja ( X l , X2,
Xn) uma
amostra aleatria simples de X.
7.3.1
Propriedades de um estimador
Um estimador, por ser uma varivel aleatria, pode assumir valores, segundo uma distribuio de probabilidades. Contudo, desejvel que, em mdia, ele seja igual ao parmetro que se deseja estimar. Mais formalmente,
E(2)-G2 = - o 2
v
7
n
(7.13)
chamada de vis do
do estimador
estimador d22.
Na prtica, retiramos s uma amostra, produzindo um nico valor para o
estimador - uma estimativa. Mesmo que o estimador seja no viesado, o valor
da estimativa pode estar longe do valor do parmetro. Outra propriedade desejvel que o estimador tenha varincia pequena, porque isso reduz a chance de
a estimativa acusar um valor distante do parmetro.
(6.14)
Considere a mdia amostrai (X') e a mediana amostrai (Md) como estimaSabemos que V(X') = 2/n. Se supusermos a populao
dores do parmetro
/2 ) * ( /n ) . Como
V(X')
<
V(M d ),
na estimao de
do que Md
(7.15)
E(T-)2
(7.16)
(7.17)
7.3.2
Seja uma populao caracterizada por uma varivel aleatria X, que assume o valor 0 ou 1, conforme o elemento tenha ou no certo atributo de interesse. Por exemplo, nas peas que saem de uma linha de produo, o cdigo C
pode identificar pea boa e o cdigo 1 pea defeituosa. Para um elemento tomado ao acaso, seja p = P(X = 1). Note que p representa a proporo de elementos com o atributo, na populao.
J vimos que a proporo amostrai P um bom estimador da proporo
populacional p. Dada uma amostra aleatria simples de tamanho n, o que se
pode dizer sobre o erro amostrai: \ - p\?
Conforme discutido na Seo 7.2, se n for grande, a distribuio amostra]
de P aproximadamente normal com 6
6
Estamos supondo populao infinita ou bastante grande. Caso contrrio, deveramos
usar a correo (7.9), como discutido na Seo 7.2.
(7.26)
Na prtica, no pode ser calculado por (7.21), porque depende do parmetro desconhecido p. Ento, usamos em seu lugar a estimativa:
7
(7.27)
Desde que a amostra seja grande (p. ex., n 50), a diferena entre sp e p
pode ser considerada desprezvel, e um intervalo de confiana para p, com nvel
de confiana de 95%, pode ser calculado por:
Em suma, embora p seja um parmetro populacional desconhecido, possvel, com base em uma amostra aleatria simples, construir um intervalo que
deve conter p com alto nvel de confiana. bastante usual o nvel de confiana
de 95%, mas o intervalo pode ser construdo com um nvel y qualquer, bastando encontrar o valor de zy na distribuio normal padro, conforme mostra a Figura 7.8.
0,800
0,900
0,950
0,980
0,990
0,995
0,998
zy
1,282
1,645
1,960
2,326
2,576
2,807
3,090
Figura 7.8
Com Zy tomado adequadamente, conforme o esquema da Figura 7.8, calculamos o intervalo de confiana para p por:
(7.29)
Exemplo 7.3 Na avaliao de dois sistemas computacionais, A e B, foram selecionadas 400 cargas de trabalho (tarefas) - supostamente uma amostra aleatria da infinidade de cargas de trabalho que poderiam ser submetidas a esses
sistemas. O sistema A foi melhor que o B em 60% dos casos. Construir intervalos de confiana para p (proporo de vezes que o sistema A melhor que o sistema B, considerando todas as possveis cargas de trabalho) usando nveis de
confiana de 95% e 99%.
Para o nvel de confiana de 95%, temos zy = 1,96, resultando em
= 0,6000,048
ou, em porcentagens:
IC(p, 95%) = 60,0% 4,8%
Conclumos, ento, que o intervalo (55,2%; 64,8%) contm o parmetro p,
com nvel de confiana de 95%.
aumenta
7.3.3
Seja uma populao caracterizada pela distribuio de uma varivel aleatria X com os seguintes parmetros: E(X) = e V(X) = 2. Por exemplo, X
pode representar a mensurao da resistncia mecnica de um novo material.
Devido ao erro experimental onipresente, X uma varivel aleatria; assim, o
interesse recai em seu valor esperado .
Considere uma amostra aleatria simples {X1, X2, ..., Xn} de X. Supondo X
com distribuio aproximadamente normal, ento
(7.30)
o estimador natural de . Vimos na Seo 7.2 que X' tem distribuio aproximadamente normal com mdia e varincia dadas por 8
(7.31)
(7.32)
(7.33)
ser chamado de erro padro de X'.
Escolhendo zy em funo do nvel de confiana y desejado, tal que P { - zy
Z zy} = y, podemos escrever
(7.34)
ou
8 Novamente,
estamos
supondo
(7.3),
como vidto
na Seo
7.2. a populao infinita
(7.35)
A distribuiko t de Student
\
Figura 7.9
Figura 7.10
(7.39)
ou
(7.40)
Assim, o intervalo de confiana para com a amostra efetivamente observada, dado por9
(7.41)
9
Para amostras pequenas, a validade do IC(, y) est condicionada suposio de que
os dados provenham de uma distribuio aproximadamente normal. Para n > 30, o teorema limite central garante a validade de IC(, ) e, alm disso, tem-se para N grande: ty zr
Ou seja, a resistncia mecnica esperada do ao produzido pelo novo processo de tmpera 36,15 HRc, tolerando, com 95% de confiana, uma margen]
de erro de at 0,53 HRc.
EXERCCIOS
9.
T1 = (X1, +X2+X3+X4+X5+X6+X7)/7
T2 =
(X2 +X3+X4+X5+X6) / 5
T3 = (X2 + X 3 + X 4 + X5 + X 6 ) / 7
a)
b)
10. Em uma amostra aleatria simples com 200 edifcios com cinco anos, em
certa cidade, 55% apresentaram problemas estticos relevantes aps a entrega da obra. Construir um intervalo de confiana para a proporo de
edifcios da cidade que apresentam problemas estticos relevantes nos cinco primeiros anos. Use nvel de confiana de 95%.
11. Uma empresa fabricante de pastilhas para freios efetua um teste para controle de qualidade de seus produtos. Selecionou-se uma amostra de 600
pastilhas, das quais 18 apresentaram nveis de desgaste acima do tolerado.
Construir um intervalo de confiana para a proporo de pastilhas com
desgaste acima do tolerado, do atual processo industrial, com nvel de confiana de 95%. Interpretar o resultado.
12. Uma fundio produz blocos para motor de caminhes. Os blocos tm furos para as camisas e deseja-se verificar qual o dimetro mdio no processo do furo. A empresa retirou uma amostra de 36 blocos e mediu os dimetros de 36 furos (1 a cada bloco). A amostra acusou mdia de 98,0 mm e
desvio padro de 4,0 mm. Construir um intervalo de confiana para a mdia do processo, com nvel de confiana de 99%. Interpretar o resultado. Se
o processo deveria ter mdia 100 mm, h evidncia (com 99% de confiana) de que a mdia do processo no est no valor ideal? Explique.
7.4
TAMANHO DE AMOSTRA
Na seo anterior, aprendemos como estimar um parmetro mediante observao de uma amostra aleatria simples de tamanho n. A estimao feita
com certa preciso, no sentido de que tambm avaliamos o erro amostrai que
podemos estar cometendo.
Contudo, ainda na fase do planejamento da pesquisa, muitas vezes precisamos calcular o tamanho n da amostra, para garantir certa preciso desejada,
que descrita em termos do erro amostrai mximo tolerado (E0y) e do nvel de
confiana () a ser adotado no processo de estimao. No caso de estimao de
, podemos exigir
Quadro 7.1
Quando o objetivo estimar uma proporo p (0 < p < 1), podemos usar
a seguinte relao (ver a Figura 7.11):
(7.50)
Figura 7.11
A expresso (7.47) (Quadro 7.1c) tambm usada com o objetivo de estimar uma nica proporo p, quando no temos informao a priori sobre o valor de p. Contudo, deve resultar em um valor de n maior do que o necessrio.
No caso de estarmos usando nvel de confiana de 95%, temos
zy = 1,96 2,fazendo com que (7.47) resulte em:
(7.51)
A expresso (7.51) muito usada no planejamento de pesquisas de levantamento, com o objetivo de estimar vrias propores, como nos exemplos seguintes:
numa pesquisa eleitoral, em que comum a necessidade de avaliar a
proporo de cada candidato;
em pesquisas de mercado, em que normalmente desejam-se avaliar as
propores de vrios atributos nos consumidores;
no levantamento de arquivos que trafegam em uma rede, em que
comum o interesse em verificar a proporo de cada tipo de arquivo.
EXERCCIOS
13. Um pesquisador precisa determinar o tempo mdio gasto para perfurar trs
orifcios em uma pea de metal. Qual deve ser o tamanho da amostra para
que a mdia amostrai esteja a menos de 15 s da mdia populacional? Por experincia prvia, pode-se supor o desvio padro em torno de 40 s. Considere
tambm, que a estimao ser realizada com nvel de confiana de 95%.
1 4 . Seja a construo de um plano para garantir a qualidade dos parafusos
vendidos em caixas com 100 unidades. Um dos requisitos controlar o
comprimento mdio dos parafusos. Quer-se saber quantos parafusos de-
EXERCCIOS COMPLEMENTARES
17. Sob condies normais, realizaram-se dez observaes sobre o tempo de
resposta de uma consulta a certo banco de dados. Os resultados, em segundos, foram:
28 35 43 23 62 38 34 27 32 37
Construa um intervalo de confiana para o tempo mdio de uma consulta, sob condies normais. Use = 0,99.
18. Fixados certos parmetros de entrada, o tempo de execuo de um algoritmo foi medido 12 vezes, obtendo-se os seguintes resultados, em minutos:
15 12 14 15 16 14 16 13 14 11 15 13
a)
b)
19. Uma empresa tem 2.400 empregados. Deseja-se extrair uma amostra de
empregados para verificar o grau de satisfao em relao qualidade da
comida no refeitrio. Em uma amostra piloto, numa escala de 0 a 10, o
grau de satisfao recebeu nota mdia 6,5 e desvio padro 2,0.
a)
b)
Considere que a amostra planejada no item anterior tenha sido realizada e obteve-se mdia 5,3 e desvio padro 1,8 ponto. Construa um intervalo de 99% de confiana para o parmetro .
c)
d)
20. Com os dados histricos sobre a temperatura do pasteurizador de um laticnio, sabe-se que a varincia aproximadamente 1,8 (C)2. Planeja-se fazer
uma amostragem para avaliar o valor mdio da temperatura do pasteurizador. Suponha que as observaes sejam feitas sob as mesmas condies e
de forma independente. Qual deve ser o tamanho da amostra, para garantir um erro mximo de 0,3C, com nvel de confiana de 95%?
21. Planeja-se extrair uma amostra aleatria simples dos 2.000 funcionrios de
uma empresa, para avaliar a satisfao com o trabalho. A satisfao ser
avaliada atravs de um questionrio com vrios itens numa escala de 1 a 5.
Pretende-se avaliar o valor mdio de cada item. Qual deve ser o tamanho
da amostra para garantir um erro mximo de 0,2 unidade, com nvel de
confiana de 95%?
Nota: Use como varincia o valor terico que se obtm ao supor probabilidade igual para cada um dos cinco nveis da escala. Observe que dificilmente algum item ter varincia maior do que esta que voc est calculando, pois, na prtica, a tendncia que as respostas se concentrem em torno
de algum nvel.
22. Numa pesquisa para estudar a preferncia do eleitorado a uma semana da
eleio presidencial, qual deve ser o tamanho de uma amostra aleatria
simples para garantir, com nvel de confiana de 95%, um erro amostrai
no superior a 2%?
23. Um analista de sistemas est avaliando o desempenho de um novo programa de anlise numrica. Forneceu como entrada do programa 14 operaes similares e obteve os seguintes tempos de processamento (em milissegundos):
12,0
15,2
a)
b)
Construir um intervalo de confiana para o tempo mdio de processamento, com nvel de confiana de 95%.
c)
24. Uma unidade fabril da Intel produziu 500.000 chips Pentium IV em certo
perodo. So selecionados, aleatoriamente, 400 chips para testes.
a)
Supondo que 20 chips no tenham a velocidade de processamento adequada, construir o intervalo de confiana para a proporo de chips
adequados. Use nvel de confiana de 95%.
b)