Sei sulla pagina 1di 107

Probabilidade

No captulo anterior, procuramos conhecer a variabilidade de algum processo com base em observaes das variveis pertinentes. Nestes trs prximos
captulos, continuaremos a estudar os processos que envolvem variabilidade,
aleatoriedade ou incerteza, mas procuraremos construir modelos matemticos
para facilitar a anlise. Esses modelos normalmente so construdos a partir de
suposies sobre o processo, mas podem tambm basear-se em dados observados no passado.
O leitor j deve ter ouvido falar de probabilidade ou de modelos probabilsticos. H dois aspectos a considerar. O primeiro que intuitivamente as pessoas
procuram tomar decises em funo dos fatos que tm maior probabilidade de
ocorrer. Veja os seguintes exemplos:
a) se o cu est nublado, ento h chance considervel de chover.
Deve-se levar um guarda-chuva ao sair de casa!;
b) se um inspetor de qualidade est observando as peas produzidas
por uma mquina, e verifica que elas esto saindo fora do padro,
ento ele pode deduzir que existe alta chance de essa mquina continuar produzindo peas fora do padro. Logo, a mquina dever receber ateno especial;
c)

se em determinada famlia h muitos casos de doena cardaca, ento


h maior chance de pessoas daquela famlia serem afetadas; portanto, os exames preventivos precisam ser feitos mais freqentemente.

O segundo aspecto a incerteza inerente s decises que podem ser tomadas sobre determinado problema.

a) por mais nublado que o cu esteja, pode no chover, ao menos durante o perodo de tempo em que a pessoa estiver fora de casa;
b) algumas peas poderiam estar fora do padro por motivos meramente casuais. O processo pode estar funcionando bem;
c)

apesar dos vrios precedentes familiares, uma pessoa pode viver a


vida inteira sem ter problemas cardacos.

Se for possvel quantificar a incerteza associada a cada fato, algumas decises tornam-se mais fceis. Veja os casos a seguir:
a)

Qual deve ser a capacidade instalada de uma usina hidreltrica, em


funo da vazo e da precipitao pluviomtrica?

b)

Qual deve ser a capacidade do servidor de comrcio eletrnico de


uma empresa, em funo da demanda prevista?

No caso (a), se for possvel prever as variaes na quantidade de chuva e,


no caso (b), se houver previso da demanda, podemos responder melhor s
questes que foram colocadas. A teoria do clculo de probabilidades permite
obter uma quantificao da incerteza associada a um ou mais fatos e, portanto,
extremamente til no auxlio tomada de decises.
Os modelos probabilsticos so aplicados em situaes que envolvem algum tipo de incerteza ou variabilidade. Mais especificamente, consideraremos a
presena de algum experimento aleatrio como princpio para a construo de
modelos probabilsticos.
Exemplo 4.1

So exemplos de experimentos aleatrios:

a)

o lanamento de um dado e a observao da face voltada para cima;


no sabemos exatamente qual face vai ocorrer, apenas que ser uma
das seis existentes. Alm disso, se o dado for no viciado e o lanamento imparcial, todas as faces tm a mesma chance de ocorrer;

b)

a observao dos dimetros, em mm, de eixos produzidos em uma


metalrgica; sabemos que as medidas devem estar prximas de um
valor nominal, mas no sabemos exatamente qual o dimetro de
cada eixo antes de efetuar as mensuraes;

c)

o nmero de mensagens que so transmitidas corretamente por dia


em uma rede de computadores; sabemos que o mnimo possvel
zero, mas no sabemos nem sequer o nmero mximo de mensagens que sero transmitidas.

Nos casos em que os possveis resultados de um experimento aleatrio podem ser listados (caso discreto), um modelo probabilstico pode ser entendido
como a listagem desses resultados, acompanhados de suas respectivas probabi-

lidades. A Figura 4.1 ilustra as etapas para a construo de um modelo probabilstico.

Figura 4.1

4.1

Passos para a construo de um modelo probabilstico (caso discreto).

ESPAO AMOSTRAL E EVENTOS


Seja um experimento aleatrio qualquer.

O conjunto de todos os possveis resultados do experimento chamado de


espao amostrai e denotado pela letra grega .

Exemplo 4.2 Seguem alguns experimentos aleatrios com os respectivos espaos amostrais:
a) lanamento de um dado e observao da face voltada para cima:
b) retirada de uma carta de um baralho comum (52 cartas) e observao do naipe: = {copas, espadas, ouros, paus};
c)

o nmero de mensagens que so transmitidas corretamente por dia


em uma rede de computadores: = {0, 1, 2, 3, ..-};1

d) a observao do dimetro, em mm, de um eixo produzido em uma


metalrgica: = {d, tal que d > 0}.2
O espao amostrai pode ser:
1. finito, formado por um nmero limitado de resultados possveis,
como nos casos (a) e (b);
2.

infinito enumervel, formado por um nmero infinito de resultados,


os quais podem ser listados, como no caso (c); ou

1
Note que no h um limite superior conhecido, mas somente possvel a ocorrncia de
valores inteiros.
2

No h um limite superior e, teoricamente, pode haver uma infinidade de valores.

3.

infinito, formado por intervalos de nmeros reais, como no caso (d).

Os elementos para se tomar alguma deciso podem corresponder a um conjunto de resultados (ou evento) associados ao experimento aleatrio. Por exemplo, se o dimetro D de um eixo, em mm, que sai da linha de produo, pertencer ao conjunto (ou evento) A = {49,0 D 51,0}, ento se decide que ele
adequado.

Exemplo 4.3 Seja o experimento do lanamento de um dado. Temos:


= {1, 2, 3, 4, 5, 6}. So exemplos de eventos:
A = nmero par do dado = {2, 4, 6};
B = nmero maior que 2 do dado = {3, 4, 5, 6};
C = nmero 6 {6}.
Dizemos que um evento ocorre quando um dos resultados que o compem
ocorre. Com respeito ao Exemplo 4.3, se o dado for lanado e ocorrer o nmero
4, ento ocorrem os eventos A e B, mas no ocorre o evento C.
Como um evento um subconjunto do espao amostrai, ento todos os
conceitos da teoria de conjuntos podem ser aplicados a eventos. Considerando
A e B eventos quaisquer, veja as principais operaes na Figura 4.2.

Exemplo 4.3 (continuao). Sejam:


A = nmero par do dado = {2, 4, 6};
B = nmero maior que 2 do dado = {3, 4, 5, 6};
C = nmero 6 = {6}.
Eventos complementares:

B' = nmero menor ou igual a 2 do dado = {1, 2};


C' = no 6 = {1, 2, 3, 4, 5}.
Algumas unies:
A B = {2, 3, 4, 5, 6};

AC

= {2, 4, 6};

A =

Algumas intersees:
A B = {4, 6};

A C = {6}; A = {} = 0 .

Eventos so ditos mutuamente exclusivos se e s se eles no puderem


ocorrer simultaneamente. Ento, para dois eventos quaisquer, A e B, temos:

A e B so mutuamente exclusivos <=> A B = 0.

No Exemplo 4.3, os eventos = {1, 3, 5} e C = {6} so


mutuamente exclusivos, pois eles no podem ocorrer simultaneamente (observe que C =0).

EXERCCIOS
1.

Apresente os espaos amostrais dos seguintes experimentos aleatrios:


a)

Lanamento de uma moeda honesta e observao da face voltada para


cima.

b)

Observao da qualidade de peas produzidas, registrando o nmero


de peas defeituosas.

c)

Contagem do nmero de clientes numa fila nica de banco, que chegam durante uma hora.

d) Medio da velocidade do vento, em km/h, na pista de um aeroporto.


e)

2.

Medio da temperatura, em graus Celsius, n u m a estao meteorolgica da cidade de Florianpolis.

Considere que voc vai cronometrar o tempo, em segundos, para carregar


uma pgina da web.
a)

Represente, em forma de conjuntos, os seguintes eventos:


A = mais do que 5 e, no mximoy 10 segundos;
B = mais do que 10 segundos;
C = mais do que 8 segundos;

b)

4.2

Represente geometricamente (como intervalos na reta dos reais) os


conjuntos do item anterior.

DEFINIES DE PROBABILIDADE

Intuitivamente, as pessoas sabem como calcular algumas probabilidades


para tomar decises. Observe os seguintes exemplos.
Exemplo 4.4
a) V a m o s supor que voc fez u m a aposta com um amigo. O vencedor
ser aquele que acertar a face que ficar para cima, no lanamento de
u m a m o e d a honesta.3 Qual a probabilidade de voc ganhar?

Intuitivamente, voc responderia que a probabilidade de ganhar


igual a 50% (ou 1/2).
3
Usaremos a expresso moeda honesta para referenciar uma moeda perfeitamente equilibrada e lanamentos imparciais. De forma anloga, usaremos o adjetivo honesto para dado, baralho etc.

b) Voc continua apostando com o mesmo amigo. O vencedor ser


aquele que acertar o naipe de uma carta que ser retirada, ao acaso,
de um baralho comum de 52 cartas. Qual a probabilidade de voc
ganhar?

Novamente, de forma intuitiva, voc responderia que de 25%


(ou 1/4).
O que h em comum entre as situaes (a) e (b) do Exemplo 4.4? Refletindo um pouco, voc observar que em ambas as situaes temos experimentos
aleatrios. A cada realizao do experimento apenas um dos resultados possveis pode ocorrer. Alm disso, como se supe que a moeda e o baralho so honestos, cada um dos resultados possveis tem a mesma probabilidade de ocorrer.

4.2.1

Definio clssica de probabilidade

Se um experimento aleatrio tem n resultados igualmente provveis, e nA


desses resultados pertencem a certo evento A, ento a probabilidade de ocorrncia do evento A ser:

(4.1)

Exemplo 4.4 (continuao)


a) No caso da moeda, h apenas dois resultados possveis e igualmente
provveis, resultando que a probabilidade de ocorrncia de uma das
faces ser igual a 1/2 (ou 50%).
b) No caso dos naipes do baralho, h quatro resultados possveis e
igualmente provveis, resultando que a probabilidade de ocorrncia
de um deles ser igual a 1/4 (ou 25%). Analogamente, podemos considerar cada carta do baralho como um resultado. Nesse caso, a probabilidade de ocorrer certo naipe de 13/52 = 1/4.

4.2.2

Definio experimental de probabilidade

Muitas vezes, a alocao de probabilidades baseia-se em observaes do


passado. Seja um experimento aleatrio com espao amostrai e um evento A
de interesse. Suponha que esse experimento seja repetido n vezes e o evento
A ocorreu n(A) vezes. A freqncia relativa do evento A dada por:

(4.2)
medida que o experimento repetido mais e mais vezes, sob as mesmas
condies, a freqncia relativa do evento A tender a ficar cada vez mais prxima da probabilidade de ocorrncia do evento A. Mais especificamente:

(4.3)
Exemplo 4.5 Um fabricante de lmpadas fluorescentes precisa especificar o
tempo de garantia de um de seus modelos. Embora os projetistas estimem que
o tempo mdio de vida do modelo seja de 5.000 horas, no se sabe exatamente
como as lmpadas iro comportar-se. E sem esse conhecimento seria temerrio
especificar o tempo de garantia.
Ao definir o experimento aleatrio como ligar a lmpada e registrar o tempo (em horas) que ela funciona, o espao amostrai formado pelo conjunto de
todos os valores maiores ou iguais a zero, ou seja:

Seja o evento:
At = a lmpada funcionar at o tempo t
Podemos repetir o experimento com um nmero n suficientemente grande
de lmpadas.4 Com os resultados do experimento, podemos calcular as freqncias relativas:

(4.4)
para diversos valores de t. Essas freqncias relativas podem ser usadas como
valores aproximados das probabilidades P(At) e, assim, definir adequadamente
o tempo de garantia, de tal forma que ele no seja demasiadamente longo, pois
a seria necessrio repor muitas lmpadas (custo financeiro alto), mas tambm
no seja muito curto, o que pode gerar a suspeita de um produto com baixa
qualidade, acarretando perda de mercado.
Em muitas situaes, impossvel realizar o experimento diversas vezes.
Veja o exemplo seguinte.
Exemplo 4.6 Quando estudamos o regime de vazes de um rio, com o objetivo de avaliar a viabilidade da construo de uma usina hidreltrica, no possvel replicarmos os diversos meses e anos, fenmenos climticos e eventual in4
H mtodos estatsticos para calcular n (tamanho da amostra), conforme ser visto no
Captulo 7.

terveno humana. Nesse caso, bastante comum a utilizao de dados


histricos.5 Supondo que as condies atuais e futuras sejam razoavelmente semelhantes quelas nas quais os dados foram obtidos, podemos ter uma idia sobre as probabilidades dos eventos de interesse atravs das freqncias relativas
dos dados histricos.

4.2.3

Axiomas e propriedades da probabilidade

Independentemente de como so obtidas, usando a definio clssica ou a


experimental, as probabilidades atendem a alguns axiomas. Formalmente, seja
um experimento aleatrio e um espao amostrai associado a ele. A cada
evento Ei (i = 1 , 2 , . . . ) associaremos um nmero real denominado probabilidade de ocorrncia de Ei P(E i ), que deve satisfazer aos seguintes axiomas:

O axioma (a) afirma que uma probabilidade sempre um nmero entre 0


e 1. O axioma (b) afirma que, ao realizar o experimento, sempre vai ocorrer algum dos resultados possveis, razo pela qual o espao amostrai chamado de
evento certo. J o axioma (c) menos intuitivo. Ele afirma que, ao unir eventos
formados por resultados diferentes, a probabilidade de ocorrer essa unio
dada pela soma das probabilidades de cada evento.
Para ilustrar os axiomas, retomemos o experimento de lanar um dado e
observar o lado voltado para cima. Temos = {1, 2, 3, 4, 5, 6}. Ao realizar o
experimento, certamente vai ocorrer algum elemento de ; logo, P() = 1. Vamos considerar, por exemplo, os eventos associados a cada resultado, isto ,
Ei = i (i = 1, 2, ..., 6). Se for suposto que o dado perfeitamente equilibrado e
os lanamentos imparciais (dado honesto), podemos atribuir, pela definio
clssica, as seguintes probabilidades: P(E i ) = 1/6 (i = 1, 2, ..., 6). Note que esses eventos so mutuamente exclusivos (Ei Ej = , i j) e a probabilidade
da unio de quaisquer desses eventos dada pela soma das probabilidades de
cada um. Por exemplo, pela definio clssica, Expresso 4.1, temos:

O mesmo valor pode ser obtido pelo axioma (c):

Seguem algumas propriedades bsicas da probabilidade:


1. P ( 0 ) = 0
Se o experimento realizado, algum resultado certamente vai
ocorrer (P() = 1). Portanto, nunca ocorre (P() = 0). conhecido como evento impossvel.
2.

Para o caso discreto, isto , quando os resultados possveis podem


ser listados, ento, pelo axioma (c), a probabilidade de qualquer
evento pode ser obtida pela soma das probabilidades dos resultados
individuais, ou seja, se A = {l9 2, 3, ... }, ento:
(4.5)

No experimento do dado, por exemplo:

Observe que esse processo de calcular probabilidades pode ser


usado mesmo quando o espao amostrai no for eqiprovvel.

(4.6)
Note que, ao unir A e A' temos o espao amostrai
, que tem probabilidade igual a 1. Pelo axioma (c),
temos a expresso do evento complementar.
No experimento do dado, temos, por exemplo, P(ocorrer seis)
= P({6}) = 1/6. Pela propriedade do evento complementar: P(no
ocorrer seis) = 1 - 1/6 = 5/6.
4.

(Regra da soma das probabilidades). Sejam A e B eventos quaisquer,


ento:
(4.7)
Note, pelo esquema ao lado, que, ao somar
P(A) e P(B), estamos contando duas vezes os pontos do conjunto AB. Logo, ao calcular P(A B),
necessrio excluir uma vez P(A B).

EXERCCIOS
3.

Retira-se, ao acaso, u m a carta de um baralho de 52 cartas. Calcule a probabilidade de:

a) a carta no ser de ouros;


b) ser uma carta de ouros ou uma figura.
4. Depois de um longo perodo de testes, verificou-se que o procedimento A
de recuperao de informao corre um risco de 2% de no oferecer resposta satisfatria. No procedimento B, o risco cai para 1%. O risco de ambos os procedimentos apresentarem resposta insatisfatria de 0,5%. Qual
a probabilidade de pelo menos um dos procedimentos apresentar resposta insatisfatria?
5. De um conjunto de cinco empresas, deseja-se selecionar, aleatoriamente,
uma empresa, mas com probabilidade proporcional ao nmero de funcionrios. O nmero de funcionrios da Empresa A 20; de B 15; de C 7;
de D 5 e de E 3.
a) Qual a probabilidade de cada uma das empresas ser a selecionada?
b) Qual a probabilidade de a Empresa A no ser selecionada?
6.

Considere que a probabilidade de ocorrer k defeitos ortogrficos em uma


pgina de jornal dada por:

Tomando-se uma pgina qualquer, calcule a probabilidade de:


a) no ocorrer erro;
b)
7.

ocorrer mais do que dois erros.

Mostre que:

4.3

PROBABILIDADE CONDICIONAL E INDEPENDNCIA

Muitas vezes, h interesse em calcular a probabilidade de ocorrncia de


um evento A, dada a ocorrncia de um evento B. Exemplos:
Qual a probabilidade de chover amanh em Florianpolis, sabendo
que choveu hoje?
Qual a probabilidade de um dispositivo eletrnico funcionar sem
problemas por 200 horas consecutivas, sabendo que ele j funcionou
por 100 horas?
Qual a probabilidade de que um dos trs servidores de correio eletrnico fique congestionado, sabendo que um deles est inoperante?
Em outras palavras, queremos calcular a probabilidade de ocorrncia de A
condicionada ocorrncia prvia de B. Essa probabilidade representada por
P(AB) (l-se probabilidade de A dado B).
Exemplo 4.7 Os dados, a seguir, representam o sumrio de um dia de observao em um posto de qualidade, em que se avalia o peso dos pacotes de leite
produzidos num laticnio.
Tipo do leite

Condio do peso
Dentro das especificaes (D)
Fora das especificaes (F)
Total

B (B)

C CC)

UHT (U)

Total

500

4.500

1.500

6.500

30

270

50

350

530

4.770

1.550

6.850

Retira-se, ao acaso, um pacote de leite da populao de 6.850 unidades.


Sejam D e F os eventos que representam se o pacote retirado est dentro ou
fora das especificaes, respectivamente. Da mesma forma, B, C eU so eventos
que representam o tipo do leite. Pergunta-se:
a) Qual a probabilidade de o pacote de leite estar fora das especificaes?
Resp.: Como o espao amostrai composto de 6.850 unidades, sendo que 350 satisfazem ao evento, ento:

b) Qual a probabilidade de o pacote de leite retirado estar fora das especificaes, sabendo-se que do tipo UHT?
Resp.: Nesse caso, o espao amostrai ficou restrito s 1.550 unidades
de leite UHT. Destas, 50 satisfazem ao evento. Ento:

Note que, se o numerador e o denominador de P(F\U) forem divididos


pelo nmero total de unidades, temos:

que a relao usada na definio formal de probabilidade condicional.


Sejam A e B eventos quaisquer, sendo P(B) > 0. Definimos a probabilidade
condicional de A dado B por:

(4.8)
Note que no denominador temos a probabilidade do evento que supostamente aconteceu, mas calculada nas condies originais do experimento.
Se houver interesse no oposto, isto , na probabilidade de ocorrncia de B
condicionada ocorrncia prvia de A, sendo P(A) > 0, temos:

(4.9)
importante ressaltar que a operao de interseco comutativa, impli-

Exemplo 4.8 Seja o lanamento de 2 dados no viciados e a observao das


faces voltadas para cima. Suponha que haja interesse nas probabilidades dos seguintes eventos:
a) Faces iguais, sabendo que a soma menor ou igual a 5.
b) Soma das faces menor ou igual a 5, sabendo que as faces so iguais.
Inicialmente, vamos explicitar o espao amostrai desse experimento, que
formado por todas as 6 x 6 = 36 possveis combinaes de resultados dos dois
dados, ou seja:

I-

ESTATSTICA

(1,1)
(2,1)
(3,1)
(4,1)
(5,1)
(6,1)

(1,2)
(2,2)
(3,2)
(4,2)
(5,2)
(6,2)

(1,3)
(2,3)
(3,3)
(4,3)
(5,3)
(6,3)

(1,4)
(2,4)
(3,4)
(4,4)
(5,4)
(6,4)

(1,5)
(2,5)
(3,5)
(4,5)
(5,5)
(6,5)

(1,6)
(2,6)
(3,6)
(4,6)
(5,6)
(6,6)

Considere os eventos:
E1 = faces iguais = {(1,1), (2,2), (3,3), (4,4), (5,5), (6,6)} e
E2 = soma das faces menor ou igual a 5 =
= {(1,1), (1,2), (1,3), (1,4), (2,1), (2,2), (2,3), (3,1), (3,2), (4,1)}.

Calculando
a) A probabilidade de as faces serem iguais, sabendo que a soma menor ou igual a 5. Ou seja:

Note que, se o espao amostrai for restringido ao evento conhecido, E2, temos 10 resultados possveis, sendo que 2 satisfazem tambm ao evento de interesse, El1, o que torna natural a probabilidade
condicional ser 2 / 10 .
b) A probabilidade de a soma das faces ser menor ou igual a 5, sabendo que as faces so iguais. Ou seja:

4.3.1

A regra do produto

Uma das conseqncias da expresso da probabilidade condicional (4.8)


a regra do produto, obtida ao isolar a probabilidade da interseo. Ou seja:
(4.10)
que fornece uma frmula de calcular a probabilidade de ambos os eventos (A e
B) ocorrerem. Em (4.10), o evento condicionado B, mas o inverso tambm
possvel, pois
(4.11)

Para trs eventos, A, B e C, a regra do produto pode ser escrita como

(4.12)
importante que seja observada a seqncia lgica dos eventos para montar as expresses precedentes.
Exemplo 4.9. Uma caixa contm 4 cartes amarelos e 8 vermelhos. Retiramos, ao acaso, 2 cartes, um aps o outro, sem reposio, e observamos as cores dos dois cartes.
a) Qual a probabilidade de que ambos sejam amarelos?
Chamando de Ai o evento que representa carto amarelo na
i-sima extrao e Vi o evento que representa carto vermelho na
i-sima extrao (i = 1, 2), temos o seguinte espao amostrai:

A probabilidade de interesse P{(Al A2)}, que tambm pode


ser colocada em termos de interseo: P(A 1 A2), isto , a probabilidade de ocorrer amarelo na primeira extrao e amarelo na segunda extrao. Para a aplicao da regra do produto, P(A1 A2) =
P(A 1 ) . P(A2A1), calculamos:

b) Como alocar probabilidades a todos os elementos do espao amostrai?


Nesse caso, podemos construir uma rvore, indicando todas as
situaes possveis (rvore de probabilidades). Veja a Figura 4.3.

1- extrao
Figura 4.3

2- extrao

rvore de probabilidades - retiradas sem reposio (A = amarelo;


V = vermelho).
Com base na Figura 4.1, podemos calcular as probabilidades de
todos os resultados do espao amostrai, como segue:

Observe que a soma dos quatro resultados possveis igual a 1


(axioma (b) da probabilidade).
c)

Qual a probabilidade de ocorrer exatamente 1 carto amarelo?


Queremos a probabilidade de ocorrer (A1 ,V 2 ) ou (V1 ,A 2 ). Em
termos da linguagem de conjuntos, queremos a unio dos dois resultados (eventos). Como esses eventos so mutuamente exclusivos
(no podem ocorrer simultaneamente), ento a probabilidade
dada pela soma, ou seja:

d) Considere a retirada de 3 cartes. Qual a probabilidade de que os


dois primeiros sejam vermelhos e o terceiro seja amarelo?
Desejamos calcular

Os dois primeiros fatores j foram calculados anteriormente.


Para calcular P(A 3 V 1 V2) basta considerar a caixa com 2 cartes
vermelhos a menos, ou seja, com 4 amarelos e 6 vermelhos. Assim:

4.3.2

Eventos independentes

O Exemplo 4.10 parecido com o exemplo anterior, mas com a amostragem feita com reposio. Verifique que os clculos tornam-se mais simples, pois
a configurao da urna no se altera na segunda extrao.
Exemplo 4.10 Uma caixa contm 4 cartes amarelos e 8 vermelhos. Retiram-se, ao acaso, 2 cartes da caixa, um aps o outro, sendo que o primeiro

carto reposto antes da retirada do segundo (amostragem com reposio), e


observa-se a cor dos dois cartes.
A Figura 4.4 apresenta a rvore de probabilidades desse experimento.

1- extrao
Figura 4.4

2- extrao

rvore de probabilidades - retiradas com reposio (A = amarelo;


V = vermelho).

Note que nessa situao, P(A2A1)= P(A2V1) = 4/12, ou seja, no importa


se saiu carto amarelo ou vermelho na primeira extrao, a probabilidade de
sair amarelo na segunda extrao de 4/12 - h independncia entre os eventos.
Assim, basta escrever P(A 2 ), sem condicionante.
Dois ou mais eventos so independentes quando a ocorrncia de um dos
eventos no influencia a probabilidade da ocorrncia dos outros.
Se dois eventos A e B so independentes, ento:
(4.13)
(4.14)

Como conseqncia de (4.14), a regra do produto pode ser simplificada da


seguinte forma:
(4.15)
Essa relao usada para definir formalmente eventos independentes, ou
seja:

A definio de independncia ainda pode ser ampliada para mais eventos,


como segue:

Embora a implicao seja dos dois lados, normalmente as condies do experimento permitem verificar se razovel supor independncia entre os eventos e, em caso afirmativo, o clculo da probabilidade da interseo pode ser fatorado nas probabilidades dos eventos independentes.
Quando a populao for bastante grande em relao ao tamanho da amostra, mesmo que a amostragem seja feita sem reposio, podemos supor independncia. Imagine que no experimento do Exemplo 4.9 haja 4.000 cartes
amarelos e 8.000 vermelhos. Ao extrair dois cartes, a probabilidade de sair
amarelo na segunda extrao de aproximadamente 4 / 12 , independentemente
de ter sado amarelo ou vermelho na primeira extrao.
Exemplo 4.11. Considere um sistema composto de n componentes ligados em
srie, de tal forma que, se um componente falhar, o sistema todo falha. Esquematicamente:

Se os componentes operam independentemente e cada um tem probabilidade p de falhar, qual a probabilidade de o sistema funcionar?
Resp.: (1 -p)n (verifique o porqu; use a regra do produto para eventos
independentes).

EXERCCIOS
8.

Para testar se um sistema especialista responde satisfatoriamente a um


usurio, foram feitas cinco perguntas, cada uma com quatro alternativas de
resposta. Se o sistema escolhe as alternativas aleatoriamente, qual a probabilidade de ele responder corretamente a todas as cinco perguntas?

9.

Com respeito ao Exemplo 4.7, calcule:

4.4

TEOREMA DA PROBABILIDADE TOTAL

Exemplo 4.12. Imagine que voc utiliza peas de quatro fornecedores, que
tm diferentes desempenhos quanto a sua qualidade. As peas so classificadas
como conformes ou no conformes e voc conhece a proporo de peas no
conformes de cada fornecedor (p l ,p 2 , p 3 e p 4 ). Considere a formao de um lote
com peas dos quatro fornecedores, conforme ilustra a Figura 4.5. Se voc selecionar, ao acaso, uma das peas do lote, qual a probabilidade de ela ser no
conforme?
Fornecedor:
(1)

(2)

(3)

(4)

A resposta seria simples se voc soubesse de qual fornecedor a pea selecionada, mas voc no sabe. O chamado teorema da probabilidade total permite
solucionar esse problema.
Considere o espao amostrai particionado em k eventos,
tisfazendo s seguintes condies:

E1

,E2,

Ek, sa-

Figura 4.6

Partio do espao amostrai em eventos mutuamente exclusivos.

Seja um evento F qualquer, referente ao espao amostrai . Ento:

onde os eventos (F E i ) (i = 1, 2, ..., n) so mutuamente exclusivos entre si.


Logo:

Usando a regra do produto, temos a seguinte equao, conhecida c o m o o


teorema da probabilidade total:

ou

(4.16)

Naturalmente, algumas P ( F | E i ) podero assumir valor zero por no haver


interseo entre F e Et. O teorema da probabilidade total pode ser interpretado
fisicamente c o m o u m a medida do peso de cada um dos eventos E b na contribuio para formar o evento F.
Exemplo 4.12 (continuao)
Os eventos E t representam as procedncias das
peas (fornecedores 1, 2, 3 e 4 ) , e o evento F representa pea no conforme. Repare que os eventos E t (fornecedores) so mutuamente exclusivos, pois a pea
somente pode ser originria de um dos fornecedores; e que o evento F tem interseo com cada um deles ( u m a vez que todos os fornecedores p r o d u z e m peas no conformes).
Suponha a m e s m a probabilidade para todos os fornecedores, isto ,

e as probabilidades de no-conformidade para cada fornecedor sejam:

Ento, usando (4.16), a probabilidade de no conforme dada por:

4.5

TEOREMA DE BAYES

O teorema de Bayes est intimamente relacionado ao teorema da probabilidade total. Supem-se as mesmas condies (eventos Et mutuamente exclusivos e exaustivos e um evento F qualquer). Basicamente, o teorema de Bayes
permite obter a probabilidade de que um dos eventos Et ocorra, sabendo-se que
o evento F ocorreu. Para o caso das peas dos quatro fornecedores, o Teorema
de Bayes permite responder a questes do tipo: "sabendo-se que a pea no
conforme, qual a probabilidade de que tenha vindo do fornecedor 4?"
De maneira geral, usando a expresso (4.8), temos:

Usando a regra do produto (4.10), podemos escrever o chamado Teorema


de Bayes:
(4.17)

onde P(F) calculado por (4.16).


Exemplo 4.12 (continuao) Sabendo-se que a pea no conforme, qual a
probabilidade de que ela tenha vindo do fornecedor 4?
Lembrando que j calculamos P(F) = 0,20, ento, aplicando (4.17), temos:

EXERCCIOS
10. Uma caixa contm trs cartes verdes, quatro amarelos, cinco azuis e trs
vermelhos. Dois cartes so retirados da caixa, ao acaso, um aps o outro,
sem reposio. Anotam-se suas cores. Calcular a probabilidade de que:
a)

os dois cartes sejam da mesma cor;

b)

os dois cartes sejam verdes, sabendo-se que so da mesma cor.

11. Uma rede local de computadores composta por um servidor e cinco clientes (A, B, C, D e E). Registros anteriores indicam que dos pedidos de determinado tipo de processamento, realizados atravs de uma consulta, cerca
de 10% vm do cliente A, 15% do B, 15% do C, 40% do D e 20% do E. Se
o pedido no for feito de forma adequada, o processamento apresentar
erro. Usualmente, ocorrem os seguintes percentuais de pedidos inadequados: 1% do cliente A, 2% do cliente B, 0,5% do cliente C, 2% do cliente D e
8% do cliente E.
a)

Qual a probabilidade de o sistema apresentar erro?

b)

Qual a probabilidade de que o processo tenha sido pedido pelo cliente


E, sabendo-se que apresentou erro?

EXERCCIOS

COMPLEMENTARES

12. A probabilidade de que Joozinho resolva este problema 0,5. A probabilidade de que Mariazinha resolva este problema 0,7. Qual a probabilidade de o problema ser resolvido se ambos tentarem independentemente?
13. Um sistema tem dois componentes que operam independentemente. Suponha que as probabilidades de falha dos componentes 1 e 2 sejam 0,1 e 0,2,
respectivamente. Determinar a probabilidade de o sistema funcionar nos
dois casos seguintes:
a)

os componentes so ligados em srie (isto , ambos devem funcionar


para que o sistema funcione);

b)

os componentes so ligados em paralelo (isto , basta um funcionar


para que o sistema funcione).

14. Um sistema tem quatro componentes que operam independentemente, sendo que cada componente tem probabilidade 0,1 de no funcionar. O sistema ligado da seguinte forma:

Determinar a probabilidade de o sistema funcionar.

15. De acordo com certa tbua de mortalidade, a probabilidade de Jos estar


vivo daqui a 20 anos de 0,6, e a mesma probabilidade para Manuel de
0,9. Determinar:
a)

P (ambos estarem vivos daqui a 20 anos);

b)

P (nenhum estar vivo daqui a 20 anos);

c)

P (um estar vivo e outro estar morto daqui a 20 anos).

16. Aps um longo processo de seleo para preenchimento de duas vagas de


emprego para engenheiro, uma empresa chegou a um conjunto de 9 engenheiros e 6 engenheiras, todos com capacitao bastante semelhante. Indeciso, o setor de recursos humanos decidiu realizar um sorteio para preencher as duas vagas oferecidas.
a)

construa o modelo probabilstico, considerando que se esteja observando o sexo (masculino ou feminino) dos sorteados;

b)

qual a probabilidade de que ambos os selecionados sejam do mesmo


sexo?

c)

sabendo-se que ambos os selecionados so do mesmo sexo, qual a


probabilidade de serem homens?

17. Est sendo avaliada a qualidade de um lote de peas numa indstria cermica, onde esto misturados 30 pisos e 40 azulejos.
a)

retira-se uma pea ao acaso do lote e observa-se o tipo de cermica.


Construa o modelo probabilstico para esta situao;

b)

retiram-se duas peas ao acaso do lote, uma aps a outra, com reposio, e observa-se o tipo de cermica. Construa o modelo probabilstico
para esta situao;

c)

repita o item (b), supondo que no haja reposio;

d)

registros anteriores da qualidade indicaram que 1,5% dos azulejos e


cerca de 0,7% dos pisos apresentaram defeitos. Retira-se, ao acaso,
uma pea do lote. Qual a probabilidade de a pea apresentar defeito?

e)

para as condies do item (d), qual a probabilidade de a pea ser


piso, uma vez que apresentou defeito?

18. A caixa I tem 8 peas boas e 2 defeituosas; a caixa II tem 6 peas boas e 4
defeituosas; a caixa III tem 9 peas boas e 1 defeituosa.
a)

tira-se, aleatoriamente, uma pea de cada caixa. Determinar a probabilidade de serem todas boas;

b)

escolhe-se uma caixa ao acaso e tira-se uma pea. Determinar a probabilidade de ser defeituosa;

c)

escolhe-se uma caixa ao acaso e tira-se uma pea. Calcular a probabilidade de ter sido escolhida a caixa I, sabendo-se que a pea defeituosa.

19. A qualidade de CDs foi avaliada em termos da resistncia a arranho e adequao das trilhas. Os resultados de 1.000 CDs foram:

Resistncia a arranho

Adequao das trilhas


Aprovado

Reprovado

Alta

700

140,

Baixa

100

60

Se um CD for selecionado ao acaso desse lote de 1.000 CDs, qual a


probabilidade de ele:
a)

ter resistncia a arranho alta e ser aprovado na avaliao das trilhas?

b)

ter resistncia a arranho alta ou ser aprovado na avaliao das trilhas?

c)

ser aprovado na avaliao das trilhas, dado que tem resistncia a arranho alta?

d)

ter resistncia a arranho alta, dado que foi aprovado na avaliao das
trilhas?

20. Certo sistema funciona somente se houver um caminho fechado de A a B,


com componentes que funcionam. Os componentes funcionam independentemente um dos outros. O sistema esquematizado abaixo, assim como
as probabilidades de falha de cada componente:

Calcule a probabilidade de o sistema funcionar.


21. Dois nmeros inteiros so extrados, aleatoriamente e sem reposio, do intervalo [- 20, 29]. Esses dois nmeros so multiplicados. Qual a probabilidade de o produto ser positivo?

Variveis Aleatrias Discretas

5.1

VARIVEL ALEATRIA

Um conceito de fundamental importncia para a estatstica indutiva o de


variveis aleatrias. Para entender esse conceito, imagine que um dado comum
vai ser lanado. Tente dizer qual ser o nmero resultante. claro que, antes
do lanamento, no podemos dizer qual o nmero que ocorrer, pois o resultado depende do fator sorte e, por isso, uma varivel aleatria.

Uma varivel aleatria pode ser entendida como varivel quantitativa,


cujo resultado (valor) depende de fatores aleatrios.

Outros exemplos de variveis aleatrias so:


a) nmero de coroas obtido no lanamento de duas moedas;
b) nmero de itens defeituosos em uma amostra retirada, aleatoriamente, de um lote;
c) nmero de defeitos em um azulejo que sai da linha de produo;
d) nmero de pessoas que visitam um determinado site, num certo perodo de tempo;
e) volume de gua perdido por dia, num sistema de abastecimento;
f)

resistncia ao desgaste de um tipo de ao, num teste padro;

g) tempo de resposta de um sistema computacional;


h) grau de empeno em um azulejo que sai da linha de produo.
Todos os exemplos acima tm uma caracterstica comum: alm do resultado ser quantitativo (valor real), no podemos prev-lo com exatido, pois ele
depende de experimento aleatrio.
Embora no exemplo do dado os valores que a varivel aleatria pode assumir coincidam com o espao amostrai do experimento, este no um caso geral. No exemplo (a), lanamento de 2 moedas, o espao amostrai mais completo
= {(cara, cara), (cara, coroa), {coroa, cara), (coroa, coroa)}, enquanto que a
varivel aleatria nmero de coroas assume valores no conjunto {0, 1, 2}. Mas
existe uma relao (funo) entre os dois conjuntos, conforme mostra o esquema a seguir:

Formalmente, uma varivel aleatria uma funo que associa elementos do espao amostrai ao conjunto de nmeros reais.
As variveis aleatrias podem ser discretas ou contnuas, conforme mostra
a Figura 5.1.

Figura 5.1 Variveis aleatrias discretas e contnuas.

Os casos (a) - (d) so exemplos de variveis aleatrias discretas e os casos


(g) - (h) so exemplos de variveis aleatrias contnuas. No restante deste captulo, trataremos apenas do primeiro caso.
Cabe observar que as variveis qualitativas tambm podem ser caracterizadas como variveis aleatrias discretas, desde que as representemos como variveis indicadoras 0 ou 1. Por exemplo, ao avaliar azulejos que saem de uma linha de produo, cada azulejo pode ser classificado como bom (X = 0) ou
defeituoso (X = 1). Nesse caso, a varivel aleatria discreta X est definida
como varivel indicadora de item defeituoso.1

5.1.1

Distribuio de probabilidades

Definida uma varivel aleatria discreta, temos a descrio do que pode


ocorrer no experimento aleatrio. Em alguns casos e sob certas suposies, temos duas informaes:
quais resultados podem ocorrer;
qual a probabilidade de cada resultado acontecer.
Exemplo 5.1 Seja a varivel aleatria X = nmero obtido no lanamento de
um dado comum. Se assumirmos o dado perfeitamente equilibrado e o lanamento imparcial, podemos alocar as seguintes probabilidades aos valores possveis de X:

Ou, mais resumidamente, p(j) = 1/6

0 = 1. 2, 3, 4, 5, 6).

1
Se houver mais de duas categorias (por exemplo, A, B e C), podemos usar mais de uma
varivel indicadora. No caso de trs categorias, podem ser empregadas as variveis aleatrias X e
Y, ondeX = 1 se ocorrer B, eX = 0 caso contrrio; Y = 1 se ocorrer C, e Y = 0 caso contrrio. A
ocorrncia de A estaria representada por X = 0 e Y = 0.

A distribuio de probabilidades de uma varivel aleatria X a descrio do conjunto de probabilidades associadas aos possveis valores de X, conforme foi ilustrado no exemplo precedente. Observe que a soma das probabilidades dos valores possveis de X igual a 1 (um).

Se X for discreta, com possveis valores {x1 , x2, ...}, ento a distribuio de
probabilidades de X pode ser apresentada pela chamada funo de probabilidade, que associa a cada valor possvel xt a sua probabilidade de
ocorrncia p(x) ou seja:

Existe certa similaridade entre as distribuies de probabilidades e as distribuies de freqncias vistas no Captulo 3. Contudo, na distribuio de probabilidades so mostrados os possveis valores e no os valores efetivamente observados. Alm disso, as probabilidades so, geralmente, alocadas a partir de
suposies a respeito do experimento aleatrio em questo, enquanto as freqncias so obtidas com efetivas realizaes do experimento.
A Figura 5.2 apresenta grficos que podem ser usados para representar a
distribuio de probabilidade de uma varivel aleatria discreta. O grfico em
hastes (do lado esquerdo) tpico para variveis aleatrias discretas. J o grfico em forma de histograma (do lado direito) construdo com o cuidado de a
rea total ser igual unidade.

Figura 5.2 Representaes grficas da distribuio de probabilidades da varivel


aleatria X = nmero obtido no lanamento de um dado comum.

5.1.2

Funo de distribuio acumulada

Outra forma de representar uma distribuio de probabilidades de uma


varivel aleatria atravs de sua funo de distribuio acumulada, que definida por:
(5.1)
Assim, para todo x e R a funo de distribuio acumulada descreve a
probabilidade de ocorrer um valor at x, conforme ilustrado a seguir:

A varivel aleatria X = nmero obtido no lanamento de um dado comum


tem a seguinte funo de distribuio acumulada:

Observe que os pontos em que a funo de probabilidade descreve probabilidades no nulas correspondem a saltos na funo de distribuio acumulada
e, tambm, que a altura de cada salto eqivale ao valor da probabilidade naquele ponto. Assim, para todo x e R, h uma relao direta entre p(x) e F(x).

5.1.3

Valor esperado e varincia

Na anlise exploratria de dados, discutimos algumas medidas (particularmente, a mdia, a varincia e o desvio padro - Captulo 3) para sintetizar as
informaes sobre distribuies de freqncias de variveis quantitativas. De
forma anloga, essas medidas tambm podem ser definidas para as variveis
aleatrias, com o objetivo de sintetizar caractersticas relevantes de uma distribuio de probabilidades. Considere uma varivel aleatria X e sua distribuio
de probabilidades:

A mdia ou valor esperado de uma varivel aleatria X dado por:


(5.2)

E a varincia por:
(5.3)
Alternativamente, a varincia pode ser calculada por:2
(5.4)

E o desvio padro dado por:


(5.5)
Retomemos o exemplo da varivel aleatria X = nmero obtido no lanamento de um dado comum, em que a funo de probabilidade dada por:

e calculemos o valor esperado e a varincia.

Considerando que as probabilidades podem ser interpretadas como limite


da freqncia relativa quando o experimento executado muitas e muitas vezes, podemos interpretar o valor esperado como a mdia aritmtica dos resultados da varivel aleatria se o experimento pudesse ser repetido infinitas vezes.
Assim, se pudssemos lanar o dado infinitas vezes, obteramos, em mdia, 3,5
pontos por lanamento. J a varincia informa sobre a disperso dos possveis
valores.
Observe que, no presente exemplo, o valor esperado = 3,5 um nmero
que a varivel aleatria no pode assumir. Fisicamente, o valor esperado corresponde ao centro de gravidade da distribuio de probabilidades.
Algumas propriedades

Sendo c uma constante e X e Y variveis aleatrias, as seguintes relaes


podem ser comprovadas:

As relaes (b) e (g) mostram que ao somar uma constante a uma varivel
aleatria, a distribuio de probabilidades deslocada por esta constante, mas
a variabilidade preservada. Todavia, ao multiplicar a varivel aleatria por
uma constante - relaes (c) e (h) -, o centro da distribuio deslocado na
mesma proporo e a variabilidade tambm alterada (ver Figura 5.3).

5.1.4

Variveis aleatrias independentes

Considere que um dado seja lanado duas vezes, sob as mesmas condies. Seja X( a varivel aleatria que representa o nmero de pontos obtido no
z-simo lanamento ( = 1, 2). Supondo que o dado seja perfeitamente equilibrado e o lanamento imparcial, ento X1 e X2 tm a mesma funo de probabilidade, que dada por:
P(j) =

/6

(j = 1, 2, 3, 4, 5, 6)

Considere, tambm, a varivel aleatria S como o nmero total de pontos


obtidos nos dois lanamentos, isto ,

S = X1 + X2
A funo de probabilidade de S pode ser obtida com base em funes de
probabilidades de Xl e X2 , resultando em:

Note que, se o primeiro lanamento for realizado e ocorrer o resultado x1


sendo x1 {1, 2, 3, 4, 5, 6}, a funo de probabilidade de X2 permanece a mesma, pois o segundo lanamento independe do primeiro. Assim, podemos dizer

que X1 e X2 so variveis aleatrias independentes.

No entanto, a funo de probabilidade de S alterada. Por exemplo, se


ocorrer o valor 1 (X1 = 1), ento a distribuio de S passa a ser:

Ou seja, X1 e S no so variveis aleatrias independentes.


Em geral, X1 X2,
Xn podem ser consideradas variveis aleatrias independentes se o conhecimento de uma no altera as distribuies de probabilidades das demais.
Muitas vezes as caractersticas do experimento permitem-nos avaliar se as
variveis aleatrias envolvidas so independentes. Essa condio importante,
pois a maioria dos mtodos estatsticos desenvolvida na suposio de que as
observaes provm de variveis aleatrias independentes.
Considerando a regra do produto, podemos calcular a probabilidade de

sair nmero par nos dois lanamentos do dado simplesmente multiplicando a


probabilidade de sair par em cada lanamento, ou seja, (1/2) . (1/2) = 1/4. Pode-

mos representar o evento sair nmero par nos dois lanamentos do dado por:
{X1 (2, 4, 6), X2 (2, 4, 6)}
E a probabilidade deste evento por:

Para um conjunto de variveis aleatrias X1 X2, ..., Xn, definimos:

Se X e Y so variveis aleatrias independentes, ento:


V(X + Y) = V(X) + V(Y)

(5.6)

V(X - Y) = VQO + V(Y)

(5.7)

Note, por (5.7), que a varincia da diferena de duas variveis aleatrias


independentes a soma das varincias de cada varivel aleatria. Isso decorre
da propriedade (h) (Seo 5.1.3).

EXERCCIOS
1.

Apresente a funo de probabilidade para as seguintes variveis aleatrias:


a)

Nmero de caras obtido com o lanamento de uma moeda honesta;

b)

Nmero de caras obtido no lanamento de duas moedas honestas;

c)

Nmero de peas com defeito em uma amostra de duas peas, sorteadas aleatoriamente de um grande lote, em que 40% das peas so defeituosas;

d)

Nmero de peas com defeito em uma amostra de trs peas, sorteadas aleatoriamente de um grande lote, em que 40% das peas so defeituosas.

2.

Apresente, sob forma grfica, a distribuio de probabilidades do Exerccio 1(d).

3.

Apresente a funo de probabilidade acumulada do Exerccio 1(d).

4.

Calcule os valores esperados e as varincias das distribuies de probabilidade do Exerccio 1.

5.

Considere que um produto pode estar perfeito (B), com defeito leve (DL)
ou com defeito grave (DG). Seja a seguinte distribuio do lucro (em R$),
por unidade vendida desse produto:

6.

a)

Calcule o valor esperado e a varincia do lucro.

b)

Se, com a reduo de desperdcios, foi possvel aumentar uma unidade


no lucro de cada unidade do produto, qual o novo valor esperado e a
varincia do lucro por unidade?

c)

E se o lucro duplicou, qual o novo valor esperado e varincia do lucro por unidade?

Certo tipo de conserva tem peso lquido mdio de 900 g, com desvio padro de 10 g. A embalagem tem peso mdio de 100 g, com desvio padro
de 4 g. Suponha que o processo de enchimento das embalagens controla o
peso lquido, de tal forma que se possa supor independncia entre o peso
lquido e o peso da embalagem. Qual a mdia e o desvio padro do peso
bruto?

5.2

PRINCIPAIS DISTRIBUIES DISCRETAS


Na seo anterior, construmos as distribuies de probabilidades de algu-

mas variveis aleatrias, empregando nosso conhecimento para o clculo das


probabilidades envolvidas. Nesta seo, estudaremos alguns modelos probabilsticos padres, que podem ser usados em diversas situaes prticas. O problema
passa a ser, ento, determinar qual modelo o mais adequado para a situao
em estudo e como aplic-lo adequadamente.
Lembremos que, para identificarmos uma varivel aleatria discreta, temos de conhecer quais resultados podem ocorrer e quais so as probabilidades
associadas aos resultados. A seguir, vamos ver os principais modelos discretos.

5.2.1

Distribuio de Bernoulli

Talvez os experimentos mais simples so aqueles em que observamos a


presena ou no de alguma caracterstica, que so conhecidos como ensaios de
Bernoulli. Alguns exemplos:
a) lanar uma moeda e observar se ocorre cara ou no;
b) lanar um dado e observar se ocorre seis ou no;
c)

numa linha de produo, observar se um item, tomado ao acaso,


ou no defeituoso;

d) verificar se um servidor de uma intranet est ou no ativo.

Denominamos sucesso e fracasso os dois eventos possveis em cada caso.3


O ensaio de Bernoulli caracterizado por uma varivel aleatria X, definida
por X = 1, se sucesso; X = 0, se fracasso. A funo de probabilidade de X (Distribuio de Bernoulli) dada por

onde p = P{sucesso}. A distribuio fica completamente especificada ao


atribuirmos um valor para p. No exemplo (a), se o lanamento for imparcial e a
moeda perfeitamente equilibrada, p = 1/2. Em (b), com suposio anloga, p = 1/6.
Outras caractersticas da distribuio de Bernoulli:

5.2.2

Distribuio Binomial

Na maior parte das vezes, so realizados n ensaios de Bernoulli. O interesse est no nmero X de ocorrncias de sucesso, como nos exemplos a seguir:
a)

lanar uma moeda cinco vezes e observar o nmero de caras;

b) numa linha de produo, observar dez itens, tomados ao acaso, e


verificar quantos esto defeituosos;
c)

verificar, num dado instante, o nmero de processadores ativos,


num sistema com multiprocessadores;

d) verificar o nmero de bits que no esto afetados por rudos, em um


pacote com n bits.
Nos exemplos precedentes, se for possvel supor:
ensaios independentes;
P{sucesso} = p, constante para todo ensaio (0 < p < 1).
3 No presente contexto, o termo sucesso no significa algo bom, mas simplesmente um
resultado ou evento no qual temos interesse; e fracasso, o outro resultado ou evento possvel.

Temos, ento, exemplos de experimentos binomiais.


Uma varivel aleatria com distribuio binomial de parmetros n e p
pode ser apresentada por:

X = X1 + X2 + ... + Xn

(5.11)

onde Xl9 X2, ...,Xn so variveis aleatrias independentes, sendo cada uma delas
com distribuio de Bernoulli de parmetro p. Como Xt ser 0 ou 1, dependendo da ocorrncia ou no de sucesso no i-simo ensaio (i = 1, 2, ..., n), ento a
soma X corresponder ao nmero de sucessos. Para especificarmos a funo de
probabilidade de X, considere o seguinte exemplo:
Exemplo 5.1 Uma indstria processadora de suco classifica os carregamentos
de laranja que chegam a suas instalaes em A, B ou C. Suponha independncia
entre as chegadas dos carregamentos, isto , a classificao de um no altera a
classificao dos demais. Suponha tambm que a probabilidade p de classificao na classe A a mesma para todos os carregamentos. Para os prximos 4
carregamentos, seja X a varivel aleatria que representa o nmero de carregamentos classificados na classe A. Vamos calcular a probabilidade de que X assuma o valor x, isto , a probabilidade de que x carregamentos sejam classificados
na classe A (x = 0, 1, 2, 3, 4).
Para cada carregamento, seja S (sucesso) quando este for classificado na
classe A; e seja F (fracasso) quando este for classificado em outra classe. A Figura 5.4 mostra todas as possveis seqncias de resultados, os possveis valores
de X e as correspondentes probabilidades.
Resultados possveis de 4 carregamentos:

Explicando as probabilidades da Figura 5.4. O evento X = 0 ocorre quando


nenhum carregamento classificado na classe A (FFFF), cuja probabilidade

(1 - p ) ( 1 - p ) ( l - p ) ( 1 - p ) = (1 - p ) 4 . O evento X = 1 ocorre quando um carregamento for classificado na classe A (SFFF ou FSFF ou FFSF ou FFFS). Como
cada um desses resultados tem probabilidade p( 1 - p) 3 , a probabilidade do
evento X = 1 igual a 4p(l - p) 3 . As outras probabilidades podem ser obtidas
de forma anloga.
Coeficientes binomiais
Na Figura 5.4, podemos observar que no clculo da probabilidade do
evento X = 1, contamos de quantas maneiras poderia aparecer um sucesso entre as quatro possibilidades, assim encontramos a quantidade quatro, correspondente s seguintes seqncias de respostas: SFFF, FSFF, FFSF e FFFS.
Em geral, na distribuio binomial, para calcular a probabilidade do evento X = x, onde x um valor possvel da varivel aleatria X, precisamos conhecer o nmero de maneiras em que podemos combinar os x sucessos entre os n
ensaios. Esse valor, conhecido como coeficiente binomial, entra no clculo da
probabilidade como um coeficiente das potncias de p e 1 - p, como verificamos na Figura 5.4.

Expresso geral da distribuio binomial


Seja X uma varivel aleatria com distribuio binomial de parmetros n e
p (sendo 0 < p < 1). A probabilidade de X assumir um certo valor x, pertencente
ao conjunto {0, 1, 2,..., n}, dada pela expresso:

(5.13)
Exemplo 5.2 (continuao). Historicamente, 3 0 % dos carregamentos so classificados na classe A, em que podemos supor que a probabilidade p de um carregamento ser classificado na classe A 0,3. Entre os quatro prximos carregamentos, calculemos a probabilidade de exatamente dois serem classificados na
classe A.
T e m o s n = 4 e p = 0,3. Assim, a probabilidade de x carregamentos serem
classificados na classe A dada por:

A Tabela 1 do apndice apresenta probabilidades da binomial para n 15


e p mltiplo de 0,05. O Exemplo 5.3 ilustra o uso da tabela.
Exemplo 5.2 Dados histricos mostram que 7 0 % das pessoas que acessam a
pgina p23 da internet t a m b m acessam a pgina p24. Obteremos, atravs da
tabela da distribuio binomial, a probabilidade de que, nos dez prximos acessos p23, a maioria t a m b m acesse a p24.

Note que temos um experimento binomial, com


n = 10 e p = 0,7 (supondo independncia entre os acessos). Usando a Tabela da distribuio binomial, podemos
especificar a distribuio de X = nmero de pessoas que
tambm acessam a p24. A probabilidade de ocorrer o
evento a maioria tambm acessar a p24 corresponde, em
termos da varivel aleatria X, ao evento {X > 5}, como
ilustramos ao lado. A probabilidade deste evento ser a
soma dos resultados individuais, ou seja:

Se X tem distribuio binomial de parmetros nep, ento seu valor esperado e sua varincia p o d e m ser calculados por:

E(X)

= n.p

V(X) = n.p. (1 - p)

(5.14)
(5.15)

A Figura 5.5 mostra duas distribuies binomiais com a indicao da posio dos respectivos valores esperados.

Distribuies binomiais com p = 0,5 so simtricas, mas so assimtricas


quando p 0,5. A assimetria aumenta medida que p aproxima-se de zero (assimetria positiva) ou de um (assimetria negativa).

EXERCCIOS
7.

8.

Dados histricos mostram que 5% dos itens provindos de um fornecedor


apresentam algum tipo de defeito. Considerando um lote com 20 itens, calcular a probabilidade de:
a)

haver algum item com defeito;

b)

haver exatamente dois itens defeituosos;

c)

haver mais de dois itens defeituosos;

d)

qual o nmero esperado de itens defeituosos no lote?

e)

e de itens bons?

Apresente o grfico da varivel aleatria do Exemplo 5.2 sob a forma de


um histograma, indique a posio do valor esperado e represente P(X > 5)
como uma rea na figura.

5.2.3

Distribuio hipergeomtrica

Considere o problema bsico de inspeo por amostragem, em que observamos uma amostra de n itens de um lote com N itens, sendo r defeituosos.
Avaliamos o nmero X de itens defeituosos na amostra. A varivel aleatria X
aparenta ser binomial, mas s realmente binomial se:
a seleo da amostra for aleatria (para garantir a mesma probabilidade p de sair item defeituoso em todos os ensaios);
com reposio (para garantir independncia entre os ensaios).
A segunda condio no costuma ser satisfeita na prtica. Se a amostragem for aleatria, mas sem reposio, a distribuio de X conhecida como hipergeomtrica de parmetros N, n e r (ver Figura 5.6).
Amostra com n itens

Figura 5.6

Caso tpico de inspeo por amostragem. Varivel aleatria em estudo: X = nmero de defeituosos na amostra.

A funo de probabilidade de X expressa por:

(5.16)

com valor esperado e varincia dados por:


(5.17)
(5.18)

Exemplo 5.3 Placas de vdeo so expedidas em lotes de 30 unidades. Antes


que a remessa seja aprovada, um inspetor escolhe aleatoriamente cinco placas
do lote e as inspeciona. Se nenhuma das placas inspecionadas for defeituosa, o
lote aprovado. Se uma ou mais forem defeituosas, todo o lote inspecionado.
Supondo que haja trs placas defeituosas no lote, qual a probabilidade de que
o controle da qualidade aponte para a inspeo total?
Seja X o nmero de placas defeituosas na amostra. Desejamos calcular:

P(X 1) = 1 - P(X = 0)
Usando o modelo hipergeomtrico:

Logo, P(X 1) = 1 - 0,5665 = 0,4335.


importante ressaltar que quando N muito maior do que n, a distribuio hipergeomtrica pode ser aproximada pela binomial. Muitos autores prescrevem uma relao n/N 0,05 para que seja possvel fazer a aproximao.4 Nesse caso, a binomial tem parmetros n e p = r/N .

EXERCCIOS
9.

Qual a probabilidade do Exemplo 5.3, se a inspeo completa for feita somente quando forem encontradas mais do que uma placa defeituosa na
amostra?

10. Calcule o valor esperado e a varincia da varivel aleatria definida no


Exemplo 5.3.

5.2.4

Distribio de Poisson

Considere as situaes em que se avalia o nmero de ocorrncias de um


tipo de evento por unidade de tempo, de comprimento, de rea, ou de volume.
Por exemplo:
4
Observe que se N for muito maior que n, as retiradas, mesmo feitas sem reposio, no
iro modificar em demasia as probabilidades de ocorrncias de sucessos (e de fracassos), na seqncia de ensaios.

a) nmero de consultas a uma base de dados em um minuto;


b) nmero de pedidos a um servidor num intervalo de tempo;
c) nmero de erros de tipografia em um formulrio;
d) nmero de defeitos em um m 2 de piso cermico;
e) nmero de pulsaes radioativas em um intervalo de tempo, na desintegrao dos ncleos de uma substncia radioativa.
Suposies bsicas:
independncia entre as ocorrncias do evento considerado;
os eventos ocorrem de forma aleatria, de tal forma que no haja tendncia de aumentar ou reduzir as ocorrncias do evento, no intervalo
considerado.
Para desenvolvermos a distribuio de Poisson, consideremos a varivel
aleatria X = nmero de consultas a uma base de dados em um minuto. Ou seja,
X a contagem de ocorrncias de consultas no intervalo de tempo [0, 1), como
representado a seguir:

Considere o intervalo [0, 1) particionado em n subintervalos de amplitude


1/n;
t
=

Seja n suficientemente grande para que a probabilidade de ocorrer duas


ou mais consultas, em cada subintervalo de amplitude At, seja desprezvel,
Assim, considere que em cada subintervalo s possa ocorrer 0 ou 1 consulta.
Sendo p a probabilidade de ocorrer uma consulta em t, as probabilidades associadas a X podem ser calculadas, aproximadamente, pela binomial (Expressc
5.13). Ento,

Ento, sendo X a taxa mdia de consultas por unidade de tempo, as probabilidades de X p o d e m ser calculadas pela chamada distribuio de Poisson, cuja
funo de probabilidade dada por:

Exemplo 5.4 Supondo que as consultas n u m banco de dados ocorrem de forma independente e aleatria, c o m u m a taxa mdia de trs consultas por minuto, calculemos a probabilidade de que no prximo minuto ocorram menos do
que trs consultas.

Seja X o nmero de consultas por minuto. Ento:

A Tabela 2 do apndice apresenta as probabilidades acumuladas da Poisson,


isto :

Exemplo 5.4 (continuao) Calculemos a probabilidade de que nos prximos


dois minutos ocorram mais do que 5 consultas.
Observe que a unidade de tempo alterou de um para dois minutos. Mas se
a taxa mdia de trs ocorrncias por minuto, ento, em dois minutos, a taxa
mdia de seis ocorrncias. Logo, no presente problema, = 6 e

Aproximao da binomial pela Poisson

Justificamos a distribuio de Poisson a partir da binomial, fazendo n oo


e p 0 (Expresso 5.20). Logo, em experimentos binomiais, quando n for muito grande e p for muito pequeno, podemos usar a distribuio de Poisson com:
, = n.p

(5.24)

Observe que se n for grande (acima de 100, por exemplo) as combinaes


da binomial ficam difceis de serem calculadas. Nesse caso, o uso da aproximao Poisson torna-se imprescindvel.
Exemplo 5.5 Seja uma linha de produo em que a taxa de itens defeituosos
de 0,5%. Calculemos a probabilidade de ocorrer mais do que quatro defeituosos, em uma amostra de 500 itens.

EXERCCIOS
11. Mensagens chegam a um servidor de acordo com uma distribuio de
Poisson, com taxa mdia de cinco chegadas por minuto.
a)

Qual a probabilidade de que duas chegadas ocorram em um minuto?

b)

Qual a probabilidade de que uma chegada ocorra em 30 segundos?

12. Em um canal de comunicao digital, a probabilidade de se receber um bit


com erro de 0,0002. Se 10.000 bits forem transmitidos por esse canal,
qual a probabilidade de que mais de quatro bits sejam recebidos com
erro?

EXERCCIOS COMPLEMENTARES
13. Um armazm abastecido mensalmente, sendo que a taxa mdia de abastecimento 30 unidades/dia, com desvio padro de 3 unidades/dia. A demanda mdia de 25 unidades/dia, com desvio padro de 4 unidades/dia.
Suponha que o abastecimento e a demanda sejam independentes e, alm
disso, a demanda e o abastecimento num dia no alteram o abastecimento
e a demanda nos dias seguintes. Qual o valor esperado e o desvio padro
do excedente de produtos, no perodo de um ms?

14. Suponha que 10% dos clientes que compram a crdito em uma loja deixam
de pagar regularmente suas contas (prestaes). Se num particular dia, a
loja vende a crdito para 10 pessoas, qual a probabilidade de que mais de
20% delas deixem de pagar regularmente as contas? Suponha que as 10
pessoas que fizeram credirio nesse dia correspondam a uma amostra aleatria de clientes potenciais desta loja.
15. Em um sistema de transmisso de dados, existe uma probabilidade igual a
0,05 de um lote de dados ser transmitido erroneamente. Foram transmitidos 20 lotes de dados para a realizao de um teste de anlise da confiabilidade do sistema.
a)

Qual o modelo terico mais adequado para esse caso? Por qu?

b)

Calcule a probabilidade de haver erro na transmisso.

c)

Calcule a probabilidade de que haja erro na transmisso em exatamente 2 dos 20 lotes de dados.

d)

Qual o nmero esperado de erros no teste realizado?

16. Numa fbrica, 3% dos artigos produzidos so defeituosos. O fabricante


pretende vender 4000 peas e recebeu 2 propostas:
Proposta 1: o comprador A prope examinar uma amostra de 80 peas.
Se houver 3 ou menos defeituosas, ele paga 60 unidades monetrias (u.m.)
por pea; caso contrrio, ele paga 30 u.m. por pea.
Proposta 2: o comprador B prope examinar 40 peas. Se todas forem
perfeitas, ele est disposto a pagar 65 u.m. por pea; caso contrrio, ele
paga 20 u.m. por pea.
Qual a melhor proposta? (Calcule o valor esperado da venda em
cada proposta.)
17. O departamento de qualidade de uma empresa seleciona, aleatoriamente,
alguns itens que chegam empresa e submete-os a testes. Para avaliar um
lote de transformadores de pequeno porte, o departamento de qualidade
selecionou, aleatoriamente, 10 transformadores. Ele vai recomendar a aceitao do lote se no existir item defeituoso na amostra. Supondo que o
processo produtivo desses transformadores gera um percentual de 3% de
defeituosos, responda:
a)

Qual a probabilidade de que o lote venha a ser aceito?

b)

Ao analisar 8 lotes de transformadores, com amostras aleatrias de 10


itens em cada lote, qual a probabilidade de que, no mximo, um lote
seja rejeitado?

18. Na comunicao entre servidores, uma mensagem dividida em n pacotes,


os quais so enviados em forma de cdigos. Pelo histrico da rede, sabe-se

que cada pacote tem uma pequena probabilidade, igual a 0,01, de no


chegar corretamente a seu destino e, alm disso, o fato de um pacote
no chegar ao destino no altera a probabilidade dos demais chegarem
corretamente. Um programa corretivo garante o envio correto da mensagem quando o nmero de pacotes enviados erroneamente no passar de
10% do total de pacotes da mensagem. Qual a probabilidade de uma
mensagem composta de 20 pacotes ser enviada corretamente? Responder
usando:
a)

a distribuio binomial;

b)

a distribuio de Poisson.

19. Uma central telefnica recebe, em mdia, 300 chamadas na hora de maior
movimento, e pode processar, no mximo, 10 ligaes por minuto. Utilizando a distribuio de Poisson, calcular a probabilidade de que a capacidade da mesa seja ultrapassada em dado minuto do horrio de pico.
20. Um piso cermico tem, em mdia, 0,01 defeito por m 2 . Em uma rea de
10 m x 10 m desse piso, calcule a probabilidade de ocorrer algum defeito.
2 1 . Placas de circuito integrado so avaliadas aps serem preenchidas com
chips semicondutores. Considere que foi produzido um lote de 20 placas e
selecionadas 5 para avaliao. Calcule a probabilidade de encontrar pelo
menos uma placa defeituosa, supondo que o lote tenha 4 defeituosas e que
tenha sido realizada:
a)

uma amostragem aleatria com reposio;

b)

uma amostragem aleatria sem reposio.

22. Suponha que o nmero de falhas em certo tipo de placa plstica tenha distribuio de Poisson, com taxa mdia de 0,05 defeito por m 2 . Na construo de um barco, necessrio cobrir uma superfcie de 3 m x 2 m com essa
placa.
a)

Qual a probabilidade de que no haja falhas nessa superfcie?

b)

Qual a probabilidade de que haja mais que uma falha nessa superfcie?

c)

Na construo de 5 barcos, qual a probabilidade de que pelo menos 4


no apresentem defeito na superfcie plstica?

23. Um item vendido em lotes de 200 unidades. Normalmente o processo de


fabricao gera 5% de itens defeituosos. Um comprador compra cada caixa
por R$ 100,00 (alternativa 1). Um outro comprador faz a seguinte proposta: de cada lote, ele escolhe uma amostra de 15 peas; se a caixa tem 0 defeituoso, ele paga R$ 200,00; 1 defeituoso, ele paga R$ 50,00; mais que 1
defeituoso, ele paga R$ 5,00 (alternativa 2). Em mdia, qual alternativa

mais vantajosa para o fabricante? (Calcule os valores esperados das duas


alternativas.)
24. Na produo de rolhas de cortia, no possvel garantir qualidade homognea, devido s variaes internas nas placas de cortia. Em funo disso,
um equipamento separa as rolhas que saem da linha de produo em duas
categorias: A e B. Os dados histricos mostram que 40% so classificadas
como A e 60% como B. O fabricante vende por R$ 100,00 o milhar de rolhas da categoria A; e por R$ 60,00 o milhar da categoria B.
Um comprador prope comprar a produo diria da fbrica. Ele far
um plano de amostragem, extraindo 8 rolhas aleatoriamente. Se encontrar
mais que 5 rolhas da categoria A, ele paga R$ 200,00; caso contrrio, ele
paga R$ 50,00. Pede-se:
a)

Qual a probabilidade do comprador encontrar mais que 5 rolhas da


classe A?

b)

Qual o valor esperado da venda do fabricante, por milhar de rolhas


vendidas, se ele aceitar a proposta do comprador? Em termos do valor
esperado da venda, a proposta do comprador mais vantajosa do que
a venda separada por categoria?

c)

Qual a varincia da venda do fabricante, por milhar de rolhas vendidas, se ele aceitar a proposta do comprador?

25. Suponha que as requisies a um sistema ocorram de forma independente


e que a taxa mdia de ocorrncias trs requisies por minuto, constante
no perodo em estudo. Calcule a probabilidade de:
a)

ocorrer mais que uma requisio no prximo minuto;

b)

ocorrer mais que uma requisio no prximo minuto, sabendo-se que


certa a ocorrncia de pelo menos uma (pois, voc mesmo far uma requisio no prximo minuto).

Variveis Aleatrias Contnuas

6.1

CARACTERIZAO DE UMA VARIVEL ALEATRIA


CONTNUA

Muitas variveis aleatrias que surgem na vida de um engenheiro ou de


um profissional da informtica tm natureza eminentemente contnua, tais
como:
tempo de resposta de um sistema computacional;
rendimento de um processo qumico;
tempo de vida de um componente eletrnico;
resistncia de um material etc.
Outras vezes, h variveis aleatrias discretas, com grande nmero de possveis resultados, em que prefervel usar um modelo aproximado contnuo no
lugar do modelo exato discreto. o caso de:
nmero de transaes por segundo de uma CPU;
nmero de defeitos numa amostra de 5.000 itens etc.
Para entender as peculiaridades das variveis aleatrias contnuas, imagine o seguinte experimento.

Exemplo 6.1a Um crculo dividido em dois setores de mesmo tamanho (180 cada um), aos quais so atribudos os nmeros 1 e 2. Um ponteiro preso ao centro do crculo e girado, conforme mostra a figura ao lado. Seja a varivel aleatria
discreta X = nmero do setor apontado quando o ponteiro pra
de girar. A distribuio de probabilidades de X, considerando
que todos os pontos sejam equiprovveis, pode ser especificada
pela funo de probabilidade da Figura 6.1.

Figura 6.1 Trs formas de apresentao da funo de probabilidade do experimento aleatrio do exemplo 6.1a.

A representao com grfico de hastes tpica para variveis discretas.


Apresentamos, tambm, um grfico em forma de histograma, em que as probabilidades podem ser representadas por rea. No caso do exemplo em questo,
as bases dos retngulos so iguais unidade, o que faz com que a rea seja
igual altura do retngulo.1
Exemplo 6.1b Considere, agora, o crculo dividido em quatro setores de mesmo tamanho (90 cada um). A distribuio de probabilidades da varivel aleatria discreta X = nmero do setor apontado quando o ponteiro pra de girar
apresentada na Figura 6.2.

Figura 6.2

Representao grfica da funo de probabilidade do experimento


aleatrio do Exemplo 6.1b.

Ao representarmos probabilidades por reas, devemos tomar o cuidado para que

rea total seja igual unidade.

Exemplo 6.1c Imagine que o crculo seja dividido em 8, 16 e 32 setores. A Figura 6.3 mostra a funo de probabilidade de X em cada caso.

Figura 6.3 Representaes grficas das funes de probabilidade dos experimentos aleatrios do Exemplo 6.1c.
fcil verificar que medida que aumentamos o nmero de divises no
crculo, o nmero de possveis setores (resultados de uma varivel aleatria discreta) vai aumentando, e a probabilidade de cada resultado ocorrer (representada pela rea de um retngulo) vai sendo reduzida. Teoricamente, o crculo
pode ser dividido em infinitos setores, o que torna invivel a representao tabular ou grfica da distribuio de probabilidades, da forma como fizemos no
Exemplo 6.1. Em termos matemticos, teramos:

Uma alternativa melhor definir uma varivel aleatria contnua, como


veremos na seo seguinte.

6.1.1

Funo densidade de probabilidade

Exemplo 6.2 Considere um crculo, com medidas de ngulos, em graus, a


partir de determinada origem, como mostra a figura ao lado. Nesse crculo, h
um ponteiro que colocado a girar.

Seja a varivel aleatria contnua X = ngulo formado entre a posio que o


ponteiro pra e a linha horizontal do lado direito. Considerando que no existe
regio de preferncia para o ponteiro parar, a distribuio de probabilidade de X pode ser representada por
uma funo que assume um valor constante e positivo
em todo o intervalo [0o, 360), de tal forma que as probabilidades possam ser representadas por reas sob a
curva dessa funo. Como certamente vai ocorrer um resultado em [0 o , 360), ento a rea sob a funo neste
intervalo deve ser igual a 1, e nula fora deste intervalo.
A Figura 6.4 ilustra a distribuio de probabilidades de
X, atravs da chamada funo densidade de probabilidade, e mostra a relao entre uma rea e um evento.

Figura 6.4

(a) Funo densidade de probabilidade da varivel aleatria do


Exemplo 6.2; e (b) Probabilidade do evento {0 X < 90}, representada por uma rea.

Note que os eventos associados a uma varivel aleatria contnua so intervalos (ou coleo de
intervalos) dos nmeros reais. Com base na funo
densidade de probabilidade, podemos calcular probabilidades de eventos desse tipo. Por exemplo,
qual a probabilidade do ponteiro parar no intervalo [30, 60]? Tomando a rea do retngulo indicado na figura ao lado, temos:

Observe que a incluso ou excluso dos extremos no altera a probabilidade, pois uma linha tem rea nula. Ou seja, para uma varivel aleatria contnua, a probabilidade de ocorrer um particular valor igual a zero.

As probabilidades de eventos associados a uma varivel aleatria contnua


X podem ser calculadas atravs de uma funo densidade de probabilidade f que deve satisfazer:

Exemplo 6.3 Seja a varivel aleatria T definida como o tempo de resposta


na consulta a um banco de dados, em minutos. Suponha que essa varivel aleatria tenha a seguinte funo densidade de probabilidade:

Vamos calcular a probabilidade de a resposta


demorar mais do que 3 minutos, isto , P(T > 3).

6.1.2

Funo de distribuio acumulada

Como X uma varivel aleatria contnua com funo de densidade de


probabilidade f, definimos sua funo de distribuio acumulada por:

(6.2)
Considere a funo densidade de probabilidade do Exemplo 6.3:

Vamos obter a funo de distribuio acumulada. Como a expresso matemtica se altera no ponto zero, devemos considerar os dois seguintes casos:

Resumindo, a funo de distribuio acumulada da varivel aleatria T


dada por:

Cabe observar que possvel obter qualquer probabilidade atravs da funo de distribuio acumulada. Para a < b, temos:
(6.3)
(6.4)
(6.5)
Retomando o Exemplo 6.3, o clculo de P(T > 3) pode ser feito aplicando (6.4):

Dada a funo de distribuio acumulada F, podemos obter a funo densidade de probabilidade f por:

(6.6)
para todo ponto x em que F derivvel.2 Assim, a funo F tambm caracteriza
a distribuio de probabilidades de uma varivel aleatria.

6.1.3

Valor esperado e varincia

Uma varivel aleatria contnua X, com funo densidade de probabilidade f, tem valor esperado e varincia definidos por:
(6.7)

(6.8)

No conjunto finito de pontos em que F no derivvel, podemos arbitrar valores para/.

As interpretaes dessas medidas podem ser feitas de forma anloga ao


caso discreto. Alm disso, todas as propriedades enunciadas para o caso discreto continuam vlidas para o caso contnuo, em especial
(6.9)

Retomando o Exemplo 6.3, em que a varivel aleatria T era caracterizada por

EXERCCIOS
1.

2.

Seja um ponto escolhido aleatoriamente no intervalo [0, 1].


a)

Apresente uma funo densidade de probabilidade para este experimento.

b)

Obtenha a funo de distribuio acumulada.

c)

Calcule o valor esperado e a varincia.

Um profissional de Computao observou que seu sistema gasta entre 20 e


24 segundos para realizar determinada tarefa. Considere a probabilidade
uniforme em [20, 24], isto , todo subintervalo de mesma amplitude em

[20, 24] tem a mesma probabilidade. Como pode ser descrita, grfica e algebricamente, a funo densidade de probabilidade? Sob essa densidade,
calcule:

3.

Com respeito ao exerccio anterior, mas supondo probabilidades maiores


em torno de 22 segundos e a densidade decrescendo, simtrica e linearmente, at os extremos 2C e 24 segundos. Como pode ser descrita, grfica
e algebricamente, a funo densidade de probabilidade? Sob essa densidade, calcule:

Comparando os grficos das funes de densidade de probabilidade


dos dois exerccios, voc acha razoveis as diferenas encontradas nos trs
itens?
4.

Seja X uma varivel aleatria com funo de distribuio acumulada

Obtenha a funo densidade de probabilidade de X.


5.

Seja X com funo densidade de probabilidade dada por

Calcule:

6.2

PRINCIPAIS MODELOS CONTNUOS


Nesta seo sero descritos trs modelos contnuos bastante conhecidos.

6.2.1

Distribuio uniforme

Relembremos o Exemplo 6.2, onde tnhamos um crculo e um ponteiro que era colocado a girar. A varivel
aleatria de interesse era X = ngulo formado entre a posio que o ponteiro pra e a linha horizontal do lado direito.
Sups-se, tambm, no existir regio de preferncia para o
ponteiro parar. Nessas codies, podemos considerar que
todo intervalo de mesma amplitude, contido em [0o, 360),
tem a mesma probabilidade de ocorrncia. um experimento tpico em que a chamada distribuio uniforme apropriada.
Uma varivel aleatria X tem distribuio uniforme de parmetros e ,
sendo > , se sua densidade especificada por:

(6.10)
Em conseqncia, sua distribuio acumulada dada por (ver Figura 6.5):

(6.11)

Figura 6.5

Representao grfica da funo densidade de probabilidade e da funo de distribuio acumulada de uma varivel aleatria com distribuio uniforme em [, ].

O valor esperado e a varincia de uma distribuio uniforme so:

(6.12)
(6.13)

Note que o valor esperado da distribuio uniforme exatamente o ponto


mdio do intervalo [, ], ou seja, nessa distribuio fica evidente que representa o centro de gravidade da massa descrita pela funo densidade de probabilidade.

6.2.2

Distribuio exponencial

O modelo exponencial tem forte relao com o modelo discreto de Poisson.


Enquanto a distribuio de Poisson pode ser usada para modelar o nmero de
ocorrncias em um perodo contnuo (de tempo ou de comprimento), a distribuio exponencial pode modelar a varivel aleatria contnua que representa o
intervalo (de tempo ou de comprimento) entre as ocorrncias. Exemplos:
a) tempo (em minutos) at a prxima consulta a uma base de dados;
b) tempo (em segundos) entre pedidos a um servidor;
c)

distncia (em metros) entre defeitos de uma fita.

A distribuio exponencial pode ser usada quando as suposies de Poisson


(independncia entre as ocorrncias e taxa mdia de ocorrncia constante no
intervalo considerado) estiverem satisfeitas. A Figura 6.6 ilustra a relao entre
as duas distribuies.

Figura 6.6 Relao entre a distribuio de Poisson e a exponencial

Para chegarmos formulao matemtica da distribuio exponencial, vamos considerar a equivalncia entre os dois seguintes eventos:

Sejam as variveis aleatrias:


Xt = nmero de ocorrncias no intervalo de tempo [0, t); e
T = tempo entre as ocorrncias.
Sendo a taxa mdia de ocorrncias por unidade de tempo, ento, considerando independncia entre as ocorrncias, Xt tem distribuio de Poisson
com parmetro t. E a equivalncia entre os dois eventos pode ser expressa por:

Usando o evento complementar, podemos definir para todo t > 0 a funo


de distribuio acumulada de uma varivel aleatria T com distribuio exponencial:
(6.14)
Em conseqncia, para t > 0 temos a funo densidade de probabilidade
dada por:
(6.15)

Figura 6.7

Representao grfica da funo densidade de probabilidade de uma


varivel aleatria com distribuio exponencial.

Em geral, mais fcil partir do complemento de F(t) para calcular as probabilidades, ou seja, para t > 0,

(6.16)
Exemplo 6.3 (continuao) Dada a varivel aleatria T = tempo de
resposta na consulta a um banco de dados por minutos) com funo densidade
de probabilidade

ou seja, uma exponencial com = 2, calcular a probabilidade da consulta demorar mais que 3 minutos, isto , P(T > 3). Podemos partir da funo de densidade, fazendo:

Ou podemos usar (6.16), obtendo:

Considere, agora, o clculo da probabilidade


P(2 T 3), isto , a prxima consulta ocorrer no intervalo de 2 a 3 minutos. Podemos fazer

Para uma varivel aleatria T, com distribuio exponencial de parmetro


, temos:
(6.17)

(6.18)

Um exemplo do clculo do valor esperado e da varincia de uma exponencial foi feito na Seo 6.1.3. Observe que podemos obter os mesmos resultados
com (6.17) e (6.18).

EXERCCIOS
6.

7.

O tempo de vida (em horas) de um transistor uma varivel aleatria T


com distribuio exponencial. O tempo mdio de vida do transistor de
500 horas.
a)

Calcule a probabilidade de o transistor durar mais do que 500 horas.

b)

Calcule a probabilidade de o transistor durar entre 300 e 1000 horas.

c)

Sabendo-se que o transistor j durou 500 horas, calcule a probabilidade de ele durar mais 500 horas.

Usando a expresso de probabilidade condicional (Captulo 4), mostrar que


para s, t > 0, vale a seguinte relao para uma varivel aleatria T exponencial:
P(T > s + t\T > S) = P(T >

t)

Essa propriedade conhecida como "falta de memria", pois no importa o que aconteceu no passado (T s), mas apenas a partir do momento
em que se inicia a observao, que pode ser considerado como o instante
zero. Nesse contexto, a distribuio exponencial inadequada para representar "tempo de vida" de itens que sofrem efeito de fadiga.

6.2.3

Distribuio normal

A normal considerada a distribuio de probabilidades mais importante,


pois permite modelar uma infinidade de fenmenos naturais e, alm disso, possibilita realizar aproximaes para calcular probabilidades de muitas variveis
aleatrias que tm outras distribuies. muito importante tambm na inferncia estatstica, como ser observado nos captulos seguintes.
A distribuio normal caracterizada por uma funo de probabilidade,
cujo grfico descreve uma curva em forma de sino, como mostra a Figura 6.8.
Essa forma de distribuio evidencia que h maior probabilidade de a varivel
aleatria assumir valores prximos do centro.

Figura 6.8 Representao grfica da funo densidade de probabilidade normal


e a indicao de seus dois parmetros: e .

Dados os p a r m e t r o s e R e > 0, a f u n o d e n s i d a d e de probabilidade


da n o r m a l d a d a por:

Com certo esforo matemtico, possvel mostrar que o valor esperado

e a varincia da dis

A Figura 6.9 m o s t r a diferentes curvas normais, em f u n o dos valores de


e a. As distribuies da Figura 6.8 p o d e m r e p r e s e n t a r , p o r exemplo, medidas
da d u r e z a de ao p r o d u z i d o sob diferentes condies. A distribuio (1) representa a d u r e z a do ao em u m a situao p a d r o ; e a distribuio (2), as medidas
d e d u r e z a d o ao aps u m processo d e m e l h o r i a d a qualidade, e m q u e a u m e n t o u a d u r e z a m d i a . A distribuio (3) r e p r e s e n t a as m e d i d a s de dureza do ao
q u a n d o o processo est sob rgido controle; e n q u a n t o a distribuio (4) quando
fora de controle, o q u e a c a r r e t a a u m e n t o na variabilidade.

Figura 6.9 Diferentes distribuies normais em funo dos parmetros e

Figura 6.10

Afastamentos da mdia, em unidades de desvio padro, preservam a


mesma rea sob a curva normal.

(6.24)

tem distribuio normal com mdia zero e desvio padro unitrio, ou seja, Z :
N(0,1), que tambm conhecida como distribuio formal padro. Qualquer
rea (probabilidade) sob a densidade de X pode ser avaliada sob a densidade
de Z, conforme ilustra a Figura 6.11. Dessa forma, qualquer problema relativo a
uma distribuio normal pode ser pensado em termos da distribuio normal
padro.

Distribuio de X:
normal com = 170e = 10

Figura 6.11

Distribuio de Z:
normal padro

Transformao do evento {X > 180}, da distribuio normal de parmetros = 170 e = 10, em um evento da distribuio normal
padro: {Z > 1}.

Tabela da distribuio normal padro


Como vimos, as probabilidades de uma varivel com distribuio normal
podem ser representadas por reas sob a curva da distribuio normal padro.
No apndice, apresentamos a Tabela 3, que relaciona valores positivos de
com reas sob a cauda superior da curva. Os valores de z so apresentados com
duas decimais. A primeira decimal fica na coluna da esquerda e a segunda decimal na linha do topo da tabela. A Figura 6.12 mostra como podemos usar a Tabela 3 para encontrar uma rea sob a cauda superior da curva.

Figura 6.12

Ilustrao do uso da tabela da distribuio normal padro (Tabela


3 do apndice) para encontrar P(Z > 0,21).

A rea 0,4168 corresponde probabilidade P(Z > 0,21) = 1 - (0,21),


onde representa a funo de distribuio acumulada da normal padro. Ou
seja, a Tabela 3 fornece os valores 1 - (z), para z = 0,01, 0,02, ..., 3,00.
Exemplo 6.4 Seja Z uma varivel aleatria com distribuio normal padro.
Vamos usar a Tabela 3 para encontrar as seguintes probabilidades:
a) P(Z < 0,42). Esta probabilidade corresponde
rea da distribuio normal padro indicada ao
lado. Podemos obter esta rea, fazendo a seguinte operao:

Mais formalmente,
(0,42) = P(Z < 0,42) = 1 - P(Z > 0,42) = 1 - 0,3372 = 0,6628
b) P(Z < 0,42). O esquema seguinte mostra esta probabilidade em termos de rea e como podemos usar a simetria da curva para obt-la
na Tabela 3.

Ou seja,
P(Z < - 0,42) = P(Z > 0,41) = 0,3372
c) P ( - 0,42 < Z < 0,42).

Ento, P(- 0,42 < Z < 0,42) = 1 - 2 (0,3372) = 0,3256.

Exemplo 6.5 Na distribuio normal padro, qual


o valor de z, tal que P ( - z < Z < z) = 0,95? (Veja figura ao lado.)
Considerando a simetria da curva normal e o fato
de a rea total sob a curva ser igual a 1 (um), podemos transformar esta pergunta em: Qual o valor de z
tal que P(Z > z) = 0,025? A figura ao lado ilustra a
equivalncia entre as duas perguntas.

Entrando com o valor de rea 0,025 na Tabela 3 do apndice, encontramos o valor de z igual a 1,96. Esse processo ilustrado a seguir.

Exemplo 6.6 Suponha que a absoro de gua (%) em certo tipo de piso cermico tenha distribuio normal com mdia 2,5 e desvio padro 0,6. Selecionando, aleatoriamente, uma unidade desse piso, qual a probabilidade de ele
acusar absoro de gua entre 2% e 3,5%?

Soluo: Primeiramente, precisamos transformar os valores de absoro de gua (x) em valores


padronizados (z), por (6.24), isto ,
z =

x -

x - 2,5
0,6

Para x = 2, temos: z =

2-25
= - 0,83
0,6

3,5-2,5
e para x = 3,5, temos: z =
= 1,67.
0,6
Usando a Tabela 3 do apndice, encontramos
para 2 = 0,83 e z = 1,67 as respectivas reas nas extremidades da curva: 0,2033 e 0,0475 (lembrando
que para valores negativos de z, como - 0,83, procuramos na Tabela 3 seu valor absoluto, 0,83). fcil
observar, pela figura ao lado, que a probabilidade
desejada corresponde ao complemento da soma dessas reas, ou seja:
P(2 <X < 3,5) = P ( - 0,83 < Z < 1,67) = 1 - (0,2033 + 0,0475) =
= 0,7492.

EXERCCIOS
8.

Seja Z uma varivel aleatria com distribuio normal padro. Calcule:

9.

Suponha que o tempo de resposta na execuo de um algoritmo uma varivel aleatria com distribuio normal de mdia 23 segundos e desvio padro de 4 segundos. Calcule:
a)

a probabilidade de o tempo de resposta ser menor do que 25 segundos;

b)

a probabilidade de o tempo de resposta ficar entre 00 e 30 segundos.

10. Certo tipo de conserva tem peso lquido (Xx) com mdia de 900 g e desvio padro de 10 g. A embalagem tem peso (X2) com mdia de 100 g e desvio
padro de 4 g. Suponha X1 e X2 independentes e com distribuies norfriais.
a)

Qual a probabilidade de o peso bruto ser superior a 1.020 g?

b)

Qual a probabilidade do peso bruto estar entre 980 e 1.020 g?

6.3

A NORMAL COMO LIMITE DE OUTRAS DISTRIBUIES

Muitas distribuies de probabilidade aproximam-se da distribuio normal. o caso da binomial quando n grande e da Poisson quando grande.

6.3.1

Aproximao normal binomial

Nos experimentos binomiais, quando n muito grande, o uso da funo de


probabilidade binomial impraticvel, pois os coeficientes binomiais tornam-se
exageradamente grandes. J vimos que nos casos em que n grande e p muito pequeno, podemos usar a distribuio de Poisson para calcular, aproximadamente, as probabilidades de uma binomial. Quando n grande e p no prximo de 0 ou de 1, a distribuio normal pode ser usada para calcular,
aproximadamente, as probabilidades de uma binomial.
A Figura 6.13 apresenta grficos das distribuies de probabilidades binomiais com n = 1, 10 e 50 e p = 0,5 e 0,2.
Observando a Figura 6.13, verificamos que quando n = 50, a forma da distribuio binomial parecida com a curva de uma distribuio normal. Observe, ainda, que se p = 0,5, a aproximao j parece razovel para n = 10.
De maneira geral, as condies para fazer uma aproximao da distribuio binomial para a normal so:
1) n grande e
2) p n o muito prximo de 0 (zero) ou de 1 (um).

Figura 6.13

Distribuies binomiais para diferentes valores de n e p.

Uma regra prtica, sugerida por vrios autores, considera a aproximao


razovel se as duas seguintes inequaes estiverem satisfeitas:
np 5 e

(6.25)

n ( l - p) 5

(6.26)

Os parmetros e da distribuio normal devem-se identificar ao valor


esperado e ao desvio padro do modelo binomial, ou seja:
(6.27)

(6.28)
Exemplo 6.7 Historicamente, 10% dos pisos cermicos, que saem de uma linha de produo, tm algum defeito leve. Se a produo diria de 1000 unidades, qual a probabilidade de ocorrer mais de 120 itens defeituosos?

Pelas caractersticas do experimento, a varivel aleatria Y = nmero de


defeituosos na amostra tem distribuio binomial com parmetros n = 1000 e
p = 0,1. Verificamos, tambm, que as condies 6.25 e 6.26 esto satisfeitas, pois

Considere X uma varivel aleatria normal com mdia = 100 e varincia


= 90. Ento:

Correo de continuidade
Ao calcularmos probabilidades de eventos oriundos de experimentos binomiais como reas sob uma curva normal, estamos fazendo uma aproximao de
uma varivel aleatria discreta, que s assume valores inteiros, para uma varivel contnua, cujos eventos constituem intervalos de nmeros reais. Nesse contexto, devemos fazer alguns ajustes, como ilustra o exemplo seguinte.
Exemplo 6.8 Seja Y o nmero de caras obtido em dez lanamentos de uma
moeda honesta. Vamos calcular a probabilidade de obter quatro caras usando a
distribuio normal.
Pelas caractersticas do experimento, Y tem distribuio binomial com
n = 1 0 e p = 0,5. Ento, a mdia e o desvio padro so dados por:

Considere o evento: ocorrer quatro caras, ou seja {y = 4}. Ao expressar


este evento em termos de uma varivel aleatria contnua X : N(5, 2,5), devemos considerar um intervalo em torno do valor 4, pois para variveis aleatrias
contnuas s faz sentido avaliar probabilidades em intervalos. O intervalo adequado, nesse caso, construdo pela subtrao e soma de meia unidade ao valor
quatro, ou seja, {3,5 < X < 4,5}, como ilustra a Figura 6.14.

Figura 6.14

Aproximao da probabilidade do evento {Y = 4} (em termos da distribuio binomial) para a probabilidade do evento {3,5 < X < 4,5}
(em termos da distribuio normal).

O procedimento de subtrair e somar meia unidade para construir um intervalo em torno de valores inteiros conhecido como correo de continuidade.
Esta correo deve ser usada ao aproximar um evento de uma varivel aleatria que s assume valores inteiros para um evento de uma varivel aleatria
contnua.
A Figura 6.15 ilustra as diversas situaes possveis de probabilidade associada a uma varivel aleatria discreta, assumindo valores em {0, 1, 2, ...},
aproximada por probabilidade associada a uma varivel aleatria contnua, a
qual pode assumir qualquer valor real.

Figura 6.15

6.3.2

Correo de continuidade ao aproximar uma varivel aleatria discreta por uma varivel aleatria contnua.

Aproximao normal Poisson

A distribuio de Poisson (Figura 6.16) tambm se aproxima da normal


quando grande. Como o valor esperado e a varincia de uma Poisson so
ambos iguais a , ento, na aproximao normal, devemos usar:

Figura 6.16

Distribuies de Poisson para diferentes valores de .

Conforme mostra a Figura 6.16, a aproximao razovel para 5. Para


a aproximao da normal Poisson, a correo de continuidade, discutida na
Seo 6.4.1, tambm deve ser usada.

EXERCCIOS
11. De um lote de produtos manufaturados, extramos 100 itens ao acaso. Se
10% dos itens do lote so defeituosos, calcular a probabilidade de:
a)

12 itens serem defeituosos;

b)

mais do que 12 itens serem defeituosos.

12. Uma empresa de auxlio lista telefnica recebe, em mdia, sete solicitaes por minuto, segundo uma distribuio de Poisson. Qual a probabilidade de ocorrer mais de 80 solicitaes nos prximos 10 minutos?

6.4

GRFICO DE PROBABILIDADE NORMAL

Como veremos nos captulos posteriores, muitos mtodos estatsticos so


desenvolvidos na suposio de que os dados provm de uma distribuio normal. Quando o nmero de observaes grande, podemos construir um histograma e verificar se sua forma segue uma curva em forma de sino, sugerindo o
modelo normal. o caso da Figura 6.17.

Figura 6.17

Distribuio de freqncias de 1.389 leituras da temperatura de um


pasteurizador.

Podemos, tambm, calcular a mdia (x') e o desvio padro (s) dos dados e
verificar se os intervalos

tm percentuais de casos prximos dos esperados por uma distribuio normal


(Figura 6.10).
Quando a quantidade de observaes for pequena, o histograma pode
apresentar uma forma muito diferente da real distribuio do processo que gerou os dados. Alm disso, o clculo de x' e s podem ser muito influenciados por
algum valor discrepante. Em geral, o chamado grfico de probabilidade normal
mais adequado para verificar a suposio de um modelo normal para os dados.
Algoritmos computacionais para a construo desse grfico esto implerpenta1
dos em quase todos pacotes computacionais estatsticos.
Ilustraremos a construo do grfico de probabilidade normal com apenas
cinco observaes (xi i = 1, 2, ..., 5): 74,8; 74,0; 74,7; 74,4 e 75,9. Sejam x(i)
os valores ordenados, isto , 74,0; 74,4; 74,7; 74,8; 75,9.
Considere uma distribuio normal com a rea dividida em cinco partes
iguais (mesmo nmero de partes do nmero de valores, n). E sejam q(i) (i = 1, 2,
..., 5) os pontos medianos dos intervalos formados pela diviso das cinco reas
iguais (ver a Figura 6.18).

3(1) 3(2)3(3) 3(4)


Figura 6.18

3(5)

Configurao de cinco pontos com as posies relativas mais verossmeis possveis sob um modelo normal

Se as cinco observaes (74,0; 74,4;


74,7; 74,8; 75,9) provm de uma distribuio normal, devemos esperar uma relao
aproximadamente linear com os valores tericos q(i) . O grfico de probabilidade normal
compreende a apresentao dos pontos (x(i),
q(i))), num par de eixos cartesianos, conforme
o grfico ao lado. Nesse grfico, os valores
de q(i) foram padronizados (mdia zero e varincia 1).
A Figura 6.19 apresenta dois grficos de probabilidade normal. O grfico
da esquerda foi construdo com 40 observaes que aparentemente seguem

uma distribuio normal. No grfico da direita introduzimos um valor discrepante.

Figura 6.19

Grfico de probabilidade normal referente a 40 leituras de temperatura de um pasteurizador e o efeito de um valor discrepante.

A Figura 6.20 mostra um grfico de probabilidade normal construdo com


dados gerados por uma distribuio assimtrica, como mostrado do lado esquerdo da figura. Note que os pontos no esto aleatoriamente em torno de
uma reta.

valor observado
Figura 6.20

Grfico de probabilidade normal referente a 40 observaes geradas


por uma distribuio assimtrica.

EXERCCIOS COMPLEMENTARES
13. O setor de manuteno de uma empresa fez um levantamento das falhas
de um importante equipamento, constatando que h, em mdia, 0,75 falha
por ano e que o tempo entre falhas segue uma distribuio exponencial.
Qual a probabilidade de o equipamento no falhar no prximo ano?

14. A vida til de certo componente eletrnico , em mdia, 10.000 horas e


apresenta distribuio exponencial. Qual a percentagem esperada de
componentes que apresentaro falhas em menos de 10.000 horas?
15. A vida til de certo componente eletrnico , em media, 10.000 horas e
apresenta distribuio exponencial. Aps quantas horas se espera que 25%
dos componentes tenham falhado?
16. Na manufatura de fios de linha para costura ocorre, em mdia, um Refeito
a cada 100 metros de linha, segundo uma distribuio de Poisson.
a)

Qual a probabilidade de o prximo defeito ocorrer aps 120 metros?

b)

Quantos metros de linha podero ser percorridos para que a probabilidade de aparecimento de algum defeito seja de 10%?

17. Num laticnio, a temperatura do pasteurizador deve ser de 75C. Se a temperatura ficar inferior a 70C, o leite poder ficar com bactrias malficas
ao organismo humano. Observaes do processo mostram que valores da
temperatura seguem uma distribuio normal com mdia 75,4C e desvio
padro 2,2C.
a)

Qual a probabilidade da temperatura ficar inferior a 70C?

b)

Qual a probabilidade de que, em 500 utilizaes do pasteurizador,


em mais do que cinco vezes a temperatura no atinja 70C? Precisa
supor distribuio normal.

18. O tempo para que um sistema computacional execute determinada tarefa


uma varivel aleatria com distribuio normal, com mdia 320 segundos e
desvio padro de 7 segundos.
a)

Qual a probabilidade de a tarefa ser executada entre 310 e 330 segundos?

b)

Se a tarefa colocada para execuo 200 vezes. Qual a probabilidade de ela demorar mais do que 325 segundos em pelo menos 50 vezes?

19. a) Um exame de mltipla escolha consiste em dez questes, cada uma


com quatro possibilidades de escolha. A aprovao exige, no mnimo,
50% de acertos. Qual a probabilidade de aprovao se o candidato
comparece ao exame sem saber absolutamente nada, apelando apenas
para o "palpite"?
b)

E se o exame tivesse 100 questes?

20. No horrio de maior movimento, um sistema de banco de dados recebe, em


mdia, 100 requisies por minuto, segundo uma distribuio de Poisson.
Qual a probabilidade de que no prximo minuto ocorram mais de 120 requisies? Use a aproximao normal com correo de continuidade.

2 1 . Os dados histricos de uma rede de computadores sugerem que as conexes com essa rede, em horrio normal, seguem uma distribuio de Poisson
com mdia de cinco conexes por minuto. Calcule t0, tal que se tenha probabilidade igual a 0,90 de que ocorra pelo menos uma conexo antes do
tempo t0.
2 2 . O padro de qualidade recomenda que os pontos impressos por uma impressora estejam entre 3,7 e 4,3 mm. Uma impressora imprime pontos,
cujo dimetro mdio igual a 4 mm e o desvio padro 0,19 mm. Suponha que o dimetro dos pontos tenha distribuio normal.
a)

Qual a probabilidade do dimetro de um ponto dessa impressora estar dentro do padro?

b)

Qual deveria ser o desvio padro para que a probabilidade do item (a)
atingisse 95%?

23. Certo tipo de cimento tem resistncia compresso com mdia de 5.800
kg/cm 2 , e desvio padro de 180 kg/cm 2 , segundo uma distribuio normal.
Dada uma amostra desse cimento, calcule as seguintes probabilidades:
a)

resistncia inferior a 5.600 kg/cm 2 ;

b)

resistncia entre 5.600 kg/cm 2 e 5.950 kg/cm 2 ;

c)

resistncia superior a 6.000 kg/cm 2 , sabendo-se que ele j resistiu a


5.600 kg/cm 2 .

d)

se quer a garantia de que haja 95% de probabilidade de o cimento resistir a determinada presso, qual deve ser o valor mximo dessa presso?

24. Uma empresa fabrica dois tipos de monitores de vdeo. suposto que as
durabilidades deles seguem distribuies normais, sendo o monitor Ml
com mdia de 6 anos e desvio padro 2,3 anos; e o monitor M2 com mdia
de 8 anos e desvio padro 2,8 anos. Ml tem 2 anos de garantia e M2 tem 3
anos. A empresa lucra R$ 100,00 a cada Ml vendido e R$ 200,00 a cada
M2 vendido, mas se deixarem de funcionar no perodo de garantia, a empresa perde R$ 300,00 (no caso de M l ) e R$ 800,00 (no caso de M2). Em
mdia, qual o tipo de monitor que gera mais lucro?

Distribuies Amostrais e
Estimao de Parmetros

Este captulo apresenta a base para aprendermos a estatstica indutiva, a


qual fornece procedimentos formais para tirar concluses sobre uma populao,
a partir dos dados de uma amostra. Para isso, veremos como se relacionam estatsticas (caractersticas dos elementos de uma amostra) com parmetros (caractersticas dos elementos de uma populao).

7.1

PARMETROS E ESTATSTICAS
Relembremos alguns conceitos bsicos:

Populao: conjunto de elementos que formam o universo de nosso estudo e que so passveis de ser observados, sob as mesmas condies.
Amostra: uma parte dos elementos de uma populao.
Amostragem: o processo de seleo da amostra.
Amostragem aleatria simples: o processo de seleo feito por sorteio, fazendo com que todos os elementos da populao tenham a mesma
chance de serem escolhidos e, alm disso, todo subconjunto de n elementos
tenha a mesma chance de fazer parte da amostra.
Quando a amostragem aleatria e, em especial, quando aleatria simples, podemos fazer inferncias sobre a populao, com base no estudo de uma
amostra (ver a Figura 7.1).

INFERENCIA

Figura 7.1 Ilustrao de conceitos bsicos da estatstica.

Em geral, estamos pesquisando uma ou mais variveis associadas aos elementos da populao ou da amostra. Nesse contexto, tambm podemos caracterizar a populao e a amostra em termos da varivel em estudo. Por exemplo,
ao verificar se cada consumidor potencial de uma revendedora de automveis
planeja (X = 1) ou no (X = 0) comprar um carro novo no prximo ano, podemos representar a populao pelo conjunto {x1, x2, x3,..., xN}, onde

= 0 ou 1,

dependendo se o j-simo indivduo da populao pretende ou no comprar um


carro novo no prximo ano. Da mesma forma, a amostra, que ser formada por
n indivduos a serem selecionados da populao, pode ser representada por {Xl
X2, ..., Xn}, onde X{ a varivel aleatria que corresponde ao valor de X (0 ou 1)
na i- sima observao ( = 1, 2, ...n).

No presente contexto, definimos:

Parmetro: alguma medida descritiva (mdia, varincia, proporo etc.)


dos valores x1, x2, x3,..., associados populao.
Amostra aleatria simples: conjunto de n variveis aleatrias independentes {X1, X2, ..., Xn}, cada uma com a mesma distribuio de probabilidades de certa varivel aleatria X. Essa distribuio de probabilidades
deve corresponder distribuio de freqncias dos valores da populao
(X1, X2, X3, ...).
Estatstica: alguma medida descritiva (mdia, varincia, proporo etc.)
das variveis aleatriaX 1 , X 2 ,...,X n , associadas amostra (ver a Figura 7.2).

Estatsticas e variveis aleatrias


Vamos considerar uma amostragem aleatria simples, o que faz com que
qualquer medida associada amostra (estatstica) seja uma varivel aleatria.
Isso ocorre por causa da aleatoriedade introduzida pelo sorteio, na amostragem. A fim de entender melhor esse conceito, vamos acompanhar os exemplos
seguintes.
Exemplo 7.1 Em um estudo sobre emisses de C0 2 , definiu-se uma populao como sendo composta por quatro nibus de uma pequena companhia de
transporte urbano. Dos quatro nibus, um deles apresentava alto ndice de
emisso, enquanto os outros trs estavam dentro dos padres. Assim, a populao pode ser descrita por {1, 0, 0, 0}. O parmetro de interesse a proporo de
veculos fora do padro. Considere as seguintes questes acerca dessa populao:
a) calcular a proporo populacional (p);
b) se for retirada uma amostra aleatria simples, com reposio, de tamanho n = 2, qual ser a proporo P de veculos fora dos padres
na amostra?
Soluo: Para a questo (a), a resposta trivial: p = 1/4i J a
questo (b) no pode ser respondida, pois a proporo amostrai ()
uma varivel aleatria. Assim, no podemos dizer o que vai ocorrer, mas to-somente o que pode ocorrer.

c) retificando a questo (b), construir a distribuio de probabilidades


da proporo amostrai.
Soluo: Seja a varivel aleatria X = nmero de nibus com alto
ndice de emisso entre dois nibus selecionados ao acaso. Ento, X
possui distribuio binomial, j que se trata de dois eventos independentes, com duas possibilidades cada (sucesso = nibus com alto
ndice de emisso; fracasso = nibus dentro dos padres). Os parmetros da distribuio so n = 2 e p = 0,25. Assim, pela distribuio
binomial (ver a Tabela I do apndice), temos:

A funo de probabilidade de P tambm chamada de distribuio da proporo amostrai ou distribuio amostrai da proporo, pois apresenta os possveis resultados de uma proporo, que calculada sobre os elementos de uma
amostra a ser extrada da populao em estudo. De maneira geral, temos:

Uma estatstica uma varivel aleatria e sua distribuio de probabilidades chamada de distribuio amostral

Exemplo 7.2 Seja a populao dos quatro nibus e


a varivel X = nmero de vezes que o nibus teve um
defeito grave. Se um nibus teve dois defeitos graves,
o outro trs, o outro quatro e o ltimo cinco defeitos
graves, ento a populao, em termos da varivel X,
pode ser descrita pelo conjunto {2, 3, 4, 5}. A populao tambm pode ser descrita pela funo de probabilidade ao lado - a distribuio da populao. Essa distribuio tem os parmetros valor esperado (mdia) e varincia dados por:

A Tabela 7.1 mostra a construo da distribuio da mdia amostrai, considerando uma amostragem aleatria simples com n = 2 elementos, extrada
com reposio.

Tabela 7.1 Construo da distribuio de X (Exemplo 7.2).

A Figura 7.3 mostra a distribuio da populao e a distribuio da mdia


amostrai. Note que ambas tm a mesma mdia (valor esperado), mas a distribuio da mdia amostrai mais concentrada (menor varincia) e tem forma
mais parecida com a distribuio normal.

Figura 7.3

Distribuio da populao do Exemplo 7.2 e a distribuio da mdia


amostral, considerando amostragem aleatria simples com n = 2 elementos, extrados com reposio.

EXERCCIOS
1.

Refaa o Exemplo 7.1c, considerando que a amostra seja retirada sem reposio.

2.

Em um estudo sobre consumo de combustvel, definiu-se uma populao


composta por quatro nibus de uma pequena companhia de transporte urbano. Os consumos dos nibus (km/l), em condies padres de teste,
eram 3,8, 3,9, 4,0 e 4,1. Uma amostra de dois elementos ser sorteada,
com reposio. Verifique todas as amostras possveis e, em seguida, construa a distribuio amostrai para o consumo mdio da amostra e calcule o
valor esperado e a varincia.

3.

Refaa o exerccio anterior considerando amostragem sem reposio.

7.2

DISTRIBUIES AMOSTRAIS

Quando a amostragem aleatria simples, vrias estatsticas apresentam


distribuies amostrais que se aproximam de distribuies contnuas conhecidas, medida que o tamanho da amostra cresce. o caso da mdia e da proporo que apresentam distribuies amostrais aproximadamente normal.

7.2.1

Distribuio amostrai da mdia

Considere o esquema ilustrado na Figura 7.4.

Figura 7.4

Esquema geral de uma amostragem aleatria simples na observao


de uma varivel quantitativa X.

Seja uma amostra aleatria simples {X1 ,X 2 , ..., Xn} e a estatstica X. A distribuio de X (distribuio da mdia amostrai) apresenta as seguintes propriedades:
a)

O valor esperado da mdia amostrai igual mdia da populao,


ou seja:1

(7.1)

ou

c)

(Teorema limite central) Se o tamanho da amostra for razoavelmente


grande, ento a distribuio amostrai da mdia pode ser aproximada
pela distribuio normal Em geral, para n 30, a aproximao j
boa, porm, se a distribuio da populao no for muito distante
de uma normal, a aproximao pode ser usada com n menor.

Exemplo 7.2 (continuao) Dada a populao {2, 3, 4, 5}, com parmetros


= 3,5 e 2 = 1,25, e considerando o planejamento de uma amostra aleatria
simples, com reposio, de n = 2 elementos, ento podemos obter o valor esperado e a varincia da mdia amostrai usando (7.1) e (7.2):

Observe que so os mesmos valores encontrados anteriormente.

7.2.2

Distribuio amostrai da proporo

Quando o interesse estudar uma proporo, tal como a proporo dos elementos que tm certo atributo A, a populao pode ser vista como dividida em
dois subgrupos:
1. o subgrupo dos elementos que tm o atributo A; e
2.

Figura 7.5

o subgrupo dos elementos que no tm o atributo A, como mostra a


Figura 7.5.

Esquema geral de uma amostragem aleatria simples quando se observa a proporo de certo atributo A.

A distribuio da populao pode ser representada por uma varivel aleatria de Bernoulli (tipo "0-1"), com funo de probabilidade:
x

P(x)
0

1-p

Como vimos no Captulo 5, o valor esperado e a varincia de uma distribuio desse tipo so dados, respectivamente, por:
(7.4)
(7.5)
Representando as observaes amostradas por

verificamos que

(7.6)
ou seja, a proporo eqivale a uma mdia aritmtica para dados de variveis
do tipo "0-1". Assim, as propriedades da distribuio amostrai da mdia tambm so aplicadas distribuio amostrai da proporo. Usando as notaes
prprias da proporo, temos:
a)

O valor esperado da proporo amostrai igual proporo da populao:


(7.7)

b) A varincia da proporo amostrai dada por


(se a amostragem for com reposio, ou N
muito grande ou infinito).

(7.8)

(se a amostragem for sem reposio


e N no muito grande, N < 20n)

(7.9)

ou

c)

Se o tamanho da amostra for razoavelmente grande, ento a distribuio amostrai da proporo pode ser aproximada pela distribuio
normal.3

As aplicaes da distribuio da proporo amostrai podem ser feitas no


contexto da aproximao da distribuio normal binomial, inclusive com a
correo de continuidade (Seo 6.3.1).

EXERCCIOS
4.

Uma fundio produz blocos para motor de caminhes. Os furos para as


camisas devem ter dimetro de 100 mm, com tolerncia de 5 mm. Para verificar qual o dimetro mdio no processo, a empresa vai retirar uma
amostra com 36 blocos e medir os dimetros de 36 furos (1 a cada bloco).
Suponha que o desvio padro (populacional) dos dimetros seja conhecido
e igual a 3 mm.
a)

Qual o desvio padro da distribuio da mdia amostrai?

b)

Qual a probabilidade de a mdia amostrai diferir da mdia populacional (desconhecida) em mais do que 0,5 mm (para mais ou para
menos)?

c)

Qual a probabilidade de a mdia amostrai diferir da mdia populacional (desconhecida) em mais do que 1 mm (para mais ou para menos)?

d)

Se algum afirmar que a mdia amostrai no se distanciar da mdia


populacional em mais do que 0,98 mm, qual a probabilidade de essa
pessoa acertar?

e)

Se algum afirmar que a mdia amostrai no se distanciar da mdia


populacional em mais do que 1,085 mm, qual a probabilidade de
essa pessoa errar?

5.

Uma empresa fabricante de pastilhas para freios efetua um teste para controle de qualidade de seus produtos. Supondo que 1% das pastilhas fabricadas pelo processo atual apresenta desempenho deficiente quanto ao nvel
de desgaste, qual a probabilidade, em uma amostra aleatria simples
com 10.000 pastilhas, de serem encontradas 85 ou menos pastilhas com
problemas?

6.

Sabe-se que 50% dos edifcios construdos em uma grande cidade apresentam problemas estticos relevantes em menos de cinco anos aps a entrega

3
Observamos que a distribuio exata a binomial (ou a hipergeomtrica se a amostragem for feita de populao pequena e sem reposio).

da obra. Considerando a seleo de uma amostra aleatria simples com


200 edifcios com cinco anos, qual a probabilidade de menos de 90 deles
apresentarem problemas estticos relevantes (considerar que no tenha havido obras de reparo nos edifcios selecionados)?

7. Existem vrios algoritmos computacionais que permitem gerar nmeros

aleatrios (ou, mais apropriadamente, pseudo-aleatrios) no intervalo [0, 1],


com distribuio uniforme. Considere a gerao de 100 nmeros (X l , X2, ...,
X100) desta forma e seja X a mdia aritmtica simples desses 100 nmeros.

8.

a)

Qual o valor esperado e a varincia de X1

b)

Qual a probabilidade de X1 assumir um valor no intervalo [0,47, 0,53]?

c)

Qual o valor esperado e a varincia de X'?

d)

Qual a distribuio de probabilidade de X'?

e)

Qual a probabilidade de X' assumir um valor no intervalo [0,47, 0,53]?

Um profissional de Computao observou que seu sistema gasta entre 20 e


24 segundos para realizar determinada tarefa. Alm disso, o tempo gasto,
X, pode ser razoavelmente representado pela seguinte funo de densidade:

a)

Numa particular rodada, qual a probabilidade de o sistema gastar


mais que 22,4 segundos?

b)

Em 30 rodadas, qual a probabilidade de o sistema gastar, em mdia,


mais que 22,4 segundos por rodada?

7.3 ESTIMAO DE PARMETROS


Nesta seo, estudaremos o problema de avaliar parmetros populacionais,
a partir de operaes com os dados de uma amostra. um raciocnio tipicamente indutivo, em que se generalizam resultados da parte (amostra) para o
todo (populao), conforme ilustra a Figura 7.6.

Figura 7.6

O raciocnio indutivo da estimao.

Por exemplo, podemos ter interesse em avaliar a resistncia mecnica X de


um novo material. Contudo, X no um nmero, mas uma varivel aleatria,
porque h uma infinidade de fatores no controlveis que provocaro variaes
nas possveis medidas de resistncia mecnica do material. at razovel admitir que a distribuio de X seja aproximadamente normal, por se tratar de medidas fsicas. E o interesse pode estar na avaliao dos parmetros populacionais

Medidas de resistncia mecnica ( X l , X2,


Xn), a serem realizadas de forma independente e sob as mesmas condies, constituem uma amostra aleatria simples de X. Clculos podem ser feitos sobre essas medidas para estimar os
parmetros de interesse. Exemplos desses clculos podem ser

(7.10)

(7.11)
que so estimadores dos parmetros e 2, respectivamente.
De forma genrica, considere uma populao caracterizada pela distribuio de certa varivel aleatria X, com parmetro . E seja ( X l , X2,
Xn) uma
amostra aleatria simples de X.

Uma estatstica T uma funo dos elementos da amostra, isto T= (Xl,


X2,
Xn). Quando ela usada para avaliar certo parmetro , tambm
chamada de estimador de .
Observe que um estimador uma varivel aleatria, pois depende da
amostra a ser selecionada. Realizada a amostragem, o estimador assume determinado valor (o resultado do clculo), o qual denominamos de estimativa.4
4
Neste texto, as estimativas sero representadas por letras minsculas, contrastando
com os estimadores, os quais sero representados por letras maisculas.

Algumas propriedades desejveis de um estimador sero discutidas, o que


permite, pelo menos em tese, escolher o melhor estimador para cada situao
prtica. Usando as distribuies amostrais, possvel avaliar probabilisticamente o erro que se est cometendo por se usar uma amostra e no toda a populao - o erro amostral Isso ser feito com estimativas em forma de intervalos de
confiana (Sees 7.3.2 e 7.3.3).

7.3.1

Propriedades de um estimador

Um estimador, por ser uma varivel aleatria, pode assumir valores, segundo uma distribuio de probabilidades. Contudo, desejvel que, em mdia, ele seja igual ao parmetro que se deseja estimar. Mais formalmente,

T um estimador no-viesado (ou no-tendencioso) de um parmetro se e s se E(T) = .

Por exemplo, X e P so estimadores no viesados dos parmetros e p,


respectivamente, porque E(X') = e E() = p, conforme foi visto na Seo 7.2.
J o estimador
(7.12)
2
um estimador viesado do parmetro
a 2, pois E(
E(d^2
)) = (n-1/n)
a 22.. Por isso, definin
mos
a varincia
varincia amostrai,
amostral S
S22,, com
com denominador
denominador (n
1) no
no lugar
lugar de
de n.
n. A
difemos a
(n -- 1)
A diferena
rena

E(2)-G2 = - o 2
v
7
n

(7.13)

chamada de vis do
do estimador
estimador d22.
Na prtica, retiramos s uma amostra, produzindo um nico valor para o
estimador - uma estimativa. Mesmo que o estimador seja no viesado, o valor
da estimativa pode estar longe do valor do parmetro. Outra propriedade desejvel que o estimador tenha varincia pequena, porque isso reduz a chance de
a estimativa acusar um valor distante do parmetro.

Dados dois estimadores no viesados T 1 e r 2 , sendo V(T1) < V(T 2 ), ento T 1


dito mais eficiente do que T2. E a eficincia relativa de T1 em relao a T2
dada por:

(6.14)

A Figura 7.7 ilustra os conceitos de vis e eficincia, fazendo analogia com


tiros ao alvo, realizados por trs rifles. Os rifles T1 e T2 so no viesados, porque,
em mdia, acertam o alvo; enquanto o rifle T3 viesado. Embora T1 e T2 sejam
no viesados, T1 mais eficiente do que T2, pois a varincia entre os tiros
menor.

Figura 7.7 Tiros ao alvo com trs rifles.

Considere a mdia amostrai (X') e a mediana amostrai (Md) como estimaSabemos que V(X') = 2/n. Se supusermos a populao

dores do parmetro

com distribuio normal e a amostra grande, possvel mostrar que V(M d )


2

/2 ) * ( /n ) . Como

V(X')

<

V(M d ),

na estimao de

ento X' um estimador mais eficiente

do que Md

nas condies estabelecidas. E a eficincia relativa de X' em

relao Md dada por

(7.15)

Assim, em amostras grandes de populaes normais, a mdia amostrai


cerca de 57% mais eficiente do que a mediana amostrai. Isso significa que se
formos usar M d no lugar de X', precisamos ter uma amostra 57% maior, para
garantir a mesma eficincia na estimao de .

De modo geral, a qualidade de um estimador T, na estimao de um par


metro , pode ser avaliada em funo de seu erro quadrtico mdio, o qual de
finido por
EQM(T) =

E(T-)2

(7.16)

que pode ser escrito como 5


EQM(T) = V(T) + (vis)2

(7.17)

Ento, para um estimador T no viesado, temos EQM(T) = V(T).


Para dois estimadores

e T 1 T 2 quaisquer (no necessariamente no viesa

dos), definimos a eficincia relativa de T1 em relao T2 por:

7.3.2

Intervalo de confiana para proporo

Em muitas situaes, o principal parmetro de interesse alguma propor


o p. Por exemplo:
-

a proporo de itens defeituosos em uma linha de produo;

a proporo de consumidores que vo comprar certo produto;

a proporo de mensagens que chegam adequadamente a seu destino etc.

Seja uma populao caracterizada por uma varivel aleatria X, que assume o valor 0 ou 1, conforme o elemento tenha ou no certo atributo de interesse. Por exemplo, nas peas que saem de uma linha de produo, o cdigo C
pode identificar pea boa e o cdigo 1 pea defeituosa. Para um elemento tomado ao acaso, seja p = P(X = 1). Note que p representa a proporo de elementos com o atributo, na populao.
J vimos que a proporo amostrai P um bom estimador da proporo
populacional p. Dada uma amostra aleatria simples de tamanho n, o que se
pode dizer sobre o erro amostrai: \ - p\?
Conforme discutido na Seo 7.2, se n for grande, a distribuio amostra]
de P aproximadamente normal com 6

6
Estamos supondo populao infinita ou bastante grande. Caso contrrio, deveramos
usar a correo (7.9), como discutido na Seo 7.2.

o desvio padro da distribuio amostrai de P, que no presente contexto ser


chamado de erro padro de P.
Seja uma varivel aleatria normal padro, Z. Como vale a relao7

Observada efetivamente a amostra, e chamando de p a proporo obtida


nesta amostra, podemos definir um intervalo de confiana para p, com nvel de
confiana de 95%, por

(7.26)
Na prtica, no pode ser calculado por (7.21), porque depende do parmetro desconhecido p. Ento, usamos em seu lugar a estimativa:
7

Ver Exemplo 6.5 (Captulo 6).

(7.27)

Desde que a amostra seja grande (p. ex., n 50), a diferena entre sp e p
pode ser considerada desprezvel, e um intervalo de confiana para p, com nvel
de confiana de 95%, pode ser calculado por:

Em suma, embora p seja um parmetro populacional desconhecido, possvel, com base em uma amostra aleatria simples, construir um intervalo que
deve conter p com alto nvel de confiana. bastante usual o nvel de confiana
de 95%, mas o intervalo pode ser construdo com um nvel y qualquer, bastando encontrar o valor de zy na distribuio normal padro, conforme mostra a Figura 7.8.

0,800

0,900

0,950

0,980

0,990

0,995

0,998

zy

1,282

1,645

1,960

2,326

2,576

2,807

3,090

Figura 7.8

Valores de zy para alguns nveis de confiana.

Com Zy tomado adequadamente, conforme o esquema da Figura 7.8, calculamos o intervalo de confiana para p por:

(7.29)
Exemplo 7.3 Na avaliao de dois sistemas computacionais, A e B, foram selecionadas 400 cargas de trabalho (tarefas) - supostamente uma amostra aleatria da infinidade de cargas de trabalho que poderiam ser submetidas a esses
sistemas. O sistema A foi melhor que o B em 60% dos casos. Construir intervalos de confiana para p (proporo de vezes que o sistema A melhor que o sistema B, considerando todas as possveis cargas de trabalho) usando nveis de
confiana de 95% e 99%.
Para o nvel de confiana de 95%, temos zy = 1,96, resultando em

= 0,6000,048
ou, em porcentagens:
IC(p, 95%) = 60,0% 4,8%
Conclumos, ento, que o intervalo (55,2%; 64,8%) contm o parmetro p,
com nvel de confiana de 95%.

Para o nvel de confiana de 99%, temos zy = 2,576, resultando em

Ou seja, o intervalo (53,7%; 66,2%) contm o parmetro p, com nvel de


confiana de 99%. Esquematicamente:

Observe que, ao exigir maior nvel de confiana, o intervalo de confiana


em magnitude. Tente entender o porqu disso! Para dado nvel de con-

aumenta

plitude de seu intervalo de confiana. A forma natural de aumentar a preciso


aumentando o tamanho da amostra. Voltaremos a esse ponto na Seo 7.4.

7.3.3

Intervalo de confiana para mdia

Seja uma populao caracterizada pela distribuio de uma varivel aleatria X com os seguintes parmetros: E(X) = e V(X) = 2. Por exemplo, X
pode representar a mensurao da resistncia mecnica de um novo material.
Devido ao erro experimental onipresente, X uma varivel aleatria; assim, o
interesse recai em seu valor esperado .
Considere uma amostra aleatria simples {X1, X2, ..., Xn} de X. Supondo X
com distribuio aproximadamente normal, ento

(7.30)
o estimador natural de . Vimos na Seo 7.2 que X' tem distribuio aproximadamente normal com mdia e varincia dadas por 8

(7.31)
(7.32)

(7.33)
ser chamado de erro padro de X'.
Escolhendo zy em funo do nvel de confiana y desejado, tal que P { - zy
Z zy} = y, podemos escrever

(7.34)

ou

8 Novamente,
estamos
supondo
(7.3),
como vidto
na Seo
7.2. a populao infinita

(7.35)

Observada efetivamente a amostra, e chamando de a mdia aritmtica


dos dados, podemos definir um intervalo de confiana para , com nvel de
confiana , por:
(7.36)
Exemplo 7.4 Em uma indstria de cerveja, a quantidade de cerveja inserida
em latas tem-se comportado como uma varivel aleatria com mdia 350 ml e
desvio padro 3 ml. Aps alguns problemas na linha de produo, suspeita-se
que houve alterao na mdia. Uma amostra de 20 latas acusou mdia = 346
ml. Construa um intervalo de confiana para o novo valor da quantidade mdia
// de cerveja inserida em latas, com nvel de confiana 95%, supondo que no
tenha ocorrido alterao no desvio padro do processo.
Soluo:

Interpretando: a quantidade mdia de cerveja inserida em latas, aps os


problemas na linha de produo, 346 ml, tolerando, com 95% de confiana,
uma margem de erro de at 1,31 ml. Assim, o intervalo (344,69; 347,31) contm, com 95% de confiana, o valor . Isso mostra que estatisticamente houve
alterao na mdia do processo, pois o valor da mdia antiga (350 ml) no pertence ao intervalo.
Desvio padro desconhecido
O intervalo de confiana descrito em (7.36) somente poder ser usado nas
situaes em que conhecemos o desvio padro a da populao, o que no comum na prtica. Caso contrrio, o procedimento usual substituir a pelo desvio padro calculado com os dados da amostra:
(7.37)
Duas situaes a considerar:
1. quando a amostra for grande (digamos, n 50), a diferena entre a
e s pode ser desprezvel, permitindo ainda o uso de (7.36);
2. quando a amostra for pequena, necessrio efetuar uma correo,
como veremos a seguir.

A distribuiko t de Student
\

Supondo a populao com distribuio normal, a estatstica


(7.38)

tem distribuio de probabilidades conhecida como distribuio t de Student,


com gl = n - 1 graus de liberdade.
A distribuio t de Student, como mostra a Figura 7.9, tem forma parecida
com a normal padro, mas um pouco mais dispersa. Essa disperso varia com
o tamanho da amostra. bastante dispersa para amostras pequenas, mas se
aproxima da normal padro para amostras grandes.

Figura 7.9

Grficos de distribuies t de Student e da normal padro.

Dado um nvel de confiana y, podemos obter o valor ty da distribuio t


de Student, usando a Tabela 4 do apndice, na linha correspondente a gl = n 1. A Figura 7.10 ilustra esse processo, com gl = 9 e nvel de confiana de 95%.

Figura 7.10

Uso da tabela da distribuio t de Student: ilustrao com gl - 9 e


nvel de confiana de 95%.

Intervalo de confiana para , com uso da distribuio t de Student


Usando a Tabela 4 com gl = n - 1, podemos escolher o valor ty em funo
do nvel de confiana y desejado, tal que

(7.39)

ou

(7.40)

Assim, o intervalo de confiana para com a amostra efetivamente observada, dado por9
(7.41)

Exemplo 7.5 Deseja-se avaliar a dureza esperada do ao produzido sob un


novo processo de tmpera. Uma amostra de dez corpos de prova do ao produ
ziu os seguintes resultados de dureza, em HRc:
36,4 35,7 37,2 36,5 34,9 35,2 36,3 35,8 36,6 36,9
Construir um intervalo de confiana para

com nvel de confiana de 95%.

Calculando as estatsticas para a amostra observada, temos:

9
Para amostras pequenas, a validade do IC(, y) est condicionada suposio de que
os dados provenham de uma distribuio aproximadamente normal. Para n > 30, o teorema limite central garante a validade de IC(, ) e, alm disso, tem-se para N grande: ty zr

Como vimos na Figura 7.10, usando nvel de confiana = 95%, temos,


pela Tabela 4 com gl = 9, o valor t95% = 2,262, resultando em:

Ou seja, a resistncia mecnica esperada do ao produzido pelo novo processo de tmpera 36,15 HRc, tolerando, com 95% de confiana, uma margen]
de erro de at 0,53 HRc.

EXERCCIOS
9.

Sejam X1, X2,


X7 uma amostra aleatria simples de uma populao com
mdia// e desvio padro a. Considere os seguintes estimadores de :

T1 = (X1, +X2+X3+X4+X5+X6+X7)/7
T2 =

(X2 +X3+X4+X5+X6) / 5

T3 = (X2 + X 3 + X 4 + X5 + X 6 ) / 7
a)

Quais estimadores so no viciados? Justifique.

b)

Qual estimador o mais eficiente entre T1 e T2? Justifique.

10. Em uma amostra aleatria simples com 200 edifcios com cinco anos, em
certa cidade, 55% apresentaram problemas estticos relevantes aps a entrega da obra. Construir um intervalo de confiana para a proporo de
edifcios da cidade que apresentam problemas estticos relevantes nos cinco primeiros anos. Use nvel de confiana de 95%.
11. Uma empresa fabricante de pastilhas para freios efetua um teste para controle de qualidade de seus produtos. Selecionou-se uma amostra de 600
pastilhas, das quais 18 apresentaram nveis de desgaste acima do tolerado.
Construir um intervalo de confiana para a proporo de pastilhas com
desgaste acima do tolerado, do atual processo industrial, com nvel de confiana de 95%. Interpretar o resultado.
12. Uma fundio produz blocos para motor de caminhes. Os blocos tm furos para as camisas e deseja-se verificar qual o dimetro mdio no processo do furo. A empresa retirou uma amostra de 36 blocos e mediu os dimetros de 36 furos (1 a cada bloco). A amostra acusou mdia de 98,0 mm e
desvio padro de 4,0 mm. Construir um intervalo de confiana para a mdia do processo, com nvel de confiana de 99%. Interpretar o resultado. Se
o processo deveria ter mdia 100 mm, h evidncia (com 99% de confiana) de que a mdia do processo no est no valor ideal? Explique.

7.4

TAMANHO DE AMOSTRA

Na seo anterior, aprendemos como estimar um parmetro mediante observao de uma amostra aleatria simples de tamanho n. A estimao feita
com certa preciso, no sentido de que tambm avaliamos o erro amostrai que
podemos estar cometendo.
Contudo, ainda na fase do planejamento da pesquisa, muitas vezes precisamos calcular o tamanho n da amostra, para garantir certa preciso desejada,
que descrita em termos do erro amostrai mximo tolerado (E0y) e do nvel de
confiana () a ser adotado no processo de estimao. No caso de estimao de
, podemos exigir

O tamanho mnimo da amostra o menor n que satisfaz a inequao precedente.


A dificuldade operacional para calcularmos o tamanho da amostra que o
clculo depende da varincia populacional 2, que em geral desconhecida.
Em alguns problemas, 2 pode ser avaliada por meio de estudos anteriores ou
pela experincia do engenheiro; em outras situaes, 2 obtida de uma amostragem piloto, isto , alguns elementos da populao so examinados e a varincia encontrada nesta amostra piloto usada no lugar de 2. Nesse caso, melhor usar a expresso (7.44) com ty no lugar de zy.
Exemplo 7.5 (continuao) Considere que o pesquisador julgou o resultado
encontrado, IC(, 95%) = 36,15 0,53, pouco preciso. Ele tolera um erro
amostrai mximo de 0,3 HRc. Alm disso, ele quer realizar as estimaes com
nvel de confiana de 99%. Qual deve ser o tamanho da amostra?
Soluo: Para efetuar o clculo, necessrio o conhecimento da varincia populacional, 2. Usaremos, em seu lugar, a varincia calculada sobre as
dez observaes, isto s2 = (0,7352) 2 0,54. Logo,

Portanto, precisamos de n = 64 corpos de prova para satisfazer a preciso


desejada.
O Quadro 7.1 apresenta o formulrio para o clculo do tamanho da amostra, em funo do parmetro desejado. Quando a populao infinita ou muito
grande, n0 j o tamanho da amostra. Porm, se N conhecido e, especialmente, se no for muito grande, devemos dar seqncia ao clculo, conforme indica
a ltima linha do Quadro 7.1.

Quadro 7.1

Tamanho mnimo de uma amostra aleatria simples.

Quando o objetivo estimar uma proporo p (0 < p < 1), podemos usar
a seguinte relao (ver a Figura 7.11):
(7.50)

A primeira parte da relao (7.50) foi usada para construir a expresso de


n0 em (7.46) (Quadro 7.1b); e a segunda em (7.47) (Quadro 7.1c).

Figura 7.11

A expresso (7.47) (Quadro 7.1c) tambm usada com o objetivo de estimar uma nica proporo p, quando no temos informao a priori sobre o valor de p. Contudo, deve resultar em um valor de n maior do que o necessrio.
No caso de estarmos usando nvel de confiana de 95%, temos
zy = 1,96 2,fazendo com que (7.47) resulte em:
(7.51)

A expresso (7.51) muito usada no planejamento de pesquisas de levantamento, com o objetivo de estimar vrias propores, como nos exemplos seguintes:
numa pesquisa eleitoral, em que comum a necessidade de avaliar a
proporo de cada candidato;
em pesquisas de mercado, em que normalmente desejam-se avaliar as
propores de vrios atributos nos consumidores;
no levantamento de arquivos que trafegam em uma rede, em que
comum o interesse em verificar a proporo de cada tipo de arquivo.

EXERCCIOS
13. Um pesquisador precisa determinar o tempo mdio gasto para perfurar trs
orifcios em uma pea de metal. Qual deve ser o tamanho da amostra para
que a mdia amostrai esteja a menos de 15 s da mdia populacional? Por experincia prvia, pode-se supor o desvio padro em torno de 40 s. Considere
tambm, que a estimao ser realizada com nvel de confiana de 95%.
1 4 . Seja a construo de um plano para garantir a qualidade dos parafusos
vendidos em caixas com 100 unidades. Um dos requisitos controlar o
comprimento mdio dos parafusos. Quer-se saber quantos parafusos de-

ve-se examinar em cada caixa, para garantir que a mdia da amostra ()


no difira do comprimento mdio dos parafusos da caixa () em mais que
0,8 mm. Considere que a estimao seja realizada com nvel de confiana
de 95%. Anlises feitas na linha de produo indicam varincia em torno
de 2 mm2.
15. Considerando o Exerccio 14, mas supondo a caixa com 1.000 parafusos,
qual o tamanho da amostra necessrio?
16. Com o objetivo de avaliar a confiabilidade de um novo sistema de transmisso de dados, torna-se necessrio verificar a proporo de bits transmitidos com erro em cada lote de 100 Mb. Considere que seja tolervel um
erro amostrai mximo de 2% e que em sistemas similares a taxa de erro na
transmisso de 10%. Qual deve ser o tamanho da amostra?

EXERCCIOS COMPLEMENTARES
17. Sob condies normais, realizaram-se dez observaes sobre o tempo de
resposta de uma consulta a certo banco de dados. Os resultados, em segundos, foram:
28 35 43 23 62 38 34 27 32 37
Construa um intervalo de confiana para o tempo mdio de uma consulta, sob condies normais. Use = 0,99.
18. Fixados certos parmetros de entrada, o tempo de execuo de um algoritmo foi medido 12 vezes, obtendo-se os seguintes resultados, em minutos:
15 12 14 15 16 14 16 13 14 11 15 13
a)

Apresente um intervalo de 95% de confiana para o tempo mdio de


execuo do algoritmo.

b)

Considerando as 12 mensuraes como uma amostra piloto, avalie o


nmero de mensuraes (tamanho da amostra) necessrio para garantir um erro mximo de 15 segundos (0,25 minutos). Use = 0,95.

19. Uma empresa tem 2.400 empregados. Deseja-se extrair uma amostra de
empregados para verificar o grau de satisfao em relao qualidade da
comida no refeitrio. Em uma amostra piloto, numa escala de 0 a 10, o
grau de satisfao recebeu nota mdia 6,5 e desvio padro 2,0.

a)

Determine o tamanho mnimo da amostra, supondo amostragem


aleatria simples, com erro mximo de 0,5 unidade e nvel de confiana de 99%.

b)

Considere que a amostra planejada no item anterior tenha sido realizada e obteve-se mdia 5,3 e desvio padro 1,8 ponto. Construa um intervalo de 99% de confiana para o parmetro .

c)

Considerando o resultado do item anterior, voc diria, com nvel de


confiana de 99%, que a nota mdia seria superior a cinco se a pesquisa fosse aplicada a todos os 2.400 funcionrios? Justifique.

d)

Realizada a amostra planejada no item (a), suponha que 70 atriburam


notas iguais ou superiores a cinco. Apresente um intervalo de 90% de
confiana para a porcentagem de indivduos da populao que atribuiriam notas iguais ou superiores a cinco.

20. Com os dados histricos sobre a temperatura do pasteurizador de um laticnio, sabe-se que a varincia aproximadamente 1,8 (C)2. Planeja-se fazer
uma amostragem para avaliar o valor mdio da temperatura do pasteurizador. Suponha que as observaes sejam feitas sob as mesmas condies e
de forma independente. Qual deve ser o tamanho da amostra, para garantir um erro mximo de 0,3C, com nvel de confiana de 95%?
21. Planeja-se extrair uma amostra aleatria simples dos 2.000 funcionrios de
uma empresa, para avaliar a satisfao com o trabalho. A satisfao ser
avaliada atravs de um questionrio com vrios itens numa escala de 1 a 5.
Pretende-se avaliar o valor mdio de cada item. Qual deve ser o tamanho
da amostra para garantir um erro mximo de 0,2 unidade, com nvel de
confiana de 95%?
Nota: Use como varincia o valor terico que se obtm ao supor probabilidade igual para cada um dos cinco nveis da escala. Observe que dificilmente algum item ter varincia maior do que esta que voc est calculando, pois, na prtica, a tendncia que as respostas se concentrem em torno
de algum nvel.
22. Numa pesquisa para estudar a preferncia do eleitorado a uma semana da
eleio presidencial, qual deve ser o tamanho de uma amostra aleatria
simples para garantir, com nvel de confiana de 95%, um erro amostrai
no superior a 2%?
23. Um analista de sistemas est avaliando o desempenho de um novo programa de anlise numrica. Forneceu como entrada do programa 14 operaes similares e obteve os seguintes tempos de processamento (em milissegundos):

12,0

13,5 16,0 15,7 15,8 16,5 15,0 13,1

15,2

18,1 18,5 12,3 17,5 17,0

a)

Calcule a mdia e o desvio padro da amostra do tempo de processamento.

b)

Construir um intervalo de confiana para o tempo mdio de processamento, com nvel de confiana de 95%.

c)

Qual deve ser o tamanho da amostra para garantir um erro amostrai


mximo de 0,5 milissegundo, na estimao do tempo mdio de processamento, com nvel de confiana de 99%?

24. Uma unidade fabril da Intel produziu 500.000 chips Pentium IV em certo
perodo. So selecionados, aleatoriamente, 400 chips para testes.
a)

Supondo que 20 chips no tenham a velocidade de processamento adequada, construir o intervalo de confiana para a proporo de chips
adequados. Use nvel de confiana de 95%.

b)

Verificar se essa amostra suficiente para obter um intervalo de 99%


de confiana, com erro amostrai mximo de 0,5%, para a proporo
de chips adequados. Caso contrrio, qual deveria ser o tamanho da
amostra?

Potrebbero piacerti anche