Sei sulla pagina 1di 139

Introdução a Estatística

JOELMIR FELICIANO
O que é Estatística ?

ESTATÍSTICA: conjunto de técnicas que permite, de forma sistemática,


coletar, organizar, descrever, analisar e interpretar dados oriundos de
estudos ou experimentos, realizados em qualquer área do conhecimento.
Algumas Atividades que Envolvem Estatística.

• Área Social: O censo populacional.

• Área Industrial: Confiabilidade de Sistemas,


Controle Estatístico de Qualidade, etc.

• Área Agropecuária: Identificação de melhores


formas de manejo, etc.

• Área Bancária: Concessão de Crédito, Atuária.

• Marketing: Pesquisas de Mercado, Inferência, etc.


Principais Áreas da Estatística

• Estatística Descritiva: Utilizada na etapa inicial da análise, quando


tomamos contato com os dados pela primeira vez. É o conjunto de
técnicas destinadas a descrever e resumir os dados a fim de que
possamos tirar conclusões a respeito da característica de interesse.

• Probabilidade: Teoria matemática utilizada para se estudar a incerteza


oriunda de fenômenos de caráter aleatório.

• Inferência Estatística: Estudo de técnicas que possibilitam a


extrapolação, a um grande conjunto de dados, das informações e
conclusões obtidas a partir de subconjuntos de valores, usualmente de
dimensão muito menor.
Exemplos de Aplicação
• Comparação entre tratamentos ou processos:

Tratamento Tipo 1 Tratamento Tipo 2

Produção
Produção
Tipo 1
é mais
produtivo
do que o
x11 x12 ... x1n Tipo 2? x21 x22 ... x2n
Raciocínio Estatístico

População Dados
Amostragem

Estatística
Descritiva

Inferência Estatística
(Probabilidade)

Com Suporte Computacional


Técnicas de Amostragem

JOELMIR FELICIANO
Noções Básicas

• Definição de População: Ao grande conjunto de


elementos que contém determinada característica
comum, que temos interesse recebe o nome de
população.
População 1 População 2

Ex1: Toda a população brasileira.

Ex2: Toda a população de sapos brasileiros.


Noções Básicas

Quando observamos todos os dados, procedemos ao


Censo.
Exemplo: Examinar todos os brasileiros quanto a condição
de nutrição.
População

Qual é a proporção de
brasileiros desnutridos?
=?

• Um parâmetro é uma medida numérica que descreve uma característica


de uma população. Ex: 20% dos brasileiros estão desnutridos.
Noções Básicas

Quase não se trabalha com população.


Motivos Principais

• Alto custo da pesquisa/experimento (material, pessoal, logística, etc);

• Resultados demorados;

• Razões Éticas (experimentos com animais);

• Impossibilidade (Linha de produção, sangue, etc).


Noções Básicas: Amostra.

Definição: subconjunto da população, em geral com


dimensão sensivelmente menor.

População
Amostra

x : Estatística.

• Estatística: é uma medida numérica que descreve uma característica de uma


amostra. Ex: média da altura da pop. Brasileira, proporção de desnutridos, etc.
Noções Básicas: Amostra.

Vantagens da Amostragem.

•Baixo custo operacional.

• Maior rapidez na execução da pesquisa ou estudo.

• Maior segurança nos resultados


Tipos de Amostragem

Amostra casual simples: Existência de um “frame”. Todos os


elementos da população devem ter chance igual de escolha.
Procedimento baseado no sorteio aleatório.de escolha.

Figura 1: Sorteio Aleatório


Tipos de Amostragem

Amostra Estratificada: Na amostra estratificada os elementos são


provenientes de todos os estratos da população.

Em cada estrato é feito o sorteio aleatório.

Ex: Pesquisas em um cidade; pesquisas em florestas; etc.


Tipos de Amostragem

Amostra Sistemática: Na amostra sistemática os elementos são


escolhidos não por acaso, mas por um sistema.

No primeiro período o sorteio é aleatório.

Exemplo: Linha de Produção; Pesquisas em formulários; etc.


Tipos de Amostragem

Amostra por conglomerado: Amostra feita em vários estágios.


Maior economia.

Ex: Em uma pesquisa feita no pais, primeiro sorteamos os estados, depois as


cidades, depois os bairros, os setores censitários, os domicílios e os indivíduos.
Tipos de Amostragem: Exercícios
A- Identifique o tipo de amostra:

1. Obtém-se uma amostra de um produto extraindo-se cada 100º unidade da linha


de produção;
2. Um fabricante de automóveis faz um estudo de mercado compreendendo testes
de direção feitos por uma amostra de 10 homens e 10 muheres em cada uma
das quatro diferentes faixas etárias;
3. Geram-se números aleatórios em um computador para selecionar números de
séries de carros a serem escolhidos para uma amostra teste.
4. Em uma linha de produção são produzidos 1000 comprimidos por hora,
sabendo que a linha funciona por 8 horas seguidas por dia e que deve ser
extraída uma amostra de 400 comprimidos por dia, qual seria o processo de
amostragem mais indicado e como seria a seleção dessa amostra?
Análise Exploratória de Dados
Estatística Descritiva 1
Organização dos dados em
Tabelas?
O que é uma variável ?
• Variável é uma característica, propriedade ou atributo de uma
unidade da população, cujo valor pode variar entre as unidades
da população.

Tipos de Variáveis

• Variáveis Qualitativas ou Categóricas: Quando os possíveis


valores assumem atributos ou qualidades. Ex: sexo, cor, escolaridade,
doença, condição do ar, condição da água, etc.

• Variáveis Quantitativas ou de Medidas: Quando seus valores são


expressos em números. Ex: altura, peso, número de filhos, pH,
concentração do reagente, etc .
Especificando os tipos de variáveis

As variáveis qualitativas podem ser classificadas ainda como:


• Ordinais: quando o atributo tem uma ordenação natural, indicando
intensidade crescente de realização. Ex: grau de escolaridade, classe
social, condição do ar, condição da água, estado clínico, etc.

• Nominais: quando o atributo não se estabelece ordem. Ex: sexo, cor,


raça, doença, etc.

Já as variáveis quantitativas podem ser:

• Discretas: resultantes de contagens, assumindo assim, em geral


valores inteiros. Ex: número de filhos, número de peças defeituosas,
nº de pessoas doentes na região, etc.

• Contínuas: assumem valores em intervalos de números reais e


geralmente, são provenientes de uma mensuração. Ex: peso, altura,
pH, concentração do reagente, etc..
Resumo geral: tipo de variável

nominal
Qualitativa
ordinal

Variável

discreta

Quantitativa

contínua
Exercícios

Classifique cada uma das variáveis abaixo em qualitativa (nominal ou


ordinal) ou quantitativa (discreta ou contínua)?

a) Intenção de voto para presidente (possíveis respostas são os nomes dos


candidatos, além de (“não sei”).

b) Perda de peso de maratonistas na Corrida de São Silvestre, em quilos.

c) Intensidade da perda de peso de maratonistas na Corrida de São Silvestre


(leve, moderada, forte).

d) Grau de satisfação da população brasileira com relação ao trabalho de seu


presidente (valores de 0 a 5, com 0 indicando totalmente insatisfeito e 5
totalmente satisfeito
Apresentação dos dados em tabela

Tabela 1.1: Número de Nascimentos segundo o sexo

Sexo Freqüência
Masculino 10
Feminino 8
Total 18
Fonte: E.W.
Para efeito de comparação: Tabela de
freqüência relativa

Tabela 1.2: Número de Nascimentos segundo sexo.


Sexo Freqüência Freqüência relativa(%)
Masculino 10 55,56%
Feminino 8 44,44%
Total 18 100,00%

Fonte: E.W.
Tabelas de distribuição de freqüência.
Quando os dados são quantitativos contínuos, não conseguimos resumir a
informação da mesma forma anterior. Neste caso precisamos organizar
os dados em uma tabela de distribuição de frequências. Veja os dados
abaixo,
Tabela 1.7: Peso ao nascer de nascidos vivos, em quilogramas
2,522 3,200 1,900 4,100 4,600 3,400
2,720 3,720 3,600 2,400 1,720 3,400
3,125 2,800 3,200 2,700 2,750 1,570
2,250 2,900 3,300 2,450 4,200 3,800
3,220 2,950 2,900 3,400 2,100 2,700
3,000 2,480 2,500 2,400 4,450 2,900
3,725 3,800 3,600 3,120 2,900 3,700
2,890 2,500 2,500 3,400 2,920 2,120
3,110 3,550 2,300 3,200 2,720 3,150
3,520 3,000 2,950 2,700 2,900 2,400
3,100 4,100 3,000 3,150 2,000 3,450
3,200 3,200 3,750 2,800 2,720 3,120
2,780 3,450 3,150 2,700 2,480 2,120
3,155 3,100 3,200 3,300 3,900 2,450
2,150 3,150 2,500 3,200 2,500 2,700
3,300 2,800 2,900 3,200 2,480
3,250 2,900 3,200 2,800 2,450
Fonte: IBGE
Exemplo de tabela de distribuição de
freqüência.
Tabela 1.9: Peso de recém nascidos.
Classe Ponto médio Freqüência
1,5 |--- 2,0 1,750 3
2,0 |--- 2,5 2,250 16
2,5 |--- 3,0 2,750 31
3,0 |--- 3,5 3,250 34
3,5 |--- 4,0 3,750 11
4,0 |--- 4,5 4,250 4
4,5 |--- 5,0 4,75 1

Numa tabela de distribuição de frequência também podem ser


apresentados os pontos médios de classe. O ponto médio é dado pela soma dos
extremos de uma classe, dividida por 2. Para a classe 1,5 |--- 2,0, o ponto médio
é: (1,5+2)/2=1,75.
Exemplo de tabela de distribuição de
freqüência.
Tabela 2.0 – Número de Filhos

Número de Frequência Frequência Frequência Frequência Proporção


Filhos Relativa Absoluta Acumulada
Fab. Fac.
0 2 0,2 2 0,2 20%
1 3 0,3 5 0,5 30%
2 3 0,3 8 0,8 30%
3 2 0,2 10 1,00 20%
Total 10 1,00 ----- ----- 100%
Cálculo da amplitude de classes

• Ordenar os dados

•Intervalo da amostra= Maior valor – menor valor

• Número de classes = raiz de n = Tamanho da amostra


 

Intervalo da amostra
• Amplitude =
Número de classes

• Construir os intervalos = limite inferior + amplitude


Análise Exploratória de Dados
Estatística Descritiva 2

• Representação Gráfica de Dados


Gráfico de Setores ou Pizza.
Usado para representar variáveis qualitativas, quando os
dados apresentam poucas características.

Figura1.1: Fonte de Emissão de CO na RMSP-2003.

31%

54%

15%

G a s o lin a A lc o o l D ie s e l
Gráfico de Barras.
Gráfico de barras bastante usado com variáveis qualitativas e quantitativas
discretas. Ideal para quando temos várias classes de categorias.
Figura 1.2: Distribuição das reclamações via 0800.
25

25

20

15 13
Freqüência

10 8
7

0
Mau atendimento Troca de mercadoria Mercadoria com defeito Falta de variedade
Reclamações
Histograma
O histograma é a representação gráfica para variáveis quantitativas
contínuas. Este tipo de representação mostra a forma da distribuição
da variável. É de fundamental importância na aplicação dos conceitos
de inferência estatística
Figura 1.3:

Ponto médio

Espalhamento
dos dados
Diagramas de Dispersão
Quando temos dados emparelhados e desejamos verificar se existe uma
associação entre esses dados, usamos como análise preliminar o diagrama
de dispersão.
Figura 1.4: Diagrama de dispersão: Temperatura X Rendimento de PQ.
100

90

80

70

60
Rendimento

50

40

30

20

10

0
0 20 40 60 80 100 12 0
T e m p e ra tu ra
Exercícios
1. Uma pesquisa com usuários de transporte coletivo na cidade de São Paulo indagou
sobre os diferentes tipos usados nas suas locomoções diárias. Dentre ônibus, metro e
trem, o número de diferentes meios de transportes utilizados foi o seguinte:

2, 3, 2, 1, 2, 1, 2, 1, 2, 3, 1, 1, 1, 2, 2, 3, 1, 1, 1, 1, 2, 1, 1, 2, 2, 1, 2, 1, 2 e 3.

a) Organize estes dados em uma tabela.


b) Faça uma representação gráfica.
c) Admitindo que esta amostra represente bem o comportamento do usuário
paulistano, o que você escreveria sobre a percentagem de usuários que utilizam mais
de um transporte.

2. A idade dos 20 ingressantes num certo curso de pós-graduação foi o seguinte:

22, 22, 22, 22, 23, 23, 24, 24, 24, 24, 25, 25, 26, 26, 26, 26, 27, 28, 35 e 40.

a) Organize estes dados em uma tabela.


b) Faça uma representação gráfica.
Análise Exploratória de Dados
Estatística Descritiva 3

Medidas de Centralidade.
Medidas de Posição.
Cálculo de Médias
x   xi  x1  x 2    x n  Dados Brutos.
1 n 1
n i 1 n

x   xi .ni  x1.n1  x2 .n2    xk .nk  Tabelas.


1 k 1
n i 1 n
x   xi . f i  x1 . f1  x 2 . f 2    x k . f k Tabelas.
k

i 1
Onde :
x i = i - ésimo elemento da amostra ou o ponto médio da variável contínua.
f i = i - ésimo elemento da frequência relativa.
n i = i - ésimo elemento da frequência .
n = tamanho da amostra.
k = número de classes.
Medidas de Centralidade
• Média Aritmética de um conjunto de valores é o valor
obtido somando-se todos eles e dividindo-se o total pelo
número de valores.

Exemplo 1: Os valores em gramas referentes aos pesos de recém nascidos


de uma pequena cidade em um dia específico foram: 2500, 2350, 3400,
3280, 2650, 4010 e 2910.
Assim o peso médio é calculado como:

2500  2350  ...  2910 21100


x   3014,28
7 7
Medidas de Centralidade
Tabela 2.0 – Número de Filhos

Número de Frequência Frequência Frequência Frequência Proporção


Filhos Relativa Absoluta Acumulada
Fab. Fac.
0 2 0,2 2 0,2 20%
1 3 0,3 5 0,5 30%
2 3 0,3 8 0,8 30%
3 2 0,2 10 1,00 20%
Total 10 1,00 ----- ----- 100%
Medidas de Centralidade
Se os dados apresentam observações extremas, a média pode não ser a
medida mais indicada para centralidade, pois sobre influência direta
de observações extremas. Por exemplo:

Em uma pesquisa sobre salário de um Tecnólogo em Química Fármaco


Industrial observamos os seguintes valores: $1000,00; $1200,00;
$1800,00; $2500,00; $2700,00 ; $3200,00 e $15000,00

A média é: 3914,28. Essa medida é representativa para este conjunto de


dados.

Solução: O uso da mediana.


Mediana (Me) é o valor que divide a amostra ou população em duas partes
iguais.
Para o exemplo, Me = $2500,00
Medidas de Centralidade
Figura 2.1 : Salários dos Tecnólogos
16000

14000

12000

10000

8000

6000

4000

2000

0
1 2 3 4 5 6 7

Dados Média Mediana


Medidas de Centralidade
Como calcular a mediana?
Se o número n de observações na amostra ou população for
ímpar, então a mediana será o elemento de ordem n  1 , ou seja :
2
Me  x n 1 
 
 2 

Se o número for de ordem par, então a mediana será a média entre os


elementos centrais ou seja:

x n   x n 
   1 
Me  2 2 
2
Exemplos para o cálculo da
Mediana:
Serie 1: 12, 124, 32, 10, 18, 29 e 100 n= 7; impar
Ordenar : 10, 12, 18, 29, 32, 100 e 124.

Me  x  n 1   x ( 4)  29
 
 2 

Serie 2: 12, 124, 32, 10, 18 e 29 n= 6; par.


Ordenar : 10, 12, 18, 29, 32, 124.

x n   x n 
   1 x (3)  x ( 4) 18  29
Me  2 2 
   23.5
2 2 2
Moda
Medidas de Posição

Moda(mo): É o valor (ou atributo) que ocorre com maior frequência.

Variável
qualitativa

Ex: 4,5,4,6,5,8,4,4
Mo = 4
Medidas Separatrizes
As medidas de posição possibilitam um melhor
entendimento dos dados, focalizando sua posição
relativa em relação ao conjunto como um todo.
Mediana: divide os dados ordenados em duas partes iguais.

Quartis: Dividem os dados ordenados em 4 partes iguais.

Decis: Dividem os dados ordenados em 10 partes iguais.

Percentis: Dividem os dados ordenados em 100 partes iguais.


Medidas Separatrizes
Calculando o percentil (medida geral)

Ordenar a série de n observações em ordem crescente de valores, definimos


como 0% à posição de ordem 1 e 100% a observação de ordem n. Portanto
uma observação com ordem x terá uma posição p.

Posição
100%

0%

Ordem
1 x n
Medidas Separatrizes
• Usando a semelhança de triângulos, vamos ter:

n 1 x 1

100  0 P  0

n : número total de observações na série.


x : é a ordem de uma determinada observação.
P : é o percentil dessa observação.

x 1
P * 100%
n 1

P
x  (n  1) * 1
100
Medidas Separatrizes: Exemplo1.
Série de 27 32 64 65 58 62 59 54 29 30 26 48 47
Dados 46 43 38 29 32 35 37 31 43 45 42 37 36

Calcular o valor da observação para o percentil P = 32%.

Primeiro Passo: Ordenar os dados.

Série 26 27 29 29 30 31 32 32 35 36 37 37 38
Ordem 1 2 3 4 5 6 7 8 9 10 11 12 13
Série 42 43 43 45 46 47 48 54 58 59 62 64 65
Ordem 14 15 16 17 18 19 20 21 22 23 24 25 26
Medidas Separatrizes: Exemplo.

Agora vamos encontrar a ordem x correspondente:

P 32
x  (n  1) *  1  (26  1) * 1  9
100 100

Portanto o valor na série de ordem x=9 é 35. Ou seja, o valor que


separa a série de dados entre os 32% menores valores é 35.
Boxplot
O BOXPLOT representa os dados através de um retângulo construído com
os quartis e fornece informação sobre valores extremos. Usado para todas
as variáveis. (veja o esquema embaixo)

d = Intervalo Interquartil =
= Primeiro Quartil = 25% do dados à esquerda e 75% à direita.
= Segundo Quartil = Md(X) = 50% dos dados à esquerda e 50% à direita
= Terceiro Quartil = 75% dos dados à esquerda e 25% à direita.
Descritiva 4

Medidas de dispersão.
Medidas de dispersão
Problema:
Uma empresa farmacêutica realiza um teste com dois
medicamentos para a mesma finalidade em um grupo de 14 pessoas,
sendo que 7 tomaram o medicamento A e as outras 7 o B.O tempo de
reação foi anotado para cada individuo:
Tabela 1: Tempo de reação dos medicamentos.

Tempo de Reação Média


Med.A 15 61 48 16 72 17 16 35
Med.B 35 35 36 34 33 35 37 35
Fonte: J. F.

As médias para os dois grupos são iguais. Qual é o melhor medicamento?


Medida de Dispersão
Só utilizando a média como medida resumo para um conjunto de
dados, não vamos ter uma boa representação. Necessitamos de outras medidas
para avaliar o grau de variabilidade, ou dispersão dos valores em torno da
média. As medidas de dispersão medem a representatividade da média.
T e m p o d e R e a ç ã o d o s M e d ic a m e n to s

80

70

60

50
Tempo de Reação

M e d .A
40 M e d .B
M é d ia

30

20

10

0
1 2 3 4 5 6 7
P a c ie n te s
Medidas de Dispersão
• Amplitude Total: Diferença entre o maior e menor valor da série de
dados. No exemplo temos.

MedA : 72  15  57

MedB : 37  33  4

Temos uma ideia da dispersão.

Problema: Depende dos valores extremos.


Não é avaliada a dispersão dos valores internos.
Medidas de Dispersão
Os desvios de uma série de dados com relação a média são dados
por :

xi  x , onde i  1,2,..., n.

Portanto o desvio médio seria uma boa taxa de dispersão


entre os dados. No entanto:

 (x
n

i  x)  0
i 1
Medidas de Dispersão.
Confirmando o resultado.

Med.A Med.B
xi (xi  x) xi (xi  x)
15 -20 35 0
61 26 35 0
48 13 36 1
16 -19 34 -1
72 37 33 -2
17 -18 35 0
16 -19 37 2
Soma 0 Soma 0
Medidas de Dispersão

    
Variância Amostral: É dada quando trabalhamos com amostras.

1
  1

n 2

S (X )  xi  x  x1  x   xn  x Dados Brutos.
2 2 2

 n x  x   n x  x Tabelas.
n 1 i 1 n 1

 n x  x 
1 1
k 2

S (X ) 
2 2 2

n 1 n 1
i i 1 1 k k
i 1

Onde :
x i = i - ésimo elemento da amostra ou o ponto médio da variável contínua.
f i = i - ésimo elemento da frequência relativa.
n i = i - ésimo elemento da frequência .
n = tamanho da amostra.
k = número de classes.
Medidas de Dispersão.
Calculando a variância amostral para o MedA, temos:

(15  35 ) 2
 ( 61  35 ) 2
 ...  (16  35 ) 2
3660
S (X ) 
2
  610
7 1 6

Calcular a variância para o MedB.

( 35  35 ) 2
 ( 35  35 ) 2
 ...  ( 37  35 ) 2
10
S (X ) 
2
  1.666
7 1 6
Medidas de Dispersão.
Algumas conclusões relacionadas com a variância.

O valor da variância é sempre positivo.

Quando todos os elementos da série são iguais, a variância é igual a


zero.

O valor da variância é uma medida em escala diferente dos dados.


Medidas de Dispersão.
Para resolver o problema da diferença de escala entre variância e os dados,
utilizamos o desvio padrão. O desvio padrão é a raiz quadrada da variância.

S(X )  S 2(X )

Para o exemplo anterior.

Med A: S(X) = 24,698. Med B : S(X) = 1,29.


Variância Populacional
Var( X )   xi  x 
1 1
      
n 2

x1  x    xn  x Dados Brutos.
2 2

Var( X )   n x  x   n x  x     n x  x  Tabelas.
n i 1 n
1 1
k 2
2 2

Var( X )   f x  x    f x  x     f x  x  Tabelas.
n n
i i 1 1 k k
i 1
k 2
2 2
i i 1 1 k k
i 1

Onde :
x i = i - ésimo elemento da amostra ou o ponto médio da variável contínua.
f i = i - ésimo elemento da frequência relativa.
n i = i - ésimo elemento da frequência .
n = tamanho da amostra.
k = número de classes.
Medidas de Dispersão.
Desvio Padrão Populacional.

 ( X )  DP( X )  Var ( X )
Coeficiente de variação: Mede a variabilidade em termos relativos,
dividindo o desvio padrão pela média.

S 
CVa   100% CVa   100%
x x
Índices para avaliar a variação dos dados.
Baixa: menor que 10%
Médio: de 10% a 20%
Alto: de 20% a 30%
Muito Alto: acima de 30%
Medidas de Centralidade
Tabela 2.0 – Número de Filhos

Número de Frequência Frequência Frequência Frequência Proporção


Filhos Relativa Absoluta Acumulada
Fab. Fac.
0 2 0,2 2 0,2 20%
1 3 0,3 5 0,5 30%
2 3 0,3 8 0,8 30%
3 2 0,2 10 1,00 20%
Total 10 1,00 ----- ----- 100%
Exercícios
1. Responda certo ou errado, justificando.

a) Suponha duas amostras colhidas de uma mesma população, sendo uma de tamanho 100
e outra de tamanho 200. Então, não há dúvida de que a amostra de tamanho maior é mais
representativa da população, certo? Justifique.

b) Duas variáveis diferentes podem apresentar histogramas idênticos?

2. Suponha que duas empresas desejam emprega-lo e após considerar às vantagens de


cada uma você escolha aquela que lhe paga melhor. Após certa pesquisa, você consegue a
distribuição de salário das empresas dadas segundo os gráficos abaixo. Com base nas
informações de cada gráfico, qual seria a sua decisão?
Exercícios
3. Quais medidas de posição são mais adequadas nos seguintes casos?
Justifique.

• Estão disponíveis dados mensais sobre a incidência de envenenamento por


picada de cobra. Deseja-se planejar a compra mensal de antídoto.

• O número diário de usuários, entre 17 e 19 horas, de determinada linha de


ônibus foi anotado. Pretende-se utilizar essa informação para dimensionar a
frota em circulação.

• Um fabricante de baterias deseja divulgar a durabilidade do seu produto e


coleta a informação sobre a duração de 100 de suas baterias.

• Num voo internacional uma companhia serve dois tipos de pratos: peixe ou
frango. Um banco de dados contém os pedidos feitos nos últimos 200 voos.
Pretende-se planejar o número de cada tipo à ser colocado a disposição dos
passageiros.
Exercícios
4. Vinte e cinco residências de um bairro foram sorteadas e visitadas por um
entrevistador que, entre outras questões, perguntou sobre o número de televisores. Os
dados foram os seguintes:

2, 2, 2, 3, 1, 2, 1, 1, 1, 1, 0, 1, 2, 2, 2, 2, 3, 1, 1, 3, 1, 2, 1, 0 e 2.

Organize os dados em uma tabela de frequência e determine as diversas medidas de


posição e de dispersão.

5. Num experimento, 15 coelhos foram alimentados com uma nova ração e seu peso
avaliado ao fim de um mês. Os dados referentes ao ganho de peso (em kg) foram os
seguintes:
1,5; 1,6; 2,3; 1,7; 1,5; 2,0; 1,5; 1,8; 2,1; 2,1; 1,9; 1,8; 1,7; 2,5 e 2,2

a) Utilizando os dados brutos acima, determine média, moda, mediana e variância.


b) Organize uma tabela de frequência com faixas de amplitude 0,2 a partir de 1,5.
c) Calcule a partir da tabela de frequência e com o ponto médio representando cada
faixa, a média, a moda, mediana e variância. Comente as diferenças em relação ao
item a.
d) Se ao invés de 15, fossem 500 coelhos, qual seria o procedimento mais conveniente
(a) ou (c)?
Exercícios
6. Você está indeciso em comprar uma televisão e decide avaliar algumas
informações estatísticas, fornecidas pelo fabricante, sobre a duração(em horas)
do tubo de imagem.

Marca de TV GA FB HW
Média 8000 8200 8000
Mediana 8000 9000 7000
Desvio Padrão 600 1500 2500

Justifique.

7. A pulsação de 10 estudantes após exercícios físicos foram as seguintes (em


batimentos por minuto): 80, 91, 84, 86, 93, 88, 80, 89, 85 e 86. Determine a
média, a moda, a mediana e o desvio padrão.
Exercícios
8. Num estudo amostral sobre consumo de combustível, 200 automóveis do
mesmo ano e modelo tiveram seu consumo observado durante 1000
quilômetros. A informação obtida é apresentada na tabela abaixo em Km/litro.
Consumo de Frequência
combustível
7├ 8 27
8├ 9 29
9├ 10 46
10├ 11 43
Determine o desvio padrão do consumo. 11├ 12 55

9. Num certo bairro da cidade de São Paulo, as companhias de seguro


estabeleceram o seguinte modelo para o número de veículos roubados por
semana. Calcule a média e a variância do número de furtos semanais.

Furtos 0 1 2 3 4
1/4 1/2 1/8 1/16 1/16
Exercícios
10. Num jogo de dados, um jogador paga R$ 5 para lançar um dado equilibrado
e ganha R$ 10 se der face 6, ganha R$ 5 se der face 5 e não ganha nada com as
outras faces. Defina a variável lucro por jogada como sendo o saldo do que o
jogador ganhou menos o pagamento inicial. Determine média, moda, mediana e
variância, desvio padrão dessa variável.

11. Um certo cruzamento tem alto índice de acidentes de trânsito, conforme


pode ser constado em uma amostra dos últimos 12 meses: 5, 4, 7, 8, 5, 6, 4, 7, 9,
7, 6 e 8. Determine a média e o desvio padrão do número de acidentes mensais.

12. Estudando uma nova técnica de sutura, foram contados os dias necessários
para a completa cicatrização de determinada cirurgia.
Os resultados de 25 pacientes foram os seguintes: 6, 8, 9, 7, 8, 6, 6, 7, 8, 9, 10,
7, 8, 10, 9, 9, 9, 7, 6, 5, 7, 7, 8, 10 e 11. Organize os dados em uma tabela de
frequência e calcule a média, mediana e a moda.
Exercícios
13. Uma amostra de vinte empresas, de porte médio, foi escolhida para um estudo
sobre o nível educacional dos funcionários do setor de
vendas. Os dados coletados, quanto ao número de empregados com curso superior
completo, são apresentados abaixo:

Empresas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Média 1 0 0 3 0 1 1 2 2 2 0 2 0 2 0 1 1 2 3 2

a. Organize em uma tabela de frequência e calcule a média, mediana e a moda.


b. Determine o desvio padrão.

c. As empresas pretendem incentivar o estudo dos seus funcionários oferecendo


um adicional de 2 salários mínimos para cada funcionários com curso
superior. Qual será a despesa média adicional nessas empresas?
Exercícios
14. As notas finais de um curso de Estatística foram as seguintes: 7, 5, 4, 5, 6, 1,
8, 4, 5, 4, 6, 4, 5, 6, 4, 6, 6, 4, 8, 4, 5, 4, 5, 5, 6.
a. Determine a mediana e a média.
b. Separe o conjunto de dados em dois grupos denominados ‘’aprovados’’ com
nota igual ou maior que 5, e ‘’reprovados’’. Compare a variabilidade desses
dois grupos através de seus coeficientes de variação.

15. Um hospital maternidade está planejando a ampliação dos leitos para recém-
nascidos. Para tal, fez um levantamento dos últimos 50 nascimentos obtendo a
informação sobre o número de dias que os bebês permanecem no hospital antes
de terem alta. Os dados já ordenados foram:
1,1,1,2,2,2,2,2,2,2,2,2,2,2,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,5,5,5,5,
5,5,6,7,7,8,15.
a. organize os dados em uma tabela de frequências.
b. calcule a média, moda, mediana e quartis.
c. determine a variância e o desvio padrão.
d. você identifica alguma valor excepcional (outlier) entre os dados? Caso sim
retire-o da série e refaça os cálculos dos itens a, b e c. Comente as
diferenças encontradas
Exercícios
16. O departamento de atendimento ao consumidor de uma concessionária de veículos
recebe, via telefone, as reclamações dos clientes. O número de chamadas dos últimos 30
dias foram anotadas e os resultados foram: 3, 4, 5, 4, 4, 5, 6, 9, 4,4, 5, 6, 4, 3, 6, 7, 4,5, 4,
5, 7, 8, 8, 5, 7, 5, 4, 5, 7, e 6.

a. Construa uma distribuição de frequência,


b. Calcule a média e o desvio padrão.
c. Admitindo que cada telefonema acarreta serviços sob a garantia avaliados em R$
50,00 por chamada, calcule a média e o desvio padrão das despesas oriundas do
atendimento ao consumidor.

17. Um hospital maternidade está planejando a ampliação dos leitos para recém-nascidos.
Para tal, fez um levantamento dos últimos 50 nascimentos obtendo a informação sobre o
número de dias que os bebês permanecem no hospital antes de terem alta. Os dados já
ordenados foram: 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3,
3, 4, 4, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 6, 7, 7, 8, 15.

a. Organize os dados em uma tabela de frequências.


b. Calcule a média, moda, mediana e quartis. Depois calcule e o desvio padrão.
c. Você identifica alguma valor excepcional (outlier) entre os dados? Caso sim retire-o
da série e refaça os cálculos dos itens a, b e c. Comente as diferenças encontradas.
Exercícios
18. Foram anotados os níveis de colesterol (em mg/100ml) para uma amostra de
trinta pacientes de uma clínica cardíaca. As medidas se referem a homens entre
40 e 65 anos, que foram à clínica fazer um chek-up.
Paciente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Colesterol 160 160 161 163 167 170 172 172 173 177 178 181 181 182 185

Paciente 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Colesterol 186 194 197 199 203 203 205 206 206 208 209 211 214 218 225

a. Calcule a média, moda, mediana e variância a partir da tabela de dados


brutos.
b. Organize os dados em uma tabela de frequências com faixa de amplitude
(tamanho) 10 a partir de 160.
c. Refaça o item (a) através da tabela obtida no item (b).
d. Comente as diferenças encontradas entre os valores obtidos no item (a) e
(c).
Exercícios
19. O tempo, em horas, necessário para um certo medicamento fazer efeito ´e
apresentado abaixo:
0,21 2,71 2,12 2,81 3,30 0,15 0,54 3,12 0,80 1,76
1,14 0,16 0,31 0,91 0,18 0,04 1,16 2,16 1,48 0,63

a) Calcular a média e o desvio padrão para o conjunto de dados.


b) Construir uma tabela de frequência para classes com amplitude de 0,5 hora,
começando do zero.
c) Suponha que o conjunto original de dados foi perdido e só se dispõe da
tabela construída em (b). Construir o histograma a partir desta tabela e,
utilizando alguma hipótese conveniente (e razoável), estimar a média e a
variância. Comentar as possíveis diferenças encontradas

20. Estudando-se o número de acertos em 100 lances-livres de bola ao cesto,


uma amostra com 20 jogadores forneceu os seguintes resultados: 68, 73, 61, 66,
96, 79, 65, 86, 84, 79, 65, 78, 78, 62, 80, 67, 75, 88, 75 e 82. Agrupar as
observações em intervalos de comprimento 5 a partir de 60 e, usando alguma
suposição adicional, estimar a média e a variância do número de acertos em 100
arremessos.
Exercícios
21. O sindicato dos Engenheiros do Estado de São Paulo está estudando o
impacto do estágio na obtenção de bons empregos. Dentre os engenheiros
recém formados e com empregos considerados bons, foi sorteada uma
amostra e observado o número de anos de estágio anteriores à formatura, o
resultado da pesquisa foi

Anos de Estágio Frequência a) Calcule a média e a


0 25 variância.
1 58
2 147 b) Para efeito de análise,
decidiu-se desprezar os
3 105
valores que se distanciassem
4 72 de dois desvios-padrões, isto
5 45 é, só serão considerados os
6 10 valores no intervalo
Total 462 Recalcule os resultados
Exercícios
22. Quer se estudar o número de erros de impressão de um livro. Para isso
escolheu-se uma amostra de 50 páginas, encontrando-se o número de erros por
página da tabela abaixo.

Erros Frequência
0 25
1 20
2 3
3 1
4 1
Total 50

a. Qual o número médio de erros por página? (R: 0.66)


b. E o número mediano? (R:0,5)
c. Qual é o desvio padrão? (R: 0.8393)
d. Se o livro tem 500 páginas, qual o número total de erros esperados no livro?
(R: 330)
Exercícios
23. As taxas de juros recebidas por 10 ações durante um certo período foram
(medidas em porcentagens) 2,59; 2,64; 2,60; 2,62; 2,57; 2,55: 2,61; 2,50;
2,63; 2,64. Calcule a média, a mediana e o desvio padrão.

24. Para facilitar um projeto de ampliação da rede de esgoto de uma certa


região de uma cidade, as autoridades tomaram uma amostra de tamanho 50
dos 270 quarteirões que compõem a região e foram encontrados os seguintes
números de casas por quarteirão:

2 2 3 10 13 14 15 15 16 16
18 18 20 21 22 22 23 24 25 25
26 27 29 29 30 32 36 42 44 45
45 46 48 52 58 59 61 61 61 65
66 66 68 75 78 80 89 90 92 97

a. Use cinco intervalos e construa um histograma.


b. Calcule a média e o desvio padrão.
Exercícios
25. Numa pesquisa realizada com 100 famílias, levantaram-se as seguintes
informações:

Número de Filhos 0 1 2 3 4 5 Mais que 5


Famílias 17 20 28 19 7 4 5

a) Qual a mediana do número de filhos?


b) E a moda?
c) Que problemas enfrentaríamos no cálculo da média de filhos?

26. O que acontece com a mediana, média e desvio padrão de uma série de
dados quando:

a. Cada observação é multiplicada por 2?


b. Soma-se 10 a cada observação?
c. Subtrai-se a média geral x de cada observação?
d. De cada observação subtrai-se x e divide-se pelo desvio padrão dp(x)?
Exercícios
27. Os dados abaixo representam as vendas semanais, em classe de salários
mínimos, de vendas de gêneros alimentícios:

Vendas Semanais Número de


a) Faça um histograma ,
Vendedores
calcule a média e o
2 desvio padrão da
10 amostra.
18 b) Qual a porcentagem
50 das observações
70 compreendidas entre
30
18
c) Calcule a mediana.
2
Total 200
Exercícios
28. - O número de divórcios na cidade X, de acordo com a duração do
casamento está representado na tabela abaixo.

Duração do Números de
Casamento Divórcios
2800
1400
600
150
50
Total 5000

a. Qual a duração média dos casamentos? E a mediana?


b. Encontre a variância e o desvio padrão dos casamentos.
c. Construa o histograma da distribuição.
d. Encontre o intervalo interquartil.
Exercícios
29. O Departamento Pessoal de uma certa firma fez um levantamento dos
salários dos 120 funcionários do setor administrativo, obtendo os resultados
(em salários mínimos)
Faixa salarial Frequência relativa
0,25
0,40
0,20
0,15
Total 1,00

a. Esboce o histograma correspondente.


b. Calcule a média, a variância e o desvio padrão.
c. Calcule a mediana.
d. Se for concedido um aumento de 100% para todos os 120 funcionários,
haverá alteração na média? E na variância? Justifique sua resposta.
e. Se for concedido um abono de dois salários mínimos para todos os 120
funcionários, haverá alteração na média?
Exercícios
30. Na companhia A, a média dos salários é 10.000 unidades e o 3º quartil é
5.000.
a. Se você se apresentasse como candidato a essa firma e se o seu salário
fosse escolhido ao acaso entre os possíveis salários, o que seria mais
provável: ganhar mais ou menos que 5.000 unidades? Justifique.
b. Suponha que na companhia B a média dos salários é 7.000 unidades e a
variância é praticamente zero, e l á o seu salário também seria escolhido ao
acaso. Em qual companhia você se apresentaria para procurar emprego?
Justifique.
31. Estamos interessados em estudar a idade dos 12.325 funcionários da Cia.
Distribuidora de Leite Teco, e isso será feito por meio de uma amostra. Para
determinar que tamanho deverá ter essa amostra, foi colhida uma amostra
piloto. As idades observadas foram: 42, 35, 27, 21, 5, 18, 27, 30, 21 e 24.

a. Determine as medidas descritivas dos dados que você conhece.


b. Qual dessas medidas você acredita que será a mais importante para julgar
o tamanho final da amostra? Porque?
Introdução à Teoria das
Probabilidades

JOELMIR FELICIANO
Conceitos Básicos
Experimento Aleatório ou Fenômeno Aleatório
Situações ou acontecimentos cujos resultados não podem ser previstos com certeza.

Exemplos:
• Condições climáticas do próximo domingo;
• Taxa de inflação do próximo mês;
• Resultado ao lançar um dado ou moeda;
• Tempo de duração de uma lâmpada.

Espaço Amostral ( ou S)
Conjunto de todos os possíveis resultado de um experimento aleatório ou fenômeno
aleatório.
Exemplos:
1. Lançamento de um dado.  ={1,2,3,4,5,6}
2. Tipo sanguíneo de um individuo.  ={A, B, AB,0}
3. Opinião de um eleitor sobre um projeto.  ={Favorável,Contrário}
4. Tempo de duração de uma lâmpada  ={t; t>0)

Evento subconjunto do espaço amostral 


Notação: A, B, C,...

Exemplos: No exemplo 1, alguns eventos:


A: sair face par:  A={2,4,6}  
B: Sair face maior que 3  B={4,5,6}  
C: sair face 1  C={1}  
D: sair face 7  D={ } (evento impossível)=  (conjunto vazio)  
Operação com eventos
Sejam os eventos A e B definidos no mesmo espaço amostral
•AB: União dos eventos A e B.
Representa a ocorrência de pelo menos um dos eventos A ou B
•AB: Intersecção dos eventos A e B.
Representa a ocorrência simultânea dos eventos A e B.
• A e B são disjuntos ou mutuamente exclusivos quando não têm elementos em
comum, isto é, AB= 
• A e B são complementares se sua intersecção é vazia e sua união o espaço
amostral, isto é. AB=  e AB= .
• O complementar de um evento A é representado por A C ou A
Exemplo: Lançamento de um dado
= {1, 2, 3, 4, 5, 6}

Eventos: A = {2, 4, 6}, B = {4, 5, 6} e C = {1}

• A  B: = {2, 4, 6}  {4, 5, 6} = {4, 6}

• A  C = {2, 4, 6}  {1} = 

• A  B = {2, 4, 6}  {4, 5, 6} = {2, 4, 5, 6}

• A  C = {2, 4, 6}  {1} = {1, 2, 4, 6}

• AC = {1, 3, 5}
Exercícios
1. Descrever o espaço amostral (S) a cada um dos experimentos a seguir:

(1) Lançam-se dois dados honestos e observam-se os números nas faces voltadas
para cima;
(2) Cada uma das três pecas usinadas é classificada como acima da especificação (a) e abaixo da
especificação (b) padrão para a peça;
(3) Chamadas são repetidamente feitas em uma linha telefônica ocupada ate que uma conexão
seja alcançada.

2. Descrever o espaço amostral (S) e eventos associados a cada um dos experimentos a seguir:

E1: Lançar uma moeda três vezes, sucessivamente, e anotar a sequência de caras (c) e coroas (k).
A1: Sair pelo menos duas caras.
E2: Numa linha de produção conta-se o numero de pecas defeituosas num período de 1 hora.
A2: Obter menos de 3 defeituosas.
E3: Mede-se a duração de lâmpadas, deixando-as acesas ate queimarem.
A3: O tempo de vida da lâmpada e inferior a 30 horas.
E4: Um fabricante produz um determinado artigo. Da linha de produção são retirados 3 artigos e
cada um é classificado como bom (b) ou defeituoso (d).
A4: Pelo menos dois artigos são bons.
Exercícios
3. Quatro estudantes de Engenharia Civil da UFMS são selecionados aleatoriamente
em uma aula de Probabilidade e Estatística. Liste os elementos do espaço amostral S1
usando a letra m para representar estudantes do sexo masculino e f para feminino.
Defina um segundo espaço amostral S2, onde os elementos representam o numero de
estudantes do sexo feminino selecionados.

4. Sejam A, B e C três eventos quaisquer. Estabeleça uma expressão para os eventos


abaixo:

(a) A e B ocorrem;
(b) A ou B ocorrem;
(c) B ocorre, mas A não ocorre;
(d) A não ocorre;
(e) não ocorre A e não ocorre B;
(f) A e B ocorrem, mas C não corre;
(g) somente A ocorre, mas B e C não ocorrem.
Exercícios
5. Três componentes estão conectados para formar um sistema conforme exibido na
figura a seguir. Como os componentes no subsistema 2-3 estão conectados em
paralelo, esse subsistema funcionara se ao menos um dos dois componentes
individuais funcionar. Para que todo o sistema funcione, o componente 1 deve
funcionar, bem como o sistema 2-3.

Figura 1: Sistema dos componentes.

O experimento consiste em determinar a condição de cada componente (sucesso [S]


para um componente que funciona bem e falha [F] para o componente que não
funciona).

(a) Que resultados estão contidos no evento A para que exatamente dois dos três
componentes funcionem?

(b) Que resultados estão contidos no evento B para que ao menos dois componentes
funcionem?
Probabilidade
Pergunta: Como atribuir probabilidade
aos elementos do espaço amostral?
Definições de probabilidades
Definição Clássica ou a priori
Se um experimento aleatório tiver n() resultados mutuamente exclusivos e
igualmente prováveis e se um evento A tiver n(A) desses resultados. A
probabilidade do evento A representado por P(A), é dado por:

n( A)
P (A) 
n ( )

Exemplo: Considere o lançamento de 2 dados balanceados. Calcular a


probabilidade de:
a) Obter soma 7;
b) Obter soma maior que 10;
c) Que o resultado do primeiro dado seja superior ao resultado do segundo.
 1,1 1, 2 1,3 1, 4 1,51,6 
 2 ,1 2 , 2 2 ,3 2 , 4 2 ,5 2 ,6 

 3,1 3, 2 3,3 3, 4 3,5 3,6 
 
 4 ,1 4 , 2 4 ,3 4 , 4 4 ,5 4 , 6 
 5,1 5, 2 5 ,3 5 , 4 5 ,5 5 , 6 
 
 6 ,1 6 , 2 6 ,3 6 , 4 6 ,5 6 ,6 

a) A={(1,6),(5,2),(4,3),(3,4),(2,5),(6,1)}  P(A)=n(A)/n()=6/36=1/6
b) B={(5,6),(6,5),(6,6)} => P(B) = 3/36 = 1/12.
c) P(C)= 15/36.
Definição frequentista ou a posteriori
Suponhamos que realizamos um experimento n vezes (n grande) e destas o
evento A ocorre exatamente r<n vezes, então a frequência relativa de vezes que
ocorreu o evento A, “r/n”, é a estimação da probabilidade que ocorra o evento A,
ou seja,
r
P ( A ) 
n

Essa estimação da probabilidade por frequência relativa de um evento A, é


próxima da verdadeira probabilidade do evento A, quando n tende ao infinito.

Exemplo: Considere o lançamento de uma moeda. Calcular a probabilidade de


A={ resultado obtido é cara}.

fr1 fr2 fr3 fr4 frA


Cara 2/5 6/10 22/50 47/100 0,5
Coroa 3/5 4/10 28/50 53/100 0,5
n 5 10 50 100 
Definição axiomática

A probabilidade de um evento A define-se com o número P(A), tal que satisfaz os


seguintes axiomas:
( i ) 0  P ( A )  1,  A  
( ii ) P (  )  1
( iii ) Se A 1 ,  , A n são eventos mutuamente exclusivos , então


 n  n
P   A i   P ( Ai )
 i 1  i 1

Propriedades
1. P()  0 Regra da adição de probabilidades
2. Se A   então, P( A)  1  P( Ac ) ou P( Ac )  1  P( A)
3. Se A  B   então, P( A)  P( B)
4. Se A, B   então, P( A  B)  P( A)  P(B)  P( A  B)
5. Se A, B, C   então,
P( A  B  C)  P( A)  P( B)  P(C)  P( A  B)  P( B  C)  P( A  C) 
P( A  B  C)
Exemplo 1. Na tabela 1, apresenta-se a composição por raça e sexo de uma
população de um país.

Tabela 1: Distribuição da população por raça e sexo.


Sexo
Raça Masculino Feminino Total
Branca 1726384 2110253 3836637
Outra 628309 753125 1381434
Total 2354693 2863378 5218071
Suponha que selecionamos um habitante desse país e consideremos os
eventos:

H: "o habitante selecionado é do sexo masculino"


Hc:"o habitante selecionado é do sexo feminino"
B: "o habitante selecionado é da raça branca"
Bc: "o habitante selecionado é de outra raça"
H  B : "o habitante selecionado é de sexo masculino e da raça branca"
H  B : "o habitante selecionado é de sexo masculino ou da raça branca"
Hc  B : "o habitante selecionado é de sexo feminino e da raça branca"
Hc  B : "o habitante selecionado é de sexo feminino ou da raça branca"
Hc  Bc :"o habitante selecionado é de sexo feminino e de outra raça "
Hc  Bc "o habitante selecionado é de sexo feminino ou de outra raça"
As probabilidades de cada um destes eventos são:
2354693
P ( H )   0 , 4512 ;
5218071
P ( H c
)  1  P ( H )  1  0 , 451  0 , 5488 ;
3836637
P ( B )   0 , 7352
5218071
P ( B c
)  1  P ( B )  1  0 , 7352  0 , 2648
1726384
P ( H  B )   0 , 3308
5218071
P ( H  B )  P ( H )  P ( B )  P ( H  B ) 
 0 , 4512  0 , 7352  0 , 3308  0 , 8556 ;
2110253
P ( H c
 B )   0 , 4044 ;
5218071
P ( H c
 B )  P ( H c )  P ( B )  P (H c
 B ) 
 0 , 5488  0 , 7352  0 , 4044  0 , 8796 .
753125
P ( H c
 B c
)   0 , 1443
5218071
P ( H c
 B c
)  P (H c )  P ( B c )  P ( H c  B c ) 
 0 , 5488  0 , 2648  0 , 1443  0 , 6693 .
Exercícios
Exercícios
3. Sejam A e B acontecimentos tais que P(A)+P(B) = x e P(A∩B) = y.
Determine em função de x e de y a probabilidade de:

(a) Não se realizar nenhum dos dois acontecimentos.


(b) Que se realize um e só um dos dois acontecimentos.
(c) Que se realize pelo menos um dos dois acontecimentos.
(d) Que se realize no máximo um único acontecimento.

4 . Dados P(A)  1 , P (B )  3 e P(A  B)  1 .


2 8 8
Calcule P ( A  B ), P ( A c
 B c ), P ( A c
 B c ),
P(A  Bc) e P(A c
 B ).
Respostas : 0,75; 0,25; 0,875; 0,375 e 0,25.

5 . Suponha que P ( A / B )  0 , 4 e P ( B )  0 ,5 .
Calcule P(A c
 B ). Resposta : P(A c
 B)  0 ,3 .
Exercícios
6. Uma associação de industrias transformadoras de resinas plásticas e
composta de 20 empresas que produzem sacos plásticos (S), 10 que produzem
garrafas (G), 8 que produzem utensílios domésticos (U) e 2 que se encarregam
de brinquedos (B). Ao escolhermos uma empresa ao acaso, achar a
probabilidade de que:

(a) seja uma indústria que produza sacos plásticos ou utensílios domésticos;
(b) seja uma indústria produtora de sacos plásticos ou brinquedos;
(c) não seja uma indústria que produza garrafas.
Respostas: (a) 28/40; (b) 22/40; (c) 30/40.

7. Uma sala de aula de Engenharia consiste em 25 estudantes de Engenharia de


Produção, 10 de Computação, 10 de Elétrica e 8 de Engenharia Civil. Se uma
pessoa e selecionada aleatoriamente pelo professor para responder a uma
pergunta, determine a probabilidade de que o estudante escolhido seja:

(a)um estudante de Engenharia de Produção;


(b)um estudante de Engenharia Civil ou Elétrica.
Respostas: (a) 25/53; (b) 18/53.
Probabilidade Condicional e Independência

Definição:[Probabilidade condicional] Sejam A e B dois eventos em um mesmo


espaço amostral, , a probabilidade condicional de A dado que ocorreu o
evento B, é representado por P(A|B) é dado por:

P( A  B)
P( A | B)  , P ( B )  0. (1)
P(B)

Exemplo 2. Selecionamos uma semente, ao acaso, uma a uma e sem reposição


de uma sacola que contem 10 sementes de flores vermelhas e 5 de flores
brancas. Qual é a probabilidade de que :
(a) a primeira semente seja vermelha. ?
(b) a segunda seja branca se a primeira foi vermelha.?
Probabilidade Condicional e Independência
Sejam os eventos:

V 1 : " A 1 a semente é vermelha" ;


V 1c :" A 1 a semente é branca"
V 2 : " A 2 a semente é vermelha" ;
V 2c :" A 2 a semente é branca"
(a) 10 2
P (V1 )  
15 3
5
(b) P (V 2c | V1 ) 
14
Essas probabilidades podem ser representados em um diagrama da árvore de
probabilidades, a qual é mostrado na figura 1
Probabilidade Condicional e Independência
Figura 1: Diagrama de árvore de probabilidade
• Resultados • Probabilidade
• V1V2

• V1V2c
Não é possív el exibir esta imagem.

V1c V2
Não é possív el exibir esta imagem.

5 4 2
• V1c V2c  
15 14 21
• Total • 1

Da expressão (1), pode-se deduzir uma relação bastante útil,

P( A  B)  P( B) P( A | B),
Que é conhecida como regra do produto de probabilidades ou probabilidade da
interseção
Probabilidade Condicional e Independência
Exemplo 3: No exemplo 2, suponha que temos interesse em determinar a
probabilidade que as duas sementes selecionadas sejam brancas.

O evento é V1c  V 2c : " a 1a e 2 a semente são brancas"


5 4 2
P( V1  V )  P (V1 ) P (V | V1 ) 
c c c c

c

15 14 21
2 2

Teorema 1: Se B é um evento em , tal que P(B)>0, então:

1. P( | B)  0
2. Se A, B  , então: P(Ac | B)  1  P( A | B) ou P( A | B)  1  P(Ac | B)
3. Se A, B, C  , então:
P( A  C | B)  P( A | B)  P(C | B)  P( A  C | B).
Probabilidade Condicional e Independência
Exemplo 3: Na Cidade de São Paulo, a probabilidade de chuva no primeiro dia de
setembro é 0,50 e a probabilidade de chuva nos dois primeiros dias de setembro é
0,40. Se no primeiro de setembro choveu, qual é a probabilidade que no dia
seguinte não chova ?

Solução: Sejam os eventos: A:” chove no primeiro de setembro”, B:”chove no


segundo dia de setembro”.

Do enunciado do problema temos : P(A)=0,50 e P(AB)=0,40. A probabilidade


pedida é:
* P( A  B) 0,40
P( B | A) 1  P( B | A)  1 
c
1  0,20
P( A) 0,50
* Pelo teorema 1.2.
Probabilidade Condicional e Independência
Definição[Independência de eventos] Dois eventos A e B são independentes se a
informação da ocorrência ou não de B não altera a probabilidade da ocorrência
de A. Isto é,
P(A|B)=P(A), P(B)>0
Consequentemente, temos que dois eventos A e B são independentes se somente
se,
P(AB)=P(A)P(B).

Exemplo 4: Em uma escola 20% dos alunos tem problemas visuais, 8% problemas
auditivos e 4% tem problemas visuais e auditivos. Selecionamos um aluno desta
escola ao acaso:
(a) os eventos de ter problemas visuais e auditivos são eventos independentes?
(b) se aluno selecionado tem problemas visuais, qual é a probabilidade de que
tenha problemas auditivos?
(c)qual é a probabilidade de não ter problemas visuais ou ter problemas auditivos ?
Probabilidade Condicional e Independência
Solução: sejam os eventos:
V:” o aluno tem problemas visuais”
A:” o aluno tem problemas auditivos”.
Do enunciado temos: P(V)=0,20, P(A)=0,08 e P(AV)=0,04.

( a ) P (V ) P ( A )  0 , 2  0 ,08  0 , 016
P (V  A )  0 , 04 .
Como P (V  A )  P (V ) P ( A ), A e V não são independen tes .
P (V  A ) 0 , 04
(b ) P ( A | V )    0 , 20 .
P (V ) 0 , 20
( c ) P (V c  A )  P (V c )  P ( A )  P (V c  A ) 
 1  P (V )  P ( A )  P ( A ) P (V c | A )  1  P (V )  P ( A )  P ( A )1  P (V | A ) 
 P (V  A ) 
 1  P (V )  P ( A )  P ( A ) 1   
 P ( A) 
 0 ,04 
 1  0 , 2  0 , 08  0 ,08 1    0 ,84
 0 , 08 
Probabilidade Condicional e Independência
Teorema 2: Se A , B eventos em  são eventos independentes, então:

(i ) A e B c são independen tes.


(ii ) A c e B são independen tes
(iii) A c e B c são independen tes

Exemplo 5: Um atirador acerta 80% de seus disparos e outro (na mesmas


condições de tiro), 70%. Qual é a probabilidade de acertar se ambos atiradores
disparam simultaneamente no alvo.? Considere que o alvo foi acertado quando
pelo menos, uma das duas balas tenha feito impacto no alvo.
Probabilidade Condicional e Independência
Sejam os eventos : Bi :" o atirador i acerta o alvo" , i  1,2. P(B1 )  0,8 e
P ( B2 )  0,7. Logo,
P ( B1  B2 )  P(B1 )  P(B 2 )  P ( B1  B2 ) 
 P(B1 )  P(B 2 )  P(B1 ) P (B 2 ) 
 0,8  0,7  0,8  0,7  0,94

Alternativamente este exemplo, pode ser resolvido de uma segunda forma :


P ( B1  B2 )  1  P ( B1c  B2c )  1  P ( B1c ) P ( B2c ) 
 1  1  P(B1 )1  P(B 2 )  1  [1  0,8][1  0,7]  0,94.
Teorema de Bayes
Teorema de Bayes
Teorema Bayes. Se B1,, Bk , formam uma partição do espaço amostral , e A é qualquer evento
em , então:

P(Bi )P( A | Bi )
P (Bi | A) 

k
P (Bi )P ( A | Bi )
i 1

Exemplo 6: Uma montadora trabalha com 2 fornecedores (A e B) de uma


determinada peça. As chances de que uma peça proveniente dos
fornecedores A e B esteja fora das especificações são 10% e 5%
respectivamente. A montadora recebe 30% das peças do fornecedor A e 70%
de B. Se uma peça do estoque inteiro é escolhido ao acaso:

(a) Calcule a probabilidade de que ela esteja fora das especificações.


(b) Se uma peça escolhida ao acaso está fora das especificações, qual é a
probabilidade que venha do fornecedor A ?
Teorema de Bayes
Solução:
Sejam os eventos:
A: “ peça selecionada seja do fornecedor A”
B:” peça selecionada seja do fornecedor B”
E:” peça selecionada esteja fora das especificações”

Do enunciado do problemas temos: (A)=0,30; P(B)=0,70; P(E|A)=0,10 e


P(E|B)=0,05.
Teorema de Bayes
Pelo teorema da probabilidade total temos:
(a) P(E)=P(A)P(E|A)+P(B)P(E|B)=(0,30)(0,10)+(0,70)(0,05)=0,065
(b) P(A|E)=?
Pelo teorema de Bayes temos:

P( A) P( E | A) 0,30  0,10 0,03


P( A | E )     0,46
P( A) P( E | A)  P( B) P( E | B) 0,30  0,10  0,70  0,05 0,065

A solução do exemplo anterior é facilitada pelo diagrama de árvore de


probabilidades.
Exercícios
1. Um aluno vai se formar em Engenharia Civil no final do semestre.
Depois de ser entrevistado por duas empresas de construção civil, ele
avalia que a probabilidade de conseguir uma oferta da empresa A e de 0.8
e da empresa B e de 0.6. Se, por outro lado, ele crê que a probabilidade
de conseguir uma oferta das duas empresas e de 0.5, qual e a
probabilidade de que ele consiga uma oferta de pelo menos uma das
empresas?

Resposta: 0.9.

2. Certo tipo de motor elétrico falha se ocorrer uma das seguintes situações:
emperramento dos mancais, queima dos enrolamentos, desgaste das
escovas. Suponha que o emperramento seja duas vezes mais provável do
que a queima, esta sendo quatro vezes mais provável do que o desgaste
das escovas. Qual será a probabilidade de que a falta seja devida a cada
uma dessas circunstâncias?

Respostas: 8/13, 4/13 e 1/13.


Exercícios
3. Certo motor de um Peneirador elétrico tem duas lâmpadas que podem
estar acesas ou apagadas, tendo sido observadas as seguintes
probabilidades apresentada no quadro adiante. O quadro mostra por
exemplo, que ambas as lâmpadas estavam simultaneamente apagadas
30% do tempo.
Lâmpada 1 Lâmpada 2
Acesa Apagada
Acesa 0,15 0,45
Apagada 0,10 0,30
Pergunta-se:

(a) O fato da lâmpada 1 acesa e independente da lâmpada 2 acesa? Justifique


sua resposta.
(b) O fato da lâmpada 2 apagada e independente da lâmpada 2 acesa?
Justifique sua resposta.

Respostas: (a)Sim; (b)Não.


Exercícios
4. Amostras de emissões de três fornecedores são classificados com relação a
satisfazer as especificações de qualidade do ar. Os resultados de 100
amostras são resumidos a seguir:

Fornecedor Conforme
Sim Não
I 22 8
II 25 5
III 30 10

Seja A o evento em que uma amostra seja proveniente do fornecedor I e B o


evento em que uma amostra atenda as especificações. Se uma amostra
aleatória for selecionada ao acaso, determine as seguintes probabilidades:

P ( A ), P ( B ), P(A C ), P ( A  B ), P ( A  B ) e P ( A c  B ).
Respostas : 0 ,3; 0 ,77 ; 0 , 7 ; 0 , 22 ; 0 ,85 e 0 ,92 .
Exercícios
5. Discos de plástico de policarbonato, provenientes de um fornecedor, s~ao
analisados com relação a resistência a arranhões e a choque. Os
resultados de 100 discos estão resumidos a seguir:
Resistência a Resistência a Choque
Arranhões Alta Baixa
Alta 70 9
Baixa 16 5
(a) Se um disco for selecionado ao acaso, qual será a probabilidade de sua
resistência a arranhões ser alta e de sua resistência a choque ser alta?
(b) Se um disco for selecionado ao acaso, qual sera a probabilidade de sua
resistência a arranhões ser alta ou de sua resistência a choque ser alta?
(c) Considere o evento em que um disco tenha alta resistência a arranhões e o
evento em que um disco tenha alta resistência a choque. Esses dois
eventos são mutuamente excludentes (exclusivos)?

Respostas: (a) 0.70; (b) 0.95 e (c) Não.


Exercícios
6. Numa faculdade 30% dos homens e 20% das mulheres estudam Engenharia
Civil. Além disso, 45% dos estudantes são mulheres. Se um estudante
selecionado aleatoriamente esta estudando Engenharia Civil, qual a
probabilidade de que este estudante seja mulher? Resposta: 0.3529.

7. A probabilidade e 1% de que um conector elétrico, que seja mantido seco,


falhe durante o período de garantia de um Compactador. Se o conector
for molhado, a probabilidade de falha durante o período de garantia será
de 5%. Se 90% dos conectores forem mantidos secos e 10% forem
mantidos molhados, qual será a proporção de conectores que falhara
durante o período de garantia? Resposta: 0.014.

8. Se P( A / B)  0,3, P( B)  0,8 e P(A)  0,3. Os eventos A e B são


independentes? Resposta : Sim.
Exercícios
8. A aspereza nas bordas de produtos de papel cortado aumenta a medida que
as laminas de uma faca vão sendo gastas. Somente 1% dos produtos
cortados com novas laminas tem bordas ásperas, 3% dos produtos
cortados com novas laminas mediante afiadas exibem rugosidade e 5%
dos produtos cortados com novas laminas gastas exibem rugosidade. Se
25% das laminas na fabricação de papel forem novas, 60% forem
mediante afiadas e 15% forem gastas, qual será a proporção dos produtos
que exibem uma aspereza nas bordas? Resposta: 0.028.

9. Três alarmes est~ao dispostos de tal maneira que qualquer um deles


funcionara independentemente, quando qualquer coisa indesejável
ocorrer. Se cada alarme tem probabilidade 0.9 de trabalhar
eficientemente, qual e a probabilidade de se ouvir o alarme quando
necessário? Resposta: 0.999.
Funções de Distribuição de
Probabilidades.

• Distribuição de Bernoulli.
• Distribuição Binomial.
• Distribuição Normal

Potrebbero piacerti anche