Sei sulla pagina 1di 44

1

Apostila de Estatstica e Probabilidade


Prof Cristiane Leito

Captulo I - Conceitos Iniciais
2
1.1. Estatstica
A Estatstica est interessada nos mtodos cientficos para coleta,
organizao, resumo, apresentao e anlise de dados, bem como na obteno
de concluses vlidas e na tomada de decises razoveis baseadas em tais
anlises.
A Estatstica tem por objetivo, fornecer mtodos e tcnicas para lidarmos,
racionalmente com situaes sujeitas a incertezas. Bioestatstica a Estatstica
aplicada as Cincias Mdicas e Biolgicas.
1.2. Populao e amostra. Estatstica indutiva e descritiva
Ao coletar os dados referentes s caractersticas de um grupo de objetos
ou indivduos, tais como as alturas e pesos dos estudantes de uma
universidade ou os nmeros de parafusos defeituosos ou no produzidos por
uma fbrica em certo dia, muitas vezes impossvel ou impraticvel observar
todo o grupo, especialmente se for muito grande. Em vez de examinar todo o
grupo, denominado populao ou universo, examina-se uma pequena parte
chamada amostra.
Se uma amostra representativa de uma populao, concluses
importantes sobre a populao podem ser inferidas de sua anlise.

1.3.Variveis
Uma varivel o conjunto de resultados possveis de um fenmeno.
Tratando-se de estatstica de varivel, possvel distinguir duas categorias de
varivel:
Qualitativa quando seus valores so expressos por atributos.
Esse tipo de varivel, se divide ainda em:
Varivel Nominal quando este atributo no admite uma
ordenao.
Ex: Cor dos olhos (pretos, castanhos, azuis, etc)
Varivel Ordinal quando este atributo admite algum tipo de
ordenao.
Ex: Classe social (alta, mdia ou baixa)
Quantitativa quando seus valores so expressos por nmeros.
Esse tipo de varivel, se divide ainda em:
Varivel Contnua quando seus valores so expressos por
nmeros que podem assumir, teoricamente, qualquer valor entre dois
limites.
Ex: peso corporal, altura...
Varivel Discreta quando seus valores so expressos por
nmeros pertencentes a um conjunto enumervel.
Ex: quantidade de alunos de uma turma, nmero de crianas de uma
famlia.
Os dados que podem ser descritos por meio de uma varivel discreta ou
contnua so chamados dados discretos ou dados contnuos, respectivamente.
O nmero de crianas em cada uma de 1.000 famlias um exemplo de dados
discretos, enquanto o peso de 100 estudantes universitrios um exemplo de
3
dados contnuos. Em geral, as medies do origem a dados contnuos,
enquanto as enumeraes ou contagens resultam em dados discretos.
ESTATSTICA DESCRITIVA
Vamos apresentar os principais conceitos sobre o levantamento de dados;
destacar as tcnicas de apresentao, por meio de tabelas e grficos; oferecer
as medidas prprias para anlises e as tcnicas usadas para a interpretao
dos dados numricos.
Fases do Mtodo Estatstico
Mtodo um conjunto de meios dispostos convenientemente para se chegar
a um fim que se deseja. O Mtodo Estatstico usa o conjunto de meios
listados abaixo, para uma tomada de deciso.
As fases dos mtodo estatstico:
Definio do problema;
Planejamento;
Coleta dos dados;
Crtica dos dados;
Apresentao dos dados;
Anlise e Interpretao dos dados.
A Estatstica Descritiva pode ser resumida do diagrama:

1.4. Coleta de dados
Aps a definio do problema a ser estudado e o estabelecimento do
planejamento da pesquisa (forma pela qual os dados sero coletados;
cronograma das atividades; custos envolvidos; exame das informaes;
delineamento da amostra etc.), o passo seguinte a coleta de dados, que
consiste na busca ou compilao dos dados das variveis, componentes do
fenmeno a ser estudado.
1.5. Crtica dos dados
Objetivando a eliminao dos erros capazes de provocar futuros enganos
de apresentao e anlise, procede-se a uma reviso crtica dos dados,
suprindo os valores estranhos ao levantamento.
Coleta de
dados
Crtica de
dados
Apresenta-
o dos
dados
Tabelas
Grfico
s
Anlise
4
1.6. Apresentao dos dados
Aps a crtica, convm organizarmos os dados de maneira prtica e
racional, para o melhor entendimento do fenmeno que se est estudando. Os
dados, geralmente, so apresentados de duas formas: Tabelas e/ou Grficos.
1.6.1. Tabelas
um quadro que resume informaes. A elaborao de tabelas obedece
uma resoluo do Conselho Nacional de Estatstica. Uma tabela deve
apresentar o cabealho, o corpo e o rodap.
O cabealho deve conter o suficiente para que sejam respondidas as
seguintes questes: o qu? (referente ao fato), onde? (relativo ao lugar) e
quando? (correspondente poca).
O corpo representado por colunas e subcolunas dentro das quais sero
registrados os dados.
O rodap reservado para as observaes pertinentes, bem como a
identificao da fonte dos dados.
1.6.2. Sries Estatsticas
Denominamos srie estatstica a organizao de dados referentes a uma
mesma ordem de classificao. Geralmente, as sries estatsticas so
representadas por meio de tabelas.
Conforme o critrio de agrupamento, as sries classificam-se em:
Temporal, Geogrfica, Especfica e Distribuio de Freqncias.
Srie Temporal (Cronolgica, Evolutiva ou Histrica) a srie
estatstica em que os dados so observados segundo a poca de
ocorrncia.
Vendas da Empresa Alfa 2001 a 2008
Ano Vendas (em
R$)
200
1
200
2
200
3
200
4
200
5
200
6
200
7
200
8
2.181,00
3.948,00
5.642,00
7.550,00
10.000,00
11.728,00
18.790,00
29.076,00
Fonte: Departamento de Vendas da Empresa
5
Srie Geogrfica (ou de Localizao) a srie estatstica em que
os dados so observados segundo a localidade de ocorrncia.
INSS Empresas fiscalizadas em 1990.
Regies Empresas
fiscalizadas
Norte
Nordeste
Sudeste
Sul
Centro-
Oeste
7.495
107.783
281.207
53.661
15.776
Fonte: Mensrio Estatstico
Srie Especfica (ou categrica) a srie estatstica em que os
dados so agrupados segundo a modalidade da ocorrncia.
Matrcula no Ensino do Terceiro Grau- Brasil 1975
reas de Ensino Matricula
s
Cincias Biolgicas
Cincias Exatas e
Tecnologia
Cincias Agrrias
Cincias Humanas
Letras
Artes
Duas ou mais reas
32.109
65.949
2.419
148.842
9.883
7.464
16.323
Fonte: Servio de Estatstica da Educao e Cultura
Distribuio de Freqncias a srie estatstica em que os
dados so agrupados com suas respectivas freqncias absolutas.
Obs: Freqncia o nmero de elementos que pertencem a uma
determinada classe.
Por se tratar do tipo mais importante de srie estatstica, a estudaremos
isoladamente no prximo captulo.
1.6.3. Grficos
O grfico estatstico uma forma de apresentao dos dados estatsticos,
cujo o objetivo inicial o de produzir em geral, uma impresso mais rpida do
6
fenmeno em estudo. A representao grfica de um fenmeno deve obedecer
a certos requisitos fundamentais, para ser realmente til:
Simplicidade o grfico deve ser destitudo de detalhes de importncia
secundria, que possam levar o observador a uma anlise errnea.
Clareza o grfico deve possibilitar uma correta interpretao dos
valores representativos do fenmeno em estudo.
Veracidade o grfico deve sempre expressar a verdade sobre o
fenmeno em estudo.
Os principais grficos indicados para a representao de uma srie
estatstica so:
Grfico em linhas
Grficos em barras verticais ou horizontais
Grfico em setores
- Grficos em Linhas
NMERO DE PESSOAS, ACIMA DE 40 ANOS ATENDIDAS NO SETOR DE
CARDIOLOGIA DO HOSPITAL SO JORGE (RS) NO 1o. SEMESTRE DE
CADA ANO (1994/1999)
0
200
400
600
800
1000
1200
1 2 3 4 5 6
ANOS
N

M
E
R
O

D
E

P
E
S
S
O
A
S


- Grficos em Colunas (barras verticais)
0
20
40
60
80
100
1
Trim.
2
Trim.
3
Trim.
4
Trim.
Leste
Oeste
Norte
7
Obs: Geralmente os grficos de barras verticais so chamados tambm
de grficos em colunas.
- Grfico em Barras (barras horizontais)
CRIANAS NO-VACINADAS CONTRAA
PLIO - BRASIL / 1989
0 100.000 200.000 300.000 400.000 500.000 600.000
Sul
Centro-Oeste
Norte
Sudeste
Nordeste
R
E
G
I

E
S
NMERO DE CRIANAS
- Grficos em Setores: a representao grfica de uma srie
estatstica, em um crculo, por meio de setores. utilizado principalmente
quando se pretende comparar cada valor da srie com o total. Para construir
divide-se o crculo em setores, cujas reas sero proporcionadas aos valores da
srie. Essa diviso pode ser obtida pela soluo da regra de trs.



Total ----360 graus
Parte ---- X graus
8
AS ARMAS CONTRAO FUMO - CANAD/ 1990
28%
24%
21%
14%
13%
Goma de mascar
com nicotina
Internamentos em
hospital
Acupuntura
Hipnose
Injees de
Clonidina
- Cartogramas
a representao sobre uma carta geogrfica.
Este grfico empregado quando o objetivo o de figurar os
dados estatsticos diretamente relacionados com reas geogrficas ou
polticas.
- Grfico Polar: a representao de uma srie estatstica por meio de
um polgono. Geralmente usamos para apresentao de sries temporais. Para
constru-lo, divide-se uma circunferncia em tantos arcos iguais quantos forem
os dados a representar. Pelos pontos de divisas traam-se raios. Em cada raio
representado um valor da srie, marcando-se um ponto cuja distncia ao
centro diretamente proporcional a esse valor . A seguir unem-se os pontos.
0
100
200
300
JAN
FEV
MAR
ABR
MAI
JUN
JUL
AGO
SET
OUT
NOV
DEZ
- Pictogramas
So construdos a partir de figuras representativas da intensidade do
fenmeno. Este tipo de grfico tem a vantagem de despertar a ateno do
pblico leigo, pois sua forma atraente e sugestiva. Os smbolos devem ser
auto-explicativos. A desvantagem dos pictogramas que apenas mostram uma
9
viso geral do fenmeno, e no de detalhes minuciosos. Veja o exemplo
abaixo:

Fonte: IBGE
Exerccios
1) A Tabela abaixo mostra o nmero de toneladas de trigo e de milho
produzidos na fazenda Cris, durante os anos de 1980 a 1990.
Ano
s
Toneladas de
trigo
Toneladas de
milho
198
0
198
1
198
2
198
3
198
4
198
5
198
6
198
7
198
8
198
200
185
225
250
240
195
210
225
250
230
235
75
90
100
85
80
100
110
105
95
110
100
10
9
199
0
Com referncia a esta tabela, determine o ano, ou anos, durante os quais:
a) foi produzido o menor nmero de toneladas de trigo;
b) foi produzido o maior nmero de toneladas de milho;
c) ocorreu o maior declnio na produo de trigo;
d) foi produzido o mesmo nmero de toneladas de trigo;
e) a produo total de trigo e milho foi mxima.
2) Exprimir os dados de produo de trigo e de milho do Problema 1 em
percentagem da produo anual total no ano de 1980, e representar
graficamente as percentagens, utilizando o grfico de setores:
3) A tabela abaixo apresenta as vendas da Empresa X no ano de 2008.
Meses Vendas
R$
Jan
Fev
Maro
Abril
Maio
Junho
Julho
Agosto
Setembr
o
Outubro
Novembr
o
Dezembr
o
1.000.000
,00
800.000,0
0
1.500.000
,00
300.000,0
0
2.000.000
,00
500.000,0
0
800.000,0
0
1.000.000
,00
1.300.000
,00
1.800.000
,00
2.000.000
,00
3.000.000
,00
Fonte: Dep de Vendas
Captulo II - Distribuio de Freqncias
a) Qual a porcentagem das vendas em janeiro em
relao a venda anual da empresa?
b) Qual a porcentagem das vendas em dezembro
em relao a venda anual da empresa?
c) Em que ms houve uma maior queda percentual
nas vendas? De quanto foi essa queda?
11
Por se tratar do tipo de tabela mais importante para a Estatstica
Descritiva, faremos um estudo completo sobre as distribuies de freqncias,
incluindo sua construo.
Uma distribuio de freqncias pode ser:
Distribuio de freqncias sem intervalos de classes.
Distribuio de freqncias com intervalos de classes.
Representao da Amostra
A seguir definiremos alguns procedimentos comuns para a representao
das distribuies de freqncias:
1. Dados brutos ou Tabela Primitiva o conjunto de dados
numricos obtidos aps a crtica dos valores coletados no ordenados
numericamente.
Ex1.: Os dados abaixo, representam a taxa de glicose, em miligramas por
100ml de sangue, em uma amostra de 42 ratos machos da raa Wistar, com 20
dias de idade.
88,5 97,5 80,0 97,0 85,0 80,5 88,0
92,0 88,5 92,5 94,5 100,5 94,0 89,0
85,5 85,0 95,0 89,0 87,0 94,0 87,5
98,5 84,5 95,5 99,0 84,0 93,0 103,5
91,0 91,0 86,0 91,5 87,0 90,5 86,0
87,0 90,0 88,0 89,5 83,5 89,5 96,5
2. Rol o conjunto de dados aps sua ordenao numrica.
80,0 85,0 87,0 89,0 91,0 94,0 97,0
80,5 85,5 87,5 89,0 91,0 94,0 97,5
83,5 86,0 88,0 89,5 91,5 94,5 98,5
84,0 86,0 88,0 89,5 92,0 95,0 99,0
84,5 87,0 88,5 90,0 92,5 95,5 100,5
85,0 87,0 88,5 90,5 93,0 96,5 103,5
3. Amplitude total ou range (R) - a diferena entre o maior e o
menor valor observados. R = 103,5 80,0 = 23,5
4. Nmeros de classes (K) no h uma frmula exata para o clculo
do nmero de classes. Uma boa aproximao a Regra de Sturges:

n K log 22 , 3 1 +
onde n o tamanho da amostra
No nosso exemplo temos:

1 3, 22 log 42
1 3, 22 1, 62 1 5, 2164
6, 2164 pode-se utilizar K= 6 ou K= 7
K
K
K
+
+ +

5. Amplitude das classes (h) o tamanho de classes


K R h
12
mais apropriado que aproximamos o nmero de classes e a amplitude das
classes para o maior nmero inteiro. Assim, se 23, 5 7 3, 36 h h . Usamos h
= 4.
6. Freqncia absoluta (
i
F
) o nmero de vezes que o elemento
aparece na amostra.
Exemplo de uma distribuio de freqncia com varivel discreta.

Obs: X representa a varivel

n F
i
onde n = tamanho da amostra
Exemplo de distribuio de freqncia para varivel contnua:
Classes F
i
80 |----- 84
84 |----- 88
88 |----- 92
92 |----- 96
96 |----- 100
100 |----- 104
3
11
13
8
5
2
Total (n) 42
7. Freqncia absoluta acumulada (
)
ac
F
- a soma das freqncias
dos valores inferiores ou iguais ao valor dado.
8. Limites das classes
80 |----- 84 compreende todos os valores entre 80 e 84 excluindo o
84.
9. Pontos mdios das classes (
i
x
) a mdia aritmtica entre o
limite superior e o inferior da classe. Assim se a classe for 80 |----- 84,
teremos:

80 84
82
2
i
x
+

10. Freqncia relativa ( ) ou ( )
i ri
f f - A freqncia relativa de um valor
dada por
n
F
f
i
i
, ou seja, a porcentagem daquele valor da amostra.
Obs:

1
i
f
i
X
i
F
22
23
24
28
33
34
2
2
2
1
1
2

1
0
13
Montando a distribuio do nosso exemplo:
Classes F
i
x
i
F
ac
f
i
80 |----- 84
84 |----- 88
88 |----- 92
92 |----- 96
96 |----- 100
100 |----- 104
3
11
13
8
5
2
82
86
90
94
98
102
3
14
27
35
40
42
0,07
0,26
0,31
0,19
0,12
0,05
Total (n) 42 ---- ---- 1
11. Histograma a representao grfica de uma distribuio de
freqncia por meio de retngulos.
12. Polgono de freqncia a representao da distribuio por
meio de um polgono.
Exemplo 1: As notas de 35 estudantes de uma classe esto descritas a seguir:
0,0 0,0 1,0 1,5 2,0 - 2,0 2,5 3,5 3,5 4,0
4,0 4,0 4,0 4,5 4,5 4,5 5,0 5,0 5,0 5,0
5,0 5,5 5,5 5,5 6,0 6,0 6,0 6,5 6,5 7,0
7,0 7,5 8,0 8,0 8,5
Determinar:
a) as distribuies de freqncias
b) amplitude total
c) qual a porcentagem dos alunos que tiveram nota menor que
4,0?
d) o histograma e o polgono de freqncia.
Exemplo 2: Dado um rol de 50 notas, agrupar os elementos em classes:
30 35 35 39 41 41 42 45 47 - 48
50 52 53 54 55 55 57 59 60 60
61 64 65 65 65 66 66 66 67 68
69 71 73 73 74 74 76 77 77 78
80 81 84 85 85 88 89 91 94 94
Polgono de freqncia
14
Soluo: Amplitude total: R = 94 30 = 64
N de classes:
50 log 22 , 3 1 + K
1 + 3,22 .(1,7) 7
Amplitude das classes: K R h
10 14 , 9 7 64
Classes
i
F
ac
F
i
f
i
x
30 | 40
40 | 50
50 | 60
60 | 70
70 | 80
80 | 90
90 |
100
4
6
8
1
3
9
7
3
4
10
18
31
40
47
50
0,0
8
0,1
2
0,1
6
0,2
6
0,1
8
0,1
4
0,0
6
3
5
4
5
5
5
6
5
7
5
8
5
9
5

5
0
1
Exemplo 3: Os pesos de 40 alunos esto relacionados a seguir:
45 49 50 53 53 53 54 57 58 58
59 60 60 60 62 63 63 64 64 65
65 66 67 67 68 68 69 70 71 72
72 73 74 75 76 80 81 81 83 93
Construir a tabela de distribuio de freqncia . Dado
6 , 1 40 log
.
Exemplo 4: Complete a tabela abaixo com os seus elementos e determine:
Estaturas de 80 pacientes da Clnica
de Fisioterapia So Jos (SP) - 1997
Estatura (cm) F
i
150 |----- 156
156 |----- 162
162 |----- 168
168 |----- 174
174 |----- 180
180 |----- 186
186 |----- 192
192 |----- 198
7
18
22
15
10
5
2
1
Total (n) 80
Fonte: Clnica So Jos
Captulo III - Medidas de Posio
a) o ponto mdio da sexta classe;
b) a freqncia absoluta da quarta classe;
c) a freqncia relativa em percentual da classe
com maior nmero de pacientes;
d) a freqncia acumulada da quinta classe;
e) o nmero de pacientes cuja altura no atinge
180 cm;
f) a percentagem de pacientes cuja altura no
atinge 168cm;
g) a percentagem de pacientes cuja altura atinge
e ultrapassa 162 cm, mas inferior a 192 cm;
h) a classe do 52

paciente.
15
O estudo que fizemos sobre distribuies de freqncias, at agora,
permite-nos descrever, de modo geral o comportamento de uma varivel.
Ocorre, todavia que trabalhar com uma distribuio de freqncias completa,
muitas vezes, difcil, razo pela qual costuma-se lanar mo de determinadas
medidas. Essas medidas sumarizam certas caractersticas importantes da
distribuio de freqncias. H diversas medidas que possibilitam condensar
as informaes dentro da fase analtica da Estatstica Descritiva. Dentre as
medidas de posio mais importantes esto as medidas de tendncia central.
3.1. ndices ou notao por ndice
O smbolo
i
X (l-se X ndice i) representa qualquer um dos N valores,
N 2 1
X ......, , , X X
. A letra i, em
i
X , pode representar qualquer dos nmeros
1,2,3,...,N, denominada ndice. Evidentemente, pode ser usada qualquer
outra letra alm de i, como j, k, p ou s.
3.2. Notao de Somatrio
O smbolo
1
N
i
i
X

usado para representar a soma de todos os


i
X desde i
=1 at
ij = N, isto , por definio

1
N
i
i
X

=
N 2 1
X ...... + + +X X
3.3. Medidas de Tendncia Central
As medidas de tendncia central recebem tal denominao pelo fato de os
dados observados tenderem, em geral, a se agrupar em torno dos valores
centrais.
Dentre as medidas de tendncia central, destacamos:
mdia ( )
X
ou (M
a
)
moda

( ) X ou (M
o
)
mediana

( ) X ou (M
d
)
A mdia aritmtica , de modo geral, a mais importante e mais comum de
todas as mensuraes numricas descritivas.
Estas medidas podem ser calculadas, tanto para dados no agrupados em
classes, quanto para dados agrupados em classes.
16
3.3.1. Dados no agrupados em classes
- Mdia Aritmtica
A mdia aritmtica, ou mdia, de um conjunto de N nmeros
N
X X X ,...., ,
2 1
representado por
X
(l-se x barra) e definida por

X
=
1 2 1
.....
N
i
N i
X
X X X
N N

+ + +


Ex: A mdia aritmtica dos nmeros 8, 3, 5,12,10 :

X
= 6 , 7
5
38
5
10 12 5 3 8

+ + + +
Propriedade da Mdia Aritmtica
A soma algbrica dos desvios de um conjunto de nmeros, em relao
mdia aritmtica, zero.
Ex: Os desvios dos nmeros 8, 3, 5, 12, 10, em relao sua mdia aritmtica
7,6 so: 8 7,6 ; 3 7,6; 5 7,6 ; 12 7,6 ; 10 7,6 ou 0,4 ; 4,6 ; 2,6 ; 4,4 ;
2,4 com soma algbrica igual a zero.
- Moda
A moda de um conjunto de nmeros o valor que ocorre com maior
freqncia, ou seja, o valor mais comum. A moda pode no existir e, mesmo
que exista pode no ser nica.
Ex1: O conjunto 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 13 tem moda 9.
Ex2: O conjunto 3, 5, 8, 10, 12, 15, 17 no tem moda.
Ex3: O conjunto 2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9 tem duas modas 4 e 7.
Uma distribuio que no tem moda denominada amodal.
Uma distribuio que tem apenas uma moda denominada unimodal.
- Mediana
A mediana de um conjunto de nmeros, organizados em ordem de
grandeza (isto , em um rol) , o valor central ou a mdia aritmtica dos dois
valores centrais.
* Quando o tamanho da amostra mpar, a mediana ser o elemento de
ordem
1
2
+ n
.
Ex1: O conjunto dos nmeros 3, 4, 5, 6, 7, 8, 8 tem mediana 6.
Pois o elemento que ocupa a 4 posio, basta ver que n = 7, ento
1 7 1
4
2 2
+ +

n
, ou seja, 4 posio.
* Quando o tamanho da amostra par, a mediana ser a mdia dos
elementos de ordens
2
n
e 1
2
+
n
.
17
Ex2: O conjunto dos nmeros 5, 5, 7, 9, 11, 12, 15, 18 tem mediana
10
2
11 9

+
.
Pois a mdia dos elementos que ocupam a 4 e 5 posio, basta ver
que n = 8, ento
2
n
=
8
4
2
e 1
2
+
n
=
8
1 4 1 5
2
+ + , ou seja 4 e 5 posies.
Geometricamente, a mediana o valor de X (abscissa) correspondente
vertical que divide o histograma em duas partes de reas iguais. Esse valor de
x, s vezes, representado por
~
X
.
3.3.2. Dados agrupados em classes
- Mdia Aritmtica
Se estivermos trabalhando com uma distribuio de freqncias com
intervalos de classes, para calcularmos a mdia aritmtica dessa distribuio,
utilizaremos a seguinte frmula:

i i
x F
X
n


- Moda
Se estivermos trabalhando com uma distribuio de freqncias com
intervalos de classes, para calcularmos a moda dessa distribuio, utilizaremos
a seguinte frmula:

1
1 2
o
o
D h
X L
D D

+
+
Onde:
o
L - limite inferior da classe modal

1
D - freqncia da classe modal menos freqncia da classe
anterior

2
D - freqncia da classe modal menos freqncia da classe
posterior

o
h - amplitude da classe modal
Obs: Classe Modal classe com maior freqncia.
- Mediana
Se estivermos trabalhando com uma distribuio de freqncias com
intervalos de classes, para calcularmos a mediana dessa distribuio,
utilizaremos a seguinte frmula:

2
i
ant
d d
d
F
Fac
X L h
F

Onde:
d
L - limite inferior da classe mediana
18

ant
Fac - freqncia acumulada na classe anterior classe mediana

d
h - amplitude da classe mediana

d
F - freqncia da classe mediana
Obs: Classe Mediana classe que contm o elemento
2
i
F

=
2
n
, chamado
Elemento Mediano.
- Separatrizes
So medidas que dividem uma seqncia ordenada de dados em partes
que contm a mesma quantidade de elementos. As separatrizes, por sua vez,
se dividem em:
quartis;
decis;
percentis.
Os Quartis dividem a srie em quatro partes, cada uma representa 25%
da srie. Os quartis so:
1 Quartil (
1
Q ) o termo precedido por 25% dos termos da srie
2 Quartil (
2
Q ) coincide com a mediana.
3 Quartil (
3
Q ) o termo precedido de 75% dos termos da srie.
Os Decis dividem em 10 partes, representadas por 10% da srie. Os decis
so:
1 Decil (
1
D ) o termo precedido por 10% dos termos da srie
2 Decil (
2
D ) o termo precedido por 20% dos termos da srie.
3 Decil (
3
D ) o termo precedido de 30% dos termos da srie, e etc.
Os Percentis dividem em 100 partes de 1% da srie. Os percentis so:
99 2 1
,...., , P P P
.
Clculo das separatrizes em uma Distribuio de Freqncias
A frmula para se determinar o termo de uma srie que represente uma
Separatriz anloga frmula usada para a determinao da Mediana. At
mesmo porque, a Mediana ela prpria uma Separatriz.
Qualquer Separatriz determinada pela frmula:

+
o ant
s s
s
P Fac
S L h
F
Onde: S Separatriz desejada

s
L - limite inferior da classe que contm a separatriz.
19

ant
Fac - freqncia acumulada na classe anterior classe que
contm a separatriz

s
h - amplitude da classe que contm a separatriz.

s
F - freqncia da classe que contm a separatriz.
P posio da separatriz, sendo P calculado por
100 100
i
o
i F i n
P

, sendo i o nmero percentual da separatriz.


Exerccio 1: Calcule a mdia aritmtica, a moda, a mediana e os percenits 25
e 75.
Classes F
i
x
i x
i
F
i
F
ac
80 |----- 84
84 |----- 88
88 |----- 92
92 |----- 96
96 |----- 100
100 |----- 104
3
11
13
8
5
2
Total (n) 42
Exerccio 2: A tabela abaixo representa as taxas de colesterol (mg/dl) de 90
indivduos da Cidade de Framingham, EUA em 1998.
Classes F
i
100 |----- 150
150 |----- 200
200 |----- 250
250 |----- 300
300 |----- 350
350 |----- 400
400 |----- 450
450 |----- 500
2
24
35
14
10
3
1
1
Total (n) 90
Agora, pede-se:
a) mdia aritmtica
b) moda
c) mediana
d) acima de qual taxa encontram-se 80% dos indivduos? Qual o
percentil correspondente?
20
Captulo IV - Medidas de Disperso
Servem para verificarmos a representatividade das medidas de posio,
pois muito comum encontrarmos sries que, apesar de terem mesma mdia,
so compostas de maneira distinta.
Assim para as sries:
a) 20, 20, 20, 20, 20
b) 15, 10, 20, 25, 30
temos 20
b a
X X .
Note que os valores da srie a se concentram totalmente na mdia 20,
enquanto que os valores da srie b se dispersam em torno do mesmo valor.
Ou seja, a srie a no apresenta disperso entre os valores e os valores da
srie b esto dispersos em torno de 20. Vamos agora medir o grau de
concentrao ou disperso dos dados em torno da mdia.
- Desvio Mdio e Varincia
Desvio Mdio Neste caso considera-se o mdulo de cada desvio
) ( X X
i
, evitando com isso que

0
i
d
. Assim o Desvio Mdio dado por:
N
F d
N
F X X
DM
i i
i i

Trata-se da mdia aritmtica dos desvios considerados em mdulos.


Varincia Neste caso considera-se o quadrado de cada desvio
2
) ( X X
i
,
evitando com isso que

0
i
d
. Assim, a definio da varincia dada por:
N
F d
N
F X X
i i i i

2 2
2
) (

Obs:
2
indica varincia e l-se sigma ao quadrado e
X
a mdia da
populao.
Para o caso do clculo da varincia de valores amostrais conveniente
usarmos a seguinte frmula:
1
) (
2
2

N
F X X
S
i i
Como podemos notar, as diferenas entre as frmulas so: para o caso da
varincia populacional
2
, utiliza-se a mdia populacional
X
tendo como
denominador o tamanho da populao N. Para o clculo da varincia amostral
2
S , utiliza-se a mdia amostral
X
tendo no denominador o tamanho da
amostra menos um.
Temos tambm outras frmulas para o clculo da varincia:
( )
1
1
]
1




N
F X
F X
N
i i
i i
2
2 2
1

21
( )
1
1
]
1



N
F X
F X
N
S
i i
i i
2
2 2
1
1
- Desvio Padro
O Desvio Padro de um conjunto de dados uma medida que nos fornece
a variao dos valores em relao mdia aritmtica.
Para o clculo do Desvio Padro deve-se primeiramente determinar o
valor da varincia e, em seguida extrair a raiz quadrada desse resultado.
2

o desvio padro populacional
2
S S
o desvio padro amostral
- Coeficiente de Variao
Trata-se de uma medida relativa de disperso, til para a comparao em
termos relativos do grau de concentrao em torno da mdia de sries
distintas. dado por:
C.V =
X

ou .
S
CV
X

Obs: Geralmente multiplica-se a coeficiente de variao por 100, para


darmos o resultado em porcentagem.
Para classificarmos uma distribuio em relao sua variabilidade,
usaremos o seguinte critrio:
Baixa disperso: CV 15%
Mdia disperso: 15% < CV < 30%
Alta disperso: CV 30%
Exerccios:
1) Dada a distribuio de freqncia:
Classes F
i
100 |----- 150
150 |----- 200
200 |----- 250
250 |----- 300
300 |----- 350
5
24
26
15
10
Total (n) 80
Pede-se:
a) construir o histograma e o polgono de frequncia
b) calcular a mdia
c) calcular a mediana
d) calcular o desvio mdio
e) determinar a varincia e o desvio-padro amostral
f) qual o coeficiente de variao
g) D
2 ,
P
75
, Q
1
22
2) Na srie abaixo que representa o peso de um grupo de 440 pessoas,
determinar:
Classes F
i
F
a
c
60 |--- 66
66 |--- 72
72 |--- 78
78 |--- 84
84 |---| 90
12
0
18
0
80
40
20
12
0
30
0
38
0
42
0
44
0

44
0
a) Mdia, Mediana e Moda
b) A separatriz que representa o 3 quartil
c) A separatriz que representa o 9 decil
d) Acima de que peso esto situadas 20% das pessoas
e) A varincia e o Desvio Padro Amostral
f) O coeficiente de variao e sua classificao
3) Uma pesquisa realizada em uma certa comunidade, com relao a uma
amostra de 500 pessoas revelou a seguinte srie com relao a idade da
populao:
Classes F
i
F
a
c
0 |--- 12
12 |--- 24
24 |--- 36
36 |--- 48
48 |---| 60
60
14
0
18
0
80
40
60
20
0
38
0
46
0
50
0

50
0
Determine:
a) A idade mdia
b) A idade que aparece com maior freqncia
c) A idade mediana
23
d) A separatriz que representa o 4 Decil
e) Acima de que idade esto 25% da comunidade
f) O Desvio Mdio e sua interpretao
g) A Varincia
h) O Desvio Padro e sua interpretao
i) O Coeficiente de Variao e classifique o grau de disperso.
4) Dada a Distribuio abaixo:
Tempo de auditoria de uma empresa
Tempo de
auditoria
(em Min)
NBalanos
F
i
10 |-----20
20 |----- 30
30 |----- 40
40 |----- 50
50 |-----| 60
5
3
12
10
20
Total (n) 50
Determine:
a) O tempo mdio dos balanos
b) A Moda
c) A Mediana
d) O percentil 20 e sua interpretao
e) O desvio mdio e sua interpretao
f) O desvio padro e sua interpretao
g) O coeficiente de variao e sua classificao
Captulo V Medidas de Assimetria e Curtose
5.1. Observaes sobre a Distribuio Normal
Muitas medidas extradas de pesquisas na rea biomdica, medidas de
produtos fabricados em srie e tambm os erros de algumas medidas do
origem a grficos semelhantes ao apresentado na figura abaixo. Todas essas
medidas tm distribuies que se aproximam da Distribuio Normal.
A Distribuio Normal uma distribuio conhecida e muito estudada,
tendo inclusive todas as suas probabilidades calculadas. Assim, importante
sabermos se uma distribuio est prxima da Normal, pois, neste caso
recairamos em uma distribuio muito conhecida, onde poderamos estudar a
distribuio inicial utilizando a distribuio normal.
24
5.2. Assimetria
Denominamos assimetria o grau de deslocamento lateral de uma
distribuio em relao a uma distribuio simtrica, denominada
distribuio normal.
- Coeficiente de Assimetria de Pearson
Este coeficiente determina o grau de deslocamento lateral de uma
distribuio normal e ser calculado atravs da frmula:
As =

( )
3 X X
S

- Classificao quanto Assimetria


Para classificarmos uma distribuio quanto a intensidade de sua
assimetria, usaremos o seguinte critrio:
Assimetria muito fraca: 0 < |As| 0,5
Assimetria fraca: 0,5 < |As| 1,5
Assimetria forte: |As| > 1,5
Distribuio assimtrica para a
esquerda (ou distribuio
assimtrica negativa): A
mdia, e a mediana esto
esquerda da moda, isto , As <
0.
Distribuio simtrica (ou
assimetria nula): A mdia,
a moda e a mediana
coincidem, isto , As = 0
Distribuio assimtrica para a
direita (ou distribuio
assimtrica positiva): A mdia,
e a mediana esto direita da
moda, isto , As > 0.
25
Obs: Se uma distribuio de freqncia for assimtrica muito forte, a medida
de posio mais adequada para ser utilizada a mediana.
- Curtose
Denominamos curtose o grau de achatamento de uma distribuio em
relao a uma distribuio simtrica, denominada curva normal.
- Coeficiente de Curtose
Este coeficiente determina o grau de achatamento de uma distribuio
normal e ser calculado atravs da frmula:
K =
( )
75 25
90 10
2
P P
P P


- Classificao quanto Curtose
Para classificarmos uma distribuio quanto curtose, usaremos o
seguinte critrio:
K = 0,263 distribuio mesocrtica (achatamento normal)
K < 0,263 distribuio leptocrtica (achatamento pequeno)
K > 0,263 distribuio platicrtica (achatamento grande)
Exerccio: Uma pesquisa sobre a renda anual familiar realizada com uma
amostra de 1000 pessoas na cidade de Tangar resultou na seguinte
distribuio de freqncia. Calcule a assimetria e a curtose com as suas
classificaes.
26
Salrio Anual
(Em R$1000)
Fi
0,00 |---- 10,00
10,00 |----
20,00
20,00 |----
30,00
30,00 |----
40,00
40,00 |----
50,00
50,00 |----
60,00
60,00 |----
70,00
70,00 |----
80,00
250
300
200
120
60
40
20
10
Total 1000
Captulo VI Correlao e Regresso Linear
6.1. Anlise de Regresso Linear e de Correlao
Esta parte da Estatstica, lida com uma amostra (parte de uma populao)
de dados emparelhados, o objetivo principal da anlise de regresso predizer
o valor de uma varivel (a varivel dependente), dado que seja conhecido o
valor de uma varivel associada (varivel independente). A equao de
regresso a frmula algbrica pela qual se determina o valor previsto da
varivel dependente.
6.2. Equao de Regresso Linear para dados de uma amostra:

x
Y a bX +
x
Y o valor estimado da varivel dependente, dado um valor especfico
da varivel independente X
a o ponto de interseo da linha de regresso linear com o eixo Y (X =
0)
b a declividade (inclinao) da linha de regresso
6.3. Mtodo dos Mnimos Quadrados para ajustar uma linha de
regresso:
27
Pelo critrio dos mnimos quadrados, a linha (e a equao) de regresso
que melhor ajusta aquela que mnima a soma dos quadrados dos desvios
entre os valores observados e estimados da varivel dependente.
As frmulas de clculo pelas quais os valores de a e b da equao linear
podem ser determinados, de tal forma que satisfaa o critrio dos mnimos
quadrados :

2
2

XY nX Y
b
X nX


a Y bX
onde:
X
a mdia aritmtica dos valores da varivel X, isto ,
_

X
X
n
;
Y
a mdia aritmtica dos valores da varivel Y, isto ,
_

Y
Y
n
.
Uma vez formulada a equao de regresso, podemos utiliz-la para
estimar o valor da varivel dependente Y dado um valor da varivel
independente X . Contudo, tal estimao deve ser feita apenas dentro do
intervalo de variaes dos valores amostrais.
6.4. Coeficiente de Correlao Linear de Pearson:
O coeficiente de correlao linear de Pearson (r), mede o grau de
relacionamento linear entre os valores de duas variveis em uma amostra.
Para calcularmos o coeficiente de correlao de Pearson, entre duas variveis
(X e Y), usaremos a frmula abaixo:
( ) ( )
2 2
2 2

_ _


, ,


n XY X Y
r
n X X n Y Y
Obs.:
i) Devemos arredondar o coeficiente de correlao linear (r) para
trs casas decimais
ii) O valor de r poder variar de -1 a 1, isto , -1 r 1.
iii) Se r > 0, diremos que a correlao linear positiva.
iv) Se r < 0, diremos que a correlao linear negativa.
v) Se r = 0, diremos que no existe correlao linear entre as
variveis.
6.5. Diagrama de Disperso:
28
um grfico no qual cada ponto plotado representa um par observado de
valores para as variveis dependente e independente.
Varivel independente X
Varivel dependente Y
A forma da relao representada pelo diagrama de disperso pode ser
curvilnea em lugar de linear, o que no trataremos aqui.
Exemplos:
0 1 r < 1 0 r <
Uma linha de regresso com uma inclinao positiva, indica uma relao
direta entre as variveis;
Uma linha de regresso com uma inclinao negativa, indica uma relao
inversa entre as variveis; e
Uma inclinao nula indica que a s variveis no esto relacionadas.
Alm disso a extenso da disperso dos pontos com relao linha de
regresso indica o grau de relacionamento entre as variveis.
6.6. Erro Padro de Estimao e intervalos de predio
O erro padro de estimao uma medida das diferenas (ou distncias)
entre os valores amostrais Y observados e os valores preditos
x
Y obtidos
atravs da reta de regresso. Este erro ser calculado atravs da seguinte
frmula:

( )
2
2
x
YX
Y Y
S
n


Para fins de clculos, mais conveniente uma verso alternativa da
frmula que no requer a determinao do desvio entre casa valor observado
de Y e o valor sobre a linha de regresso
x
Y , ela:

2
2
YX
Y a Y b XY
S
n


O erro padro de estimao
YX
S , pode ser usado para estabelecer um
intervalo de predio para a varivel dependente, dado um valor especfico da
varivel independente:

x YX
Y t S t

Intervalo de predio para a varivel dependente Y . Os graus


de liberdade para a distribuio t so n-2 .
29
Quando 30 n , podemos utilizar a distribuio normal:

x YX
Y n S t
Exerccios:
1) Um analista toma uma amostra aleatria de 10 carregamentos
recentes por caminho feitos por uma companhia e anota a distncia em
quilmetros e o tempo de entrega ao meio-dia mais prximo:
Carregamento
amostrado
1 2 3 4 5 6 7 8 9 10
Distncia X, em km
Tempo de Entrega Y,
em dias
825
3,5
215
1,0
107
0
4,0
550
2,0
480
1,0
920
3,0
135
0
4,5
325
1,5
670
3,0
121
5
5,0
a) Construir o diagrama de Disperso
b) Determinar a Equao de regresso de mnimos quadrados
c) Usando a equao de regresso desenvolvida acima, estimar o tempo
de entrega para um carregamento para 1.000 Km.
Resp:
x
Y =
3,72 dias
d) Esta equao de regresso poderia ser usada para estimar o tempo de
entrega para um carregamento de 2.500 Km?
e) Calcular o erro padro de estimao para o problema de anlise do
tempo de entrega.
Resp:
YX
S = 0,42
f) Calcular o Coeficiente de Correlao
g) Construir um intervalo estimado de predio de 95% para o tempo de
entrega, envolvendo um carregamento para 1.000 Km, sem considerar
a incerteza associada com a prpria posio da linha de regresso.
Resp:
x YX
Y t S t = 3,72 t (2,306).(0,42) = 3,72 t 0,96 =
2,76 a 4,68 dias
2) A tabela abaixo apresenta dados de uma amostra referentes ao
nmero de horas de estudo fora de classe para determinados alunos de um
curso de Estatstica de 3 semanas, bem como suas notas obtidas em uma
prova no final do curso:
Estudante
Amostrado
1 2 3 4 5 6 7 8
30
Horas de estudo, X 2
0
1
6
3
4
2
3
2
7
3
2
1
8
2
2
Nota na prova, Y 6
4
6
1
8
4
7
0
8
8
9
2
7
2
7
7
a) Construir o diagrama de Disperso
b) Determinar a Equao de regresso de mnimos quadrados
Resp:
40 1, 5 + Y X
c) Usando a equao de regresso desenvolvida acima, estimar a nota na
prova de um aluno que estudou 30 horas fora da classe
Resp:
x
Y = 85
d) Esta equao de regresso poderia ser usada para estimar a nota de
um aluno que estudo 40 horas fora de classe? Porqu?
e) Calcular o erro padro de estimao.
f) Construir um intervalo estimado de predio de 90% para a nota na
prova, dado que o aluno estudou 30 horas fora da classe.
31
Captulo VII Probabilidade
7.1. Exemplos de Experimentos No-Determinsticos (aleatrios)
Experimentos Aleatrios (E) so aquelas que, mesmo repetidos vrias
vezes sob condies semelhantes, apresentam resultados imprevisveis.
:
1
E Jogue um dado e observe o nmero mostrado na face de cima.
:
2
E Jogue uma moeda quatro vezes e observe o nmero de caras
obtido.
:
3
E
Jogue uma moeda quatro vezes e observe a seqncia de caras
e coroas.
:
4
E Em uma linha de produo, fabrique peas em srie e conte o
nmero de peas defeituosas produzidas em um perodo de 24 horas.
5
: E Peas so fabricadas at que 10 peas perfeitas sejam
produzidas. O nmero total de peas fabricadas contado.
6
: E De uma urna, que s contm bolas pretas, tira-se uma bola e
verifica-se sua cor.
7.2. O Espao Amostral
32
Definio: Para cada experimento E do tipo que estamos considerando,
definiremos o espao amostral como o conjunto de todos os resultados
possveis de E. Geralmente representamos esse conjunto por S.
Vamos considerar cada um dos experimentos acima e descrever um
espao amostral para cada um deles. O espao amostral
i
S
se refere ao
experimento
i
E
.
:
1
S { } 6 , 5 , 4 , 3 , 2 , 1
:
2
S { } 4 , 3 , 2 , 1 , 0

'


c o r o a o u c a r a a p a r e a c o n f o r m e
, o u c a d a o n d e , , , f o r m a d a p o s s v e i s s e q u n c i a s a s t o d a s
:
4 3 2 1
3
T H a a a a a
S
i
{ } N S ,...., 2 , 1 , 0 :
4
, onde N o nmero mximo que pode ser
produzido em 24 horas.
{ }
5
: 10,11,12,..... S
{ }
6
: bola preta S
A fim de descrever um espao amostral associado a um experimento,
devemos ter uma idia bastante clara daquilo que estamos mensurando ou
observando. Por isso, devemos falar de um espao amostral associado a um
experimento e no de o espao amostral.
7.3. Eventos
Outra noo fundamental o com eito de evento. Um evento A (relativo a
um particular espao amostral S, associado a um experimento E)
simplesmente um conjunto de resultados possveis. Na terminologia de
33
conjuntos, um evento um subconjunto de um espao amostral. Qualquer
resultado individual pode ser considerado como um evento.
{ } 6 , 4 , 2 , isto ocorre, nmero Um :
1 1
A A .
{ } 2 :
2
A ; isto duas caras ocorrem.
{ } THHH HTHH HHTH HHHT HHHH A , , , , :
3
; isto , mais caras do que
coroas ocorrem.
{ } 0 :
4
A ; isto , todas as peas so perfeitas.
Agora, poderemos empregar as vrias tcnicas de combinar conjuntos
(isto , eventos), os quais j apresentamos anteriormente.
a) Se A e B forem eventos, B A ser o evento que ocorrer
se, e somente se, A ou B (ou ambos) ocorrerem.
b) Se A e B forem eventos, B A ser o evento que ocorrer
se, e somente se, A e B ocorrerem.
c) Se A for um evento Aser o evento que ocorrer se, e
somente se, A no ocorrer.
d) Se n
A A A ,...., ,
2 1 for qualquer coleo finita de eventos,
ento,
i
n
i
A
1
ser o evento que ocorrer se, e somente se,
ao menos um dos eventos
i
A
ocorrer.
e) Se n
A A A ,...., ,
2 1 for qualquer coleo finita de eventos,
ento,
i
n
i
A
1
ser o evento que ocorrer se, e somente se,
todos os eventos
i
A
ocorrerem.
34
f) Suponha que S represente o espao amostral associado a
algum experimento E, e que executamos E duas vezes.
Ento, S S poder ser empregado para representar todos
os resultados dessas duas repeties. Portanto,
( ) S S s s
2 1
, significa que
1
s resultou quando E foi
executado a primeira vez e
2
s , quando foi executado a
segunda vez.
Definio: Dois eventos A e B so denominados mutuamente excludentes,
se eles no puderem ocorrer juntos. Escrevemos isso como B A , isto , a
interseo de A e B o conjunto vazio.
7.4. Noes Fundamentais de Probabilidade
Definio: Seja E um experimento. Seja S um espao amostral associado a
E. A cada evento A associaremos um nmero real representado por P(A) e
denominado probabilidade de A, que satisfaa as seguintes propriedades:
(1)
1 ) ( 0 A P
.
(2) P(S) = 1.
(3) Se A e B forem eventos mutuamente excludentes,
( ) ) ( ) ( B P A P B A P +
(4) Se
n
A A A ,...., ,
2 1
,.... forem dois a dois eventos mutuamente
excludentes, ento,
( ) ...... ) ( ..... ) ( ) (
2 1 1
+ + + +

n i
A P A P A P P
Teorema 1: Se for o conjunto vazio, ento
0 ) ( P
.
35
0 ) ( ) ( ) ( ) (
) ( ) (
+


P A P P A P
A P A P
A A
Teorema 2: Se
A
o evento complementar de A, ento ) ( 1 ) ( A P A P .
Teorema 3: Se A e B forem dois eventos quaisquer, ento

) ( ) ( ) ( ) ( B A P B P A P B A P +
.
Teorema 4: Se A, B e C forem trs eventos quaisquer, ento
) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( C B A P C B P C A P B A P C P B P A P C B A P + + +
.
Teorema 5: Se
) ( ) ( ento , B P A P B A
.
7.5. Probabilidade de um evento ocorrer:
O mtodo de avaliar P(A) freqentemente enunciado da seguinte
maneira:
casos de total n
A a favorveis casos de n
) ( A P .
7.6. Probabilidade Condicionada
Vamos examinar agora a diferena entre extrair peas de um lote ao
acaso, com ou sem reposio.
C/ reposio S/ reposio
7 V
2 bolas
A = {1 bola extrada B}
B = {2 bola extrada B}
36
10
3
) (
10
3
) (

B P
A P

'

o c o r r e r n o A s e
9
3
o c o r r e r A s e
9
2
) (
1 0
3
) (
B P
A P
Definio: Sejam A e B dois eventos associados a um experimento.
Denotaremos P(A/B) a probabilidade condicionada do evento B dado que o
evento A ocorreu, e definimos como:
0 ) ( ,
) (
) (
) / (
0 ) ( ,
) (
) (
) / (
>

>

B P
B P
B A P
B A P
A P
A P
A B P
A B P
Teorema da Multiplicao
) ( ) / ( ) (
) ( ) / ( ) (
B P B A P B A P
A P A B P B A P



1 ) / ( 0 B A P

1 ) / ( A S P

+
2 1 2 1 2 1
se ) / ( ) / ( ) / ( B B A B P A B P A B B P

+ + +
j i n n
B B P(B A B P A B P A B B B P se /A) ..... ) / ( ) / ( ) / ..... (
2 1 2 1
Ex1: Suponha que o escritrio possua 100 mquinas de calcular. Algumas
dessas mquinas so eltricas (E), enquanto outras manuais (M); e algumas
so novas (N) e outras usadas (U). A tabela abaixo d o nmero de mquina de
cada categoria. Uma pessoa entra no escritrio, pega uma mquina ao acaso,
e descobre que nova. Qual ser a probabilidade de que seja eltrica?
P(E/N) = ?
E M
N 4
0
3
0
70
U 2 1 30
7
4
) / (
70
40
) / (
) (
) (
) / (

N E P
N E P
N P
N E P
N E P
37
0 0
6
0
4
0
10
0
Definio: Dizemos que os eventos
k
B B B ,...., ,
2 1
representam uma
partio do espao amostral S quando:
a)
j i B B
j i
para ,
b)
S B
i

c)
0 ) ( >
i
B P

Por exemplo: Na jogada de um dado:
} 6 {
} 5 , 4 , 3 {
} 2 , 1 {
3
2
1

B
B
B

Representam uma partio. Como os
i
B
so eventos mutuamente
excludentes, podemos escrever:
) ( ..... ) ( ) ( ) (
2 1 k
B A P B A P B A P A P + + +
Assim;
Ex2: Consideremos o lote de 20 peas defeituosas e 80 no defeituosas,
do qual extrairemos duas peas sem reposio. Sejam A e B os eventos:
A = {a primeira pea extrada defeituosa}
B = {a segunda pea extrada defeituosa}
Podemos agora calcular P(B), assim:
) ( ) / ( ) ( ) / ( ) ( A P A B P A P A B P B P +
B1
B2
B3
B4
) ( ) / ( ..... ) ( ) / ( ) ( ) / ( ) (
2 2 1 1 k k
B P B A P B P B A P B P B A P A P + + +
Teorema da Probabilidade Total
38
99
20
) / (
99
19
) / (
5
4
5
1
1 ) (
5
1
100
20
) (



A B P
A B P
A P
A P
5
1
5
4
99
20
5
1
99
19
) ( + B P
Ex3: Uma determinada pea manufaturada por trs fbricas, digamos 1,
2 e 3. Sabe-se que 1 produz o dobro de peas que 2, e 2 e 3 produzem o
mesmo nmero de peas. Sabe-se tambm que 2% das peas produzidas por 1
e 2 so defeituosas, enquanto 4% daquelas produzidas por 3 so defeituosas.
Todas as peas produzidas so colocadas em um depsito, e depois uma pea
extrada ao caso. Qual a probabilidade de que essa pea seja defeituosa?
Vamos introduzir os seguintes eventos:
D = {a pea defeituosa}
1
B = {a pea provm de 1}
2
B = {a pea provm de 2}
3
B
= {a pea provm de 3}
Pede-se P(D), ento podemos escrever:
1 1 2 2 3 3
( ) ( / ) ( ) ( / ) ( ) ( / ) ( ) P D P D B P B P D B P B D B P B + +
4
1
) (
2
1
4
1
. 2 ) (
4
1
) (
1 ) ( 4
1 ) ( ) ( ) ( 2
1 ) ( ) ( ) (
3 1 2
2
2 2 2
3 2 1

+ +
+ +
B P B P B P
B P
B P B P B P
B P B P B P
1
2
3
( / ) 0, 02
( / ) 0, 02
( / ) 0, 04
1 1 1
( ) 0, 02. 0, 02. 0, 04. 0, 01 0, 01 0, 005 0, 025
2 4 4
P D B
P D B
P D B
P D

+ + + +
P(D) =0,025
39
Suponha agora que a pea retirada defeituosa. Calcular a probabilidade
dela ter sido manufaturada pela fbrica 1?
1
1
( )
( / )
( )
P B D
P B D
P D

?
7.7.Teorema de Bayes
Seja
k
B B B ,......, ,
2 1
uma partio do espao amostral S e seja A um
evento associado a S. Aplicando a definio de probabilidade condicionada,
podemos escrever:

k
j
j j
i i
i
B P B A P
B P B A P
A B P
1
) ( ). / (
) ( ). / (
) / (
Este resultado conhecido como Teorema de Bayes.
Assim voltando ao problema anterior:
1 1
1
( / ). ( ) 0, 02 . 1/ 2
( / ) 0, 4
( ) 0, 025
P D B P B
P B D
P D

Ex 1) Dadas 5 caixas , contendo bolas brancas e bolas pretas. Temos
duas caixas do tipo I, duas caixas do tipo II e uma caixa do tipo III; a caixa do
tipo I possui 2 bolas brancas e 4 bolas pretas, a caixa do tipo II possui 3 bolas
brancas e 3 bolas pretas e a caixa do tipo III s possui bolas brancas. Se
retirarmos ao acaso uma bola branca, qual a probabilidade dessa bola ter
vindo da caixa III?

37,5%
7.8. Eventos Independentes
Dois eventos A e B so eventos independentes quando esto inteiramente
no relacionados. Saber que B ocorreu no fornece qualquer informao sobre
a ocorrncia de A.
Assim a probabilidade absoluta (ou no condicionada) P(A) igual
probabilidade condicionada P(A/B).
40
Da poderamos dizer que A e B sero independentes se, e somente se,
P(A/B) = P(A) e
P(B/A) = P(B).
Assim:
) ( ) ( ) ( ) / ( ) (
) ( ) ( ) ( ) / ( ) (
A P B P A P A B P B A P
B P A P B P B A P B A P


Logo:
Definio: A e B sero eventos independentes se, e somente se,
) ( ) ( ) ( B P A P B A P
.
Exerccios
1) Um grupo de 50 elementos apresenta a seguinte composio:
Homen
s
Mulhere
s
Menore
s
15 5
Adultos 18 12
Um elemento escolhido ao acaso. Pergunta-se:
a) Sabendo-se que o elemento escolhido adulto, qual a probabilidade de
ser homem?
b) Dada que a escolhida mulher, qual a probabilidade de ser menor?
c) Qual a probabilidade de ser menor e mulher?
a) 60% b) 29% c) 10%

2) Em uma fbrica de parafusos, as mquinas A, B e C produzem 35%, 40% e
25% do total produzido, respectivamente. Da produo de cada mquina, 6%,
5% e 3%, respectivamente, so parafusos defeituosos. Escolhe-se ao acaso um
parafuso e verifica-se ser defeituoso. Qual ser a probabilidade de que o
parafuso venha da mquina A? Da B? Da C?
P(A/D) = 43,3% P(B/D) = 41,2% P(C/D) = 15,5%
3) Dada 6 caixas todas contendo bolas brancas e bolas pretas, temos 2 caixas
do tipo I, 3 caixas do tipo II e 1 caixa do tipo III. A caixa I possui 2 bolas
41
brancas e 4 bolas pretas, a caixa II possui 3 bolas brancas e 3 bolas pretas e a
caixa III s possui bolas brancas. Se extrairmos uma bola ao acaso e
verificamos que ela preta. Qual a probabilidade dessa bola ter vindo da caixa
II?

53%
4) Suponha que voc tenha duas moedas em seu bolso, sabe-se que uma
honesta e a outra apresenta duas cara. Extraindo ao acaso uma moeda e
jogando-a obtm-se cara. Qual a probabilidade da moeda ser honesta?
33,33%

5) Em um certo colgio, 5% dos homens e 2% das mulheres tm mais do que
1,80m de altura. Por outro lado, 60% dos estudantes so homens. Se um
estudante selecionado aleatoriamente e tem mais de 1,80m de altura, qual a
probabilidade de que o estudante seja mulher?
6) Suponha que 5% das pessoas com sangue tipo O sejam canhotas, 10% das
pessoas com outro tipo de sangue sejam canhotas, e 40% das pessoas tenham
sangue tipo O. Selecionando um canhoto aleatoriamente, qual a probabilidade
dele ter sangue tipo O? 25%
7) Suponha que 70% das pessoas com olhos castanhos, 20% das pessoas com
olhos verdes e 5% das pessoas com olhos azuis tenham todas cabelos
castanhos. Suponha ainda que 75% das pessoas tenham olhos castanhos, 5%
tenham olhos azuis e 20% tenham olhos verdes. Qual a probabilidade de
uma pessoa de cabelos castanhos, escolhida ao acaso, ter olhos verdes?
8) Segundo a OMS existem dois exames (A e B) para detectar o vrus HPV.
Alm disso, informou-se que as probabilidades de ser detectado
adequadamente a existncia do vrus valem 0,90 e 0,95, se utilizado o exame
A e B respectivamente. Por ser mais barato 70% das brasileiras optam por
fazer o exame A. Dessa forma:
a) Qual a probabilidade de uma brasileira no ser detectada
(adequadamente) como tendo o vrus HPV?
8,5%
42
b) Que percentual das brasileiras, que foram detectadas como tendo HPV,
optaram pelo exame B?
31,15%

9) Um lote formado de 25 artigos bons, 10 com defeitos menores e 5 com
defeitos graves. Um artigo escolhido ao acaso. Ache a probabilidade de que:
a) ele no tenha defeitos?
62,5%
b) ele no tenha defeitos graves?
87,5%
c) ele ou seja perfeito ou tenha defeitos graves?
75%
10) Trs jornais, A, B e C so publicados em uma cidade e uma recente
pesquisa entre os leitores indica o seguinte:
20% lem A
26% lem B
14% lem C
8% lem A e B
5% lem A e C
4% lem B e C
2% lem A,B e C
Para um adulto escolhido ao acaso, calcule a probabilidade de que:
a) ele no leia qualquer dos jornais?
55%
b) ele leia exatamente um dos jornais?
32%
c) ele leia somente o jornal A ?
9%
d) ele leia pelo menos dois jornais?
13%
e) ele leia apenas dois jornais?
11%
f) ele leia pelo menos um jornal?
45%

11) Um aluno responde a um exame de mltipla escolha no qual cada questo
tem quatro alternativas das quais uma resposta correta. A probabilidade de
que ele saiba a resposta correta de 60%. Caso contrrio, ele seleciona ao
caso uma resposta entre as quatro possveis. Se o aluno seleciona a resposta
correta para uma questo, qual a probabilidade de que ele realmente saiba a
resposta correta? 86%
12) Uma clnica especializada trata de 3 tipos de molstias; X, Y e Z. 50% dos
que procuram a clnica so portadores de X, 40% so portadores de Y e 10% de
Z. As probabilidades de cura, nesta clnica, so:
43
molstia X: 0,8
molstia Y: 0,9
molstia Z: 0,95
Um enfermo saiu curado desta clnica. Qual a probabilidade de que ele
tenha sofrido a molstia Y?
42%
13) A probabilidade de um indivduo de classe A comprar um carro
3
4
, de
classe B
1
6
e de classe C
1
20
. A probabilidade do indivduo de classe A
comprar um carro da marca D
1
10
; de B comprar da marca D
3
5
e de C
3
10
. Em certa loja comprou-se um carro da marca D. Qual a probabilidade de que
o indivduo da classe B o tenha comprado?

52,63%
14) Suponha que esteja em curso uma eleio com dois candidatos, Joo e
Pedro. Dos habitantes da cidade,
2
3
apiam Pedro, mas
5
9
dos habitantes do
interior apiam Joo. Metade dos habitantes vivem no interior e metade na
cidade. Se voc inicia uma conversa com um eleitor que se revela a favor de
Pedro, qual a probabilidade desse eleitor viver no interior?
40%
15) Os analistas de acidentes de trnsito afirmam que a probabilidade de um
motorista provocar um acidente vale 3/4 se ingerir alguma bebida alcolica e
1/4 , caso contrrio. sabido que no RJ (durante os fins de semana) 60% dos
motoristas se servem de bebidas alcolicas. Com essas informaes:
a) Qual a probabilidade de um motorista do RJ no sofrer acidente no fim
de semana?
b) E sabendo que houve um acidente grave no RJ no sbado noite, qual
a probabilidade do motorista ter ingerido bebida alcolica?
44
16) Wallace, ao volante de seu conversvel, encontra-se em uma encruzilhada
numa zona rural. Ele sabe que uma dessas estradas leva cidade mais
prxima, para onde ele deseja ir, e que a outra leva at uma fazenda vizinha,
porm no sabe qual a correta a seguir. Na encruzilhada ele encontra quatro
camponeses A, B, C e D que conhecem bem a estrada, e decide dirigir-se ao
acaso a um deles para perguntar qual estrada deve seguir. O que ele no sabe
que, enquanto A fala sempre a verdade, B fala a verdade s 70% das vezes,
C 50% das vezes e D sempre mente.
a) Determine a probabilidade de Wallace ser enviado ao caminho certo.
b) Se ele descobrir que foi enviado ao caminho errado, qual a probabilidade
de que o campons B tenha sido o que lhe deu a informao?
c) Mesma pergunta para o campons C.
Captulo VIII Distribuio Normal