Sei sulla pagina 1di 75

1 Estatstica Descritiva

1.1 Denies e Conceitos em Estatstica


a) Estatstica: a cincia que se preocupa em tirar concluses de um todo com base em uma parte
do todo. Por meio dela possvel coletar, apresentar, analisar e interpretar um conjunto de
dados.
b) Censo: um estudo estatstico que resulta da observao de todos os indivduos da populao
relativamente a diferentes atributos pr-denidos. Teoricamente, no censo, tem-se a informao
precisa de uma varivel em estudo, enquanto na estatstica tem-se uma previso da ocorrncia
da varivel.
c) Diviso da Estatstica: A estatstica bsica pode ser dividida em duas reas:
Estatstica descritiva: descreve resumidamente um conjunto de dados, utilizando ta-
belas, grcos, medidas de posio e de disperso.
Exemplos: Velocidade de processamento de um computador; tempo de espera para ser
atendido em uma loja; opinio das pessoas quanto a violncia no pas; temperatura
mensal de uma cidade.
Estatstica Indutiva ou Inferncia Estatstica: representa o estudos dos dados de
amostras com o objetivo de entender ou tirar concluses sobre o comportamento da
populao a partir das amostras.
Exemplo: Suponha que se deseja calcular a voltagem necessria para que um dispositivo
eltrico chegue a falhar. Para isso, submete-se uma amostra de tais dispositivos a
voltagens cada vez mais elevadas, at falhar cada dispositivo da amostra. Com base
nos resultados, pode-se estimar a probabilidade de falha nos dispositivos, a cada
voltagem.
d) Dados de observao: so valores (realizaes) assumidos por uma varivel e observada pelo
pesquisador
e) Populao: conjunto de indivduos ou objetos que possuem pelo menos uma caracterstica
comum observvel.
Exemplos: Todos os eleitores do Brasil;
Todos os cidados que possui TV;
f ) Amostra: um subconjunto nito da populao que mantm as mesmas caractersticas desta
populao.
Exemplos: 3000 eleitores;
Cidados entrevistados pelo servio de televiso;
g) Varivel: uma caracterstica que pode assumir diferentes valores de indivduo para indivduo.
Variveis qualitativas: so aquelas para as quais uma medio numrica no pos-
svel e, apresentam como possveis realizaes uma qualidade ou atributo do indivduo
pesquisado.
Variveis quantitativas: so aquelas para as quais possvel realizar uma contagem
ou mensurao.
Variveis nominais: utilizadas quando no existe nenhuma ordenao nas possveis
realizaes.
1
Exemplos: Sexo (Feminino ou masculino), estado civil (Solteiro, casado, divorciado,
vivo), naturalidade (Uberlndia, Monte Alegre, Araguari), etc.
Variveis ordinais: utilizadas quando os seus possveis resultados podem ser ordenados
por algum critrio especico.
Exemplos: Grau de instruo de um indivduo (Ensino Mdio, graduao, ps-graduao),
classe social (Baixa, mdia, alta), classicao de um produto (regular, bom, timo)
etc.
Variveis discretas: assumem valores especcos, e geralmente esto relacionadas a
dados de contagem e associadas com o conjunto dos nmeros inteiros.
Exemplos: Nmero de lhos de um casal, nmero de acidentes ocorridos em uma
determinada rodovia, nmero de moradores de uma residncia, etc.
Variveis contnuas: assumem innitos valores dentro de um intervalo, e esto asso-
ciadas em geral, com os nmeros reais e relacionadas a medies.
Exemplos: Estatura de um indivduo, temperatura de uma cidade, produo de uma
cultura, etc.
h) Dados Brutos: so os dados de observao sem nenhuma observao lgica.
i) Dados elaborados ou rol: so os dados de observao em ordem crescente ou decrescente.
j) Amplitude Total(A): a diferena entre o maior valor observado e o menor valor observado.
A = X
(n)
X
(1)
= maior valor observado - menor valor observado.
Apresentao dos dados
A organizao, sumarizao e descrio de dados podem ser feitas por meio dos mtodos tabulares
e grcos.
1.2 Distribuio de Frequncias:
Uma distribuio de frequncia um sumrio tabular dos dados que mostra o nmero (frequncia)
de itens em cada uma das classes ou categorias no sobrepostas.
Tipos de frequncias
a) Frequncia Absoluta (f
i
): o nmero de vezes que o indivduo aparece na amostra
b) Frequncia Relativa (f
r
): fr =
f
i
n
, em que n o nmero de observaes, ou seja,
n =
k

i=1
f
i
, sendo k o nmero de classes ou categorias.
c) Frequncia Percentual (f
p
): f
p
= f
r
100:
d) Frequncia Acumulada (F
i
): indica o nmero de dados que possuem valores menores
ou maiores, ou ento iguais ao limite superior de cada classe.
Algoritmo para construo da distribuio de frequncias para variveis quantita-
tivas
a) Calcular a Amplitude Total (A): A = X
(n)
X
(1)
;
b) Calcular o nmero de classes (k): k =

n se n 100; k = 5logn se n > 100. Em ambos
os casos deve-se escolher o nmero inteiro mais prximo;
2
c) Calcular a amplitude da Classe (C): C =
A
k1
;
d) Calcular o limite inferior da primeira classe (LI
1
a): LI
1
a = X
(1)
;
e) Organizar as classes e contar as frequncias;
Observaes:
1. Os intervalos das classes podem se classicar em: abertos(]a,b[ ou a b) de modo que
os limites da classe no pertencem a ela; fechados ([a,b] ou a b) em que os limites da
classe pertencem a ela ou mistos ([a,b[ ou a b)no qual um dos limites pertence classe,
e o outro, no;
2. Por questes de ordem prtica e esttica, sugere-se utilizar de 5 a 20 classes;
3. As frequncias simples so representadas por letras minsculas e as frequncias acumula-
das por letras maisculas;
4. No caso de variveis discretas, quando a amplitude total das observaes pequena, cada
valor adotado como sendo uma classe, e nestes casos, o algoritmo apresentado no
utilizado;
5. Para determinados clculos estatsticos, todos os pontos de uma classe podem ser repre-
sentados pelo ponto mdio da classe. O ponto mdio da classe i ( x
i
) calculado pela
mdia dos limites da classe. Esse critrio conhecido como hiptese tabular bsica.
Exemplos:
1. Uma pesquisa foi realizada para vericar a preferncia dos consumidores em uma cidade quanto
aos cinco tipos de refrigerantes: coca-cola(C), fanta(F), pepsi-cola(P), sprite(S) e Guaran(G),
obtendo os seguintes dados:
F C C F P P C G C F
C S C F C F C S P C
C P C S G P F P C C
P G P C P G S C C P
a) Classicar a varivel;
b) Obter a distribuio de frequncias;
2. Para facilitar um projeto de ampliao da rede esgoto de um certo bairro, as autoridades
tomaram uma amostra de tamanho 36 dos 270 quarteires que compem a regio em estudo,
e foram encontrados os seguintes nmeros de casas por quarteiro:
15 27 22 36 13 29
23 45 15 18 16 25
26 10 34 23 27 44
20 30 21 32 16 34
14 20 17 24 25 26
17 25 36 22 42 29
a) Classicar a varivel;
b) Colocar os dados em rol;
c) Construir a distribuio de frequncias;
d) Obter as frequencias acumuladas Abaixo de e Acima de;
3
3. Um estudo apresentou informaes sobre a tecnologia dos aparelhos domsticos e sua utilizao
por pessoas de 12 anos ou mais. Os dados a seguir referem-se ao nmero de horas de uso de
computadores pessoais durante uma semana para uma amostra de 50 pessoas:
1,5 1,6 1,6 2,0 2,8 3,0 3,1 3,1 3,1 3,3
3,4 3,5 3,7 3,7 3,9 3,9 4,0 4,1 4,1 4,1
4,1 4,2 4,3 4,4 4,7 4,8 5,4 5,6 5,7 5,7
5,7 5,9 5,9 6,1 6,1 6,1 6,2 7,1 7,2 7,6
8,8 9,5 10,3 10,3 10,4 10,4 10,8 11,1 12,1 12,9
a) Classicar a varivel em estudo;
b) Construir a distribuio de frequncias;
1.3 Representaes grcas:
Variveis contnuas:
a) Histogramas: um grco de colunas justapostas, no qual a varivel contnua, dividida
em classes, representada no eixo horizontal. No eixo vertical, marcam-se as freqncias
relativas ou percentuais de cada classe, construindo as colunas.
b) Polgono de frequncias: so segmentos de retas que tem suas extremidades correspon-
dentes ao ponto mdio da classe e a coordenada y da extremidade ser proporcional a
frequncia da classe.
c) Grco da frequncia acumulada (ogiva): so grcos construdos a partir da dis-
tribuio de frequncias acumuladas. No caso das variveis continuas, utiliza-se linhas
contnuas.
d) Histogramas com amplitudes de classes desiguais: se a distribuio de frequncias
possuir amplitudes de classes desiguais, deve-se fazer um ajuste de frequncias antes de
construir o histograma. Esse procedimento garante a proporcionalidade das reas entre
as diferentes classes. As correes das frequncias so realizadas por meio das densidades
de frequncias (d.f), ou seja, substituindo a frequncia da classe i pela df
i
, dada por:
df
i
= f
i
/C
i
.
Exemplos:
1. A distribuio de frequncias abaixo refere-se ao preo em reais das refeies por quilo de
25 restaurantes prximo a UFU:
Preo das refeies (R$) f
i
f
r
f
p
10 13 1 0,04 4
13 16 4 0,16 16
16 19 12 0,48 48
19 22 6 0,24 24
22 25 2 0,08 8
Total 25 1,00 100
Pede-se:
a) Interpretar a distribuio de frequncias;
b) Construir o histograma e o polgono de frequncias;
c) Calcular as frequncias acumuladas e construir o grco correspondente (ogivas).
4
2. Considere a seguir a distribuio de 130 empresas classicadas segundo o nmero de
empregados:
Nmero de Empregados f
i
0 20 10
20 40 30
40 80 60
80 160 30
Construir o histograma para esses dados;
Variveis discretas:
a) Grco de linhas: para as variveis discretas a representao grca conveniente para
as frequncias simples o grco de linhas, pois s ocorre frequncias nos pontos xos,
ou seja, no existe a continuidade.
b) Grco de frequncias acumuladas: so grcos construdos a partir das frequncias
acumuladas e no caso discreto, assume um aspecto de escadas.
Exemplos:
1. O setor pessoal de uma empresa brasileira registrou os seguintes nmeros de faltas de
funcionrios em uma semana do ms de julho/2010:
Nmero de faltas f
i
2 2
3 3
4 8
5 5
6 2
Total 20
Com base nestes dados:
a) Construir o grco de linhas;
b) Obter as frequncias acumuladas e representar gracamente as frequncias acu-
muladas;
Outras representaes grcas:
a) Grco de setores: compara as partes estudadas com o todo, sendo apresentado em
porcentagens sobre a forma de setores em circulo e indicado para representar variveis
qualitativas.
b) Ramos e folhas: so os grcos construdos com os valores observados. Trata-se da dis-
posio em rol dos dados, com base no isolamento de um algarismo mais signicativo,
denominado galho (por exemplo, dezena), e de algarismos menos signicativos, denomi-
nados folhas (por exemplo, unidades).
c) Grco de barras: similar ao histograma, possuindo o objetivo de apresentar as frequn-
cias sob a forma de barras horizontais ou verticais, separadas entre si. Os dados podem
ser nominais ou quantitativos (agrupados em classes ou no).
d) Grcos de pontos (disperso): usado em estudos de correlao, permitindo vi-
sualizar o grau de associao entre duas variveis quantitativas medidas em um mesmo
indivduo. Cada par de observaes representado por um ponto (x,y) do sistema de
coordenadas cartesianas.
5
e) Grco Box-plot: um dos mais usados grcos da estatstica e fornece ideias sobre as
medidas de posio, disperso, assimetria, caudas e dados discrepantes.
Exemplos:
1. Uma pesquisa foi realizada com o objetivo de vericar o estado de procedncia dos alunos
matriculados na rea de exatas na UFU, obtendo os seguintes resultados:
Estado f
p
ngulo(graus)
MG 62
SP 17
GO 14
Outros 7
Total 100
Representar essas informaes em um grco de setores.
2. Os dados abaixo referem-se ao nmero de quartos ocupados diariamente num hotel de
praia durante o ms de janeiro:
55 49 37 57 46 40 64 35 73 62
61 43 72 48 54 69 45 78 46 59
40 58 56 49 42 62 53 46 81 52
Represente os dados atravs de um grco de ramos e folhas.
3. Utilizando as informaes do exemplo 1, construa um grco de barras.
4. Um estudo realizado em 5 cidades mineiras vericou que o nmero de lhos de 50 famlias
pode ser representado pela tabela a seguir:
Nmero de lhos f
i
f
r
f
p
1 14 0,28 28
2 18 0,36 36
3 12 0,24 24
4 6 0,12 12
Total 50 1 100
Esboar o grco de barras para esses dados.
5. Os dados a seguir foram obtidos num estudo sobre a relao entre a resistncia (ohms) e
o tempo (min) que certos resistores sobrecarregados levam para falhar.
Resistncia 33 36 30 44 34 25 40 28 40 46
Tempo 39 36 34 51 36 21 45 25 45 36
Verique, por meio do diagrama de disperso, a relao existente entre a resistncia e o
tempo de falha.
1.4 Interpolaes em tabelas de distribuio de frequncias:
Exemplo: A tabela a seguir representa a distribuio de salrios em uma empresa:
Salrios fa
7,50 10,50 14
10,50 13,50 17
13,50 16,50 11
16,50 19,50 8
Total 50
a) Qual a % de funcionrios que ganham mais de 13,50 salrios?
b) Qual a % de funcionrios que ganham entre 8 e 12 salrios?
6
1.5 Natureza da distribuio de frequncias:
a) Simtrica: 50% das observaes esto abaixo do valor central e 50% acima.
b) Assimtrica direita: maioria dos valores esto concentrados esquerda da distribuio.
c) Assimtrica a esquerda: maioria dos valores esto concentrados a direita da distribuio.
d) Multimodal: vrios picos de frequncia.
1.6 Tcnicas de somatrio
Dada as variveis X
i
e Y
j
(i = 1,2, , n), (j = 1,2, , m) e a constante k, temos:
a)
n

i=1
X
i
= x
1
+x
2
+ +x
n
b)
n

i=1
m

j=1
X
i
Y
j
= x
1
y
1
+x
1
y
2
+ +x
n
y
m
c)
n

i=1
X
i
m

j=1
Y
j
= (x
1
+x
2
+ +x
n
)(y
1
+y
2
+ +y
m
)
d)
n

i=1
X
2
i
= x
2
1
+x
2
2
+ +x
2
n
e) (
n

i=1
X
i
)
2
= (x
1
+x
2
+ +x
n
)
2
f )
n

i=1
k = k +k + +k = nk
g)
n

i=1
kX
i
= kx
1
+kx
2
+ +kx
n
= k
n

i=1
X
i
1.7 Medidas de posio
As medidas de posio ou de tendncia central constituem uma forma mais sinttica de apresentar
os resultados contidos nos dados observados, pois representam um valor central, em torno do qual os
dados se concentram. Portanto, constitui como objetivo ao obter as medidas de posio, encontrar
um nico valor, em um conjunto de valores observados, que seja representante desse conjunto. As
medidas de posio mais empregadas so a mdia, a mediana e a moda.
a) Mdia aritmtica ( x): uma medida de fcil compreenso, mais comum e simples de ser
calculada.
i) Dados no agrupados: x =
n

i=1
x
i
n
ii) Dados agrupados: x =
k

i=1
x
i
f
i
n
, em que x
i
o ponto mdio da classe i;
7
Observao:
1. Nas distribuies de frequncias, assume-se a hiptese de que todas as observaes
contidas em uma classe so consideradas iguais ao ponto mdio da classe.
Exemplos:
1. O nmero de peas defeituosas observado em amostras retiradas diariamente da linha
de produo de uma indstria, durante uma semana foi de: 10, 14, 13, 15, 16, 18 e 12
peas. Calcular o nmero mdio de peas defeituosas por dia desta semana avaliada.
2. Considere os nmeros de gols por partida em um determinado campeonato de futebol,
agrupados e apresentados na sequncia. Calcule o nmero mdio de gols por partida.
N
o
de gols por partida f
i
0 7
1 12
2 16
3 12
4 9
5 2
6 2
Total 60
3. Para a distribuio de frequncias que representa a fora de ruptura em libras por
polegada quadrada (psi) da garrafas descartveis de um litro de refrigerante, calcular
a mdia.
Classes f
i
86,6 147 1
147 208 6
208 269 13
269 330 8
330 390 2
Total 30
Propriedades da mdia aritmtica:
1. A soma dos desvios (SD) de um conjunto de dados em relao a sua mdia nula.
2. A soma dos quadrados dos desvios de um conjunto de dados em relao a uma
constante k mnima se e somente se k= x.
3. Somando ou subtraindo uma constante k a cada valor observado, a mdia do novo
conjunto de dados car somada ou subtrada da constante k, em relao a mdia
inicial.
4. Multiplicando ou dividindo-se cada valor observado por uma constante k a nova
mdia car multiplicada ou dividida por k.
b) Outros tipos de mdia:
1. Mdia Ponderada ( x
p
): essa mdia associa as observaes x
1
, x
2
, , x
n
determinadas
ponderaes ou pesos que dependem da importncia atribuda a cada uma das observa-
es.
x
p
=
n

i=1
w
i
x
i
n

i=1
w
i
=
w
1
x
1
+w
2
x
2
+ +w
n
x
n
w
1
+w
2
+ +w
n
,
8
sendo w
i
o peso da observao i.
2. Mdia Geomtrica (G): utilizada para representar variveis assimtricas a direita, pois
nestes casos, a mdia aritmtica, por ser muito inacionada pelos valores extremos, no
representa bem a varivel.
G =
n

x
1
.x
2
. .x
n
ou ainda logG =
1
n
(logx
1
+logx
2
+ logx
n
)
3. Mdia Harmnica (H): utilizada para variveis que apresentam periodicidade, ou seja,
uma variao harmnica como por exemplo, ondas de rdio, variao de preos, entres
outros.
H =
n
n

i=1
1/x
i
Exemplos:
1. Suponha que uma indstria realizou ao longo dos ltimos trs meses cinco compras
de determinada matria prima:
Compra Custo por quilo (R$) Quantidade Quilos
1 3 1200
2 3,40 500
3 2,80 2750
4 2,90 1000
5 3,25 800
Deseja-se obter informaes sobre o custo mdio por quilo da matria prima.
Qual esse custo mdio?
2. Sabe-se que os multiplicadores de crescimento anual de consumo de um determinado
servio telefnico foram iguais a 1,2; 1,8; 2,7; 0,9; 1,5; 2,3 e 0,7. Calcular a mdia
aritmtica, geomtrica e harmnica.
c) Mediana(Md): a realizao que ocupa a posio central de um conjunto de dados ordenados.
Ou seja, abaixo da mediana devero estar 50% dos elementos analisados e acima da mediana
devero estar 50% dos dados analisados.
i) Dados no agrupados: O valor da mediana depende da quantidade n de elementos
presentes no conjunto de dados. Se o nmero de dados for mpar a mediana ser igual
ao valor central. No caso de nmeros de dados par a mediana ser dada pela mdia
aritmtica entre os dois valores centrais.
Matematicamente, a mediana denida como:
Md =
_
x
(n+1)/2
se n mpar
x
(
n
2
)
+x
(
n+2
2
)
2
se n par
ii) Dados agrupados:
Md = LI +
0,5nF
i
f
Md
.C
em que:
LI o limite inferior da classe mediana;
F
i
a frequncia acumulada das classes anteriores a classe mediana;
9
f
Md
a frequncia da classe mediana;
C a amplitude da classe mediana;
n o nmero de observaes e classe mediana a classe onde se encontra o indivduo
mediano.
Exemplos:
1. Os preos em reais para uma amostra de aparelho de ar condicionado so: 500, 840,
470, 480, 420, 440 e 440. Calcular a mediana.
2. O peso de mancais produzidos por um processo de fundio est sendo estudado.
Uma amostra de seis mancais foi medida, resultando nos seguintes pesos: 1,18; 1,21;
1,19; 1,17; 1,20 e 1,21. Obter a mediana.
3. Utilizando novamente os dados referente aos nmeros de gols por partida em um
campeonato de futebol, calcular a mediana desses valores:
N
o
de gols por partida f
i
0 7
1 12
2 16
3 12
4 9
5 2
6 2
Total 60
4. Suponha que a renda familiar em salrios mnimos de uma amostra com 72 traba-
lhadores pudesse ser representada segundo a tabela:
Classe f
i
1 2 13
2 4 22
4 6 18
6 8 7
8 10 8
10 12 4
Total 72
Calcular a mediana.
d) Moda(Mo): o valor que ocorre com maior frequncia entre os valores observados. Em um
conjunto de dados, pode existir mais de uma moda ou no ter nenhum valor modal.
i) Dados no agrupados: o valor que aparece repetido mais vezes.
ii) Dados agrupados: Se os dados encontram-se em uma distribuio de frequncia, procede-
se das seguintes formas:
utilizao de frmula:
Mo = LI +

1

1
+
2
.C,
em que: LI o limite inferior da classe modal;

1
a diferena entre a frequncia da classe modal e a frequncia da classe imediatamente
inferior;

2
a diferena entre a frequncia da classe modal e a frequncia da classe posterior;
C amplitude da classe modal e classe modal a classe de maior frequncia.
10
utilizao do ponto mdio da classe modal:
Mo =
LI +LS
2
,
em que: LI o limite inferior da classe modal e LS o limite superior da classe modal
utilizao do mtodo geomtrico:
Observaes:
1. Quando o mtodo geomtrico utilizado, a moda tender para o limite inferior ou
superior da classe modal a medida que o valor da frequncia da classe anterior for
maior que a d posterior ou a frequencia da classe posterior for maior que a da anterior,
respectivamente. Se as classes anterior e posterior a classe modal tiverem a mesma
frequncia, ento a moda ser o ponto mdio da classe.
2. As propriedades (3) e (4) da mdia aritmtica tambm so vlidas para a mediana e
a moda.
Exemplos:
1. Durante o ms de setembro de um certo ano, o nmero de acidentes por dia em um
certo trecho da rodovia, apresentou os seguintes valores:
0 0 0 0 0 1 1 1 1 1
1 1 1 1 1 1 2 2 2 2
2 2 2 2 3 3 3 4 4 6
Qual a moda de acidentes por dia?
2. Determine a moda para os seguintes conjuntos de dados:
a) 150, 155, 157, 160, 160, 163, 165, 165, 170
b) 10, 12, 14, 15, 16, 19, 21
3. Considere os dados amostrais do nmero de circuitos defeituosos em um sistema
composto por 4 circuitos. Uma amostra de 19 sistemas foi coletada, obtendo os
seguintes dados:
Nmero de circuitos defeituosos f
i
1 10
2 7
3 1
4 1
Total 19
Determinar a moda, ou seja, o nmero modal de circuitos defeituosos por sistema.
4. O quadro a seguir representa a distribuio de frequncias do peso (kg) de pessoas
de uma certa faixa etria:
Peso f
i
40 45 3
45 50 8
50 55 16
55 60 12
60 65 7
65 70 3
70 75 1
Total 50
Calcular a moda e interpretar.
11
1.8 Relao entre, x, Md e Mo
a) Se x = Md = Mo: Distribuio simtrica
b) Se x > Md > Mo : Distribuio assimtrica direita.
c) Se x < Md < Mo: Distribuio assimtrica esquerda.
1.9 Separatrizes (Quartis)
Se um conjunto de dados organizado em rol, o valor central ou a mdia entre os dois valores
centrais foi denido como a mediana. Por extenso desse conceito de mediana, pode-se pensar nos
valores que dividem o conjunto em quatro partes iguais, e teremos os quartis (Q
1
, Q
2
, Q
3
). O quartil
Q
2
coincide com a mediana. Podemos ainda ter os decis que dividem os dados ordenados em 10 (D
1
,
D
2
, ..., D
9
) conjuntos iguais, ou os percentis que os dividem em 100 partes iguais (P
1
, P
2
, ..., P
99
).
Desse modo, segue que: Q
2
= D
5
= P
50
= Md; P
75
= Q
3
; P
25
= Q
1
.
Clculo do p-simo percentil:
1. Organize os dados em rol e calcule o ndice (i): i =
_
p
100
_
n, em que p o percentil
procurado e n o nmero de observaes.
2. Se i no for um nmero inteiro, arredonde-o para cima. Esse nmero denomina a posio
do p-simo percentil.
3. Se i for um nmero inteiro, o p-simo percentil ser a mdia dos valores nas posies i e
i + 1.
Exemplos:
1. As notas nais de nove alunos em uma determinada disciplina so iguais a: 89,88, 94, 65,
42, 73, 66, 66 e 35. Calcular e interpretar os quartis.
2. Os slarios dos empregados de uma indstria so: 2710, 2755, 2850, 2880, 2880, 2890,
2920, 2940, 2950, 3050, 3130 e 3325. Determine os quartis e o 85
o
percentil.
1.10 Medidas de disperso
Sabemos que sucessivas realizaes de um fenmeno no produzem o mesmo resultado. Por
exemplo, o desempenho de consumo do carro no o mesmo para cada tanque de combustvel.
Existe uma variabilidade nos resultados que nesse caso pode depender de vrios fatores como tipo
de estrada, marca do combustvel, condies climticas, desgaste do veiculo com o tempo, entre
outras. Dessa forma, resumindo o conjunto de dados em uma nica medida de posio, no se tem
ideia dessa variabilidade. Assim, necessrio obter uma medida que nos indique o quanto os dados
se encontram dispersos em torno da regio central, ou da mdia, sendo a medida de disperso usada
para esse m.
Exemplo:
Trs grupos de alunos submeteram-se a um teste, obtendo as seguintes notas:
Grupo A: {1, 8, 10, 10, 11, 12, 18} x
A
= 10; Md
A
= 10; Mo
A
= 10
Grupo B: {1, 2, 10, 10, 10, 13, 24} x
B
= 10; Md
B
= 10; Mo
B
= 10
Grupo C: {10, 10, 10, 10, 10, 10, 10} x
C
= 10; Md
C
= 10; Mo
C
= 10
12
A mdia, a mediana e a moda so iguais, mas os trs grupos apresentam comportamento dife-
renciado. O grupo C mais homogneo e o grupo B o que apresenta a maior variao das notas.
Nesse caso a variabilidade que distinta nos trs grupos no pode ser identicada apenas com as
medidas de posio, seria necessrio uma medida de disperso. As principais medidas de disperso
so: a amplitude total, a varincia e o desvio padro, o coeciente de variao e o erro padro da
mdia.
a) Amplitude total (A): corresponde a diferena entre a maior (mximo) e a menor observao
(mnimo) de um conjunto de dados.
i) Dados no agrupados: A = X
(n)
X
(1)
;
ii) Dados agrupados: A = x
k
x
1
, em palavras, a diferena entre o ponto mdio da ltima
classe e o ponto mdio da primeira classe.
Exemplos:
1. Encontre a amplitude total do conjunto de dados: 2, 3, 3, 5, 5, 5, 8, 10 e 12.
2. Utilizando o exemplo da distribuio de frequncias do peso (kg) de pessoas de uma
certa faixa etria, calcular a amplitude total:
Peso f
i
40 45 3
45 50 8
50 55 16
55 60 12
60 65 7
65 70 3
70 75 1
Total 50
Problemas associados a esta medida:
1. No considera todas as observaes no clculo;
2. No se tem ideia do comportamento dos dados entre os extremos;
3. Apresenta muita variao de uma amostra para outra, mesmo que ambas sejam
extradas da mesma populao.
Caractersticas desejadas em uma medida de disperso:
1. Considera todas as observaes no clculo;
2. facilmente calculvel e compreensvel;
3. Deve estar exposta o menos possvel as utuaes das amostras.
b) Varincia(s
2
) e desvio padro(s):
i) Dados no agrupados: s
2
=
Soma de quadrados dos desvios (SQD)
n1
=
n

i=1
(x
i
x)
2
n1
;
Desenvolvendo a soma de quadrados dos desvios e aplicando algumas propriedades algbricas,
obtm-se que: s
2
=
n

i=1
x
2
i

_
n

i=1
x
i
_
2
n
n1
.
13
ii) Dados agrupados: s
2
=
k

i=1
x
2
i
f
i

_
k

i=1
x
i
f
i
_
2
n
n1
Observaes:
1. O desvio padro (s) denido como sendo a raiz quadrada positiva da varincia, ou
seja, s =

s
2
;
2. Quanto as unidades dessas medidas de disperso, tem-se que o desvio padro possui
a mesma unidade dos dados, enquanto a varincia tem a unidade dos dados elevada
ao quadrado. Para a varincia a unidade no tem signicado fsico por estar ao
quadrado, o que diculta a interpretao
Exemplos:
1. Os dados a seguir referem-se a produo, em toneladas, de um certo produto de uma
indstria:
50 280 560 170 180 500 250 200 1050 240
180 1000 1100 120 420 510 480 90 870 360
Calcular a produo mdia da indstria, varincia e desvio padro.
2. Uma inspeo feita em uma amostra de 30 embalagens, cada uma contendo uma dzia
de ovos, ao serem transportados de uma granja at o local destinado, apresentou os
seguintes nmero de ovos danicados:
Nmero de ovos quebrados f
i
0 13
1 9
2 3
3 3
4 1
5 1
Total 30
Determinar a varincia.
3. Um estudo foi realizado para investigar a quantidade (em milhes) de passageiros
transportados em diferentes pocas do ano por uma grande empresa de transporte
urbano:
Classes f
i
1,5 4,5 5
4,5 7,5 10
7,5 10,5 12
10,5 13,5 6
13,5 16,5 7
Total 40
Pede-se: Determinar a mdia e o desvio padro.
Propriedades da varincia e do desvio padro:
1. Somando-se ou subtraindo-se uma constante k a cada observao, a varincia e o
desvio padro no se alteram.
2. Multiplicando-se ou dividindo-se cada observao por uma constante k, a nova vari-
ncia car multiplicada ou dividida por k
2
, e o novo desvio por k.
14
3. A varincia de uma constante igual a zero.
4. A varincia e o desvio padro so sempre positivos, e so usados todos os valores
observados em seu clculo.
c) Coeciente de variao: Conjuntos de dados com diferentes unidades de medida, ou mesmo
para uma nica unidade, se os conjuntos de dados possuem mdias diferentes, suas variabilida-
des no podem ser comparadas pela varincia ou desvio padro. Uma medida de variabilidade
que no depende desses fatores o coeciente de variao, que no possui unidade de medida
e pode ser calculado pela frmula:
CV =
s
x
100.
Exemplos:
1. Uma pesquisa sobre temperatura (
o
C) e presso (atm) em uma caldeira industrial
mostrou os seguintes resultados:
T(
o
C) 400 450 350 500 600 550
P(atm) 40 52 37 67 70 72
a) Calcular a mdia e o desvio padro para cada varivel;
b) Que atributo apresenta maior variabilidade?
2. Numa empresa, o salrio mdio dos homens de R$4000, com desvio padro de
R$1500, e o das mulheres e em mdia R$3000, com desvio padro de R$1200. Qual
salrio apresenta maior variabilidade?
d) Erro padro da mdia (s
x
): uma medida de disperso que mede a preciso com que a mdia
amostral foi calculada. Quanto menor for seu valor, mais provvel ser a chance de obter a
mdia da amostra nas proximidades da mdia da populao. O erro padro da mdia dado
por:
s
x
=
s

n
Observe que se n s
x
0
Exemplo:
1. Em um estudo sobre a acidez de algumas solues, o ph de um certo produto foi
medido, obtendo os seguintes resultados:
5,1 5,3 5,2 5,5 4,9
6,2 6,0 5,8 5,3 5,0
5,1 5,4 5,1 6,1 5,6
5,4 5,8 5,7 5,5 5,1
a) Calcular o erro padro da mdia usando as duas primeiras linhas dos dados;
b) Agora, utilize todos os dados;
15
2 Probabilidade
Neste captulo sero abordados os conceitos de probabilidade que do suporte para o estudo de
estatstica e experimentao. Quando fala-se de probabilidade, pretende-se identicar a chance de
ocorrncia de um determinado resultado de interesse, em situaes nas quais no possvel calcular
com exatido o valor real do evento. Desta forma, trabalha-se com chances ou probabilidades.
2.1 Conceitos
a) Experimento aleatrio: consiste em um experimento que pode ser efetuado repetidas vezes,
sob as mesmas condies de realizao, mas cujos resultados no so essencialmente os mesmos
em todas as repeties.
Exemplos:
1. Lanamento de uma moeda ou dado;
2. Tempo de vida til de um componente eletrnico;
3. Nmero de chamadas telefnicas que chegam a uma central em um intervalo de
tempo;
b) Espao amostral () : conjunto formado por todos os resultados possveis de um experimento.
c) Evento: um subconjunto do espao amostral.
Exemplos:
1. Uma fbrica produz determinado artigo. Da linha de produo so retirados trs
artigos, e cada um classicado como bom (B) ou defeituoso (D). Qual o espao
amostral associado a esse experimento? Se A denido como sendo dois artigos
bons, quais so os elementos pertencentes a esse evento?
2. Qual o espao amostral associado a um experimento que consiste em determinar
o tempo de decomposio industrial em um aterro sanitrio? Se A o evento o
tempo de decomposio est entre dois e doze anos, como pode ser representado
esse evento?
2.2 Operaes de conjuntos
As operaes com conjuntos podem ser aplicadas aos eventos. Ento dene-se:
a) Evento interseo (AB): o conjunto formado pelos resultados que pertencem aos eventos
A e B simultaneamente.
b) Evento unio (A B): o evento formado pelos resultados de A ou B, ou seja, os resultados
que pertencem a pelo menos um dos eventos.
c) Evento complementar (

A ou A
c
): o evento formado pelos resultados que no pertencem
ao evento considerado.
d) Evento mutuamente exclusivo: Dois eventos so mutuamente exclusivos se e somente se
A B = .
Se a unio de n eventos mutuamente exclusivos o prprio , temos que tais eventos formam
uma partio de .
16
2.3 Denio e axiomas de probabilidade
Probabilidade: a denio clssica de probabilidade nos diz que a probabilidade de ocorrer o
evento A denida como:
P(A) =
nmeros de casos favorveis
nmeros de casos possveis
=
A

=
n
N
Exemplos:
1. Qual a probabilidade de se retirar dois ou mais artigos bons, no experimento que tem por
nalidade classicar os artigos da linha de produo de uma fbrica?
2. Qual a probabilidade de obter duas caras em duas jogada de uma moeda?
Axiomas de Probabilidade:
Axioma 1: A probabilidade de um certo evento ocorrer corresponde a um nmero no ne-
gativo, ou seja, P(A) 0.
Axioma 2: A probabilidade de ocorrer todo o espao amostral igual a um, isto , P() = 1.
Axioma 3: Se A
1
, A
2
, , A
n
so eventos mutuamente exclusivos, P(A
1
A
2
A
n
) =
P(A
1
) +P(A
2
) + +P(A
n
)
A partir desses axiomas, pode-se enunciar as seguintes propriedades, que so teis no clculo de
probabilidades:
Propriedade 1: 0 P(A) 1, evento A .
Propriedade 2: P() = 0
Propriedade 3: Se A
1
A
2
, ento P(A
1
) P(A
2
)
Propriedade 4: P(A
c
) = 1 P(A)
Propriedade 5: P(A
1
A
2
) = P(A
1
) +P(A
2
) P(A
1
A
2
)
Exemplos:
1. Suponha que o seguinte quadro represente uma possvel diviso de alunos matriculados
na UFU em um determinado semestre:
Sexo
Cursos Masculino (M) Feminino (F) Total
Engenharia (E) 70 40 110
Matemtica (MT) 15 15 30
Qumica (Q) 10 20 30
Computao (C) 20 10 30
Total 115 85 200
Calcular:
a) A probabilidade de uma pessoa selecionada aleatoriamente estar matriculada em
engenharia;
17
b) P(M)?
c) P(MT M)?
d) P(E C)?
e) P(Q
c
)?
2. Considere um experimento e os eventos A e B associados a este experimento. Seja
P(A)= 1/2; P(B)= 1/3 e P(A B)= 1/4. Calcule:
a) P(A
c
);
b) P(A B);
c) P(A
c
B
c
);
d) P(A
c
B
c
);
e) Qual a probabilidade que B ocorra e A no ocorra.
2.4 Anlise Combinatria
Nem sempre possvel enumerar o espao amostral. Nestes casos, deve-se usar a anlise combi-
natria como processo de contagem. Nas combinaes estamos interessados somente em selecionar
objetos sem nos preocuparmos com a ordem. Assim, o nmero total de combinaes de n objetos
selecionados dentre os N objetos distintos, denotado por
_
N
n
_
:
_
N
n
_
=
N!
n!(Nn)!
.
Exemplos:
1. Em um congresso cientco existem 15 engenheiros e 12 arquitetos. Qual a probabili-
dade de se formar uma comisso com cinco membros, na qual gurem 3 engenheiros e 2
arquitetos?
2. Suponha que num lote com 20 peas existam 5 defeituosas, e escolhemos 4 peas do lote
ao acaso. Qual a probabilidade de se escolher duas peas defeituosas na amostra?
2.5 Probabilidade Condicional e Independncia
2.5.1 Probabilidade Condicional
Algumas vezes, as probabilidades necessitam ser reavaliadas medida que informaes adicionais
se tornam disponveis. Uma maneira de incorporar informao adicional em um modelo de probabi-
lidade considerar que o resultado gerado um elemento de um dado evento. Esse evento, denotado
por B, dene as condies em que se sabe que o resultado satisfatrio. Ento, as probabilidades
podem ser revistas de modo a incluir esse conhecimento. A probabilidade de um evento A, sabendo
qual ser o resultado do evento B, dada por P(A/B) e chamada de probabilidade condicional de
A dado B.
Desse modo, a probabilidade condicional P(A/B) denida como:
P(A/B) =
P(A B)
P(B)
com P(B) ,= 0
Analogamente,
P(B/A) =
P(B A)
P(A)
com P(A) ,= 0
Dessas expresses possvel denir a regra do produto de probabilidade:
P(A B) = P(B)P(A/B) = P(A)P(B/A)
18
Exemplos:
1. Utilizando os dados dos alunos matriculados em uma universidade, determine: Sabendo
que uma pessoa selecionada ao acaso est matriculada em matemtica, qual a probabili-
dade que ela seja do sexo masculino?
2. Num certo colgio, 4% dos homens e 1% das mulheres tm mais de 1,75 de altura. 60%
dos estudantes so mulheres. Um estudante escolhido ao acaso e tem mais de 1,75m.
Qual a probabilidade de que seja homem?
2.5.2 Eventos independentes
Da regra do produto de probabilidades, surge a denio de eventos independentes.
Dois eventos A e B so independentes se e somente se P(A/B) = P(A) ou P(B/A) = P(B).
Assim, se A e B forem independentes, temos:
P(A/B) =
P(A B)
P(B)
=P(A B) = P(A/B)P(B) =P(A B) = P(A)P(B)
Generalizando, vrios eventos so independentes entre si, se forem independentes dois a dois, ou
ainda: P(A B W) = P(A)P(B) P(W)
Exemplos:
1. Suponha que trs componentes de um sistema eltrico funcionam em srie. O sistema
funcionar se os componentes, 1, 2 e 3 funcionam simultaneamente. Suponha ainda que
cada componente funcione independentemente e que p
i
a probabilidade do componente
i funcionar, qual a probabilidade do sistema funcionar?
2. Suponha agora que um outro sistema constitudo por 4 componentes. Neste sistema
os componentes 1 e 2 funcionam em srie, e estes mesmos componentes funcionam em
paralelo com os componentes 3 e 4, que por sua vez funcionam em srie. A probabilidade
de cada um dos componentes funcionar de 0,90. Determinar a conabilidade deste
sistema funcionar.
3. A probabilidade de que um homem esteja vivo daqui a 30 anos 2/5; a de sua mulher
de 2/3. Determinar a probabilidade de que daqui 30 anos:
a) ambos estejam vivos;
b) somente o homem esteja vivo;
c) pelo menos um esteja vivo;
2.6 Teorema de Bayes
um importante teorema que expressa uma probabilidade condicional em funo de outras pro-
babilidades condicionais.
Teorema de Bayes: Sejam B
1
, B
2
, B
n
uma partio de , ou seja, B
i
B
j
= , i ,= j e
B
1
B
2
B
n
= . Considerando A um evento qualquer e conhecendo-se P(B
i
) e P(A/B
i
),
temos que:
P(B
i
/A) =
P(B
i
)P(A/B
i
)
n

i=1
[P(B
i
)P(A/B
i
)]
19
Exemplos:
1. Durante o ms de dezembro, a probabilidade de chover de 10%. Um time ganha um jogo
em um dia chuvoso, com 40% de probabilidade, e em um dia sem chuva, com 60% de pro-
babilidade. Tendo esse time ganho um jogo em um dia de dezembro, qual a probabilidade
de ter chovido nesse dia?
2. Considere cinco urnas cada uma com seis bolas. Duas dessas urnas (tipo C
1
), tem trs
bolas brancas, duas outras urnas (tipo C
2
), tem duas bolas brancas e a ltima (tipo C
3
)
tem seis bolas brancas. Escolhe-se uma urna ao acaso e retira-se uma bola desta. Qual a
probabilidade de que a urna escolhida seja do tipo C
3
, sabendo-se que a bola retirada
branca?
3. Para selecionar seus funcionrios, uma empresa oferece aos candidatos um curso de trei-
namento. Ao nal eles so submetidos a uma prova e 25% so classicados como bons
(B), 50% como mdios (M) e os restantes 25% como fracos (F). Para facilitar a seleo,
a empresa pretende substituir o treinamento por um teste contendo questes de conhe-
cimentos gerais e especcos. Para isso, gostaria de conhecer qual a probabilidade de
um indivduo aprovado no teste ser considerado fraco, caso zesse o curso. De acordo
com os resultados receberam os conceitos aprovado (A) ou reprovado (R). Sabendo que
P(A/B) = 0,80; P(A/M) = 0,50; e P(A/F) = 0,20, encontrar P(F/A).
20
3 Variveis aleatrias unidimensionais
Neste captulo ser apresentado o conceito de varivel aleatria unidimensional, tanto para o
caso discreto quanto para o caso contnuo, e tambm ser denida as principais funes que regem
as variveis aleatrias.
3.1 Denio de Variveis Aleatrias Unidimensionais
Considere um experimento aleatrio e o espao amostral associado a esse experimento. Uma
funo que associa valores reais aos eventos do espao amostral denida como uma varivel aleatria
(v.a.). Geralmente, as letras maisculas so utilizadas para representar a varivel aleatria, e as letras
minsculas os valores que esta varivel aleatria pode assumir. Por exemplo, se a varivel aleatria
representada por X, as realizaes dessa varivel aleatria representada pelos valores x
1
, x
2
, , x
n
.
As variveis aleatrias podem se classicar em discretas e contnuas. A varivel aleatria discreta
aquela que assume valores nitos, ou innito enumervel, de valores, j a varivel aleatria contnua
aquela que assume um nmero innito no enumervel de valores, ou seja, so valores oriundos de
grandezas mensuradas em uma escala real.
3.1.1 Varivel Aleatria Discreta
Uma varivel discreta X pode ser denida como aleatria discreta se a cada um de seus valores
se associa uma probabilidade P(X).
Exemplos:
1. Se um experimento consiste no lanamento de um dado, a funo: X: o dobro do valor
obtido menos um, dene uma varivel aleatria discreta, que pode assumir seis valores
possveis: 1, 3, 5, 7, 9 e 11 com probabilidade igual a 1/6.
2. Se um experimento consiste em observar o nmero de carros vendidos durante um dia em
uma garagem, conforme tabela abaixo:
Vendas de carros Dias P(X)
0 54 54/300 = 0,18
1 117 117/300 = 0,39
2 72 72/300 = 0,24
3 42 42/300 = 0,14
4 3 3/300 = 0,01
5 12 12/300 = 0,04
Total 300 1,00
e Y for denido como sendo o nmero de carros vendidos em um dia, Y poder assumir os
valores 0, 1, 2, 3, 4 e 5 com probabilidade 0,18; 0,39; 0,24; 0,14; 0,01 e 0,04, respectivamente.
Distribuio de Probabilidade
Para cada valor x
1
, x
2
, , x
n
que a varivel aleatria X assume sero atribudos nmeros reais,
representando as probabilidades de a varivel aleatria X ser igual a esses valores. Essas proba-
bilidades sero denotadas por P(X = x
1
) = p
1
, P(X = x
2
) = p
2
, , P(X = x
n
) = p
n
, e devem
satisfazer s seguintes condies:
a) 0 p
i
1 i = 1,2, , n.
21
b)
n

i=1
p
i
= 1.
As probabilidades p
i
, i = 1,2, , n formam o que se denomina funo de probabilidade da
varivel aleatria X.
Para quaisquer valores de a e b, tem-se que P(a < X < b) =
b

x
i
>a
P(X = x
i
).
Para os exemplos dados anteriormente, as distribuies de probabilidade nestes casos so:
X 1 3 5 7 9 11
P(X = x) 1/6 1/6 1/6 1/6 1/6 1/6 1,00
Y 0 1 2 3 4 5
P(Y = y) 0,18 0,39 0,24 0,14 0,01 0,04 1,00
3.1.2 Varivel Aleatria Contnua
A varivel aleatria dita contnua se corresponder a dados de medida, pertencentes aos R. O
conceito de v.a. contnua ser mais bem entendido por meio dos seguintes exemplos:
1. Se um experimento consiste em vericar as alturas de 30 universitrios, a funo: X: Altura de
um universitrio, dene uma varivel aleatria contnua, que pode assumir quaisquer valores
entre 130 e 220 cm.
2. Se um experimento consiste em mensurar os pesos dos 30 universitrios, a funo: Y : Peso de
um universitrio, dene uma varivel aleatria contnua, que pode assumir quaisquer valores
entre 60 e 130 kg.
3. Se um experimento consiste em vericar a durabilidade de um lote de 50 pneus, a funo:
Z: tempo de vida til de um pneu, dene uma v.a. contnua, que pode assumir quaisquer
valores entre 50.000 e 70.000 km.
Com base nos exemplos apresentados, a varivel aleatria contnua est vinculada a dados oriun-
dos de uma mensurao que resultam a um intervalo de nmeros reais.
Funo Densidade de Probabilidade
Se a varivel aleatria X contnua, dene-se uma funo, denotada por f(x), e denominada
funo densidade de probabilidade (f.d.p.) da varivel aleatria X, que representa, sicamente,
a curva das probabilidades de todos os innitos valores de X. Deste modo, reas sero usadas para
representar as probabilidades, e probabilidades so valores numricos positivos, portanto, a funo
densidade deve estar inteiramente acima do eixo x.
Uma funo de densidade de probabilidade construda de modo que a rea abaixo da curva
at o eixo x seja igual a 1, quando calculada para a amplitude de X para o qual f(x) foi denida.
Se essa amplitude de X for um intervalo nito, sempre possvel estender o intervalo para incluir o
conjunto inteiro dos reais, denindo-se f(x) como sendo igual a zero em todos os pontos nas pores
estendidas do intervalo. Isso vlido pois uma varivel contnua X tem uma probabilidade zero
de assumir exatamente qualquer um de seus valores. Essa funo f(x) deve satisfazer s seguintes
propriedades:
a) f(x) 0, para todo x R
22
b)
_
+

f(x)dx = 1
c) P(a x b) = P(a x < b) = P(a < x b) = P(a < x < b) =
_
b
a
f(x)dx, a e b.
Exemplo:
1. Suponha que o erro na temperatura de reao (em
0
C), para um experimento de labo-
ratrio controlado, seja a varivel aleatria contnua X, que tem a seguinte funo de
densidade de probabilidade:
f(x) =
_
x
2
3
, se 1 < x < 2
0, caso contrrio
a) Verique se as propriedades (a) e (b) de f(x) so satisfeitas;
b) Determine a P(0 < X 1)
3.2 Funo Repartio ou Funo de Distribuio Acumulada
A funo de distribuio acumulada nos fornece a probabilidade de que a varivel em questo
esteja abaixo de um determinado valor. Em geral, ela representada por F(X) ou (X). Assim,
F(X) = P(X x).
Varivel Aleatria Discreta:
Para uma varivel aleatria discreta a funo de distribuio acumulada ser denida como:
F(x) = P(X x) =

x
i
<x
P(X = x
i
) para < x < +.
Varivel Aleatria Contnua:
Para uma varivel aleatria contnua a funo de distribuio acumulada ser denida como:
F(x) = P(X x) =
_
x

f(t)dt para < x < +.


Propriedades da Funo Repartio ou Funo de Distribuio Acumulada
i) 0 F(X) 1
ii) F() = lim
x
F(x) = 0
iii) F(+) = lim
x+
F(x) = 1
iv) F(x) sempre crescente
v) P(a x b) = F(b) F(a), se b > a
Exemplos:
1. Um carregamento de oito microcomputadores similares para um ponto-de-venda contm
trs que apresentam defeitos. Se uma escola faz uma compra aleatria de dois desses
microcomputadores, pede-se:
a) Determinar a distribuio de probabilidade para o nmero de microcomputadores
defeituosos;
b) P(0 X 1);
c) Obter a funo de distribuio acumulada.
23
2. O dimetro X de um cabo eltrico uma v.a. contnua denida pela seguinte funo:
f(x) =
_
_
_
0 para x < 0
k(2x x
2
) para 0 x 1
0 para x > 1
a) Encontre o valor de k para que f(x) seja uma funo densidade de probabilidade;
b) Calcular a probabilidade de x ser menor que 0,5;
c) Obter a distribuio acumulada F(X).
3.3 Parmetros caractersticos de uma Distribuio de Probabilidade
3.3.1 Esperana Matemtica
Muitas vezes tem-se o interesse em estimar parmetros caractersticos de uma distribuio de
probabilidade de uma varivel aleatria qualquer. Um desses parmetros a Esperana Matemtica,
que representa uma mdia aritmtica ponderada ou um valor esperado de uma varivel aleatria.
Na prtica, a esperana pode ser entendida como um centro de distribuio de probabilidade, isto
, a mdia de uma distribuio de probabilidade.
A Esperana Matemtica denida da seguinte forma:
Se X uma varivel aleatria discreta:

x
= E(X) =
n

i=1
x
i
P(X = x
i
)
Se X uma varivel aleatria contnua:

x
= E(X) =
_
+

xf(x)dx
Propriedades da Esperana Matemtica
i) E(k) = k, sendo k uma constante
ii) E(kX) = kE(X)
iii) E(X Y ) = E(X) E(Y )
iv) E(X K) = E(X) K
v) E(XY ) =E(X)E(Y ) se X e Y so variveis aleatrias independentes.
3.3.2 Varincia e desvio padro
Anteriormente foi apresentado que a esperana matemtica fornece a mdia de uma distribuio
de probabilidade. Porm, nestas situaes no se tem a informao a respeito do grau de disperso
das probabilidades em torno da mdia. Portanto, a medida que ser utilizada para estimar o grau
de disperso (ou de concentrao) de probabilidade em torno da mdia ser a varincia.
A varincia denida da seguinte forma:
V (X) =
2
x
= E(X
2
) [E(X)]
2
= E(X
2
)
2
24
Se X uma varivel aleatria discreta, ento a esperana matemtica E(X
2
)
dada por :
E(X
2
) =
n

i=1
x
2
i
P(X = x
i
)
Se X uma varivel aleatria contnua, ento a esperana matemtica E(X
2
) :
E(X
2
) =
_
+

x
2
f(x)dx
O desvio padro obtido por meio da seguinte expresso:
x
=
_

2
x
.
Propriedades da Varincia
i) V (k) = 0, sendo k uma constante;
ii) V (kX) = k
2
V (X)
iii) V (X K) = V (X)
iv) V (X Y ) = V (X) V (Y ), se X e Y so variveis aleatrias independentes
Exemplos:
1. Um estudo do nmero de carros alugados em uma operadora durante certo perodo do
ano foi realizado e obteve se a seguinte funo de probabilidade:
X 0 1 2 3 4
P(X = x) 0,05 0,25 0,36 0,21 0,13
Obter a mdia e o desvio padro para esses dados.
2. Dada a v.a. contnua com a seguinte funo densidade de probabilidade:
f(x) =
_

_
0 para x < 0
k para 0 x < 1
k(2 x) para 1 x < 2
0 para x 2
a) Determinar o valor de k para que f(x) seja uma funo densidade de probabilidade;
b) Esboce o grco de f(x);
c) Encontre a distribuio acumulada F(X);
d) Construa o grco de F(X)
e) Calcular a esperana, a varincia e o desvio padro de f(x).
25
4 Variveis Aleatrias Bidimensionais
Em muitas situaes, pode-se estar interessado em observar duas caractersticas simultanea-
mente. Neste casos, deve-se tratar cada caracterstica como uma varivel aleatria, e, portanto, as
duas variveis aleatrias conjuntamente como uma varivel bidimensional.
4.1 Denio de Variveis Aleatrias Bidimensionais
Considere um experimento aleatrio e o espao amostral associado a esse experimento. Sejam X
e Y duas variveis aleatrias. Ento, (X, Y ) dene uma varivel aleatria bidimensional. Os valores
da varivel aleatria bidimensional (X, Y ) so representados pelos pares ordenados (x,y). Se tanto a
varivel aleatria X quanto a varivel aleatria Y assumirem um nmero nito ou innito numervel
de valores, ento dizemos que a varivel aleatria bidimensional discreta. Caso a varivel aleatria
X e a varivel aleatria Y assumirem, cada uma, um nmero innito no enumervel de valores,
ento a varivel bidimensional considerada uma varivel aleatria contnua.
Pode acontecer o caso de uma varivel aleatria ser discreta e a outra varivel aleatria ser
contnua. No entanto, somente os casos em que ambas as variveis so discretas ou ambas so
contnuas ser abordado neste curso.
4.2 Varivel Aleatria Discreta
Seja (X, Y ) uma varivel aleatria bidimensional discreta. A cada valor possvel (x, y) associa-
se um nmero real, denotado por p(x,y), representando a probabilidade de a varivel aleatria X
assumir o valor x, ao mesmo tempo em que a varivel aleatria Y assume o valor y, isto , p(x, y) =
P(X = x, Y = y). O conjunto de todas as probabilidades p(x, y), para todos os valores vlidos para
as variveis aleatrias X e Y , denido como a funo conjunta de probabilidades da varivel
aleatria bidimensional discreta (X, Y ). Esses nmeros p(x, y), como representam probabilidades,
devem satisfazer s seguintes condies:
a) 0 p(x, y) 1 para todo (x, y)
b)

y
p(x, y) = 1
Exemplos:
1. Uma fbrica produz determinado tipo de pea. A pea pode ser produzida por duas
linhas de produo distintas. A capacidade de produo da linha I de 4 peas por hora,
e a capacidade de produo da linha II de 3 peas por hora. Representando o nmero
de peas realmente produzidas pelas duas linhas em uma determinada hora atravs de
uma varivel aleatria bidimensional (X,Y ), ento o nmero de peas produzidas pela
linha I representar a varivel X e o nmero de peas produzidas pela linha II a varivel
Y . Sendo assim, tem-se a seguinte funo conjunta de probabilidades:
Y X 0 1 2 3 4 Total
0 0,01 0,01 0,05 0,08 0,11 0,26
1 0,01 0,02 0,06 0,09 0,06 0,24
2 0,01 0,03 0,06 0,07 0,08 0,25
3 0,01 0,02 0,05 0,09 0,08 0,25
Total 0,04 0,08 0,22 0,33 0,33 1
Determinar a probabilidade de a linha I produzir um nmero maior de peas do que
a linha II em uma determinada hora.
26
2. A funo de probabilidade conjunta da varivel aleatria bidimensional discreta (X, Y )
p(x, y) = c(2x +y), em que 0 x 2 e 0 y 3.
a) Determinar o valor da constante c e obter a funo conjunta da varivel bidimen-
sional (X, Y );
b) Calcular a P(X 1; Y 2);
4.2.1 Distribuies de Probabilidades Marginais
Se mais de uma varivel aleatria for denida em um experimento aleatrio, ser importante
distinguir entre a distribuio de probabilidades conjuntas de X e Y e a distribuio de probabili-
dades de cada varivel individualmente. A distribuio individual de probabilidade de uma varivel
aleatria referida como a distribuio de probabilidades marginais.
Em geral, a distribuio de probabilidades marginais de X pode ser determinada a partir da
distribuio de probabilidades conjuntas de X e de outras variveis aleatrias.
Se X e Y so variveis aleatrias discretas, com funo de probabilidade conjunta P(X,Y ), ento
as funes de probabilidades marginais de X e Y so:
p(x) = P(X = x) =

Todo y
p(x, y) e p(y) = P(Y = y) =

Todo x
p(x, y)
importante lembrar que, como p(x) e p(y) so funes de probabilidade, ento as condies
0 p(x) 1 e

x
p(x) = 1 devem ser satisfeitas, e, analogamente, 0 p(y) 1 e

y
p(y) = 1.
Voltando ao exemplo anterior das linhas de produo, tem-se que as probabilidades marginais
de X e Y so dados, respectivamente, por:
x 0 1 2 3 4
p(x) 0,04 0,08 0,22 0,33 0,33 1
y 0 1 2 3
p(y) 0,26 0,24 0,25 0,25 1
Observao:
1. A E(X), E(Y ), V (X) e V (Y ) podem ser obtidas calculando as distribuies marginais
de X e Y , e em seguida, determinando as esperanas e varincias pelo mtodo usual.
4.2.2 Distribuies de Probabilidades Condicionais
A probabilidade condicional de variveis aleatrias bidimensionais calculada de forma seme-
lhante probabilidade condicionada de eventos, vista no captulo de probabilidades. Desse modo, a
funo de probabilidade condicionada de X dado que Y = y, denotada por p(x[y), denida por:
P(X = x[Y = y) =
P(X = x; Y = y)
P(Y = y)
Exemplos:
1. Utilizando novamente o exemplo das duas linhas de produo, calcule:
a) P(X=0|Y=0)
b) P(X=2|Y=1)
c) P(X=4|Y=3)
27
2. Sejam X e Y duas variveis aleatrias, representando, respectivamente, o nmero de gols
marcados pela equipe A e o nmero de gols marcados pela equipe B em um campeonato de
futebol. Portanto, possvel expressar a funo de probabilidade conjunta dessa varivel
aleatria bidimensional discreta por meio da seguinte tabela:
Y X 0 1 2 3 p(y)
0 0,04 0,08 0,04 0,04 0,2
1 0,08 0,16 0,08 0,08 0,4
2 0,08 0,16 0,08 0,08 0,4
p(x) 0,2 0,4 0,2 0,2 1
a) Qual a probabilidade do nmero de gols marcados pela equipe A, sabendo que a
equipe B marcou um gol?
4.2.3 Variveis Aleatrias independentes
Diz-se que X e Y so variveis aleatrias independentes quando o resultado de X, por exemplo,
de modo algum no inuencia o resultado de Y , e vice-versa, ou seja, p(x[y) = p(x) para todo x e
y, ou equivalentemente, se p(y[x) = p(y) para todo x e y.
Assim, se (X, Y ) uma varivel aleatria bidimensional discreta, diz-se que X e Y so variveis
independentes se, e somente se,
p(x, y) = p(x)p(y)
para quaisquer x e y. Essa relao consequncia do conceito de probabilidade condicionada, pois
por exemplo, como P(X = x[Y = y) =
P(X=x;Y =y)
P(Y =y)
e, no caso de independncia, p(x[y) = p(x),
segue que p(x, y) = p(x)p(y).
Exemplo:
1. Verique se as variveis bidimensionais (X, Y) do exemplo das linhas de produo e
tambm das equipes do campeonato de futebol so independentes.
4.2.4 Funes de Variveis Aleatrias
Seja (X, Y ) uma varivel aleatria bidimensional discreta. Seja W = H(X, Y ) uma funo da
varivel aleatria bidimensional discreta (X, Y ). Ento, W ser uma varivel aleatria unidimensi-
onal discreta, e neste caso, tem-se o interesse em obter a sua funo de probabilidade p(w), que
obtida a partir da funo H(X, Y ) e dos valores assumidos pelas variveis X e Y .
Exemplos:
1. Utilizando os dados do exemplo das linhas de produo considere a varivel W = X +Y
que representa o nmero total de peas produzidas pelas duas linhas, em uma determinada
hora.
a) Determinar a funo de probabilidade da varivel aleatria W
b) Calcular a E(X), E(Y ), E(W)
2. Sejam X e Y variveis aleatrias que representam o nmero de carros importados e o
nmero de carros nacionais, respectivamente, que uma concessionria vende ao longo de
uma semana, conforme a tabela a seguir:
y
x 0 1 2 3
0 0,015 0,06 0,045 0,03
1 0,05 0,20 0,15 0,10
2 0,035 0,14 0,105 0,07
28
a) Calcule as distribuies marginais das variveis X e Y ;
b) Obtenha a distribuio da varivel Z = X.Y
c) Calcule E(X), E(Y ), E(Z)
4.2.5 Covarincia de duas variveis aleatrias
A covarincia entre duas variveis aleatrias uma medida de relao linear entre as variveis.
Se X e Y so duas variveis aleatrias, a covarincia de X e Y denida por:
cov(X,Y ) = E[(X E(X))(Y E(Y ))].
Para a varivel aleatria discreta esta frmula pode ser reescrita como:
cov(X,Y ) =

y
[X
i
E(X
i
)][Y
i
E(Y
i
)]P(x
i
, y
i
)
ou ainda,
cov(X,Y ) = E(XY ) [E(X)E(Y )]
.
Exemplos:
1. Verique se as variveis do exemplo das linhas de produo e tambm do exemplo das
vendas dos carros importados e nacionais so correlacionadas;
Denio:
Quando a cov(X,Y ) = 0, tem-se que X e Y so variveis aleatrias no correlacionadas
linearmente.
Proposio:
Se X e Y so duas variveis aleatrias independentes, cov(X,Y ) = 0. No entanto, a recproca
no verdadeira.
Teorema:
Para duas variveis aleatrias X e Y tem-se que:
a) V(X+Y)=V(X)+V(Y)+2cov(X,Y);
b) Se X e Y so independentes, ento: V(X+Y)=V(X)+V(Y)
4.2.6 Coeciente de correlao
H uma outra medida da relao entre duas variveis aleatrias que frequentemente mais fcil
de interpretar que a covarincia.
A correlao entre as variveis aleatrias X e Y , denotada por (X,Y ) :
(X,Y ) =
cov(X,Y )
_
V (X)V (Y )
=

X,Y

Y
Observaes:
1. Para quaisquer duas variveis aleatrias X e Y , 1 (X,Y ) +1.
2. Quando (X,Y ) = 1 existe uma relao linear perfeita entre X e Y (direta).
29
3. Quando (X,Y ) = 1 existe uma relao linear inversa perfeita entre X e Y .
4. Na equao de regresso linear (Y = ax +b), temos: Se a > 0 ento (X,Y ) positivo e
se a < 0 ento (X,Y ) negativo.
Exemplo:
1. Para os exemplos das linhas de produo e das vendas dos carros importados e nacionais
calcule o coeciente de correlao;
4.3 Varivel aleatria contnua
Seja (X,Y ) uma varivel aleatria bidimensional contnua. Isso signica que tanto a varivel
aleatria X quanto a varivel aleatria Y assumem, cada uma, um nmero innito no enumervel
de valores. Portanto, a varivel aleatria bidimensional contnua (X,Y ) pode assumir um nmero
innito no enumervel de valores.
A funo densidade de probabilidade conjunta da varivel aleatria bidimensional contnua
(X,Y ), denotada por f(x,y) e representando a superfcie de probabilidades dos valores (x,y) que a
varivel aleatria (X,Y ) assume , uma funo que deve satisfazer s seguintes condies:
a) f(x,y) 0 para todo par (x,y);
b)
_
+

_
+

f(x,y)dxdy = 1
O clculo da probabilidade de a X b e c Y d dado por:
P(a X b, c Y d) =
_
b
a
_
d
c
f(x,y)dydx
Exemplos:
1. Suponha que a varivel aleatria bidimensional contnua (X,Y ) tenha a funo densidade
de probabilidade conjunta dada por: f(x,y) = x
2
+
xy
3
, 0 x 1 e 0 y 2.
a) Verique se f(x, y) uma funo densidade de probabilidade conjunta.
b) Calcular P(X 1/2; Y 1/2)
4.3.1 Funo densidade de probabilidade marginal
De modo anlogo as variveis discretas, pode-se estar interessado na funo densidade de proba-
bilidade da varivel aleatria X ou na funo de densidade de probabilidade da varivel aleatria Y ,
determinadas, respectivamente, funo densidade de probabilidade marginal de X denotada g(x), e
funo densidade de probabilidade marginal de Y , denotada por h(y). Essas funes so denidas
da seguinte maneira:
g(x) =
_
+

f(x,y)dy e h(y) =
_
+

f(x,y)dx.
importante lembrar que, como g(x) e h(y) so funes densidade de probabilidade, g(x) 0
para todo x e
_
+

g(x)dx = 1, assim como h(y) 0 para todo y e


_
+

h(y)dy = 1.
Por meio destas funes g(x) e h(y), pode-se calcular a probabilidade de ocorrer x ou a proba-
bilidade de ocorrer y.
30
Exemplos:
1. Voltando ao exemplo anterior:
a) Determine a funo de densidade de probabilidade marginal da varivel X e da
varivel Y .
b) Qual a probabilidade de x estar entre 0,2 e 0,4?
c) Qual a probabilidade de y estar entre 0,5 e 0,75?
4.3.2 Distribuies de Probabilidade Condicionais
Sejam X e Y variveis aleatrias contnuas com funo densidade conjunta f(x,y) e distribuies
marginais g(x) e h(y).
A funo densidade de probabilidade condicional de X, dado que Y = y denida por:
f(X[Y = y) =
f(x,y)
h(y)
, h(y) > 0,
e funo densidade de probabilidade condicional de Y , dado que X = x dada por:
f(Y [X = x) =
f(x,y)
g(x)
, g(x) > 0,
Exemplos:
1. Utilizando o exemplo da varivel aleatria bidimensional contnua (X,Y ), com funo
densidade de probabilidade conjunta dada por: f(x,y) = x
2
+
xy
3
, 0 x 1 e 0 y 2,
pede-se:
a) Determinar f(x[y) e f(y[x);
b) Calcular P(Y < 1/2[X < 1/2)
2. Seja (X,Y ) uma varivel aleatria bidimensional contnua com funo densidade de pro-
babilidade conjunta dada por: f(x,y) = cx(1 y), 0 < x < 1 e 0 < y < 1. Calcular:
a) O valor da constante c.
b) A funo densidade de probabilidade condicionada f(x[y).
c) A funo densidade de probabilidade condicionada f(y[x).
4.3.3 Variveis Aleatrias Independentes
Diz-se que X e Y so variveis aleatrias contnuas independentes quando o resultado de X,
por exemplo, de modo algum no inuencia o resultado de Y , e vice-versa, ou seja, X e Y sero
independentes se g(x[y) = g(x), ou equivalentemente, se h(y[x) = h(y), para todo x e y.
Ento seja (X,Y ) uma varivel aleatria bidimensional contnua. Diz-se que X e Y so variveis
aleatrias contnuas independentes se, e somente se,
f(x,y) = g(x)h(y)
para todo x e y, em que f(x,y) a funo densidade de probabilidade conjunta da varivel aleatria
bidimensional (X,Y ), e g(x) e h(y) so as funes densidade de probabilidade marginais de X e
Y , respectivamente. Essa relao consequncia do conceito de probabilidade condicionada: como
g(x[y) =
f(x,y)
h(y)
, para todo x e y, logo f(x,y) = g(x)h(y) e, no caso de independncia, g(x[y) = g(x),
para todo x e y, logo f(x,y) = g(x)h(y); analogamente, como h(y[x) =
f(x,y)
g(x)
e, no casos de
independncia, h(y[x) = h(y), para todo x e y, logo f(x,y) = g(x)h(y).
31
Exemplos:
1. Utilizando novamente o exemplo da varivel aleatria bidimensional contnua (X,Y ), com
funo densidade de probabilidade conjunta dada por: f(x,y) = x
2
+
xy
3
, 0 x 1 e
0 y 2, vericar se as variveis X e Y so independentes.
2. O consumo de gasolina de uma marca de carro em determinada viagem representado por
uma varivel aleatria X com funo densidade de probabilidade dada por: f(x) =
x
2
,
0 < x < 2, e consumo de leo representado por uma varivel aleatria Y com funo
densidade de probabilidade dada por g(y) =
y
3
4
, 0 < y < 2. Supondo que o consumo de
gasolina e o consumo de leo sejam independentes, qual a probabilidade de o consumo de
leo ser menor que o consumo de gasolina?
32
5 Distribuio de variveis aleatrias discretas
Neste capitulo sero considerados alguns modelos probabilsticos especcos que desempenham
importante papel na estatstica.
5.0.4 Distribuio Uniforme discreta
a mais simples das distribuies de variveis aleatrias discretas, e cada valor particular dessa
varivel assume probabilidade constante.
Dessa forma, se X assume os valores x
1
, x
2
, , x
k
com igual probabilidade, ento a distribuio
uniforme discreta dada por:
P(X = x
i
) =
1
k
, i = 1,2, , k em que k o nmero de possibilidades.
Mdia e varincia:
E(X) =
x
=
k

i=1
x
i
1
k
=
1
k
k

i=1
x
i
e
V (X) =
2
x
=
(k + 1)(k 1)
12
Exemplo:
1. Uma caixa contm quatro lmpadas, sendo uma de 40, uma de 60, uma de 75 e uma de
100 watts. Se X representa a intensidade da voltagens das lmpadas:
a) Monte a distribuio de probabilidade, caso seja selecionada uma lmpada aleato-
riamente.
5.1 Distribuio Bernoulli
Considere uma nica realizao de um experimento aleatrio, em que podem ocorrer dois resul-
tados possveis: sucesso ou fracasso.
Exemplos:
1) O jogador de basquete pode acertar ou no o arremesso de uma bola na cesta;
2) Um consumidor pode comprar ou no um produto em uma certa loja;
3) Uma pea produzida por uma indstria pode ser perfeita ou defeituosa;
Associando-se uma varivel aleatria X aos possveis resultados do experimento, de forma que:
X =
_
1 se ocorrer o sucesso,
0 se ocorrer o fracasso,
segue que a varivel aleatria X, ter uma distribuio de Bernoulli, com probabilidade de sucesso
p e probabilidade de fracasso q, com p + q = 1. Nessas condies, a sua funo de probabilidade
dada por:
P(X = x) = p
x
q
1x
,
sendo q = 1 p.
33
Mdia e varincia:
E(X) =
x
=
1

i=0
xP(X = x) = 0.q + 1.p = p
V (X) = p(1 p) = p.q
Exemplos:
1. Em uma competio ganha aquele que indicar um nmero qualquer da face de um dado
e aps lan-lo obter aquele nmero, em uma nica jogada. Qual a probabilidade mdia
esperada, assim como sua varincia?
2. Uma urna tem 30 bolas brancas e 20 verdes. Retira-se uma bola dessa urna. Seja X o
nmero de bolas verdes. Calcular P(X = 1), E(X) e
2
x
.
5.2 Distribuio Binomial
uma generalizao da distribuio de Bernoulli. a mais importante das distribuies tericas
de probabilidade para variveis discretas. So realizadas n tentativas independentes de um mesmo
experimento. Cada tentativa um ensaio de Bernoulli, ou seja, podem ocorrer apenas dois resultados
possveis: o sucesso ou fracasso. A probabilidade de sucesso (p) em cada ensaio constante. Como as
probabilidades p de sucesso se mantm constantes em cada ensaio, a distribuio binomial indicada
para os casos em que a amostragem feita com reposio.
Seja a varivel aleatria X que conta o nmero total de sucessos obtidos numa sequncia de n
ensaios independentes de Bernoulli. A varivel X segue uma distribuio binomial com parmetros
n e p, denotada por X B(x; n, p), e tem funo de probabilidade:
P(X = x) =
_
n
x
_
p
x
q
nx
, x = 1, 2, 3, , n,
em que: n o nmero de repeties do experimento;
x o nmero desejado de sucessos;
n x o nmero esperado de fracassos;
p a probabilidade de sucesso num ensaio individual;
1 p a probabilidade de fracasso num ensaio individual;
Mdia e varincia:
E(X) =
x
= np

2
x
= npq
Funo Probabilidade Acumulada F(X):
F(X) = P(X x) =
n

i=1
P(X = x
i
)
Exemplos:
34
1. Sabendo-se que a probabilidade de um certo tipo de componente sobreviver a um teste
de choque 3/4, qual a probabilidade de que dentre 3 componentes testados:
a) Nenhum sobreviva ao teste;
b) Apenas um sobreviva;
c) Dois sobreviva;
d) Todos os trs sobreviva.
e) Se X representa o nmero de componentes que sobrevivem ao teste de choque,
determine a funo de probabilidade de X e seu respectivo grco.
f) Determine a distribuio acumulada de X e seu respectivo grco.
g) Determine a esperana matemtica e a varincia de X.
2. Num determinado processo de fabricao, 10% das peas produzidas so consideradas
defeituosas. As peas so acondicionadas em caixas com cinco unidades cada uma.
a) Qual a probabilidade de haverem exatamente trs peas defeituosas em uma
caixa?
b) Qual a probabilidade de haverem exatamente duas ou mais peas defeituosas em
uma caixa?
c) Qual a probabilidade de uma caixa no apresentar nenhuma pea defeituosa?
d) Supondo que uma empresa pague uma multa de R$10,00 por caixa que apresente
peas defeituosas, qual valor esperado dessa multa em um lote de 1000 caixas?
5.3 Distribuio Poisson
A distribuio de Poisson ocorre quando se tem o interesse em contar o nmero de sucessos
ocorridos em um experimento, em um intervalo de tempo, de superfcie (rea) ou volume. Uma
varivel aleatria X com distribuio de Poisson pode assumir innitos valores no conjunto dos
inteiros positivos (v.a. discreta).
Exemplos:
1) Nmero de telefonemas recebidos por hora em um escritrio;
2) Nmero de bactrias por unidade de rea em uma lmina;
3) Nmero de erros de digitao por pgina;
4) Nmero de veculos que passam num cruzamento por hora;
5) Nmero de mortes por ataque de corao por ano em Uberlndia;
A varivel aleatria X com distribuio Poisson tem funo de probabilidade dada por:
P(X = x) =
e

x
x!
,
sendo: X o nmero de sucessos em um intervalo;
e = 2,718;
a mdia de ocorrncia de sucessos (tempo, rea ou volume).
Mdia e varincia:
E(X) =
x
=
35
V (X) =
2
x
=
A distribuio de Poisson tem aplicao tambm nos casos em que os parmetros n e p da
distribuio binomial dicultam o clculo por essa distribuio (eventos raros). Isso acontece quando
a probabilidade de sucesso muito pequena e quando o nmero de experincias n muito grande
(p 0 e n ). Nestes casos a distribuio de Poisson usada como uma aproximao da
distribuio binomial, sendo a aproximao considerada adequada quando (n 50 e p < 0,1). Neste
caso, a mdia da Poisson ser: = = n.p
Exemplos:
1. Durante um experimento de laboratrio, o nmero mdio de partculas que passam no
contador em um milsimo de segundo quatro.
a) Qual a probabilidade de que seis partculas entrem em um dado contador, em
um especco milsimo de segundo?
b) Qual a probabilidade de que 10 partculas entre no contador, em 5 milsimos de
segundo?
c) Qual a probabilidade de que no mnimo uma partcula entre em um dado conta-
dor, em dois milsimos de segundo?
2. Em certa instalao industrial, acidentes ocorrem com baixa frequncia. Sabe-se que a
probabilidade de um acidente em certo dia de 0,005, e os acidentes so independentes
uns dos outros.
a) Qual a probabilidade de que, em qualquer perodo de 400 dias, haja 1 acidente
em um dia?
b) Qual a probabilidade de que haja no mximo trs dias com acidentes?
5.4 Distribuio Geomtrica
Suponha que um experimento aleatrio seja realizado e que exista o interesse apenas na ocorrncia
de algum evento A de interesse. O experimento aleatrio pode ser realizado repetidas vezes, e
as repeties so independentes. Em cada repetio do experimento, a probabilidade do sucesso
permanece constante. O experimento ser repetido at que o evento de interesse ocorra pela primeira
vez.
Assim, se a varivel aleatria X for denida como sendo o nmero de fracassos ao primeiro
sucesso ou o tempo de espera para a ocorrncia do primeiro sucesso, ento a varivel aleatria X
segue a distribuio geomtrica com parmetro p, ou seja, X geom(p), e tem funo funo de
probabilidade dada por:
P(X = x) = q
x1
p,
sendo: x = 1,2,3,..., n;
p a probabilidade de ocorrer o sucesso;
q a probabilidade de ocorrer o fracasso.
Mdia e varincia:
E(X) =
x
=
1
p
V (X) =
2
x
=
q
p
2
36
Exemplos:
1. A probabilidade de que um sinal de trnsito esteja aberto numa esquina de 0,20. Qual
a probabilidade de que seja necessrio passar pelo local dez vezes, para encontrar o sinal
aberto pela primeira vez?
2. As linhas telefnicas em um sistema de reservas de uma companhia area esto ocupadas
40% do tempo. Suponha que os eventos em que as linhas estejam ocupadas em sucessivas
chamadas sejam independentes. Qual a probabilidade de terem de ser realizadas cinco
chamadas at a primeira chamada no estar com a linha ocupada?
5.5 Distribuio Pascal
uma generalizao da distribuio geomtrica. Neste caso, suponha que um experimento
seja realizado e que exista o interesse apenas na ocorrncia de algum evento A. O experimento
aleatrio pode ser realizado repetidas vezes, e as repeties so independentes. Em cada repetio
do experimento, a P(A) = p e a P(A
c
) = 1p permanecem as mesmas. O experimento ser repetido
at que o evento A de interesse ocorra exatamente r vezes.
Desse modo, denindo a varivel aleatria X como o nmero de repeties independentes do
experimento aleatrio necessrias para que o evento A possa ocorrer exatamente r vezes, essa varivel
segue uma distribuio de Pascal, com parmetros p e r, ou seja, X Pascal(p, r). Evidentemente,
se r = 1, a varivel aleatria X ter distribuio geomtrica.
Sabe-se, ento, que X assume o valor x se, e somente se, o evento A de interesse tiver ocorrido
exatamente (r 1) vezes nas (x 1) repeties anteriores. Assim, a funo de probabilidade da
varivel aleatria X dada por:
P(X = x) =
_
x 1
r 1
_
p
r
(1 p)
xr
, x = r, r + 1, ...
Mdia e varincia:
E(X) =
r
p
V (X) =
r(1 p)
p
2
A distribuio de Pascal comumente chamada de distribuio binomial negativa, denominao
esta que pode ser explicada pelo seguinte: a distribuio binomial surge quando tem-se um nmero
xo de repeties de um experimento aleatrio e o interesse est no nmero de ocorrncias; j a
distribuio de Pascal encontrada quando xa-se o nmero de ocorrncias a ser obtido e ento
registra-se o nmero necessrio de repeties do experimento aleatrio para alcanar tal objetivo.
Exemplos:
1. Considerando o exemplo dado anteriormente do sinal de trnsito, qual a probabilidade de
que seja necessrio passar pelo local dez vezes para encontr-lo aberto pela quarta vez?
2. Determinar o nmero esperado de vezes que um experimento deve ser repetido, de modo
a se obterem quatro resultados bem sucedidos, sabendo-se que a probabilidade de esse
experimento ser bem sucedido em qualquer repetio 0,8.
37
5.6 Distribuio Hipergeomtrica
Essa distribuio adequada quando consideramos extraes casuais feitas sem reposio de uma
populao dividida segundo dois atributos. Para ilustrar considere uma populao de N objetos,
r dos quais tm o atributo A e N r tm o atributo B. Um grupo de n elementos escolhido ao
acaso, sem reposio. Em geral, tem-se o interesse em calcular a probabilidade de que esse grupo
contenha x elementos com o atributo A. Assim, a funo de probabilidade da varivel aleatria X
dada por:
P(X = x) =
_
r
x
__
Nr
nx
_
_
N
n
_ , 0 x n, x r
em que: N o tamanho da populao;
n o tamanho da amostra;
r o nmero de sucessos na populao;
x o nmero de sucessos na amostra
Mdia e varincia:
E(X) = np
V (X) = npq
_
N n
N 1
_
,
sendo p =
r
N
.
Se N grande em relao a n (
n
N
< 0,05), ento as probabilidades dadas pela distribuio
hipergeomtrica sero aproximadamente iguais s probabilidades dadas pela binomial.
Exemplos:
1. Em um controle de qualidade, lotes de 100 peas so examinados, e suponha que 10 peas
so defeituosas. Escolhendo-se 5 peas sem reposio:
a) Qual a probabilidade de no obter peas defeituosas?
b) Qual a probabilidade de obter pelo menos uma pea defeituosa?
2. Um agricultor planta seis sementes escolhidas aleatoriamente de uma caixa com cinco
sementes de tulipa e quatro de crisntemo. Qual a probabilidade de ele plantar duas
sementes de crisntemo e quatro de tulipa?
5.7 Distribuio Multinomial
Outra distribuio de probabilidade que desempenha um importante papel na estatstica a
distribuio multinomial que uma generalizao da distribuio binomial. Ela utilizada quando
em cada tentativa ocorre mais de dois resultados possveis. Assim, como na binomial, as proba-
bilidades permanecem constantes em cada tentativa, e as tentativas so independentes umas das
outras. Desse modo, seja A
1
, A
2
, , A
k
eventos mutuamente exclusivos, que formam uma partio
do espao amostral do experimento, e p
1
, p
2
, , p
k
, as correspondentes probabilidades associadas
as ocorrncias desses eventos em um dado ensaio. Seja X
i
a varivel aleatria correspondente ao
nmero de ocorrncias no evento A
i
e x
i
o nmero de realizaes do evento A
i
(i = 1,2, , k).
Ento,
k

i=1
x
i
= n,
k

i=1
p
i
= 1 e a funo de probabilidade da distribuio multinomial dada por:
P(X
1
= x
1
, X
2
= x
2
, , X
k
= x
k
) =
n!
x
1
!x
2
! x
k
!
p
x
1
1
p
x
2
2
p
x
k
k
38
Mdia e varincia:
E(X
i
) = np
i
V (X
i
) = np
i
(1 p
i
), i = 1,2, , k
Exemplos:
1. Qual a probabilidade de que, em um grupo de 10 pessoas, tenhamos 5 com sangue do
tipo O, 2 do tipo B, 2 do tipo A e 1 com tipo AB. Sabe-se que as probabilidades dos tipos
sanguneos so, respectivamente, 60%, 20%, 15% e 5%.
2. Quando um pacote enviado pelo correio uma das seguintes condies pode ocorrer: che-
gar em perfeito estado, chegar danicado ou perder-se pelo caminho. Se as probabilidades
destes acontecimentos so, respectivamente, iguais a 0,7; 0,2 e 0,1 e se uma pessoa enviou
recentemente 8 pacotes pelo correio, qual a probabilidade de que 5 chegaram corretamente
ao destino, 1 for perdido e os outros dois avariados?
Exerccios:
1. Em um determinado cruzamento entre duas plantas de milho, a probabilidade de se obter
uma planta com gentipo MM igual a 0,25, com gentipo Mm, 0,50 e com gentipo mm
0,25. De dez descendentes deste cruzamento, qual a probabilidade de qu se obtenham
respectivamente 2, 5 e 3 indivduos com gentipos MM, Mm e mm? R: 0,07690
2. Pequenos motores eltricos so expedidos em lotes de 50 unidades. Antes que uma remessa
seja aprovada, um inspetor escolhe 5 desses motores e o inspeciona. Se nenhum dos
motores inspecionados for defeituosos, o lote aprovado. Se um ou mais forem vericados
defeituosos, todos os motores da remessa so inspecionados. Suponha que existam, de
fato, trs motores defeituosos no lote. Qual a probabilidade de que a inspeo 100%
seja necessria? R: 0,2760
3. Um novo remdio tem efeito colateral indesejvel em 5% das pessoas que o tomam. Se
13 pacientes tomam o remdio, qual a probabilidade de ocorrer:
a) nenhuma reao negativa; R: 0, 5133
b) pelo menos trs reaes negativas; R: 0,02489
c) no mximo uma reao negativa. R: 0,8642
4. Por experincia, voc sabe que a probabilidade de que voc far uma venda em qualquer
telefone dado 0,23. Encontre a probabilidade de que sua primeira venda, em qualquer
dia, ocorra na quarta ligao ou quinta ligao. R: 0,186
5. Os passageiros de uma empresa area chegam aleatria e independentemente ao balco
de controle de passageiros de um importante aeroporto. A taxa mdia de chegada so 10
passageiros por minuto.
a) Calcule a probabilidade de ningum chegar no perodo de um minuto; R: 0,00004539
b) Calcule a probabilidade de trs ou mais passageiros chegarem no perodo de um
minuto; R: 0,01033
c) Calcule a probabilidade de dois passageiros chegarem em um perodo de 15 segun-
dos; R: 0,2565
d) Calcule a probabilidade de pelo menos um passageiro chegar em um perodo de
15 segundos. R: 0,0179
6. Qual a probabilidade de que no 25
o

lanamento de um dado ocorra a face quatro pela 5


a

vez? R: 0,0356
39
6 Distribuio de variveis aleatrias contnua
6.1 Distribuio Uniforme Contnua
A distribuio uniforme contnua uma das mais simples distribuies contnuas. Essa distribui-
o caracterizada por uma funo de densidade que plana e, portanto, a probabilidade uniforme
em um intervalo fechado [a,b].
Uma varivel aleatria contnua X tem distribuio uniforme no intervalo [a,b] se sua funo
densidade de probabilidade dada por:
f(x) =
_
k para a x b
0 para outros valores de x
O valor de k dado por:
_
a

0dx +
_
b
a
kdx +
_
+
b
0dx = 1
0 +
_
b
a
kdx + 0 = 1
kx[
b
a
= 1 k(b a) = 1 k =
1
b a
Logo,
f(x) =
_
1
ba
para a x b
0 para outros valores de x
Funo Probabilidade Acumulada F(X):
A distribuio acumulada de uma varivel X com distribuio uniforme contnua dada por:
F(X) =
_
x
a
1
b a
dt =
1
b a
[
x
a
=
x
b a

a
b a
=
x a
b a
,
Portanto,
F(X) =
_
_
_
0 para x < a
xa
ba
para a x b
1 para x > b
Mdia e Varincia:
E(X) =
b +a
2
V (X) =
(b a)
2
12
Exemplos:
1. Suponha que uma grande sala de conferncia usada por certa empresa no possa car
reservada por mais do que quatro horas. No entanto, o uso da sala tal que conferncias
longas e curtas ocorrem com muita frequncia. Na verdade, pode-se assumir que a durao
X de uma conferncia tem distribuio Uniforme no intervalo [0,4].
a) Qual a funo de densidade de probabilidade?
b) Qual a probabilidade de que qualquer conferncia dada dure pelo menos trs
horas?
40
2. Devido presena de quantidades variveis de impureza, o ponto de fuso de certa subs-
tncia pode ser considerado uma varivel aleatria contnua distribuda uniformemente
no intervalo de [100, 125]. Qual a probabilidade de a substncia fundir-se entre 110 e
115?
6.2 Distribuio Exponencial
Uma varivel contnua X tem distribuio exponencial com parmetros > 0 se sua funo
densidade de probabilidade for do tipo:
f(x) =
_
e
x
para x 0
0 x < 0
Mdia e varincia:
E(X) =
1

2
x
=
1

2
Funo Probabilidade Acumulada F(X):
F(X) =
_
0 para x 0
1 e
x
x < 0
Exemplos:
1. A durao, em horas, de um certo equipamento eletrnico, segue a distribuio exponen-
cial com funo densidade de probabilidade dada por:
f(x) =
_
1
500
e

x
500
para x 0
0 x < 0
a) Qual a probabilidade de um equipamento durar mais de 500 horas?
b) Calcular a durao mdia e o desvio padro.
2. Se o tempo mdio entre o pedido e o atendimento em um restaurante uma varivel
aleatria com distribuio exponencial de mdia igual a 10 minutos, determine:
a) A probabilidade de espera superior a 10 minutos;
b) A probabilidade de espera inferior a 10 minutos;
6.3 Distribuio Normal
A distribuio normal ou de Gauss ou Gaussiana uma das mais importantes distribuies da
estatstica. Alm de descrever uma srie de fenmenos fsicos, naturais, nanceiros, nas indstrias e
nas pesquisas em geral, possui grande uso na estatstica inferencial. inteiramente descrita por seus
parmetros mdia e desvio padro , ou seja, conhecendo-se estes possvel determinar qualquer
probabilidade em uma distribuio Normal.
41
Uma varivel aleatria contnua X tem uma distribuio normal ou gaussiana se a funo densi-
dade de probabilidade for dada por:
f(x) =
1

2
exp

1
2
(
x

)
2
, x R,
em que e representa a mdia e o desvio-padro, respectivamente, da distribuio de probabilidade;
corresponde a 3,1415 e exp a uma funo exponencial.
Notao: X N(,
2
), o que implica que X tem distribuio normal com mdia = E(X)
e varincia Var(X)=
2
.
Propriedades da Curva normal:
1. Seu grco tem a forma campanular (sino);
2. uma distribuio simtrica em relao mdia;
3. O desvio padro fornece a disperso dos dados em torno da mdia;
4. As trs medidas de posio (mdia, mediana e moda) so coincidentes e se localizam no
ponto mximo da curva;
5. duplamente assinttica em relao ao eixo das abscissas, pois lim
x
f(x) = 0 e lim
x+
f(x) =
0;
6. Tem dois pontos de inexo que correspondem mdia desvio padro.
7. A rea compreendida entre a curva e o eixo x igual a 1, ou seja,
_
+

f(x)dx = 1.
Funo Probabilidade Acumulada:
A funo distribuio de probabilidade acumulada da normal F(X), tambm pode ser repre-
sentada por (X) e dada por: F(X) = (X) =
_
x

f(t)dt.
Clculo de probabilidades:
Suponha que X N(,
2
) e desejamos calcular P(a < X < b).
P(a < X < b) =
_
b
a
f(x)dx =
_
b
a
1

2
exp

1
2
(
x

)
2
Essa integral no pode ser resolvida pelos mtodos tradicionais (s pode ser resolvida por aproxi-
mao numrica). Para cada valor de e e para cada intervalo (a,b), teramos que resolver esta
integral. A diculdade para processar esse tabelamento se prendeu na innidade de valores que
(media) e (desvio padro) poderiam assumir. Neste caso, teria que se dispor de uma tabela para
cada uma das innitas combinaes de e , ou seja, em cada situao que se quisesse calcular uma
probabilidade. O problema foi solucionado mediante a padronizao da distribuio normal.
6.3.1 Distribuio normal padro (ou reduzida)
A varivel normal padronizada Z obtida subtraindo cada valor de X por sua mdia e dividindo
esse resultado pelo desvio padro , ou seja, Z =
X

. Das propriedades da mdia e do desvio


padro tem-se que essa nova varivel Z tem mdia zero e varincia igual a 1. Portanto, Z ter
distribuio Normal padronizada com mdia 0 e varincia 1, ou seja, Z N(0,1).
42
A varivel Z tem-se a seguinte funo de probabilidade: f(Z) =
1

2
exp

(z)
2
2
, Z R. Neste
caso, o clculo da probabilidade s depender de Z. Portanto, pode-se calcular uma nica vez a
probabilidade no intervalo (a,b) e montar uma tabela com essas probabilidades.
A probabilidade referente ao intervalo entre = 0 e um valor z genrico, representada por
P(0 < Z < z), encontra-se na tabela da distribuio normal reduzida.
Exemplos:
1. Calcular as seguintes probabilidades:
a) P(0 < Z < 1,64)
b) P(1,33 < Z < 0)
c) P(1 < Z < 2,23)
d) P(Z > 1,96)
e) P(Z > 2,51)
f ) P(Z = 2,7)
g) P(Z < 1,0)
h) P(Z > 0)
i) P(1,0 < Z < 2,0)
j) P(Z > 5,2)
2. Dada as probabilidades encontre o valor de z:
a) P(0 < Z < z) = 0,4357
b) P(Z > z) = 0,10
c) P(z
1
< Z < z
2
) = 0,95 com z
1
e z
2
simtricos
d) P(Z > z) = 0,90
3. Os depsitos efetuados em determinado banco durante o ms de agosto de 2010 so dis-
tribuidos normalmente, com mdia R$10000 e desvio padro de R$1500,00. Um depsito
selecionado ao acaso dentre todos os referentes ao ms em questo. Encontrar a proba-
bilidade de que o depsito seja:
a) R$ 10000 ou menos;
b) pelo menos R$ 13000;
c) um valor entre R$12000 e R$15000
d) maior que R$20000
4. Uma fbrica de carros sabe que os motores de sua fabricao tm durao normal com
mdia de 150000km e desvio padro de 5000km. Qual a probabilidade de que um carro,
escolhido ao acaso, dos fabricados por essa rma, tenha um motor que dure:
a) Menos de 170000 km?
b) Entre 140000km e 165000km?
c) Se a fbrica substitui o motor que apresenta durao inferior garantia, qual deve ser
esta garantia para que a porcentagem de motores substitudos seja inferior a 0,2 %?
6.3.2 Aproximao normal das distribuies Binomial e Poisson
Quando n grande o clculo de probabilidades usando a binomial e a Poisson se torna trabalhoso.
Neste caso, a normal pode ser utilizada para realizar clculos aproximados de probabilidade, sendo
= np e
2
= npq na binomial e = e
2
= na Poisson.
A substituio da binomial pela normal recomendada quando np e nq forem maiores ou iguais
a 5. A substituio da Poisson pela normal recomendada quando 15.
A binomial e a Poisson so distribuies discretas e a normal contnua, ento deve se fazer uma
correo de continuidade, ou seja, a probabilidade no ponto x na binomial e na Poisson ser igual
a probabilidade em x 0,5 na normal. Isso feito para incluir todos os possveis valores de x no
intervalo.
43
Exemplos:
1. Cinquenta e um por cento dos adultos de um determinado pas zeram a promessa de
se exercitar mais e alcanaram seus objetivos. Voc seleciona aleatoriamente 65 adultos
desse pas que zeram tal promessa e lhes pergunta se eles cumpriram a promessa. Qual
a probabilidade de que:
a) Exatamente 50 desses adultos respondam sim;
b) Menos de quarenta deles respondam sim.
2. Pequenos defeitos em chapas de metal ocorrem ao acaso, com mdia de um defeito por
metro quadrado. Determinar a probabilidade de uma chapa de 1,5 m 50 m apresentar
mais de 70 pequenos defeitos. R: 0,69847
Exerccios:
1. Sabe-se que a varivel aleatria X, referente ao tempo gasto na soluo de uma deter-
minada prova, tem distribuio normal com mdia 40 minutos e desvio padro de 10
minutos.
a) Qual a probabilidade de uma pessoa gastar de 30 a 50 minutos na soluo da prova?
R: 68,26%
b) Qual a probabilidade de que uma pessoa gaste gaste mais de 60 minutos? R: 2,28%
c) Deseja-se fazer um agrupamento das pessoas da seguinte forma:
Grupo A: 30% das pessoas que realizaram a prova no menor tempo;
Grupo B: 50% seguintes;
Grupo C: 20% restantes;
Quais os limites de tempo esperado para a classicao dos grupos? R: X
1
= 34,8 e
X
2
= 48,4
2. Um pesquisador analisou o consumo dirio de calorias por um grupo formado por 3200
crianas. Encontrou um mdia igual a 1800kcal/dia, com um desvio padro igual a
400kcal/dia. Sabe-se que esta varivel segue uma distribuio aproximadamente normal.
Encontre a probabilidade de uma criana escolhida ao acaso apresentar um consumo:
a) entre 1800 e 2300 kcal/dia; R: 39,44%
b) entre 1650 e 1800 kcal/dia; R: 14,8%
c) entre 1500 e 1700 kcal/dia; R: 17,47%
d) entre 1350 e 1650 kcal/dia; R: 22,28%
e) maior que 2250 kcal/dia; R: 12,92%
f ) menor que 1450 kcal/dia; R: 18,94%
g) caso uma amostra formada por 10% das crianas com maiores consumos precisasse ser
extrada, qual seria o consumo calrico mnimo para incluso neste grupo? R: 2312
3. Uma viagem de nibus apresenta durao normalmente distribuda com mdia a 120
minutos e desvio padro igual a 20 minutos. Pergunta-se:
a) Qual a probabilidade de uma viagem durar menos de 110 minutos? R: 30,85%
b) Durar mais de 90 minutos? R: 93,32%
c) Qual a durao mnima de 88% das viagens? R: 96,6
4. Em um posto de grande movimento, os automveis entram razo de trs a cada dois
minutos, em mdia. Determinar a probabilidade de mais de 100 automveis procurarem
o posto no perodo de uma hora. R: 0,1335
44
5. Sabe-se que hotis sempre garantem reservas alm de sua capacidade, para assegurar
lotao. Suponha que as estatsticas feitas por um hotel mostrem que, em mdia, 10%
dos hspedes no respondem s reservas feitas. Se este hotel aceitar 250 reservas e ti-
ver somente 230 acomodaes, qual a probabilidade de todos os hspedes que tiverem
respondido s reservas conseguirem acomodao quando chegarem ao hotel? R: 0,87698
45
7 Tcnicas de Amostragem
A amostragem tem por objetivo principal determinar meios e mtodos de estudar as populaes
por meio de amostras. Observe que quando obtemos informaes a partir de amostras e tentamos
atingir a populao estamos realizando uma inferncia.
7.1 Como selecionar uma amostra
preciso garantir que as amostras que sero utilizadas para se fazer a inferncia sejam obtidas
de forma adequada. No adianta nada o uso de tcnicas renadas de estatstica se a amostra no
for representativa da populao.
Uma amostra representativa signica que, a menos de certas pequenas discrepncias ineren-
tes aleatoriedade sempre presente, a amostra dever possuir as mesmas caractersticas bsicas da
populao, no que diz respeito a varivel que desejamos pesquisar.
7.2 Amostragem com reposio e sem reposio
Na amostragem com reposio o objeto ou indivduo selecionado volta populao antes de um
novo sorteio. Nesse caso, o nmero de amostras possveis de tamanho n retiradas de uma populao
de tamanho N dada por: N
n
. Por exemplo de uma populao de tamanho 10 possvel retirar
100 amostras de tamanho 2.
Na amostragem sem reposio o objeto ou indivduo selecionado no retorna populao antes
de um novo sorteio. Nesse caso o nmero de amostras possveis de tamanho n retiradas de um
populao de tamanho N dada por
_
N
n
_
. Por exemplo, de uma populao de tamanho 10 ser
possvel retirar 45 amostras de tamanho 2.
7.3 Denies
Populao: conjunto de indivduos com pelo menos uma caracterstica observvel em comum.
Amostra: poro ou frao da populao, retirada segundo algumas tcnicas especcas, que
matem as mesmas caractersticas de interesse da populaco.
Parmetro: uma medida associada uma caracterstica populacional. Ex: Mdia (),
varincia (
2
), etc.
Estatstica ou estimador: uma medida associada uma caracterstica amostral. Ex:
Mdia (x), varincia (s
2
).
Estimativa: um valor numrico obtido por meio do estimador.
7.4 Por que amostrar?
i) Economia: menor custo;
ii) Rapidez: menor quantidade de trabalho, ou seja, menor tempo;
iii) Preciso: melhor qualidade no treinamento proporciona entrevistadores mais homogneos pos-
sveis, consequentemente maior preciso nos resultados.
46
7.5 Etapas no processo de amostragem
1. Objetivos da pesquisa: escrever ou estabelecer de forma clara os objetivos.
2. Populao que fornecer as amostras: denio da populao que se quer estudar.
3. Dados a serem coletados: decidir quais os dados sero coletados, ou seja, denir as variveis
baseando-se nos objetivos da pesquisa (atender ao item 1).
4. Denir o mtodo de medio: entrevistador, a prpria pessoa selecionada responde ao ques-
tionrio, telefonemas, etc.
5. Grau de preciso desejado: dimensionar o tamanho da amostra, ou seja, denir n.
6. Listagem das unidades amostrais: escolha da unidade amostral (pessoa, famlia, um nico
objeto, vrios objetos, etc).
7. Processo de amostragem mais adequado: a escolha da tcnica de amostragem depende da
caracterstica da populao.
8. Organizao do trabalho de campo: questionrio (perguntas abertas, fechadas, etc) e estudo
piloto (est ligado com a preciso).
9. Processamento e anlise de dados: planejamento da tabulao dos dados e anlise.
7.6 Principais processos de amostragem
7.6.1 Amostragem Simples ao Acaso ou Amostragem Aleatria Simples (AAS)
A ASA o processo de amostragem mais simples e utilizada quando se necessita obter uma
amostra representativa cujos elementos da populao so todos homogneos. Normalmente, este
processo de amostragem utilizado em associao com outros processos de amostragem, pois nem
sempre possvel de forma imediata identicar todos os elementos da populao como sendo ho-
mogneos. Todos os elementos da populao tm a mesma probabilidade de pertencer amostra,
ou seja, a probabilidade de selecionar um indivduo especco da populao para uma amostra 1/N.
Procedimento para realizar a AAS
Enumeram-se todos os indivduos da populao (1, 2, , N) e sorteiam-se por meio de um dis-
positivo aleatrio (computador, calculadora, tabela de nmeros aleatrios, etc) os indivduos que
iro fazer parte da amostra.
Exemplos de onde deve ou no aplicar a AAS:
Estudar a opinio de alunos de um determinado curso com relao a necessidade de acrescentar
uma disciplina de fsica na grade curricular; (AAS)
Estudar a opinio de alunos de uma determinada universidade com relao a necessidade de
acrescentar uma disciplina fsica avanada na grade curricular; (outro tipo de amostragem)
47
7.6.2 Amostragem Estraticada
Quando a varivel de interesse apresenta uma heterogeneidade na populao e esta heterogenei-
dade permite a identicao de grupos homogneos, pode-se dividir a populao em grupos (estratos)
mutuamente exclusivos, de modo que se tenha o mximo de homogeneidade dentro de cada estrato.
Desse modo, para obter a representatividade de cada estrato na amostra, realiza-se uma AAS em
cada estrato. Por exemplo, nas pesquisas eleitorais existe uma grande heterogeneidade em relao
inteno de votos, quando considera-se a faixa salarial ou o nvel de escolaridade. Ento, para este
caso recomendado fazer uma amostragem aleatria simples dentro de cada uma dessas categorias,
para se ter uma amostra representativa da populao a ser estudada, que neste caso a inteno de
votos.
Tipos de estraticao
Uniforme: Para realizar uma estraticao uniforme o tamanho das amostras de cada estrato
deve ser o mesmo. Esse tipo de estraticao raramente utilizado, devendo ser recomendado
apenas para situaes em que os estratos populacionais possuirem tamanhos iguais. Ento, o
tamanho da amostra de cada estrato pode ser obtido da seguinte forma: n
h
= n/h, em que n
o tamanho da amostra e h a quantidade de estratos.
Proporcional: Esta estraticao recomendada quando o tamanho dos estratos so distintos
e a variabilidade dos estratos homognea. Nesse caso, as amostras retiradas em cada estrato
proporcional ao tamanho do estrato. A proporo do estrato h em relao populao igual
ao nmero de elementos presentes neste estrato (N
h
) dividido pelo tamanho da populao N,
multiplicado pelo tamanho desejado da amostra, ou seja,n
h
=
N
h
N
n.
7.6.3 Amostragem sistemtica
A amostragem sistemtica usada quando os elementos da populao so heterogneos e no
podem ser agrupados em subpopulaes homogneas. Sendo assim, para realizar este tipo de amos-
tragem os elementos da populao devem estar de alguma maneira ordenados.
Procedimento para realizar a amostragem sistemtica
Enumeram-se todos os elementos da populao (1, 2, , N) e sorteia-se um primeiro elemento
i para formar parte da amostra. Os demais so retirados em uma progresso aritmtica, saltando
k elementos, at completar o total da amostra (n). O valor k chamado passos de amostragem
e determinado por: k = N/n elementos. O primeiro elemento deve ser sorteado entre os k
primeiros.
7.7 Exemplos
1. Um pesquisador deseja selecionar 30 estudantes que esto ingressando na UFU para avaliar a
expectativa quanto a UFU. Que tipo de amostragem poderia ser utilizada?
2. Um hotel mantm um arquivo contendo os registros de antigos hospedes em ordem alfabtica,
num total de 10.000 chas das quais sero amostradas 1.000 chas para vericar a satisfao
dos hospedes quanto a hospedagem. Isso poderia ser feito utilizando qual amostragem?
3. Uma estao de TV planeja conduzir uma pesquisa em 4 cidades, para estimar a proporo
de moradores que assistem regularmente a determinado programa. Sabendo que as cidades
A, B, C e D possuem, respectivamente, 48000, 20000, 12500 e 6500 residncias, que tipo de
amostragem voc indicaria para selecionar uma amostra de tamanho 100?
48
8 Distribuio amostral
Considerem-se todas as amostras possveis de tamanho n que podem ser retiradas de uma
populao de tamanho N (com ou sem reposio). Para cada amostra pode-se calcular uma
grandeza estatstica, como a mdia, o desvio padro etc., que varia de amostra para amostra. Com
os valores obtidos para determinada grandeza, pode-se construir uma distribuio de probabilidades,
que ser denominada de distribuio amostral. Para cada distribuio amostral possvel calcular
a sua mdia, o seu desvio padro, etc.
Dessa forma, por meio das distribuies amostrais, possvel inferir propriedades de um agregado
maior (a populao) a partir de um conjunto menor (a amostra), ou seja, inferir sobre parmetros
populacionais, dispondo apenas de estatsticas amostrais. Assim, torna-se necessrio um estudo
detalhado das distribuies amostrais, que so base para intervalos de conana e testes de hipteses.
8.1 Distribuio amostral da mdia
Para entender a distribuio amostral da mdia, considere uma populao N = 3 e a varivel
aleatria X assumindo os valores 1, 2 e 3. A probabilidade associada a cada um desses valores 1/3.
Dessa forma tem-se que:
X 1 2 3
P(X=x) 1/3 1/3 1/3 1,00
Retirando todas as amostras possveis de tamanho n = 2 com reposio, o nmero possvel
de amostras que podem ser selecionadas dado por: N
n
= 3
2
= 9 e cada amostra tem 1/9 de
probabilidade de ser selecionada. Com isso tem-se que:
Amostras x P( x)
(1,1) 1,0 1/9
(1,2) 1,5 1/9
(1,3) 2,0 1/9
(2,1) 1,5 1/9
(2,2) 2,0 1/9
(2,3) 2,5 1/9
(3,1) 2,0 1/9
(3,2) 2,5 1/9
(3,3) 3,0 1/9
E a distribuio amostral de x :
x 1 1,5 2 2,5 3
P( x) 1/9 2/9 3/9 2/9 1/9 1,00
Comparando as duas distribuies (x e x) verica-se diferenas, conforme pode-se vericar nos
grcos abaixo:
1.0 1.5 2.0 2.5 3.0
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
x
P
(
x
)
1 2 3 4 5
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
Mdia de x
P
(
M

d
ia

d
e

x
)
49
Portanto, a partir do comportamento da estatstica amostral, pode-se aplicar um teorema muito
conhecido na estatstica como Teorema do Limite Central.
Teorema do Limite Central (TLC): Considere uma populao de tamanho N com mdia
x
e varincia
2
x
. Se for retiradas n possveis amostras de tamanho n desta populao, a mdia amostral
( x) ter uma distribuio aproximadamente normal, com
x
=
x
e
2
x
=

2
x
n
se a amostragem for
realizada com reposio, ou
2
x
=

2
x
n
Nn
N1
se a amostragem for realizada sem reposio em uma
populao nita ( populao pequena).
Nn
N1
conhecido como fator de correo para populao
nita. Essa aproximao torna se progressivamente melhor com o aumento do tamanho da amostra
(n).
Observaes
1. Quanto maior o n (tamanho da amostra), melhor a aproximao normal.
2. Se n 30 a aproximao normal adequada, qualquer que seja a distribuio populacional.
3. A amostragem sem reposio recomendada quando (n/N > 0,05), e neste caso, deve-se fazer
a seguinte correo para populao nita:
2
x
=

2
x
n
Nn
N1
4. Quando N muito maior do que n, a relao
Nn
N1
tende a 1.
Diante do exposto, temos duas situaes:
i) Populao innita: x N
_

x
=
x
,
2
x
=

2
x
n
_
ii) Populao nita: x N
_

x
=
x
,
2
x
=

2
x
n
Nn
N1
_
Portanto, considerando a distribuio amostral de mdias, quando se conhece a varincia ou a
amostra grande (n 30), utiliza-se a estatstica z da distribuio normal vista anteriormente,
independente da distribuio da populao. Ento, por meio do TLC, a estatstica ser dada por:
z =
x
x

x
8.2 Distribuio amostral da diferena entre mdias para amostras grandes (n
1
e n
2
30)
( x
1
x
2
) N
_

x
1
x
2
=
x
1

x
2
;
2
x
1
x
2
=

2
x
1
n
1
+

2
x
2
n
2
_
Exemplo:
1. Um tratamento qumico A garante durao mdia de uma pea de 1400h com desvio
padro de 200h. O tratamento B, garante durao mdia de 1200h com desvio padro
de 100h. Se forem ensaiadas amostras aleatrias simples de 125 elementos de cada trata-
mento qumico:
a) Qual a probabilidade de um elemento selecionado do tratamento A durar mais de
1600h?
b) Qual a probabilidade da mdia da amostra A ser maior que 1420h?
c) Qual a probabilidade dos elementos de A ter vida mdia superior a B em pelo
menos 160h?
50
8.3 Distribuio amostral da mdia em pequenas amostras (n < 30)- Distribui-
o t-Student
Muitas das vezes no se conhece
2
e trabalha-se com amostras pequenas, ou seja, menores
ou iguais a 30. Nestes casos, conhece-se apenas a estimativa s do desvio padro populacional ,
denominado de desvio padro amostral. Substituindo por seu estimador s, na expresso da varivel
padronizada, obtm-se a varivel:
t =
x
x
s
2
x
=
x
x
s
x
/

n
,
a qual segue uma distribuio t de Student com (n 1) graus de liberdade.
Assim, tem-se que:
x t
_

x
=
x
, s
2
x
=
s
2
x
n
_
.
A distribuio t apresenta as seguintes caractersticas:
simtrica em relao mdia, que zero;
tem forma campanular (semelhante normal);
quando n tende para innito, a distribuio t tende para a distribuio normal, na prtica, a
aproximao considerada boa quando n 30;
possui = n 1 graus de liberdade.
Para aprender a utilizar a tabela t, vamos calcular algumas probabilidades.
Exemplos:
1. Dado os valores de t encontre as probabilidades:
a) P(t > 1,093) com 10 graus de liberdade
b) P(t < 2,086) com = 20
c) P(1,341 < t < 2,131) n = 16
d) P(t > 1,325) n = 21
e) P(1,071 < t < 1,071) = 16
f) P(1,476 < t < 2,571) = 5
2. Dados os valores de probabilidade encontre o valor de t:
a) P(t > t
1
) = 0,010 com = 13
b) P(t < t
1
) = 0,95 com = 20
c) P(t < t
1
) = 0,10 com = 8
3. A temperatura mdia em uma certa regio tem sido de 26
0
C em certo ms do ano. Se o
desvio padro de uma amostra aleatria de 16 dias for igual a 5
0
C:
a) Qual a probabilidade da mdia da amostra:
a
1
) Ser maior do que 23,336
0
C?
a
2
) Estar entre 22,316 e 29,684?
b) Qual o valor de x que deixa uma probabilidade de 1% de ocorrncia acima dele?
51
8.4 Distribuio amostral das propores
Dada uma populao X que tem A elementos com uma certa caracterstica e X A elementos
com outra caracterstica. A proporo p na amostra de tamanho n, com a caracterstica A, dada
por: p =
A
n
e tem distribuio binomial com parmetros p sucessos e q fracassos. Pela aproximao
da distribuio normal a binomial, podemos escrever a distribuio de p como:
p N
_

p
= p,
2
p
=
pq
n
_
.
Exemplo:
1. Acredita-se que 30% das encomendas feitas a uma rma so provenientes de clientes que
compram pela primeira vez. Uma amostra aleatria simples de 100 pedidos ser usada
para estimar a proporo de clientes que compram pela primeira vez.
a) Qual a probabilidade de a proporo amostral estar entre 0,20 e 0,40?
b) Qual a probabilidade de a proporo amostral ser maior do que 0,35?
8.5 Distribuio amostral da diferena das propores
Suponha que temos duas populaes 1 e 2, com propores p
1
e p
2
. Destas populaes retiram-se
amostras n
1
e n
2
, ento:
( p
1
p
2
) N
_

p
1
p
2
= p
1
p
2
;
2
p
1
p
2
=
p
1
q
1
n
1
+
p
2
q
2
n
2
_
E a estatstica dada por:
z =
( p
1
p
2
) (p
1
p
2
)
_
p
1
q
1
n
1
+
p
2
q
2
n
2
Exemplo:
1. As especicaes tcnicas do medicamento A informa que 95% das pessoas que fazem
uso desse medicamento cam curadas, j as especicaes do medicamento B diz que
85% dos usurios so curados. Qual a probabilidade de se realizar uma pesquisa com 100
indivduos de cada grupo e a diferena entre as propores de curados ser de no mximo
5%?
8.6 Distribuio amostral da varincia - Distribuio de Qui-Quadrado (
2
)
Ao retirar uma amostra de n elementos de uma populao normal com media e varincia

2
, tem-se que a distribuio amostral da varincia amostral (s
2
) segue uma distribuio de
2
(qui-quadrado) com n 1 graus de liberdade. A varivel da estatstica de qui-quadrado ser dada
por:

2
=
(n 1)s
2

2
tem distribuio de
2
com n 1 graus de liberdade. Esta distribuio parte sempre da origem,
assimtrica e est associada a n 1 graus de liberdade.
Exemplos:
1. Para aprender a utilizar a tabela
2
, calcule as seguintes probabilidades:
a) P(
2
> 17,275)
b) P(
2
< 11,345)
c) P(12,592 <
2
< 18,548)
52
2. Uma mquina est regulada para encher pacotes de macarro com desvio padro de 10g
e mdia de 500g. Em uma amostra de 16 pacotes, qual a probabilidade da varincia ser:
a) Maior que 48,407g
2
?
b) Menor que 121,63g
2
?
3. O tempo de vida de um certo aparelho apresenta distribuio normal com mdia de 480
horas e desvio padro de 50 horas. Em uma amostra de 25 aparelhos, qual a probabilidade
de se obter uma varincia maior que 2448 horas? R: 0,5
8.7 Distribuio amostral de duas varincias - Distribuio F
A distribuio de F de Snedecor corresponde distribuio da razo de duas varincias. Temos,
ento, duas populaes que apresentam varincias populacionais e delas so retiradas amostras, nas
quais so calculadas varincias amostrais. A relao entre essas varincias que nos d a distribuio
de F. A estatstica da distribuio apresentada a seguir:
F =

2
2

2
1
s
2
1
s
2
2
,
com = n
1
1 e = n
2
1 graus de liberdade, sendo n
1
e n
2
os tamanhos amostrais retirados da
populao 1 e 2, respectivamente.
A distribuio F sempre parte da origem, assimtrica e apresenta uma tabela especca para
cada valor de probabilidade (). Se F

(
1
,
2
) o valor de F com
1
e
2
graus de liberdade, temos
que: F
1
(
1
,
2
) =
1
F(
2
,
1
)
.
Exemplos:
1. Para aprender a utilizar a tabela da distribuio F, calcule as seguintes probabilidades:
a) P(F > 3,12) com
1
= 9 e
2
= 15
b) P(F < 4) com
1
= 12 e
2
= 6
c) P(F > F
1
) = 0,10 com
1
= 5 e
2
= 25
d) P(F < F
1
) = 0,90 com n
1
= 6 e n
2
= 26
2. Se s
2
1
e s
2
1
representam varincias de amostras aleatrias de tamanho n
1
= 21 e n
2
= 31,
cuja populao tem
2
1
= 35 e
2
2
= 25, encontre:
a) P(
s
2
1
s
2
2
< 2,702)
b) P(0,594 <
s
2
1
s
2
2
< 3,094)
3. Sabe-se que a varincia das alturas das mulheres adultas em uma populao X de
100cm
2
, j a varincia das alturas dos homens nesta mesma populao de 225 cm
2
.
Retira-se, dessa populao, uma amostra de 12 mulheres e uma amostra de 16 homens.
Qual a probabilidade de que nesta amostra a variabilidade das alturas dos homens seja
6,12 maior que a das mulheres?
53
9 Teoria da estimao
Um dos principais objetivos da estatstica inferencial consiste em estimar os valores de parmetros
populacionais desconhecidos (estimao de parmetros) utilizando dados amostrais. Ento, qualquer
caracterstica de uma populao pode ser estimada a partir de uma amostra aleatria, desde que esta
amostra represente bem a populao. Os parmetros populacionais mais comuns a serem estimados
so a mdia, o desvio-padro e a proporo. A inferncia estatstica de grande relevncia, uma
vez que na maioria das decises que um pesquisador deve tomar, esto associadas utilizao de
dados amostrais. Essa parte da estatstica consiste em tirar concluses de uma populao a partir
de amostra representativa dela, tendo uma grande importncia em muitas reas do conhecimento.
Antes de abordar a teoria da estimao vamos procurar entender o que vem a ser estimador e
estimativa. Um estimador,

, do parmetro uma funo qualquer dos elementos da amostra.
Estimativa o valor numrico assumido pelo estimador quando os valores observados so conside-
rados.
Assim, x =
n

i=1
x
i
n
, um estimador da mdia populacional , e x = 150, por exemplo, uma
estimativa da mdia populacional.
9.1 Tipos de Estimativas
9.1.1 Estimativa por ponto ou estimao pontual
Quando a estimativa de um parmetro populacional dado por um nico valor, tem-se uma
estimativa por ponto do parmetro populacional, ou seja, na estimao por ponto fornecido como
estimativa do parmetro, apenas um valor numrico.
Exemplo: A partir de uma amostra de 800 clientes (escolhidos aleatoriamente entre todos
os clientes que abasteceram na primeira quinzena de um determinado ms) de um posto de
gasolina que possuem carros populares, vericou-se que o gasto mdio de gasolina foi de R$
200,00 por quinzena, ou seja, x = 200 reais. Logo, 200 uma estimativa por ponto para
Do exposto, segue que s
2
uma estimativa por ponto de
2
; s uma estimativa por ponto de ;
p uma estimativa por ponto de p, dentre outras.
Desvantagem: A estimao pontual no fornece nenhuma ideia de quo prximo o valor
dessa estimativa em relao ao valor do parmetro. Sendo assim, essas estimativas por ponto
no nos do uma ideia sobre a conana e as margens de erro que deveriam ser aplicadas ao
resultado. Por exemplo, o que se sabe do gasto mdio de gasolina que ele foi estimado como
R$ 200,00 por quinzena, independente do tamanho da amostra e da variabilidade inerente dos
dados. Se fosse usado um tamanho grande de amostra e houvesse pouca variabilidade, teria-se
grandes razes para acreditar no resultado. Mas no se pode armar nada se for conhecido
apenas a estimativa pontual. Em funo disso, existe outra maneira de obter uma estimativa
de um parmetro, conhecido como estimativa por intervalo ou intervalo de conana, que
procura suprir essa desvantagem.
9.1.2 Estimativa por intervalo ou intervalo de conana
Na distribuio amostral, ao selecionar k amostras de tamanho n da populao, possvel obter
k estimativas pontuais de um parmetro. Estas estimativas seguiro uma determinada distribuio.
Conhecida esta distribuio pode-se determinar o limite inferior e o limite superior, dentro do qual
se espera que o valor real do parmetro populacional desconhecido (mdia, varincia, proporo)
54
esteja contido. Quando a estimativa obtida dessa forma, tem-se a estimativa por intervalo e,
ao associar uma probabilidade ou um nvel de conana a este intervalo, obtm-se o intervalo de
conana. Neste caso, pode-se armar, por exemplo, com uma conana de 95%, que o gasto mdio
com gasolina dos carros populares que abastecem no posto varia entre R$ 180,00 a R$ 220,00.
De modo geral as estimativas (pontual ou intervalar) devem ser bastante conveis, e para isso
necessrio que os estimadores que as fornecero apresentem boas propriedades, aliado ao fato de
serem obtidas a partir de amostras representativas. A seguir sero apresentadas as propriedades de
um bom estimador.
9.2 Propriedades dos Estimadores
Estimador no tendencioso; no viesado ou no viciado: Um estimador

dito um
estimador no tendencioso do parmetro se E(

) = .
Exemplo: x =
n

i=1
x
i
n
um estimador no tendencioso da mdia populacional .
Consistncia: A consistncia uma propriedade de grande amostras.
Um estimador

dito um estimador consistente do parmetro se:
i) lim
n
E(

) =
ii) lim
n

2
(

) = 0.
Ecincia: Se

1
e

2
so dois estimadores no tendenciosos de , ento,

1
mais eciente
que

2
se:
2
(

1
) <
2
(

2
).
Ecincia Relativa: A ecincia relativa do estimador

1
, em relao ao estimador

2
dada por:
ER

1
,

2
=

2
(

2
)

2
(

1
)
Observao: Quanto menor for a varincia de um estimador maior ser a sua ecincia.
Se

1
for menos eciente que

2
ento ER

1
,

2
< 1;
Se

1
for mais eciente que

1
ento ER

1
,

2
> 1.
Sucincia ou preciso: Um estimador suciente se contm o mximo de informao com
relao ao parmetro por ele estimado.
Quantidade de informao ou preciso =
1

2
(

)
9.3 Construo dos Intervalos de conana (IC)
Com uma conana (1 ) pode-se determinar, com o auxlio das distribuies amostrais, um
limite inferior e superior, no qual espera-se que o verdadeiro valor do parmetro populacional esteja
contido.
Resumidamente tem-se que:
Intervalo de conana para mdias em grandes amostras (n 30): usa-se a distribuio normal
(Z).
Intervalo de conana para mdias em pequenas amostras (n < 30): usa-se a distribuio
t-Student (t).
55
Intervalo de conana para propores: usa-se a distribuio normal (Z).
Intervalo de conana para uma varincia: usa-se a distribuio de qui-quadrado (
2
).
Intervalo de conana para duas varincias: usa-se a distribuio F.
9.3.1 Intervalo de Conana para de uma populao Normal, considerando grandes
amostras (n 30):
Varincia Populacional (
2
) conhecida:
Para determinar o IC para a mdia da populao , considere uma populao X da qual ser
retirada uma amostra n 30. Das distribuies amostrais, tem-se que:
z =
x
x
/

n
Isolando
x
, colocando o sinal de desigualdade e associando uma propriedade P de ocorrncia,
obtm-se:
P
_
x Z
/2

n
<
x
< x +Z
/2

n
_
= (1 ).
Assim, tem-se que: IC ()
1
: x e, sendo e = z

n
Varincia Populacional (
2
) desconhecida:
IC ()
1
: x e, sendo e = z

2
s

n
9.3.2 Intervalo de Conana para de uma populao Normal, considerando pequenas
amostras (n 30):
IC ()
1
: x e, sendo e = t
(n1,

2
)
s

n
9.3.3 Intervalo de Conana para diferena entre mdias, considerando grandes amos-
tras (n 30):
IC (
1

2
)
1
: (x
1
x
2
) e
Varincias Populacionais conhecidas: e = z

2
_

2
1
n
1
+

2
2
n
2
Varincias Populacionais desconhecidas: e = z

2
_
s
2
1
n
1
+
s
2
2
n
2
9.3.4 Intervalo de Conana para diferena entre mdias, considerando pequenas
amostras (n 30):
IC (
1

2
)
1
: (x
1
x
2
) e
Amostras independentes e varincias populacionais estatsticamente iguais:
e = t

2
s
p
_
1
n
1
+
1
n
2
; = n
1
+n
2
2 s
p
=
_
(n
1
1)s
2
1
+(n
2
1)s
2
2
n
1
+n
2
2
56
Amostras independentes e varincias populacionais estatsticamente desiguais:
e = t

2
_
s
2
1
n
1
+
s
2
2
n
2
; =

s
2
1
n
1
+
s
2
2
n
2

2
(
s
2
1
/n
1)
2
n
1
1
+
(
s
2
2
/n
2)
2
n
2
1
Amostras dependentes, dados aparecem em pares (Ex: antes e depois):
IC (
D
)
1
: (D) e D =
n

1=1
d
i
n
d
i
= X
1i
X
2i
e = t

2
s
D

n
s
D
=

_
n

1=1
d
2
i

_
n

1=1
d
i
_
2
n
n1
9.3.5 Intervalo de Conana para uma proporo
IC (p)
1
: p e em que e = z

2
.
_
p q
n
9.3.6 Intervalo de Conana para diferena entre propores
IC (p
1
p
2
)
1
: ( p
1
p
2
) e em que e = z

2
.
_
p
1
. q
1
n
1
+
p
2
. q
2
n
2
9.3.7 Intervalo de Conana para uma varincia
IC(
2
)
1
:
_
(n1).s
2

2
/2
;
(n1).s
2

2
1/2
_
= n 1
9.3.8 Intervalo de Conana para duas varincias
IC
_

2
1

2
2
_
1
:
_
s
2
1
s
2
2
1
F
/2
(
2
,
1
)
;
s
2
1
s
2
2
F
/2
(
1
,
2
)
_
9.4 Regras de deciso envolvendo intervalo de conana (IC) para a diferena
entre duas mdias ou duas propores:
a) Se o intervalo possui um extremo positivo e outro negativo, ou seja, se o 0 IC, temos
1
=
2
ou p
1
= p
2
b) Para o IC(
1

2
) ou IC(p
1
p
2
), se os extremos so positivos, temos:

2
> 0
1
>
2
ou p
1
p
2
> 0 p
1
> p
2
c) Para o IC(
1

2
) ou IC(p
1
p
2
), se os extremos so negativos, temos:

2
< 0
1
<
2
ou p
1
p
2
< 0 p
1
< p
2
57
9.5 Regras de deciso envolvendo intervalo de conana (IC) para duas varin-
cias:
Dado o IC
_

2
1

2
2
_
1
, temos:
a) Se 1 IC, temos
2
1
=
2
2
;
b) Se os extremos do IC so maiores do que 1, temos:
2
1
>
2
2
;
c) Se os extremos do IC so menores do que 1, temos:
2
1
<
2
2
;
Exemplos:
1. Uma mquina produz rolamentos que apresentam desvio padro de 0,042 polegadas em
seu dimetro. Desejando-se conhecer o dimetro mdio dos rolamentos produzidos por
esta mquina extraiu-se uma amostra de 100 rolamentos, observando-se uma mdia igual
a 0,824 polegadas.
a) Qual a estimativa por ponto de ?
b) Obter o intervalo de conana com 0,90 de conana para o verdadeiro dimetro
mdio dos rolamentos.
2. Os contedos de cido sulfrico em sete contineres similares so: 9,8; 10,2; 10,4;9,8;10;10,2
e 9,6 litros.
a) Qual a estimativa por ponto da mdia e da varincia dos contedos de cido
sulfrico dos contineres.
b) Utilize um IC de 95% para estimar a mdia de todos os contineres.
c) Construa um IC de 95% para a varincia populacional dos contedos de cido
sulfrico em todos os contineres.
3. Em uma linha de produo de certa pea mecnica, colheu-se uma amostra de 100 tens,
constatando-se que 4 peas eram defeituosas. Construir o IC para a proporo p das
peas defeituosas ao nvel de 10%.
4. Foi realizada uma pesquisa para vericar a preferncia por recheios de pastis. Uma
amostragem de tamanho 20 revelou que 70% das pessoas entrevistadas preferem o recheio
de carne. Uma outra amostragem de tamanho 25, foi realizada em outro local, e mostrou
que 87% das pessoas tambm preferem o recheio esse mesmo recheio. Use um IC de 95%
para vericar se existe diferena entre a proporo de pessoas que preferem o recheio de
carne no local A e no local B.
5. Para vericar a conservao de um alimento em duas embalagens, um pesquisador utilizou
uma amostra de tamanho 36 de cada embalagem. Ele obteve os seguintes resultados para
o tempo de conservao, em dias:
Embalagem x s
2
s
A 12 4 2
B 15 7 2,65
Verique, utilizando um IC de 95%, se existe diferena entre os tempos mdios de
conservao.
6. Em uma pesquisa sobre dois mtodos de ensino, selecionou-se uma amostra aleatria de
15 alunos que receberam o mtodo A e uma amostra aleatria de 10 alunos que receberam
o mtodo B. Os resultados so apresentados a seguir. Utilizando um IC de 90%, pode-se
dizer que B estatisticamente superior a A?
58
Mtodo n x s
A 15 5,7 0,7
B 10 6,6 1,2
7. Uma companhia fabrica propulsores para uso em motores de turbinas de avio. Uma das
operaes envolve esmerilhar o acabamento de uma superfcie particular para um com-
ponente de liga de titnio. Dois processos diferentes para esmerilhar podem ser usados,
podendo produzir peas com iguais rugosidades mdias na superfcie. Uma amostra ale-
atria de n
1
= 11 peas, proveniente do primeiro processo, resulta em um desvio padro
de s
1
= 5,1 micro polegadas. Uma amostra aleatria de n
1
= 16 peas, proveniente do
segundo processo, resulta em um desvio padro de s
1
= 4,7 micro polegadas. Conside-
rando que os dois processos sejam independentes e que a rugosidade na superfcie seja
normalmente distribuda, encontre um intervalo de conana de 90% para a razo de duas
varincias. Existe variabilidade da rugosidade da superfcie para os dois processos?
8. Um grupo de 10 pessoas submetido a um tipo de dieta por 10 dias, estando os pesos
antes e depois marcados na tabela abaixo. Construa um intervalo de conana ao nvel
de 5% de signicncia. Interprete os resultados.
Pessoas Peso antes em kg Peso depois em kg
1 120 116
2 104 102
3 93 90
4 87 83
5 85 86
6 98 97
7 102 98
8 106 108
9 88 82
10 90 85
59
I) INTERVALO DE CONFIANA PARA UMA MDIA
1
o
CASO: Amostras grandes (n 30)
i) IC: IC ()
1
: x e
ii) erro da estimativa: e = z

2
.

n
; e = z

2
.
s

n
2
o
CASO: Amostras pequenas (n < 30)
i) IC: IC ()
1
: x e
ii) erro da estimativa: e = t

2
.
s

n
II) INTERVALO DE CONFIANA PARA DIFERENA
ENTRE MDIAS
1
o
CASO: Amostras grandes (n 30)
i) IC: IC (
1

2
)
1
: (x
1
x
2
) e
ii) erro da estimativa: e = z

2
.
_

2
1
n
1
+

2
2
n
2
; e = z

2
.
_
s
2
1
n
1
+
s
2
2
n
2
2
o
CASO: Amostras pequenas (n < 30), independentes e varincias
populacionais estatisticamente iguais
i) IC: IC (
1

2
)
1
: (x
1
x
2
) e
ii) erro da estimativa: e = t

2
.s
p
.
_
1
n
1
+
1
n
2
; = n
1
+n
2
2
s
p
=
_
(n
1
1).s
2
1
+(n
2
1).s
2
2
n
1
+n
2
2
3
o
CASO: Amostras pequenas (n < 30), independentes e varincias
populacionais estatisticamente desiguais
i) IC: IC (
1

2
)
1
: (x
1
x
2
) e
60
ii) erro da estimativa: e = t

2
.
_
s
2
1
n
1
+
s
2
2
n
2
; =
_
s
2
1
n
1
+
s
2
2
n
2
_
2
(
s
2
1
/n
1
)
2
n
1
1
+
(
s
2
2
/n
2
)
2
n
2
1
4
o
CASO: Amostras dependentes, dados aparecem em pares
(Ex.: antes e depois)
i) IC: IC (
D
)
1
: (D)e D =
n

1=1
d
i
n
d
i
= X
1i
X
2i
ii) erro da estimativa: e = t

2
.
s
D

n
; s
D
=

_
n

1=1
d
2
i

_
n

1=1
d
i
_
2
n
n1
III) INTERVALO DE CONFIANA PARA UMA VARINCIA
IC(
2
)
1
:
_
(n1).s
2

2
/2
;
(n1).s
2

2
1/2
_
; = n 1
IV) INTERVALO DE CONFIANA PARA DUAS VARINCIA
IC
_

2
1

2
2
_
1
:
_
s
2
1
s
2
2
.
1
F
/2
(
2
,
1
)
;
s
2
1
s
2
2
.F
/2
(
1
,
2
)
_
V) INTERVALO DE CONFIANA PARA UMA PROPORO
i) IC: IC (p)
1
: p e
ii) erro da estimativa: e = z

2
.
_
p q
n
61
VI) INTERVALO DE CONFIANA PARA DIFERENA
ENTRE PROPORES;
i) IC: IC (p
1
p
2
)
1
: ( p
1
p
2
) e
ii) erro da estimativa: e = z

2
.
_
p
1
. q
1
n
1
+
p
2
. q
2
n
2
;
Regras de deciso envolvendo intervalo de conana (IC) para a
diferena entre duas mdias ou duas propores:
a) Se o intervalo possui um extremo positivo e outro negativo, ou seja, se o 0
IC, temos
1
=
2
ou p
1
= p
2
b) Para o IC(
1

2
) ou IC(p
1
p
2
), se os extremos so positivos, temos:

2
> 0
1
>
2
ou p
1
p
2
> 0 p
1
> p
2
c) Para o IC(
1

2
) ou IC(p
1
p
2
), se os extremos so negativos, temos:

2
< 0
1
<
2
ou p
1
p
2
< 0 p
1
< p
2
Regras de deciso envolvendo intervalo de conana (IC) para
duas varincias:
Dado o IC
_

2
1

2
2
_
1
, temos:
a) Se 1 IC, temos
2
1
=
2
2
;
b) Se os extremos do IC so maiores do que 1, temos:
2
1
>
2
2
;
c) Se os extremos do IC so menores do que 1, temos:
2
1
<
2
2
;
62
9.6 Determinao dos tamanhos das amostras
Uma questo que aparece frequentemente no planejamento de experimentos qual deve ser
o tamanho da amostra para se ter determinada preciso na estimao da mdia populacional? A
resposta para essa questo pode ser dada a partir do intervalo de conana. Da teoria da estimao
possvel perceber que o aumento do tamanho da amostra melhora a preciso da estimativa e diminui
o comprimento de conana.
Para entender como esse processo de determinao do tamanho de amostras, considere o intervalo
de conana para de uma populao Normal, considerando grandes amostras (n 30) e
2
conhecida:
x Z
/2

n
.
A quantidade Z
/2

n
a margem de erro(e). Desse modo, se o pesquisador xar um erro de
estimao e possuir uma estimativa da varincia populacional, possvel estimar o tamanho amostral
adequado, considerando um coeciente de conana 1 tambm xado. Neste caso, isolando n
na expresso da margem de erro, obtm-se a seguinte expresso do tamanho da amostra:
n =
z
2
/2

2
e
2
.
Esse tamanho de amostra fornece a margem de erro desejada, ao nvel de conana escolhido.
Essa equao necessita de um valor para o desvio pardro da populao. Entretanto, mesmo
que seja desconhecido, essa equao pode ser utilizada para determinar o tamanho da amostra,
desde que se tenha um valor preliminar para . Na prtica esse valor obtido por meio de pesquisa
passadas, estatsticas (informaes) ou amostras piloto.
Nas situaes que se deseja obter o tamanho da amostra com base na estimativa da proporo
populacional, esse tamanho da amostra deve ser encontrado por meio da seguinte expresso:
n =
z
2
/2
pq
e
2
Para utilizar a equao acima preciso saber quanto vale p e q, para isso deve se substituir p e q
por p e q. Mas se estes tambm forem desconhecidos, deve se substituir p e q por 0,5. Isso possibilita
maximimizar o valor do produto p.q e do tamanho da amostra a ser analisado.
Exemplos:
1. Os sistemas de escapamento de uma aeronave funcionam devido a um propelente slido.
A taxa de queima desse propelente uma caracterstica importante do produto. As
especicaes requerem que a taxa mdia de queima seja de 50 cm/s. Sabemos que o
desvio-padro da taxa de queima = 2 cm/s. Suponha que quisssemos um erro na
estimao da taxa mdia de queima do propelente do foguete menor do que 1,5 cm/s,
com uma conana de 95%. Qual deveria ser o tamanho apropriado da amostra?
2. Suponha que uma amostra aleatria de tamanho 10 da varivel renda familiar apresente
os seguintes valores: 12, 18, 12, 18, 18, 30, 12, 12, 18, e 30. Determine o tamanho da
amostra que apresente uma estimativa com erro mximo de

2 e uma conana de 90%.


3. Uma determinada pessoa est interessada em se candidatar a prefeito de uma cidade.
Suponha que ela queira determinar o tamanho da amostra necessria para que a sua
porcentagem de eleitores seja estimada com uma preciso de 2 pontos percentuais e com
uma probabilidade de acerto de 95%.
a) Qual deveria ser o tamanho amostral?
63
b) Suponha que cada entrevista custa R$ 80,00 e que h um custo operacional xo,
de R$50000,00. Quanto custaria a realizao dessa pesquisa?
Suponha agora que esta pessoa s dispe de R$180000 para custear a pesquisa. Nestas
condies:
c) Que tamanho de amostra ele deveria usar?
d) Supondo a mesma probabilidade de conana de 95%, qual a preciso que ele pode
conseguir com esse tamanho de amostra?
64
10 Teoria da deciso - Testes de hipteses
O teste de hiptese uma regra de deciso para aceitarmos ou rejeitarmos uma hiptese esta-
tstica com base nos dados amostrais. O objetivo do teste de hipteses fornecer uma metodologia
que nos permita vericar se os dados amostrais trazem evidncia que apiem ou no uma hiptese
formulada.
10.1 Denies
10.1.1 Hiptese estatstica
Trata-se de uma suposio quanto ao valor de um parmetro populacional, ou quanto natureza
da distribuio de probabilidade de uma varivel populacional.
Exemplos
1) A taxa mdia de queima de um propelente de sdio 50 centmetros por segundo;
2) O nmero de peas defeituosas em uma produo segue a distribuio Poisson;
3) A proporo de eleitores favorveis a um candidato de 50%.
10.1.2 Tipos de hipteses
a) Hiptese nula ou de nulidade: denotada por H
0
uma armao sobre o valor de um
parmetro populacional. Geralmente uma igualdade ou armativa positiva com relao ao
parmetro. Ex: H
0
: =
0
b) Hiptese alternativa: denotada por H
1
a armao que deve ser verdadeira se a hiptese
nula for falsa. Geralmente uma desigualdade e contradiz H
0
. Ex: H
1
: ,=
0
; H
1
: <
0
ou H
1
: >
0
Com base na hiptese alternativa H
1
e no valor obtido na tabela (Z, t,
2
, F) ao nvel de signi-
cncia , dene-se a regio de rejeio de H
0
, conhecida como regio crtica (RC). Supondo que uma
indstria qumica tem o interesse em vericar se a quantidade mdia de impurezas presentes em um
determinado produto igual a 16 gramas e, sabendo que essa quantidade de impurezas normal-
mente distribuda, ento o parmetro de interesse que deve ser testado a mdia, e as hipteses a
serem formuladas, bem como, a determinao da regio crtica podem ser denidas de acordo com
os seguintes tipos de testes:
Teste de hiptese bilateral
H
0
: = 16 g
H
1
: ,= 16 g
Se Z

2
Z
c
Z

2
no se pode rejeitar
H
0
.
Se Z
c
> Z

2
ou Z
c
< Z

2
rejeita-se H
0
Teste de hiptese unilateral direita
H
0
: = 16 g
H
1
: > 16 g
Se Z
c
< Z

no se pode rejeitar H
0
Se Z
c
> Z

rejeita-se H
0
Teste de hiptese unilateral esquerda
H
0
: = 16 g
H
1
: < 16 g
Se Z
c
> Z

no se pode rejeitar H
0
Se Z
c
< Z

rejeita-se H
0
65
10.2 Tipos de erros
Existem dois possveis erros associados ao teste de uma hiptese estatstica, comumente deno-
minados de erros do tipo I e II. Pode-se rejeitar uma hiptese quando ela verdadeira ou aceitar
quando ela falsa.
A rejeio de uma hiptese verdadeira chamada erro Tipo I. A no rejeio de uma hiptese
falsa constitui o erro Tipo II. As probabilidades de ocorrncia do erro tipo I e II so denotadas,
respectivamente por e .
Sendo assim tem-se que: = P(erro tipo I) = P(rejeitar H
0
/H
0
verdadeira). um valor
determinado pelo pesquisador e conhecido como nvel de signicncia do teste de hiptese. O
complementar do nvel de signicncia chamado de nvel de conana e dado por 1. = P(erro
tipo II) = P(no rejeitar H
0
/H
0
falsa).
Desse modo, quando se realiza um teste de hiptese, busca-se reduzir ao mnimo as probabilida-
des de cometerem os erros tipo I e II, que so relacionados, ou seja, uma reduo na probabilidade
de um geralmente resulta num aumento da probabilidade do outro. Uma maneira de reduzir simul-
tneamente esses dois erros aumentando o tamanho da amostra.
Um outro conceito muito importante que se relaciona com as probabilidades de erro a noo
de poder de um teste. O poder de um teste a probabilidade de se rejeitar H
0
dado que H
0
falsa.
Na Tabela a seguir relacionam-se os dois tipos de erros e as decises corretas com as respectivas
probabilidades:
TABELA 1: Tipos de erros e probabilidades associadas.
Realidade
Deciso H
0
verdadeira H
0
falsa
No rejeitar H
0
Deciso correta (1 ) Erro Tipo II ()
Rejeitar H
0
Erro Tipo I () Deciso correta (1 )
10.3 Algoritmo para a realizao de um teste de hipteses
1. Estabelecer a hiptese nula (H
0
: =
0
)
2. Estabelecer a hiptese alternativa (H
1
: ,=
0
; H
1
: <
0
ou H
1
: >
0
)
3. Determinar o nvel de signicncia ()
4. Selecionar a estatstica do teste
5. Determinar a regio crtica (RC)
6. Calcular a estatstica
7. Concluir
10.4 Testes de hipteses para mdias, varincias e propores
Exemplos:
1. A vida mdia de uma amostra de 100 lmpadas produzidas por uma rma foi calculcada
em 2570 horas, com desvio padro de 120 horas. Sabe-se que a durao das lmpadas
dessa rma tem distribuio normal com mdia de 1600 horas. Ao nvel de 1% testar se
houve alterao na durao mdia das lmpadas.
66
2. Um fabricante de lajotas de cermica introduz um novo material em sua fabricao e
acredita que aumentar a resistncia mdia, que de 206kg. A resistncia das lajotas
tem distribuio normal com desvio padro de 12kg. Retira-se uma amostra de 30 lajotas,
obtendo x = 210kg. Ao nvel de 10%, pode-se o fabricante aceitar que a resistncia mdia
de suas lajotas tenha aumentado?
3. Uma mquina projetada para fazer esferas de ao de 1cm de raio. Uma amostra de
10 esferas produzida e tem o raio mdio de 1,004cm, com s = 0,003. H razes para
suspeitar que a mquina esteja produzindo esferas com raio menor que 1cm, ao nvel de
10%?
4. Dois tipos de tinta foram testados sob as mesmas condies meteorolgicas. O tipo A
registrou uma mdia de 80 com um desvio padro de 5 em 5 partes. O tipo B, uma mdia
de 83 com um desvio padro de 4 em 6 partes. Adotando = 0,05, testar a hiptese de
que a tinta A possui mdia inferior a tinta B, considerando que as populaes possuem
varincias iguais.
5. Um teste para vericar a emisso de poluentes no ar, foi realizada com 6 automveis que
utilizaram o gs A como combustvel, e 13 carros que utilizaram a gs B. Mediu-se a
quantidade de monxido de carbono CO (g/mi). Os resultados foram:
Gs n x s
A 6 3,7 0,5
B 13 4,55 1,2
Existe diferena signicativa na emisso de CO, entre os dois combustveis? Use = 0,05
6. Realizou-se um estudo para investigar a eccia do hipnotismo na reduo da dor. A
tabela a seguir nos fornece os resultados de 8 pessoas selecionadas. Ao nvel de 5%
de signicncia, teste a armao de que as medidas sensoriais so inferiores aps o
hipnotismo, ou seja, o hipnotismo ecaz na reduo da dor. (Os valores se referem a
antes e depois da hipnose, medidas em centmetros em uma escala de dor)
Pessoas Antes Depois
1 6,6 6,8
2 6,5 2,4
3 9,0 7,4
4 10,3 8,5
5 11,3 8,1
6 8,1 6,1
7 6,3 3,4
8 11,6 2,0
7. Sabe-se por experincia que 5% da produo de um determinado artigo defeituosa. Um
novo empregado contratado. Ele produz 600 peas do artigo com 82 defeituosas. Ao
nvel de 15%, vericar se o novo empregado produz peas com maior ndice de defeitos
que o existente.
8. Avaliou-se em 240 kg o desvio padro de tenses de ruptura de certos cabos produzidos
por uma fbrica. Depois de ter sido introduzida uma mudana no processo de fabricao
desses cabos, as tenses de ruptura de uma amostra de 8 cabos apresentaram o desvio
padro de 300kg. Investigar a signicncia do aumento aparente da varincia, ao nvel
de 5%.
10.5 Testes No Paramtricos
A maioria dos procedimentos para testes de hipteses vistos at o momento baseada na supo-
sio de que amostras aleatrias so selecionadas de populaes normais. E mesmo que pequenos
67
desvio da normalidade sejam detectados, a maioria destes testes ainda convel quando o tamanho
amostral grande. Tradicionalmente, esses procedimentos de testes so chamados de mtodos pa-
ramtricos. Na sequencia sero apresentados alguns testes alternativos que podem ser considerados,
chamados de mtodos de livres distribuio ou no parmetricos, que frequentemente presume-se
no ter conhecimento sobre as distribuies que fundamentam as populaes.
10.6 Teste de Qui-Quadrado (
2
) para independncia entre variveis e aderncia
A estatstica de
2
muito utilizada para vericar independncia e aderncias de dados experi-
mentais. O teste baseia-se na ideia de que, se as variveis so independentes ou se um conjunto de
dados se ajusta a uma certa distribuio, a diferena ao quadrado entre a frequncia observada (fo)
e a frequncia esperada (fe), tende a zero.
Para vericar independncia ou aderncia utiliza-se as seguintes hipteses devem ser formuladas:
Para independncia:
H
0
: a varivel X independente da varivel Y .
H
1
: a varivel X dependente da varivel Y .
Para aderncia:
H
0
: a varivel X segue determinada distribuio.
H
1
: a varivel X no segue determinada distribuio.
Com base nas hipteses e no nvel de signicncia , determina-se a estatstica e a regio crtica
do teste:
Aderncia:
2
=
k

i=1
(fo
i
fe
i
)
2
fe
i
, em que k o nmero de classes ou colunas; = k p 1
sendo p o nmero de parmetros estimados na distribuio e fe = np.
Indepndencia:
2
=
k

i=1
(fo
i
fe
i
)
2
fe
i
, em que k o nmero de classes ou colunas; =
(k 1)(h 1) sendo p o nmero de linhas e fe =
(Total da linha)(Total da coluna)
(Total geral)
.
Regio Crtica dos testes de aderncia e de independncia: {
2
>
2

()}
Exemplos:
1. Um estudo sobre acidentes de trabalho numa indstria revelou que, 150 acidentes ocor-
reram nos seguintes dias da semana:
Dia S T Q Q S Total
fo 32 40 20 25 33 150
Testar a hiptese de que os acidentes ocorrem com igual frequncia nos diferentes dia da
semana, considerando = 5%
68
2. O impacto das bombas V-1 na Segunda Guerra Mundial foi avaliado em vrias regies do
Sul de Londres, onde vericou-se o nmero de impactos em cada regio. Um indviduo
acredita que o nmero de impactos nas regies, segue uma distribuio de Poisson e calcu-
lou o nmero esperado de regies com um determinado nmero de impactos (frequncias
esperadas). Com base nos resultados apresentados, teste se as frequncias observadas se
ajustam a uma distribuio de Poisson, usando = 5%.
Nmero de ataques de bomba 0 1 2 3 4 ou mais
Nmero real de regies 229 211 93 35 8
Nmero esperado de regies (Poisson) 227,5 211,4 97,9 30,5 8,7
3. Uma pesquisa realizada para analisar os perigos das prosses foi realizada envolvendo
490 pessoas, fornecendo os resultados do quadro abaixo. Vericar se existe dependncia
entre a prosso e a causa da morte, utilizando = 10%.
Causa da morte Polcia Caixa Taxistas Guardas Total
Homicdio 82 107 70 59 318
No homicdio 92 9 29 42 172
Total 174 116 99 101 490
4. Um estudo foi realizado com 150 pessoas para vericar a preferncia pelo tipo de cerveja
em relao ao sexo do consumidor. Os resultados foram:
Sexo Light Comum Escura Total
Masculino 20 40 20 80
Feminino 30 30 10 70
Total 50 70 30 150
Ao nvel nominal de signicncia de 5%, verique por meio de um teste de independncia
se a preferncia pelo tipo de cerveja independe do sexo do consumidor.
69
10.7 Regresso Linear Simples
10.7.1 Diagrama de disperso
Antes de realizar a anlise de regresso, comum construir um grco bidimensional denominado,
diagrama de disperso, para identicar padres que possibilitem vericar:
Se h evidncia de correlao entre as variveis;
Caso exista correlao, qual a sua fora e direo;
Possvel ajuste de um modelo de regresso aos dados, de maneira a descrever o relacionamento
entre as variveis.
Cada valor das variveis X e Y marcado em funo das coordenadas x e y do plano cartesiano.
10.8 Modelo de regresso linear simples
O modelo de regresso linear simples relata o estudo de como a varivel dependente y se relaciona
com uma varivel independente x. O modelo estatstico de uma regresso linear simples :
y
i
=
0
+
1
x
i
+
i
, (1)
em que:
y
i
o valor da varivel dependente na i-sima observao;

0
o primeiro parmetro da equao de regresso, denominado intercepto ou coeciente linear, o
qual indica o valor de y quando x = 0;

1
o segundo parmetro da equao de regresso, chamado coeciente angular de regresso, que
indica a inclinao da reta;
x
i
o valor especicado da varivel independente na i-sima observao, i = 1,2, , n;

i
o erro no observvel associado a i-sima observao;
Pressuposies do modelo de regresso
1) A relao entre x e y linear;
2) Os valores de x so xos, isto , x no uma varivel aleatria;
3) A mdia do erro zero, isto , E(
i
)= 0, i = 1,2, , n;
4) Para um dado valor de x, a varincia do erro
i
sempre constante, isto , V(
i
)=
2
, i =
1,2, ,n. Diz-se, ento, que o erro homocedstico;
5) Cov(
i
,
j
) = 0, i ,= j;
6) O erro tem distribuio Normal com mdia zero e varincia constante (
2
), isto ,
i
N(0,
2
);
Estimao dos parmetros
O objetivo na regresso determinar estimadores de
0
e
1
de tal forma que as distncias
mdias entre a reta de regresso e os valores observados sejam minimizadas, ou seja, o erro cometido
deve ser o menor possvel. A partir do modelo (1) pode-se denir o erro da seguinte forma:
70

i
= y
i

1
x
i
. (2)
O mtodo que ser utilizado para determinar os estimadores de
0
e
1
denominado de Mtodo
de Mnimos Quadrados. Esse mtodo consiste em minimizar a soma de quadrados do erro ou resduo
do modelo (1) ao longo de todos os n pares (x
i
, y
i
). A partir da equao (2) pode-se denir a soma
de quadrados dos resduos (Q) como:
Q =
n

i=1

2
i
=
n

i=1
(y
i

1
x
i
)
2
(3)
Para obter os estimadores de mnimos quadrados basta derivarmos a expresso (3) em relao
aos parmetros
0
e
1
e posteriormente, igualarmos essas derivadas parciais a zero. Primeiramente,
vamos obter as derivadas parciais (Sistema de Equaes Normais, SEN):
_

_
Q

0
= 2
n

i=1
(y
i

1
x
i
)
Q

1
= 2
n

i=1
(y
i

1
x
i
)x
i
Igualando essas derivadas a zero e substituindo
0
e
1
, pelos respectivos estimadores

0
e

1
tem-se:
_

_
2
n

i=1
(y
i

1
x
i
) = 0
2
n

i=1
(y
i

1
x
i
)x
i
= 0

_
n

i=1
(y
i

1
x
i
) = 0
n

i=1
(y
i

1
x
i
)x
i
= 0

_
n

i=1
y
i
n

1
n

i=1
x
i
= 0
n

i=1
x
i
y
i

0
n

i=1
x
i

1
n

i=1
x
2
i
= 0
(4)
Isolando

0
na primeira equao de (4) tem-se que:
n

i=1
y
i
n

1
n

i=1
x
i
= 0

0
=
n

i=1
y
i
n

1
n

i=1
x
i
n
Logo, o estimador de mnimos quadrados para

0
ser:

0
= y

1
x. (5)
71
Substituindo o resultado (5) na segunda equao de (4), e resolvendo em relao a

1
obtm-se:
n

i=1
x
i
y
i

0
n

i=1
x
i

1
n

i=1
x
2
i
= 0
n

i=1
x
i
y
i
( y

1
x)
n

i=1
x
i

1
n

i=1
x
2
i
= 0
n

i=1
x
i
y
i

_
_
_
_
_
_
n

i=1
y
i
n

1
n

i=1
x
i
n
_
_
_
_
_
_
n

i=1
x
i

1
n

i=1
x
2
i
= 0
n

i=1
x
i
y
i

i=1
x
i
n

i=1
y
i
n
+

1
_
n

i=1
x
i
_
2
n

1
n

i=1
x
2
i
= 0
n

i=1
x
i
y
i

i=1
x
i
n

i=1
y
i
n
=

1
_
n

i=1
x
i
_
2
n
+

1
n

i=1
x
2
i
n

i=1
x
i
y
i

i=1
x
i
n

i=1
y
i
n
=

1
_

_
n

i=1
x
2
i

_
n

i=1
x
i
_
2
n
_

1
=
n

i=1
x
i
y
i

i=1
x
i
n

i=1
y
i
n
n

i=1
x
2
i

_
n

i=1
x
i
_
2
n
Logo, o estimador de mnimos quadrados para

1
:

1
=
n

i=1
x
i
y
i

i=1
x
i
n

i=1
y
i
n
n

i=1
x
2
i

_
n

i=1
x
i
_
2
n
=
n

i=1
(x
i
x)(y
i
y)
n

i=1
(x
i
x)
2
=
SPxy
SQx
(6)
Portanto, os estimadores de mnimos quadrados para
0
e
1
so respectivamente:

0
= y

1
x e

1
=
SPxy
SQx
,
72
em que: x =
n

i=1
x
i
n
a mdia da varivel independente x;
y =
n

i=1
y
i
n
a mdia da varivel dependente y;
SPxy =
n

i=1
x
i
y
i

i=1
x
i
n

i=1
y
i
n
a soma de produtos entre x e y e
SQx =
n

i=1
x
2
i

_
n

i=1
x
i
_
2
n
a soma de quadrados de x.
Substituindo no modelo de regresso apresentado em (1), os parmetros,
0
e
1
, pelos seus
respectivos estimadores,

0
e

1
, obtm-se a equao de regresso estimada:
y
i
=

0
+

1
x
i
, (7)
sendo que y o estimador de y, e representa para um dado valor de x o valor mdio de y.
Observao:
1. A estimao da varivel dependente s pode ser feita dentro da faixa de valores da varivel
independente originalmente amostrada(no h fundamento estatstico assumir que a linha
de regresso apropriada fora destes limites)
Exemplo:
1. Uma empresa realizou um estudo para determinar qual a funo que ligava a distncia (km)
e o tempo (em dias) de entrega de suas mercadorias, transportadas por caminho. Foram
selecionados aleatoriamente 10 carregamentos recentes para ser analisados, conforme os dados
apresentados a seguir. Com base nestes dados, obtenha a equao de regresso estimada que
possa ser usada para prever o tempo de entrega a partir da hora que o carregamento est
disponvel para ser transportado.
Tempo de entrega (y) 3,5 1 4 2 1 3 4,5 1,5 3 5
Distncia (x) 825 215 1070 550 480 920 1350 325 670 1215
Ao analisar o grco de disperso dos dados acima, pode-se tirar as seguintes concluses prvias:
Valores maiores de distncia tendem a se relacionar com maiores tempo de entregas de mer-
cadorias;
Relao entre a distncia percorrida e o tempo de entrega parece aproximar de um linha reta,
ou seja, uma relao linear positiva indicada entre x e y.
Informaes necessrias:
73
n = 10;
10

i=1
x
i
= 7620;
10

i=1
x
2
i
= 7.104.300;
10

i=1
y
i
= 28,5;
10

i=1
x
i
y
i
= 26370; x = 762;
y = 2,85
Clculo de

0
e

1
=
SPxy
SQx
=
n

i=1
x
i
y
i

(
n

i=1
x
i
)(
n

i=1
y
i
)
n
n

i=1
x
2
i

_
n

i=1
x
i
_
2
n
=
26370
(7620)(28,5)
10
7.104.300
(7620)
2
10
=
4653
1297860
= 0,00358 0,0036

0
= y

1
x = 2,85 0,0035851 762 = 0,1181
Equao de regresso linear simples estimada
y
i
= 0,1181 + 0,0036x
i
Espera-se que com o aumento de cada unidade de distncia percorrida, ocorra um aumento
estimado no tempo mdio de entrega das mercadorias de 0,0036 dias.
10.9 Coeciente de determinao
O coeciente de determinao nos d uma medida da ecincia (ou da qualidade) do
ajuste do modelo, ou seja, indica o quanto da variao de y (variao total) que explicada
pelo modelo de regresso ajustado. Portanto, o coeciente de determinao pode ser utilizado
como um avaliador do modelo ajustado.
O coeciente de determinao, denotado por R
2
, dado por:
R
2
=
(SPxy)
2
SQxSQy
, 0 R
2
1,
em que: SPxy =
n

i=1
x
i
y
i

i=1
x
i
n

i=1
y
i
n
a soma de produtos entre x e y e
SQx =
n

i=1
x
2
i

_
n

i=1
x
i
_
2
n
a soma de quadrados de x;
SQy =
n

i=1
y
2
i

_
n

i=1
y
i
_
2
n
a soma de quadrados de y;
Exemplo:
74
1. Utilizando os dados do exemplo da distncia e tempo de entrega, pede-se:
a) Calcular o coeciente de determinao e interpretar os resultados obtidos;
R
2
=
(SPxy)
2
SQxSQy
=
(4653)
2
(1297860)(18,525)
= 0,90 = 90%
Interpretao: Podemos concluir que 90% da varincia no tempo de espera estatsti-
camente explicada pela distncia envolvida. Os 10% restantes da varincia permanecem
inexplicadas (peso da carga, habilidade do motorista, rodovias, etc.)
b) Estimar o tempo de entrega de uma mercadoria que ca a 750 km de distncia;
y
i
= 0,1181 + 0,0036x
i
= y
i
= 0,1181 + (0,0036)(750) = 2,81 3 dias
10.10 Coeciente de correlao linear de Pearson
O coeciente de correlao mede o grau de associao linear entre as variveis x e y, e
seu domnio dado pelo intervalo entre 1 e 1.
O estimador do coeciente de correlao linear populacional de Pearson () o coeciente
linear amostral, denotado por r:
r = sinal de

1
SPxy

SQx

SQy
, 1 r 1,
Se r = 0, tem-se que as variveis x e y so no correlacionadas linearmente, ou seja,
ausncia de correlao linear entre x e y. Dessa forma, pode-se dizer que no existem meios
lineares acurados (precisos) para realizar previses de valores de y conhecendo-se os valores
de x, ou vice-versa.
Se r > 0, indica que existe uma relao linear positiva entre x e y, o que signica que
h uma tendncia de pequenos valores de x estarem associados a pequenos valores de y e
vice-versa, isto , existe uma relao linear diretamente proporcional.
Se r < 0, indica que existe uma relao linear negativa entre x e y, o que signica que
h uma tendncia de pequenos valores de x estarem associados a grandes valores de y e
vice-versa, isto , existe uma relao linear inversamente proporcional.
Exemplo
1. No exemplo da distncia e do tempo, calcular o coeciente de correlao.
r = sinal de

1
SPxy

SQx

SQy
= sinal de

R
2
= +
_
0,90 = 0,9489 = 94,89%
Interpretao: O valor positivo da correlao est baseado na observao de que a
inclinao de

1
da reta de regresso positiva, e essa correlao poder ser considerada
forte, pois est prxima de 1, ou seja, a medida que a distncia aumenta, o tempo de
entrega tambm aumenta.
75

Potrebbero piacerti anche