Sei sulla pagina 1di 70

Universidade Estadual de Santa Cruz

Departamento de Cincias Exatas e Tecnolgicas












INTRODUO A ESTATSTICA ECONMICA





Professor: Marcelo Incio Ferreira Ferraz
















2011



1
PARTE I: Introduo a Estatstica Econmica

1 CONCEITOS BSICOS .............................................................................................. 2
1.1 Dados estatsticos .................................................................................................. 3
1.2 Fases do trabalho estatstico .................................................................................. 3
1.3 Arredondamento de dados ..................................................................................... 3
1.4 Sries estatsticas ................................................................................................... 4
1.5 Populao e amostra .............................................................................................. 6
2 REPRESENTAO TABULAR ................................................................................ 8
2.1 Normas de apresentao e elementos de uma tabela ............................................. 8
3 REPRESENTAO GRFICA ................................................................................ 11
4- DISTRIBUIO DE FREQNCIAS .................................................................... 19
5 MEDIDAS DE POSIO (TENDNCIA CENTRAL) ........................................... 23
5.1 Mdias ................................................................................................................. 23
5.2 Mediana ............................................................................................................... 26
5.3 MODA (M
O
) ........................................................................................................ 29
5.4 SEPARATRIZES ................................................................................................ 31
5 MEDIDAS DE DISPERSO ..................................................................................... 34
5.1. Amplitude total ou intervalo total (A
t
a, R, I
t
) ................................................... 34
5.2 Amplitude Interquartlica .................................................................................... 35
5.3. Desvio mdio ou mdia dos desvios (D
m
, d
m
, d, DM, D
m
) ................................ 35
5.4 Varincia .............................................................................................................. 37
5.5 Desvio-padro (S, o) ........................................................................................... 37
5.6 Coeficiente de variao ou coeficiente de variao relativa (CV) ...................... 38
5.7 Medidas de Assimetria ..................................................................................... 39
5.8 Medidas de Curtose .......................................................................................... 40
5.9 Boxplot ou desenho esquemtico ..................................................................... 41
6 PROBABILIDADE .................................................................................................... 45
6.1 Conceitos Bsicos ................................................................................................ 45
6.2 Probabilidade ....................................................................................................... 46
6.3 Axiomas de probabilidades ................................................................................. 47
Exemplo: Escolhe-se uma urna ao acaso e dele extraiu-se uma bola ao acaso,
verificando-se que a bola branca. Qual a probabilidade de a bola ter vindo da urna
2 ................................................................................................................................. 49
7- DISTRIBUIES DE PROBABILIDADES ........................................................... 52
Varivel aleatria ................................................................................................... 52
Esperana Matemtica ........................................................................................... 53
7.2 DISTRIBUIES DISCRETAS ........................................................................ 56
7.2.1 Distribuio Binomial .................................................................................. 56
7.2.2 - Distribuio de Poisson .............................................................................. 59
7.3 - DISTRIBUIO CONTNUA ......................................................................... 62
7.3.1 Distribuio Normal ..................................................................................... 63
7.3.2 - Outras distribuies contnuas ................................................................... 68






2
1 CONCEITOS BSICOS

- Histrico - meados do sculo XVIII, a estatstica referia-se apenas aos negcios do Estado
por seus primeiros organizadores estarem ligados a departamentos criados pelos
governantes. Atualmente atua em vrias reas como na fsica, qumica, engenharia,
economia, administrao, medicina, biologia, cincias sociais etc.

a) A estatstica:
Como cincia - se preocupa com a organizao, descrio, anlise e interpretao
(inferncia, concluso) dos dados. Como toda cincia sua essncia a observao e
objetivo bsico a inferncia.

Como mtodo - serve para estudar e medir fenmenos coletivos, visando subsidiar as
tomadas de decises em condies de incerteza. Neste caso, os mtodos estatsticos,
tornam-se ferramentas indispensveis para a atuao de profissionais de gerncia e
superviso, pois deles dependem:
- obteno de dados representativos de determinada situao;
- anlise da situao;
- previso dos negcios e do nvel de atividades econmicas, pesquisa e
anlise do mercado e da mo-de-obra;
- controle departamental ou global, das empresas, e da qualidade dos
produtos.

b) Ramos da estatstica
i) Estatstica descritiva - trata da organizao e descrio dos dados (dedutiva); pretende
somente descrever e analisar um certo grupo, sem tirar quaisquer concluses ou inferncias
sobre um grupo maior. Os dados podem ser apresentados atravs de grficos ou tabelas,
alm do clculo de coeficientes.

Ex.: o volume de vendas de um produto durante o ano.

ii) Estatstica indutiva ou inferncia estatstica ou estatstica inferencial ou induo
estatstica - trata da anlise e interpretao dos dados. Principalmente, se a amostra
representativa de uma populao, concluses importantes podem ser inferidas.

Ex.: calculando a voltagem necessria para que um dispositivo eltrico chegue a falhar, a partir de uma
amostra, estima-se uma probabilidade de falha, por a inferncia no ser absolutamente certa.

Obs.: Normalmente, ambas as partes da estatstica esto conjuntamente apresentadas na
soluo de problemas, ou seja, os dados so organizados em uma tabela, descritos,
analisados e tirados inferncias.

- Duas concepes para a palavra estatstica:
1) no plural (estatsticas), indica coleo de dados numricos, visando fornecer
informaes a respeito de uma atividade qualquer.
2) no singular (estatstica), esta relacionada cincia ou aos mtodos estatsticos.

Ex.: Estatsticas demogrficas: natalidade, desquites, falecimento, matrimnio etc - Estatsticas
econmicas: emprego, produo, preos, vendas etc.




3
1.1 Dados estatsticos
um conjunto de informaes de um fenmeno apresentadas de forma quantitativa e
qualitativa.

a) Variveis qualitativas
- Os atributos caracterizam os dados ou variveis qualitativas de uma populao (sexo,
estado civil, cor, religio etc.).
- varivel nominal: sexo, cor dos olhos
- varivel ordinal: classe social, grau de instruo

b) Variveis quantitativas
Estes dados podem ser denominados de:
- varivel discreta - normalmente resulta de uma contagem (so n
o
. e no-negativos).
Ex.: os valores de uma populao: nmeros de adultos, crianas e idosos.

- varivel contnua - no-contvel, resulta de medies, pode assumir um valor real qualquer
entre dois dados.
Ex.: altura, peso, a medio de temperatura etc.

1.2 Fases do trabalho estatstico
Para se chegar a um estudo estatstico h vrias fases:
1. Definio do problema, ou seja, saber o que vai ser pesquisado;
2. Planejamento - procedimento, como obter os dados, quais so os dados,
cronograma das atividades, custos envolvidos;
3. Coleta dos dados - dados primrios (publicados ou comunicados pela
prpria pessoa que os tenham recolhidos), dados secundrios (publicados
ou comunicados por outra pessoa ou instituio que os tenham recolhidos);
4. Apurao dos dados - tratamentos nos dados como soma, diviso etc;
5. Apresentao dos dados - por tabela e/ou grficos;
6. Anlise e interpretao dos dados - tirar concluses.

1.3 Arredondamento de dados
1. Se o dgito situado mais esquerda dos que sero eliminados for maior do que cinco o
ltimo dgito remanescente ser aumentado de uma unidade.
2. Se o dgito situado mais esquerda dos que sero eliminados for menor do que cinco o
ltimo dgito remanescente no ser aumentado de uma unidade.
3. Se o dgito situado mais a esquerda dos que sero eliminados for um cinco e o ltimo
dgito remanescente for par, no se alterar, mas se for mpar ser aumentado de uma
unidade.

Nmero a arredondar Arredondamento para Nmero arredondado
12,489 inteiros 12
15,504 inteiros 16
20,733 dcimos 20,7
16,561 dcimos 16,6
35,992 centsimos 35,99
17,578 centsimos 17,58



4

1.4 Sries estatsticas
Define-se como uma coleo de dados estatsticos referidos a uma mesma ordem de
classificao (com carter varivel).
Uma srie estatstica varia de outra pela poca, local (onde acontece) e Fenmeno
(espcie do fato).
So 4 os tipos de sries:
a) Srie temporal (histrica, cronolgica, evolutiva ou marcha)
- elemento varivel = poca;
- elemento fixo = local e fenmeno.
Ex.: uma srie de preos mensais ou uma srie de produo anual de um produto.

Tabela 1- Produo de caf do Brasil, no perodo de 1993 a 1995
Ano Produo (1.000 t)
1993 30.000
1994 40.000
1995(1) 50.000
Total 120.000
Fonte: IBGE, 1996.
Nota - No inclui nestes dados a produo de caf do Estado de Minas Gerais.
(1) Estimativa.

b) Srie geogrfica (territorial, espacial, de localizao)
- elemento varivel = local;
- elementos fixos = poca e fenmeno.
Ex.: a produo de manga no Brasil por estado.
Tabela 2 - Produo de manga (em mil frutos) dos principais estados brasileiros
produtores, em 1998
Estado 1998
Brasil 1.874.371
So Paulo 518.679
Bahia 258.365
Minas Gerais 242.646
Pernambuco 191.160
Paraba 146.923
Cear 105.214
Rio Grande do Norte 74.053
Sergipe 67.942
Piau 56.254
Par 43.240
Outros 169.895
Fonte: IBGE - Produo Agrcola Municipal.
1
FAC: freqncia acumulada.





5

c) Srie especfica (categrica, ou por categoria)
- elemento varivel = fenmeno;
- elementos fixos = poca e local.
Ex.: o comportamento da venda de leite por categoria (leite tipo A, B e C) no Brasil, em 1994 ou
produo de derivados de leite na Bahia - 1986.


Tabela 3 - Produo de derivados de leite na Bahia - 1986
Derivados Produo (T)
Leite em p 17.650
Queijo 1.965
Manteiga 1.104
Outros 6.699
Fonte: SERPA - Serv. de Insp. da Prod. Animal - Min. da Agricultura.


d) Distribuio de freqncia
- elementos fixos = poca, local e fenmeno.
Onde o fenmeno apresenta-se atravs de gradaes.
Ex.: nmero de pessoas por vrias classes de renda no Brasil ou nmero de empregados por faixa de
salrio horrio de uma empresa.


Tabela 4 - Nmero de empregados por faixa de salrio horrio dos empregados de uma
empresa na Bahia, em 2002
Salrio (R$ /h) Nmero de Empregados
16,60 19,10 3
19,10 21,60 5
21,60 24,10 7
24,10 26,60 8
26,60 29,10 5
29.10 31,60 2
Total 30
Fonte: Dados fictcios.


Caso especial:

Srie de seo-cruzada (cross-section) tabela com dupla entrada
- elemento varivel = poca e/ou fenmeno e/ou local;
- elementos fixos = poca ou fenmeno ou local.
Ex.: a produo de manga no Brasil por estado.





6

Tabela 5 - Produo de manga (em mil frutos) dos principais estados brasileiros
produtores, em 1995-1998
Estado 1995 1996 1997 1998 Participao
1998 (%)
FAC
1
(%)
Brasil 1.823.917 1.695.459 2.033.399 1.874.371 100,00
So Paulo 451.643 483.299 488.489 518.679 27,7 27,7
Bahia 187.717 207.255 228.982 258.365 13,8 41,5
Minas Gerais 205.276 228.460 419.530 242.646 12,9 54,4
Pernambuco 115.813 147.999 177.259 191.160 10,2 64,6
Paraba 184.685 116.840 154.094 146.923 7,8 72,4
Cear 100.589 112.749 127.806 105.214 5,6 78,1
Rio Grande do Norte 78.720 80.820 78.096 74.053 4,0 82,0
Sergipe 53.749 59.131 68.481 67.942 3,6 85,6
Piau 176.812 39.826 61.604 56.254 3,0 88,6
Par 82.639 87.420 47.564 43.240 2,3 90,9
Outros 186.274 131.660 181.494 169.895 9,1 100,0
Fonte: IBGE - Produo Agrcola Municipal.
1
FAC: freqncia acumulada.



1.5 Populao e amostra

Populao ou universo: Uma populao um conjunto que engloba todos os elementos
detentores de uma ou mais caractersticas em comum que os relacionam ao objeto de estudo.
Sua amplitude depende do objeto e dos objetivos pesquisados. Depois de se estabelecer o
objeto e os objetivos de estudo, o passo seguinte em uma pesquisa a delimitao da
populao dentro da qual se deseja responder tais objetivos com vistas ao estudo de tal objeto.
Delimitar a populao estabelecer o campo de validade do conhecimento que se
quer obter.

Delimitar a populao no to fcil como pode parecer. A populao de certa turma de
Estatstica perfeitamente delimitada pela listagem expedida pela Secretaria Geral de Cursos.
Se a populao for os estudantes aptos a cursarem Estatstica, no entanto, em todo final de
semestre haver uma renovao parcial. Somente se delimitssemos um perodo de tempo
seria possvel obter a lista de estudantes, mas poderia no ser interessante do ponto de vista do
objeto de estudo a delimitao de um perodo restrito de tempo. Um outro exemplo: quem so
precisamente os moradores de um bairro popular? A prpria regio fsica de um bairro
muito difcil de se demarcar, pois suas fronteiras esto em permanente movimento e alm
disso, as pessoas esto sempre se mudando, umas nascem, outras morrem.
Podemos, em vista do exposto, classificar as populaes em finitas quando possvel obter
uma lista exata dos membros, ou infinitas, quando existem processos de renovao que
impem o estabelecimento de limites exatos.




7
Ex.: universo de animais ameaados de extino; o universo de pessoas economicamente ativas do
Brasil; o universo constitudo pelo peso dessas pessoas; o universo de suas rendas mensais; de suas
idades.

- A populao pode ser ainda finita (nmero limitado de observaes) ou infinita (nmero
ilimitado de observaes):
Ex.: o universo dos estudantes da UESB (populao finita); resultados obtidos lanando um dado
(populao infinita).

- Amostra: subconjunto da populao, necessariamente finito, pois todos seu elementos
sero examinados para efeito da realizao de um estudo estatstico desejado.
- Se esta amostra representativa da populao (deve possuir as mesmas caractersticas
bsicas da populao, no que diz respeito (s) varivel(is) que desejamos pesquisar) pode-se
tirar concluses importantes sobre a populao (estatstica inferencial).
- As caractersticas da amostra so chamadas de estatsticas (descritivas), simbolizadas por
caracteres latinos ( X , S, p) enquanto que os parmetros da populao tero como smbolos,
os caracteres gregos (, o, t).
O uso de amostras em vez de estudar populaes inteiras tem enormes vantagens, tais
como o menor uso de recursos humanos, financeiros, de tempo, at de preciso na obteno
de medidas ou observaes.




8

2 REPRESENTAO TABULAR

Importncia - apresentar os dados coletados de uma forma que sintetiza as
observaes, facilitando a sua leitura e compreenso. Qualquer processo ou mtodo
estatstico tem como ponto de partida uma tabela. Estas servem para apresentar os dados
coletados, com a finalidade de sintetizar as observaes, facilitando sua leitura e
compreenso.

2.1 Normas de apresentao e elementos de uma tabela

Denomina-se representao tabular a forma que se utiliza de tabelas para apresentar os
dados coletados, com a finalidade de sintetizar as observaes, facilitando sua leitura e
compreenso.Toda tabela deve ser simples, clara, objetiva e auto-explicativa.
As tabelas estatsticas so classificadas segundo os mesmos critrios adotados para
classificao das sries estatsticas.
Sendo assim, as tabelas estatsticas simples (que apresentam apenas duas colunas) so
utilizadas para representar as sries especificativas, geogrficas e temporais.
J as tabelas de dupla entrada so utilizadas para representar as sries mistas, que
combinam duas ou mais sries estatsticas simples (histrico - especificativa, por exemplo).
Os elementos componentes de uma tabela so os seguintes: referncia; ttulo; data de
referncia; cabealho; coluna indicadora; corpo; linha; coluna; casa; trao; fonte; data;
chamada.

Referncia - usada para identificar a tabela, a referncia deve preceder o ttulo, na
mesma linha, separando-se deste por um hfen.
Ttulo - deve ser auto-explicativo, indicando o que (so os dados includos na tabela, o
fenmeno ou fato e/ou como esto classificados), onde (o local representado pelos dados) e
quando os dados ocorreram.
No deve ser colocado ponto final aps a data de referncia no ttulo.
Cabealho - parte da tabela que especifica o contedo apresentado em cada coluna.
Coluna indicadora - especifica o contedo das linhas (1

letra maiscula).
Corpo - onde esto localizados os dados e/ou informaes e sinais convencionais.
Linha - conjunto de elementos dispostos horizontalmente no corpo da tabela.
Coluna - conjunto de elementos dispostos verticalmente no corpo da tabela.
Casa - cruzamento de uma linha com uma coluna. Todas as casas de uma tabela



9
devem estar preenchidas. A falta de qualquer informao deve ser suprida por algum sinal,
conforme a conveno:
. . . o dado desconhecido, podendo ou no existir (por exemplo: preo da piaava);
.. para indicar que no se aplica dado numrico;
_ o dado no existe (Ex.: por razo da sazonalidade da produo);
0; 0,0; 0,00 o dado existe, mas seu valor inferior metade da unidade adotada na
tabela;
X o dado foi omitido, para evitar a individualizao da informao (nico dado).
Traos - delimitam obrigatoriamente o cabealho, a coluna indicadora e a parte
inferior da tabela. As tabelas no devem ser delimitadas direita e esquerda por traos
verticais; deve-se evitar traos verticais e horizontais no corpo da tabela.
Rodap - espao inferior da tabela, aps o fecho da mesma, onde se coloca
informaes adicionais para melhor entendimento da tabela. Inclui-se:
a) Fonte - indicao do responsvel pelo fornecimento dos dados ou pela sua
elaborao. citada imediatamente aps o trao inferior da tabela.
b) Nota - informaes de natureza geral, destinadas a conceituar ou esclarecer o
contedo das tabelas ou a indicar a metodologia adotada na coleta ou
elaborao dos dados. Deve ser localizada logo abaixo da Fonte.
c) Chamada - informaes de natureza especfica sobre determinada parte da
tabela, enumerada em arbicos entre parnteses, destinadas a escrever
conceitos ou esclarecer dados. Devem ser colocadas logo aps a Nota.
No Brasil, cabe ao Conselho Nacional de Estatstica e ao IBGE estabelecer normas
para as representaes estatsticas. Embora as resolues desses rgos no sejam
necessariamente de uso obrigatrio, recomendvel a sua utilizao. Os procedimentos aqui
relacionados so os de utilizao e aceitao mais generalizadas.

Tabela 6 - Produo de caf do Brasil, no perodo de 1993 a 1995
Ano Produo (1.000 T)
1993 30.000
1994 40.000
1995
(1)
50.000
Total 120.000
Fonte: IBGE, 1996.
Nota - No inclui nestes dados a produo de caf do Estado de Minas Gerais.
(1)
Estimativa.






10


Tabela 2 - Concorrncia e taxa de aprovao no vestibular da UESC de 2008 a
2010
Vestibular
Candidato/vaga Aprovao %
Cota N cota Cota N cota
2008 9.63 10.38

2009 7.92 10.07 32.4 45.3
20 10 8.33 10.15 24.82 44.25
Fonte: Relatrios Anuais de Atividades da UESC 2008, 2009 e 2010





11
3 REPRESENTAO GRFICA

Aps representados em tabelas, os dados estatsticos podem tambm ser representados
graficamente. Grfico uma representao em uma figura da relao entre variveis.
Importncia: os grficos facilitam a compreenso de uma srie estatstica e permitem
uma visualizao imediata da distribuio dos valores observados.
Elementos: compem os grficos estatsticos: referncia, ttulo, data de referncia,
fonte, nota, chamada, escala e legenda.
Com exceo dos dois ltimos, os demais elementos tm para os grficos funes
semelhantes s descritas anteriormente, quando eles foram relacionados como elementos que
compem as tabelas.
Escala: a seqncia ordenada de valores que descreve o campo de variao de um
fenmeno. Quando se trata de grfico retangular, duas escalas so levadas em conta:
Escala vertical - que comumente, refere-se freqncia ou intensidade dos fatos, e a;
Escala horizontal - que se refere ao local ou poca de variao do fato. Nesse caso,
recomenda-se que as dimenses altura e largura devam ser, sempre, uma aproximadamente
60% a 80% (AZEVEDO, 1980) da outra.
A escala aritmtica a mais largamente utilizada. Todavia, h casos em que se impe
a utilizao de escalas logartmica ou semilogartmica.
Legenda: a descrio das convenes utilizadas na elaborao de grficos que
representam mais de um fato. Devem ser localizadas direita do grfico, ou abaixo deste,
antecedendo o ttulo.

TIPOS DE GRFICOS ESTATSTICOS
Os grficos estatsticos podem ser classificados em quatro tipos bsicos: diagramas
(grficos geomtricos dispostos em 2 dimenses), cartogramas (mapas), pictogramas (figuras)
e estereogramas (representam volume e so apresentados trs dimenses).
Nos preocuparemos em detalhar apenas os diagramas. As demais formas de
representao grfica so mais complexas na sua elaborao e fogem ao objetivo deste
trabalho.
Os diagramas so denominados segundo o mtodo empregado para representao das
sries estatsticas, tais como grficos: de linha, de colunas, de barras, e de reas ou de setores.
Grfico linear - (ou grfico em curva) - usado para representar alteraes qualitativas sob a
forma de uma poligonal aberta. Sua principal utilizao na representao das sries
temporais.

Exemplo: (srie cronolgica)

Tabela 7 - Exportaes brasileiras - 1975 a 1980
Anos Valor da Exportao (US$ 1.000 fob)
1975 8.669.944
1976 10.128.303
1977 12.120.175
1978 12.658.944
1979 15.144.377
1980 20.132.401
Fonte: CACEX.



12

0
3000
6000
9000
12000
15000
18000
21000
1975 1976 1977 1978 1979 1980
Anos
U
S
$

1
0
0
0
0
0
0

F
O
B

Figura 1 - Exportaes brasileiras, no perodo de
1975 a 1980.
Fonte: Cacex, 1990.

Planejamento do Grfico:
Escala Horizontal
Largura
N de perodos a representar (intervalos): 5
Centmetros por perodo: 2 cm
Largura: L = 5 x 2 = 10 cm
Altura: A = 60% de 10 cm = 6 cm - 8 cm
Escala Vertical
Amplitude da varivel: E = 20.132.401 - 6 = 3.355.400 /cm
E = 20.132.401 - 8 = 2.516.550 /cm
3.355.400 + 2.516.550 = 5.871.950
5.871.950 2 = 2.935.975
Portanto, 1 cm = US$ 2.935.975.000
Para comodidade de clculo faz-se 1 cm ~ 3.000.000.000
As ordenadas correspondentes a cada ano so obtidas dividindo-se o valor
correspondente de cada pela escala. Assim para 1975, teramos: 8.669.944 3.000.000 = 2,9
cm; para 1976, teramos: 10.128.309 3.000.000 = 3,4 cm
(Para fixao usar srie mista).




13
8500
10500
12500
14500
16500
18500
20500
Anos
U
S
$

1
0
0
0
0
0
0

F
O
B
1975 1976 1977 1978
1979
1980
0

Figura 1 - Exportaes brasileiras, no perodo de 1975 a 1980.
Fonte: Cacex.
Escala Vertical para grfico com corte
Para ampliar o grfico, visando uma melhor observao do incremento anual, pode-se
cortar o grfico logo aps a linha do zero, sem alterar as dimenses da moldura.
No grfico anterior possui um espao vazio desde o ponto de origem at a marca dos
8.000.


Grfico em colunas - as variaes quantitativas so representadas por colunas sucessivas de
bases iguais e altura proporcionais intensidade do fenmeno. O espao entre colunas deve
ser de a da base das colunas.
Embora se preste para representar qualquer tipo de srie, os diagramas em colunas tm
seu uso mais comum na representao de sries geogrficas e especificativas.

Exemplo: (srie geogrfica ou especificativa)

Tabela 7 - Matrculas nas escolas municipais urbanas de Itabuna 1983
Turno N de Alunos
Matutino 4.212
Vespertino 3.314
Noturno 1.433
Fonte: PMI - Secretaria de Educao.



14
0
500
1000
1500
2000
2500
3000
3500
4000
4500
Matutino Vespertino Noturno
Turnos
N
o
.

d
e

a
l
u
n
o
s

Grfico 2 - Matrculas nas escolas municipais urbanas de
Itabuna, em 1983.
Fonte: PMI - Secretaria de Educao.




Grfico de Barras - assemelha-se aos diagramas em colunas. As variveis so representadas
por barras (colunas na posio horizontal) sucessivas.
Prefere-se a sua utilizao, em lugar dos diagramas em colunas, sempre que se tem
que representar categorias com nomes de muitas letras. A posio horizontal das colunas
permite que eles sejam escritos sem que se tenha que recorrer a abreviaturas ou legendas.

Exemplo (srie especificativa)

Tabela 8 - Produo de derivados de leite na Bahia - 1986
Derivados Produo (t)
Leite em p 17.650
Queijo 1.965
Manteiga 1.104
Outros 6.699
Fonte: SERPA - Serv. de Insp. da Prod. Animal - Min. da Agricultura.





15
0 5000 10000 15000 20000
Leite em p
Queijo
Manteiga
Outros
Produo (t)

Grfico 3 - Produo de derivados de leite na Bahia, em 1986.
Fonte: Serpa - Serv. de Insp. da Prod. Animal - Min. da Agricultura.



Grficos de Setores - so usados para representar sries estatsticas que relacionam a
intensidade das variveis ao total da srie. Indicadas para representarem as sries geogrficas
e especificadas. Os tipos mais conhecidos so os grficos em setores, tomados em um
retngulo ou um crculo.
Grfico de Setores em Retngulo - consiste em dividir um retngulo em retngulos
menores, com a mesma altura e base proporcional s parcelas que constituem a srie.
Exemplo: (srie especificativa).

Tabela 9 - Consumo de gua, por categorias, na Bahia - 1986
Categorias Consumo
(1000 m
3
)
Residencial 171.151
Comercial 23.436
Industrial 3.363
Contratada 9.975
Total 208.925
Fonte: EMBASA - Emp. Baiana de gua e Saneamento



16
1
7
1
,
1
5
1
2
3
,
4
3
6
3
,
3
6
3
9
,
9
7
5
Residencial
Comercial
Industrial
Contratada

Cada retngulo deve ser reticulado (ou colorido) de forma diferente, seguindo a
legenda previamente determinada.


Grfico de Setores em Crculo - neste diagrama, a rea total do crculo (360) ser
dividida proporcionalmente s parcelas que constituem a srie.

Exemplo: (mesmo do retngulo)
171151
23436
3363
9975
Residencial
Comercial
Industrial
Contratada

Grfico 5 - Consumo de gua, por categorias, na Bahia 1986.
Fonte: Embasa - Emp. Baiana de gua e Saneamento.

Cada ngulo deve ser reticulado (ou colorido) de forma diferente, como no caso
anterior.



17
Exemplos diversos









18






Figura 4 - Box plot para CRAA 2009.2 e rea de conhecimento para cotas e no
cotas para os cursos de graduao da UESC.
Nota: EC Exatas cotas; ENC -Exatas no cotas; HC Humanas cotas; Humanas no cota; VC
Vidas cota; VCN Vidas no cota
Fonte: Dados da pesquisa elaborados a partir de relatrios da SEGREG/UESC










19
4- DISTRIBUIO DE FREQNCIAS

Os dados resultantes de uma coleta (dados brutos) para serem melhor analisados,
devem-se submeter a alguns critrios de organizao.
O mais preliminar desses critrios consiste em dispor os dados em rol, ou seja, arranj-
los em ordem crescente ou decrescente. Para facilitar ainda mais a anlise, costuma-se indexar
os dados em classe e determinar o nmero de informaes pertencentes a cada classe, as
freqncias de classe.
Os dados representados em tabela que apresentam classes com as respectivas
freqncias constituem uma distribuio de freqncias.
Nas distribuies de freqncias ressaltam-se os seguintes elementos:
Freqncia simples de classe - n de ocorrncias das informaes compreendidas em uma
classe;
Amplitude total - diferena entre o maior e o menor valor da srie.
Classe de freqncia - cada um dos grupos em que se subdivide a amplitude total.
No existe regra fixa para determinao do nmero de classes de uma distribuio. Os
critrios existentes servem apenas como indicao. Recomenda-se que esse nmero no seja
inferior a 4 nem superior a 10.
A frmula de Sturges a mais usada para indicao do nmero ideal de classes:
Nmero de classes = 1 + 3,3 log N, onde N o nmero de observaes.
Limites de classes - so os nmeros extremos de cada classe. So os limites inferiores e
superiores.
Nas distribuies em que o limite superior de uma classe no coincide com o limite
inferior da classe seguinte, os limites reais das classes so obtidos somando-se o limite
superior de uma classe ao limite inferior da classe seguinte e dividindo-se os resultado por
dois.
Intervalo de classe - a diferena entre os limites inferiores (ou superiores) de duas classes
consecutivas. Esse intervalo deve ser constante e resulta da diviso da amplitude total pelo
nmero de classe.
(h = ____AT___).
n classes
H distribuies de freqncias que no tm definido o limite inferior da primeira
classe ou o limite superior da ltima classe. Os intervalos assim representados so
denominados intervalos de classe abertos (por exemplo, ao referir-se a nveis de renda,
comum constar da ltima classe a expresso acima de).
Para evitar interpretaes ambguas, recorre-se seguinte conveno para representar
com clareza os intervalos de classe:
(inclui o limite inferior e exclui o limite superior);
(exclui o limite inferior e inclui o limite superior);
(exclui os dois limites);
(inclui os dois limites).
Ponto mdio de classe - o meio do caminho entre os limites reais de uma classe.
obtido somando-se esses limites e dividindo o resultado por dois.

TIPOS DE FREQNCIAS

As freqncias podem ser dos seguintes tipos: Freqncia Simples e Freqncia
Acumulada.
As Freqncias Simples subdividem-se em absoluta - que corresponde ao nmero de



20
informaes de uma classe, e relativa - corresponde ao quociente entre a freqncia absoluta
da classe e a freqncia total. , geralmente, expressa em percentagem.
As Freqncias Acumuladas podem ser crescentes (ou abaixo de) - que corresponde
soma da freqncia de determinada classe com as anteriores, e decrescente (ou acima de)
- que corresponde soma da freqncia de determinada classe com as subsequentes.
As freqncias acumuladas tanto podem ser absolutas como relativas.
Para exemplificar o que foi anteriormente exposto, consideremos a distribuio
seguinte, que se refere aos salrios pagos por hora aos empregados da Empresa XYZ:

27,60 23,20 27,00 23,00 20,80 19,20
21,80 24,60 22,60 20,80 24,20 20,40
17,00 31,60 24,80 16,60 25,20 19,60
30,40 17,60 22,40 28,60 25,80 23,20
24,80 23,60 25,20 26,40 26,60 28,40

Para que estes dados sejam representados em uma distribuio de freqncia, deve-se
seguir o seguinte roteiro:
1. Determinao da Amplitude Total:
AT = 31,60 - 16,60 = 15
2. Determinao do nmero de classes:
C = 1 + 3,3 x log 30 6.
3. Determinao do intervalo de classe:
h = AT = 15 = 2,5
C 6
4. Determinao da freqncia das classes:
Classes Freqncia
16,60 19,10 | | | = 3
19,10 21,60 | | | | | = 5
21,60 24,10 | | | | | | | = 7
24,10 26,60 | | | | | | | | = 8
26,60 29,10 | | | | | = 5
29,10 31,60 | | = 2

5. Representao tabular da srie:
SALRIO HORRIO DOS EMPREGADOS DA EMPRESA XYZ
Classes F Fac Fad Fr F% Fac % Fad%
16,60 19,10 3 3 30 0,10 10 10,0 100,0
19,10 21,60 5 8 27 0,17 17 26,7 90,0
21,60 24,10 7 15 22 0,23 23 50,0 73,3
24,10 26,60 8 23 15 0,27 27 76,7 50,0
26,60 29,10 5 28 7 0,17 17 93,3 23,3
29,10 31,60 2 30 2 0,06 6 100,0 6,7
Total
30 1,00 100
6. Determinao das freqncias relativas (FR):
3 30 = 0,10; 5 30 = 0,17; 7 30 = 0,23; 8 30 = 0,27; 5 30 = 0,17; 2 30 = 0,06

7. Determinao das freqncias relativas percentuais (F%):



21
Freqncia relativa x 100

8. Determinao das freqncias acumuladas crescentes (ou abaixo de) FAC:
3; 3 + 5 = 8; 8 + 7 = 15; 15 + 8 = 23; 23 + 5 = 28; 28 + 2 = 30

9. Determinao das freqncias acumuladas decrescentes (ou acima de) FAD:
30; 30 - 3 = 27; 27 - 5 = 22; 22 - 7 = 15; 15 - 8 = 7; 7 - 5 = 2.

GRFICOS PARA DISTRIBUIO DE FREQNCIAS

As distribuies de freqncias tm representaes grficas especiais. As simples so
representadas por histogramas ou polgonos de freqncias e as acumuladas por polgonos de
freqncias acumuladas.
Histogramas - assemelha-se aos diagramas de colunas, com a particularidade de ter os
retngulos que representam as freqncias, adjacentes. No eixo horizontal so registrados os
intervalos de classes e no eixo vertical as freqncias das classes.
usado quando se deseja avaliar graficamente a freqncia das classes.
Exemplo: Considerando-se a distribuio anteriormente mostrada, tem-se:
Planejamento do grfico
Largura: 6 classes de 1 cm e dois intervalos tambm de 1 cm = 8 cm.
Altura: 60% da largura: 0,6 x 8 ~ 5 cm
80% da largura: 0,8 x 8 = 6,4 cm
Escala Vertical: maior freqncia dividida pela altura:
8 5 = 1,6
8 6,4 = 1,25
entre 1,25 e 1,6 pode-se utilizar como escala 1,5empregados/cm

As medidas grficas so obtidas dividindo-se as freqncias pelas escalas.
Polgono de Freqncia - um grfico em linha resultante da unio de pontos que
representam as freqncias das classes. No eixo horizontal so marcados os pontos mdios
das classes e no eixo vertical as freqncias das classes.
Assim como o histograma usado em avaliao prpria das freqncias de uma srie.
tambm utilizado para comparar graficamente duas ou mais distribuies de freqncia.
A construo de um polgono de freqncia segue os mesmos critrios adotados para
construo do histograma, sendo que, no eixo horizontal, ao invs dos limites das classes, so
tomados os pontos mdios das classes.
Exemplo: com base na srie anterior, tem-se:
Planejamento do grfico
Largura:
Altura:
Escala Vertical:
(Para fixao usar polgonos justapostos).

Polgono de freqncia acumulada - semelhante ao polgono de freqncia, tambm um
grfico de linha, resultante da unio de pontos que representam as freqncias acumuladas
(absolutas e relativas) das classes. No eixo horizontal so marcados os limites reais das
classes e no eixo vertical as freqncias acumuladas.
usado para representar e analisar uma srie estatstica ou para compor duas ou mais
sries.
Exemplo: tomando-se, ainda, a srie dos exemplos anteriores, tem-se:



22
Planejamento do grfico
Largura: 6 classes de 1 cm cada e dois espaos tambm de 1 cm = 8 cm.
Altura: 60% da largura: 0,6 x 8 cm ~ 5 cm.
Escala Vertical: freqncia total dividida por altura: 30 5 = 6.
Faz-se: 1 cm = 6 empregados.
As medidas grficas so obtidas dividindo-se as freqncias acumuladas pelas escalas.





23
5 MEDIDAS DE POSIO (TENDNCIA CENTRAL)

So assim denominadas, em virtude da tendncia dos dados observados se agruparem
em torno dos valores centrais.
Uma medida de posio um valor calculado para um conjunto de dados, e usado, de
alguma forma, para descrever resumidamente o conjunto de dados. Esse valor tende a se
localizar no centro do conjunto de dados, sendo conhecido por isso tambm como medida de
tendncia central. Espera-se que o valor seja representativo de todos os valores do conjunto.

5.1 Mdias
a) mdia aritmtica

- mdia aritmtica simples (ou simplesmente mdia) - a soma dos valores do conjunto de
dados dividida pelo nmero de valores. As frmulas para as mdias populacionais () e
amostrais ( X ) so, respectivamente:
=
1 2 3 1 x x x x
x
N
i
i
N
N N
+ + + +
=
=

...
=
X
N


X =
1 2 3 1 x x x x
x
n
i
i
n
n n
+ + + +
=
=

...
=
X
n


em que:
X
i
= valores observados;
N = nmeros de itens da populao;
n = nmeros de itens da amostra;
E = somatrio.

- mdia aritmtica ponderada obtm-se esta medida, por exemplo, com dados distribudos
em classes, os valores X
i
, X
2
, ..., X
n
, correspondero aos pontos mdios das n classes e f
1
, f
2
,
...,f
n
as respectivas freqncias de classe, as frmulas sero:
=
1
1
2
2
3
3
1 2 3
1
1
f
x
f
x
f
x
f
x
f f f f
f
x
f
N
N
N
i
i
i
N
i
i
N
+ + + +
+ + + +
=
=
=

...
...
=
fX
f
fX
N


=

X =
1
1
2
2
3
3
1 2 3
1
1
f
x
f
x
f
x
f
x
f f f f
f
x
f
n
n
n
i
i
i
n
i
i
n
+ + + +
+ + + +
=
=
=

...
...
=
fX
f
fX
n


=


Exemplos:

1) Os preos pesquisados de camisetas nas lojas de Ilhus foram, em R$, os seguintes: 20,00;
25,00; 30,00; 15,00 e 40,00. Calcular a mdia aritmtica simples.
=
X
N

=
20 25 30 15 40
5
+ + + +
= 26



24

2) Calcular a mdia aritmtica ponderada dos salrios horrios dos empregados da empresa X
apresentados na tabela a seguir.

Tabelas 9 - Salrio horrio dos empregados da empresa X, em 1994
Salrio (R$ /h) Ponto Mdio
(X`)
N.
o
de Empregados (f) (fxX)
16,60 19,10 17,85 3 53,55
19,10 21,60 20,35 5 101,75
21,60 24,10 22,85 7 159,95
24,10 26,60 25,35 8 202,80
26,60 29,10 27,85 5 139,25
29.10 31,60 30,35 2 60,70
Total 30 718,00

fX
f
fX
n


=
= =
718
30
23,93

b) Mdia geomtrica (
g x
) - por definio, a mdia geomtrica de n valores ,
genericamente, a raiz n-sima do produto de todos os valores. utilizada em certas ocasies
para determinar taxas mdias.
Ex.:Aplicaes: para estimativa do crescimento demogrfico e clculo do ndice de custo de vida.

- Mdia geomtrica simples - esta mdia ser calculada para srie de dados do tipo em que
os valores so apresentados apenas como X
1
, X
2
, X
3
, ..., X
n
, a expresso dada como:

g n
n
i
n
i
n
x x x x x x
= =
=
1 2 3
1
. . . ... .
t
ou
log
log log . . . ... . log
log log log ...log
log
g n
n
i
n
i
n
n
x x x x x x
x x x x
n n
x = = =
+ + +
=
=

1 2 3
1
1 2 3
1
t
g x
= anti
n
x log log
1



em que, a letra grega t (pi) o smbolo utilizado para indicar o produto dos valores da
varivel.
Exemplo:
Calcular a MG do conjunto X = {1, 4, 16, 64}
R:
g x
= 8

- Mdia geomtrica ponderada - esta mdia se calcula para sries de dados apresentadas
com suas freqncias, pela seguinte expresso:
g k
j
k
j
n
x x x x x
f f f
f
f k
j
k
j
j
= =
=
=
1 2
1
1 2
1
. . ...
E
t




25
onde: n =
j
k
j f
=1
E

log log . . ...
log log ... log
g k
k k
x x x x
f x f x f x
f f f
f
n
k
j
k
j
= =
+ + +
=
1 2
1 1 2 2
1 2
1
E

g x
=anti
n
f x f x f x k k
log
log log ... log
1 1 2 2
+ + +

(


Exemplo:


Calculara a mdia geomtrica ponderada para os seguintes valores:
Xj fj
1 2
3 4
9 2
27 1
Efj=9
R:
g x
= 3,829554

Exemplos:
Consideremos a tabela a seguir:
Empresa Capital lquido Dvida Relao cap/dv Relao div/cap
A 2500 1000 2,5 0,4
B 1000 2000 0,5 2,0
Total 3500 3000
Calcular:
a) a mdia aritmtica de cada relao (o produto das 2 mdias era pra ser = 1, por serem
relaes inversas)
b) a mdia aritmtica ponderada (agora o produto dos resultados de cada uma ser = 1)
c) a mdia geomtrica (sem ponderao)

d) Mdia harmnica (
h x
)
Por definio o inverso da mdia aritmtica dos inversos. Utiliza para calcular as mdias de
valores que apresenta relao inversa (Ex.: velocidade mdia Km/h - para uma distncia
constante).
- Mdia harmnica (
h x
) simples
h
i
n x
x x xn
n
n
xi
=
+ + +
=
=

1
1
1
1
2
1 1
1
...


Exemplo: No trajeto de Ilhus para Itabuna foram verificadas velocidades de 3 carros correspondentes a 80
km/h, 120 km/h e 100 km/h. Calcular a mdia harmnica das velocidades.

R:



26
h x
=
+ +
=
+ +
=
1
1
80
1
120
1
100
3
3
1
80
1
120
1
100
97 3 ,

- Mdia harmnica (
h x
) ponderada

= =
=
=
=
= = =
k
j
k
j
k
j
k
j
k
j
h
fj
xj
n
fj
xj
fj
fj
fj
xj
x
1 1
1
1
1
1 1 1
1


Exemplo: Uma pessoa gastou R$ 120,00 em camisas de R$ 30,00 e R$ 100,00 em camisas de R$ 50,00 a
unidade. Qual a mdia de preo/camisa (X = R$/camisa) dado os respectivos pesos (quantidade)?

h X
=
+
+
=
4 2
1
30
4
1
50
2
36 67 ,
Exemplo:
CLASSES f
j
X
j
(ponto mdio)
1 |- 3 2 2
3 |- 5 4 4
5 |- 7 8 6
7 |- 9 4 8
9 |- 11 2 10
20
R: 4,96
h X
=
+ + + +
=
20
1
2
2
1
4
4
1
6
8
1
8
4
1
10
2
4 96 ,

5.2 Mediana
Smbolos: X
~
ou Md
definida como o valor que divide uma srie ordenada de tal forma que pelo menos a
metade ou cinqenta por cento dos itens sejam iguais ou maiores ou menores do que ela.
Ento, depois de colocados em ordem (crescente ou decrescente) os valores da srie, a
mediana um valor que ocupa uma determinada ordem ou posio na srie ordenada.
O elemento mediano (E
Md
) indicar a posio em que se encontra a mediana.
A mediana mais utilizada do que a mdia, principalmente, nos casos em que a
disperso (CV>30%) das variveis grande.

a) Quando o nmero de observaes mpar
- primeiramente determina-se



27
E
Md
=

n +1
2

Exemplo:
Determinar a mediana da srie 9, 15, 3, 7, 6, 16, 4, 19 e 1.
R:7

b) Quando o nmero de observaes par
- primeiramente determina-se
E
'

Md
=

n
2

E
''

Md
=

(
n
2
) +1
M
d
= ser a soma dos dois valores indicados pelos elementos medianos dividido por dois.
Exemplo: Calcular a mediana da srie 3, 4, 7, 12, 15, 10, 18 e 14.
R:11

c) Para valores com freqncias e no agrupados em classe
- quando o nmero de observaes (n = soma das freqncias) mpar
- primeiramente calcula o elemento mediano
E
Md
=

n +1
2

e na coluna de freqncia acumulada encontra-se a posio dada pelo elemento mediano.
Exemplo:
X
j
f
j
FAC (F
j
)
3 3 3
4 6 9
5 9 18
6 8 26
7 6 32
8 3 35
n=35

E
Md
=

n +1
2
=
35 1
2
+
= 18, a mediana ser o 18.
o
elemento do conjunto, ou seja, se tivssemos
os elementos dispostos individualmente teramos a seguinte lista:
3,3,3,4,4,4,4,4,4,5,5,5,5,5,5,5,5,5,6,6,6,6,6,6,6,6,7,7,7,7,7,7,8,8,8 .
Md = 5

- quando o nmero de observaes (n = soma das freqncias) par
- primeiramente calcula o elemento mediano
E
'

Md
=

n
2

E
''

Md
=

(
n
2
)+1
- e na coluna de freqncia acumulada encontram-se as posies dadas pelos elementos
medianos, soma-se os dois valores (X
j
) e divide por dois.



28
Exemplo:
X
j
f
j
FREQ. ACUMULADA (F
j
)
2 5 5
3 10 15
4 15 30
5 12 42
6 5 47
7 3 50
n=50
E
'

Md
=

n
2
= 50/2=25
E
''

Md
=

(
n
2
)+1= 25+1=26
Md = (4+4)/2

Exemplo 2:
X
j
f
j
FAC (F
j
)
3 3 3
4 6 9
5 9 18
6 8 26
7 6 32
8 5 36
n=36
E
'

Md
=

n
2
= 36/2=18
E
''

Md
=

(
n
2
)+1= 18+1=19
Md = (5+6)/2=5,5

d) Para valores com freqncias e agrupados em classe
- primeiramente, calcula-se o elemento mediano que ser sempre E
Md
=

n
2
, seja par ou mpar
o nmero de observaes.
- e na coluna de freqncia acumulada encontra-se a posio da classe de acordo com o
elemento mediano.
- calcula-se em seguida a mediana;
Md =
Md
ant Md
f
h l
F E

+ , em que
l = limite inferior da classe mediana;
h = amplitude do intervalo de classe;
f
Md
= freqncia simples da classe que contm a mediana;
E
Md
= elemento mediana;
F
ant
= freqncia acumulada da classe anterior classe que contm a mediana.



29
Exemplo: Calcular a mediana do consumo de eletricidade (kw/hora) dos 80 usurios
Consumo (Kw/h) Nmero de usurios (f
j
) FAC (F
j
)
5 |- 25 4 4
25 |- 45 6 10
45 |- 65 14 24
65 |- 85 26 50
85 |- 105 14 64
105 |- 125 8 72
125 |- 145 6 78
145 |- 165 2 80
n = 80

E
Md
=

n
2
= 80/2 = 40
- e na coluna de freqncia acumulada encontra-se a posio da classe (65|-85) de acordo com
o elemento mediano (uma vez que at 85 Kw/h temos 50 observaes e at 65 apenas 24).
- calcula-se em seguida a mediana;
Md =
fMd
h l
F E ant Md

+ = 31 , 12 65
26
320
65
26
24 40
20 + = + =

+ 65
Md = 77,31kw/h
Este o consumo mediano.

5.3 MODA (M
O
)

Como definio genrica, o elemento que, dentro de um conjunto de valores, aparece
com maior freqncia.

a) Determinao da Moda de valores no-tabulados (no dispostos em tabela de
freqncia)
A definio genrica pode ser utilizada neste caso, sendo a moda o valor
predominante, o valor mais freqente deste conjunto.
Se existir um nico nmero com a maior freqncia o conjunto ser denominado
unimodal.
Caso haja mais de um nmero com a maior freqncia, teremos 2 ou 3 modas
(bimodal ou multimodal ou plurimodal etc).
Se no ocorrer um termo mais freqente, a distribuio ser denominada amodal.

Exemplo:
X = {3,4,5,6,7} R: conjunto amodal.
Y = {4,4,5,5,5,8,8,8,8,9,9,10} R:M
o
=8 (unimodal).
Z = {1,3,3,4,4,4,5,5,6,7,7,7} R: M
o1
= 4; M
o2
= 7 (bimodal).

b) Determinao da Moda de valores tabulados (dispostos em tabela de freqncia
individualmente ou agrupados em classe)
- dados apresentados individualmente - a moda dos valores determinada imediatamente,
bastando, consultar a tabela, localizando-se o valor que apresenta a maior freqncia.



30

Exemplo:

Tabela 11 - salrios mensais de operrios da empresa X, em 1996
Salrio Mensal (R$) N
o
. de Operrios (f
i
)
150 1
165 5
180 4
190 6
195 3
215 2

R: M
O
=190 (salrio modal)

- dados apresentados em tabela de freqncia e agrupados em classes - neste caso necessrio
primeiramente localizar a classe que apresenta a maior freqncia, chamada de classe modal,
ento se determinar a moda pela seguinte expresso:


f f
f
M
post ant
post
o
h LI
+
+ =
em que:
LI = limite inferior da classe modal;
h = amplitude do intervalo de classe;
f
post
= freqncia simples da classe posterior classe modal;
f
ant
= freqncia simples da classe anterior classe modal.

Exemplo:
Tabela 12 - Salrios semanais (R$) dos funcionrios da empresa Y,em 1996
Salrio Semanal (R$) N.
o
de Funcionrios
25 |- 35 3
35 |- 45 5
45 |- 55 7
55 |- 65 9
65 |- 75 8
75 |- 85 4
Ef
1
=36
R: classe modal = 55 |- 65; 33 , 60
8 7
8
10 55 =
+
+ =
Mo







31
5.4 SEPARATRIZES

- Os QUARTIS (Qi) dividem a srie em quatro partes iguais, para tanto so necessrios
3 QUARTIS.
Os trs QUARTIS so representados por Q
1
,Q
2
e Q
3
sendo chamados,
respectivamente, de primeiro, segundo e terceiro quartil.
O Q
1
o valor que separa dos valores esquerda e direita; o Q
2
o valor que
separa 2/4 dos valores esquerda e a direita a mediana; e Q
3
o valor que separa dos
valores esquerda e direita.
Genericamente, para determinar a posio do quartil a ser calculado, usaremos a
seguinte expresso para o elemento do quartil:

Qi E
in
=
4

onde:
i = nmero do QUARTIL a ser DETERMINADO
n = nmero de observaes

- Os DECIS (D
i
) dividem a srie em dez partes iguais.
Os nove DECIS so representados po D
1
, D
2
,

D
3
... D
9,
sendo chamados,
respectivamente, de primeiro, segundo e terceiro ... e nono decil.
O D
1
o valor que separa 1/10 dos valores esquerda e 9/10 direita; o D
2
o valor
que separa 2/10 dos valores esquerda e 8/10 direita; e D
3
o valor que separa 3/10 dos
valores esquerda e 7/10 direita ... e D
9
o valor que separa 9/10 esquerda e 1/10
direita.
Genericamente, para determinar a posio do decil, usaremos a seguinte expresso
para calcular o elemento do decil:

Di E
in
=
10

onde:
i = nmero do DECIL a ser DETERMINADO
n = nmero de observaes

- Os CENTIS (ou percentis) dividem a srie em cem partes iguais.
Os noventa e nove centis so representados Por C
1
, C
2
,

C
3
... C
99,
sendo chamados,
respectivamente, de primeiro, segundo e terceiro ... e nonagsimo nono CENTIL.
O C
1
o valor que separa 1/100 dos valores esquerda e 99/100 direita; o C
2
o
valor que separa 2/100 dos valores esquerda e 98/100 direita; e C
3
o valor que separa
3/100 dos valores esquerda e 97/100 direita ... e C
99
o valor que separa 99/100
esquerda e 1/100 direita.
Genericamente, para determinar a posio do CENTIL, usaremos a seguinte expresso
para calcular o elemento do decil:

Ci E
in
=
100

onde:
i = nmero do CENTIL a ser DETERMINADO
n = nmero de observaes



32


PARA O CLCULO DAS SEPARATRIZES PARA DADOS TABULADOS E
AGRUPADOS EM CLASSES
f
F E
Si
fac Si
h LI S

+ =
onde:
S = separatriz desejada;
LI = limite inferior da classe que contm a separatriz;
E
si
= elemento da separatriz, posio da separatriz;
F
ant
= freqncia acumulada da classe anterior classe da separatriz;
F
si
= freqncia simples da classe que contm a separatriz;
h = amplitude do intervalo de classe.

Exemplo:
Salrio Semanal (r$) N.
o
de Funcionrios FAC
130 |- 140 11 11
140 |- 150 12 23
150 |- 160 20 43
160 |- 170 15 58
170 |- 180 8 66
180 |- 190 7 73
190 |- 200 4 77
200 |- 210 3 80
Para o Q
1
: 20
4
80 x 1
E 1 Q
= =
Com auxlio da coluna de freqncia acumulada encontra-se o 20.
o

termo que o primeiro
quartil da distribuio de salrios pertencente a classe 140 |-150 .
50 , 147
12
11 20
10 140 1
1
1
=

+ =

+ =
f
F E
Q
fact Q
h l Q ,
isto significa que 25% dos empregados ganham at R$ 147,50 por semana e 75% restantes
ganham acima desse valor.

PARA O CLCULO DAS SEPARATRIZES PARA DADOS NO AGRUPADOS EM
CLASSES E ORGANIZADOS EM ROL
Para os dados em rol, o clculo das medidas separatrizes dada por:


onde Ip a parte inteira de p e Fp a parte fracionria (ou decimal).




33








34
5 MEDIDAS DE DISPERSO

O clculo de uma medida de posio s justifica em razo da variabilidade presente na
natureza, se no houvesse essa variao no teria sentido calcul-la. Entretanto se a
variabilidade dos dados for muito grande, sua medida de posio ter um grau de
confiabilidade to pequeno que ser intil calcul-la.
As medidas de tendncia central nos dizem alguma coisa sobre o nvel geral de sua
magnitude, indicando o ponto onde as observaes tendem a concentrar.
Porm muitas vezes desejamos saber algo mais sobre a disperso de um conjunto de dados

Por exemplo:
- Consideremos os tempos, de trs mquinas semelhantes, para executar certa operao industrial. Foram
tomados os tempos (em segundos) de 5 operaes para cada mquina:
- mquina A: 10, 10, 10, 10, 10;
- mquina B: 11, 10, 9, 11, 9;
- mquina C: 3, 4, 5, 20, 18.

mdia aritmtica:

A B C X X X
s = = = 10 ,
mas, observando detalhadamente os trs grupos obtidos, notamos que se distribuem diferentemente em relao a
sua mdia (10 s), como mostra a distribuio abaixo:

mquina A:
mquina B:
mquina C:
Disperso dos dados em torno da mdia.
Baseando-se apenas na mdia poderia se afirmar que os desempenhos das mquinas
so iguais. No nos diz a respeito da homogeneidade ou heterogeneidade do desempenho das
mquinas. A mquina A nos revela completa homogeneidade do desempenho e as outras B e
C maior heterogeneidade do desempenho.
Para analisarmos quantitativamente essa maior ou menor variao (ou disperso) do
conjunto de valores, em torno do valor mdio, vamos estudar as medidas de disperso. Estas
servem para indicar o quanto os dados se apresentam dispersos em torno da regio central.
Permite estabelecer comparaes entre fenmenos de mesma natureza e mostrando at que
ponto os valores distribuem em acima ou abaixo da medida de posio.
As principais so: a amplitude total, desvio-mdio, varincia, desvio-padro e o
coeficiente de variao

5.1. Amplitude total ou intervalo total (A
t
a, R, I
t
)
definida como a diferena entre o maior (X
mx
) e menor (X
mn
) valor do conjunto de
dados. Dar uma idia do campo de variao dos valores da srie.
a) para dados no agrupados em classe
Para os exemplos anteriores, teremos:
- mquina A: A
t
= 10-10 = 0 s
- mquina B: A
t
= 11 - 9 = 2 s;
- mquina C: A
t
= 20 3 = 17 s.,

1
0
t
t
t



35
b) para dados agrupados em classe
Se os dados vierem representados em uma tabela de freqncias, agrupados em
classes, h duas maneiras de se definir a amplitude total:
1.
o
mtodo: A
t
= ponto mdio da ltima classe - ponto mdio da primeira classe.
2.
o
mtodo: A
t
= limite superior da ltima classe - limite inferior da primeira classe.
Exemplo:
Classe f
J
Ponto Mdio
10 |- 20 5 15
20 |- 30 12 25
30 |- 40 20 35
40 |- 50 14 45
50 |- 60 10 55
60 |- 70 4 65
n = 65

1.
o
mtodo: A
t
= 65 - 15 = 50, nesse mtodo os valores extremos so eliminados.
2.
o
mtodo: A
t
= 70 - 10 = 60
Apesar das restries ao seu uso por considerar apenas os dois valores extremos e no
o conjunto, no podendo fornecer uma idia precisa quanto disperso, para alguns
fenmenos como temperatura ela satisfatria.


5.2 Amplitude Interquartlica

A amplitude interquartlica a diferena entre o terceiro e o primeiro quartil. Esta
medida mais estvel que a amplitude total por no considerar os valores mais extremos. Esta
medida abrange 50% dos dados e til para detectar valores discrepantes.
d
q
= Q
3
Q
1

Por outro lado, a amplitude semi-interquartlica definida como a mdia aritmtica da
diferena entre a mediana e os quartis:
2
1 3
Q Q
d
qm

=

5.3. Desvio mdio ou mdia dos desvios (D
m
, d
m
, d, DM, D
m
)

igual mdia aritmtica dos valores absolutos dos desvios tomados em relao a
uma das seguintes medidas de tendncia central: mdia
X
ou mediana.
d M

a) para dados sem freqncias
calculado de acordo com a definio genrica, pelas seguintes frmulas:

n n
d
X
X
D
i
n
1 i
i
m

=
=
onde:
( )
i i d X X
= , desvio em relao mdia aritmtica.
E a ttulo de informao,
t



36
n n
d
M X
D
i
n
1 i
d i
m

=
=
onde:
( )
i i d d X M
= , desvio em relao mediana.

Exemplo: calcular o desvio mdio dos conjuntos a seguir:
A = {4,5,7,9,10}; B = {4,7,7,710}.
CONJ. A CONJ. B
X
i

d
i
= X
i
- g x
|d
i
| X
i

d
i
= X
i
- X
|d
i
|
4 -3 3 4 -3 3
5 -2 2 7 0 0
7 0 0 7 0 0
9 2 2 7 0 0
10 3 3 10 3 3
Total=35 0 10 35 0 6
X= 7
7
m
A
D
= =
10
5
2
m
B
D
= =
6
5
12 ,
Desvios mdios em relao mdia aritmtica.
Como o conjunto A apresenta um desvio mdio maior do que o conjunto B,
conclumos ser ele o mais disperso.
A ttulo de informao veremos:
b) para dados com freqncias (agrupados ou no em classe)

'
=

=
f
f
X X
D
i
n
i
i
m
1

onde:
X
i
= representa um valor individual ou um ponto mdio quando agrupados em classe;
f
i
= representa a freqncia simples absoluta de um valor individual ou de uma classe.

A pesar do desvio mdio expressar aceitavelmente a disperso de uma amostra, no
to freqentemente utilizado como o desvio-padro, o qual ser descrito mais adiante, pois
este se adapta melhor a uma ampla gama de aplicaes. Alm disso, o desvio mdio despreza
o fato de alguns desvios serem negativos e outros positivos, pois essa medida os trata como se
fossem todos positivos. Todavia ser preferido o uso de desvio mdio no lugar do desvio-
padro, quando esse for indevidamente influenciado pelos desvios extremos.
Obs.: o desvio mdio , em geral, aproximadamente igual a 0,8 vezes o desvio-padro.











37
5.4 Varincia

Smbolos
- o
2
- varincia populacional;
- s
2
- varincia amostral.

a mdia aritmtica dos quadrados das diferenas (desvios) dos valores em relao
sua mdia, isto ,

a) para dados sem freqncias

( )
X
i
n
S
X X i
n
2
2
1
1
=

=


b) para dados com freqncias (individualmente ou em classe)

( )
X
i
i
n
S
f
X X i
n
2
2
1
1
=

=

onde: n
i
i
k
f
=
=

1

f
i
= freqncia da classe i;
X
i
= valor do ponto mdio da classe i.


Obs.: para a varincia populacional, usa-se no denominador apenas N.

Como, a unidade da varincia difere da unidade dos dados, ou seja se a unidade dos
valores for metro (m) a unidade da varincia ser m
2
, sendo, portanto, difcil sua
interpretao, por isso que a medida mais utilizada o desvio-padro.



5.5 Desvio-padro (S, o)

Smbolos
- o- desvio-padro populacional;
- S - desvio-padro amostral.

a raiz quadrada da varincia, por isso sua unidade igual a unidade do valores.
Ento para o clculo do desvio-padro deve-se primeiramente determinar a varincia e em
seguida extrair a raiz quadrada desse resultado.
a mais importante das medidas de disperso, uma vez que utilizada em numerosos
mtodos de inferncia estatstica.

Obs.: na quase totalidade dos casos prticos, o desvio padro supera um sexto da amplitude e inferior a um



38
tero da amplitude, isto
t t A A
S
6 3
< <
esta relao til para a verificao de erros grosseiros no clculo do
desvio padro.

Sendo, o desvio-padro por definio a raiz quadrada da varincia, tm-se, portanto,
como frmulas deste as seguintes expresses:

a) para dados sem freqncias

( )
X
i
n
S
X X i
n
=

=
2
1
1



b) para dados com freqncias (individualmente ou em classe)

( )
1
1
2

=


'
=
n
i
n
i
i
X
X
X
f
S


onde: n
i
i
k
f
=
=

1

f
i
= freqncia da classe i;
i
X
'
= valor do ponto mdio da classe i.

Obs.: para o desvio padro populacional, usa-se no denominador apenas N.


5.6 Coeficiente de variao ou coeficiente de variao relativa (CV)

o quociente entre o desvio-padro e a mdia. Esta uma medida relativa de
disperso, mede percentualmente a relao entre o desvio-padro e a mdia aritmtica.
utilizada para a comparao em termos relativos do grau de concentrao em torno da mdia
de sries estatsticas. Assim, uma pequena disperso absoluta pode ser, na verdade,
considervel quando comparada com a ordem de grandeza dos valores da varivel e vice-
versa. Deste modo, com a utilizao do CV pode-se evitar equvocos.
Sua expresso de clculo :

100
X
S
CV ou
X
S
CV = =
Exemplos:

1. Consideremos os tempos, de trs mquinas semelhantes, para executar certa operao
industrial. Foram tomados os tempos (em segundos) de 5 operaes para cada mquina:
- mquina A: 10, 10, 10, 10, 10;
- mquina B: 11, 10, 9, 11, 9;
- mquina C: 3, 4, 5, 20, 18.



39
Calcular para cada mquina:
a) a varincia
b) o desvio-padro
c) o coeficiente de variao

Mquina A Mquina B Mquina C
X
i

d
i
=(X
i
- X)
(d
i
)
2
X
i

d
i
=(X
i
- X)
(d
i
)
2
X
i

d
i
=(X
i
- X)
(d
i
)
2

10 0 0 11 1 1 3 -7 49
10 0 0 10 0 0 4 -6 36
10 0 0 9 -1 1 5 -5 25
10 0 0 11 1 1 20 10 100
10 0 0 9 -1 1 18 8 64
Total 50 0 0 50 4 50 274
Mdia 10 10 10

2. Dada uma amostra de distribuio das alturas de alunos da UESC, pede-se para calcular:
a) a varincia
b) o desvio-padro
c) o coeficiente de variao

Altura (cm) f
i
X
i

d
i
=(X
i
- X)
(d
i
)
2
f
i
(d
i
)
2
f
i
d
i


160-164 5 162 -9.590 91.963 459.816 810.000

164-168 13 166 -5.590 31.245 406.188 2158.000

168-172 22 170 -1.590 2.527 55.600 3740.000

172-176 25 174 2.410 5.809 145.233 4350.000

176-180 10 178 6.410 41.091 410.914 1780.000

180-184 3 182 10.410 108.373 325.120 546.000
total
78 1032 2.462 281.010 1802.872 13384.000
Mdia
171.590

5.7 Medidas de Assimetria

A medida de assimetria um indicador da forma da distribuio dos dados. Ao
construir uma distribuio de freqncias e/ou um histograma, est-se buscando, tambm,
identificar visualmente, a forma da distribuio dos dados que ou no confirmada pelo
coeficiente de assimetria de Pearson (As) definido como:
o

o
S
M
A

= ou
S
M
A
o
S

=


para dados populacionais e amostrais, respectivamente.

Uma distribuio classificada como:

simtrica se mdia = mediana = moda ou As = 0;

assimtrica negativa se mdia mediana moda ou As < 0. O lado mais longo do
polgono de freqncia (cauda da distribuio) est esquerda do centro.

assimtrica positiva se moda mediana mdia ou As > 0. O lado mais longo do
polgono de freqncia est direita do centro.




40


Exemplo:






5.8 Medidas de Curtose

A medida de curtose o grau de achatamento da distribuio, um indicador da forma
desta distribuio. definido como:

) ( 2
) (
10 20
1 3
P P
Q Q
K

=
A curtose ou achatamento mais uma medida com a finalidade de complementar a
caracterizao da disperso em uma distribuio. Esta medida quantifica a concentrao ou
disperso dos valores de um conjunto de dados em relao s medidas de tendncia central em
uma distribuio de freqncias.
Uma distribuio classificada quanto ao grau de achatamento como:
Uma distribuio classificada quanto ao grau de achatamento como:
Leptocrtica: quando a distribuio apresenta uma curva de freqncia bastante
fechada, com os dados fortemente concentrados em torno de seu centro, K < 0,263.

Mesocrtica: quando os dados esto razoavelmente concentrados em torno de seu
centro, K= 0,263

Platicrtica: quando a distribuio apresenta uma curva de freqncia mais aberta,
com os dados fracamente concentrados em torno de seu centro, K > 0,263.

Exemplo:




41


5.9 Boxplot ou desenho esquemtico

O grfico Box Plot (ou desenho esquemtico) uma anlise grfica que utiliza cinco
medidas estatsticas: valor mnimo, valor mximo, mediana, primeiro e terceiro quartil da
varivel quantitativa. Este conjunto de medidas oferece a idia da posio, disperso,
assimetria, caudas e dados discrepantes. A posio central dada pela mediana e a disperso
pelo desvio interquartlico dq= Q3 - Q2. As posies relativas de Q1, Q2 e Q3 do uma noo
da assimetria da distribuio.
Os comprimentos das caudas so dados pelas linhas que vo do retngulo aos valores
atpicos. Segundo Triola (2004), um outlier ou ponto discrepante um valor que se localiza
distante de quase todos os outros pontos da distribuio. A distncia a partir da qual
considera-se um valor como discrepante aquela que supera 1,5dq. De maneira geral, so
considerados outliers todos os valores inferiores Li= Q1-1,5dq ou os superiores a
Ls=Q3+1,5dq.

Exemplo 24: A construo do grfico Box Plot idades de alunos. Sua elaborao segue os
seguintes passos:

1 - Ordenar os dados em seqncia crescente.
18; 18; 19; 20; 20; 20; 20; 20; 20; 21; 21; 22; 23; 24; 25; 25; 25; 26; 29; 30; 35;
37.

2 - Determinar as seis medidas.
Mediana:

Primeiro quartil:

Terceiro quartil:




42
Desvio interquartlico:

Dq = Q3 Q1 = 25,75 20 = 5,75

Limite inferior:
Li = Q1 1,5 dq
Li = 20 1,5 x 5,75 = 11,375
Limite superior:
Ls = Q3 1,5 dq
Ls = 25,75 + 1,5 x 5,75 = 34,375

3 - Construir uma escala com valores que incluam o valor mximo e mnimo dos dados.

4 - Construir uma caixa (retangular) estendendo-se de Q1 a Q3, e trace uma linha na caixa no
valor da mediana.


Traar uma linha paralela reta, com uma das extremidades alinhada ao limite inferior Li e
a outra no centro do lado do retngulo correspondente ao primeiro quartil. Trace uma outra
linha paralela reta, com uma extremidade no centro do lado do retngulo correspondente ao
terceiro quartil e a outra alinhada com o limite mximo Ls .


Identificar os pontos discrepantes




43




No conjunto de dados no existe aluno com idade inferior a 11,375, ou seja, no h
aluno com idade considerada discrepante inferiormente. Entretanto, existem dois indivduos
cujas idades so superiores a 34,375, pontos estes considerados discrepantes neste conjunto de
dados: as idades 35 e 37. Estes pontos so identificados no diagrama de caixas por meio de
um asterisco na direo das linhas traadas nos item v.
Note-se que no intervalo interquartlico (dentro do retngulo) existem 50% dos dados,
dos quais, 25% esto entre a linha da mediana e a linha do primeiro quartil e os outros 25%
esto entre a linha da mediana e a linha do terceiro quartil. Cada linha da cauda mais os
valores discrepantes contm os 25% restantes da distribuio.




O Box Plot para a distribuio das idades dos alunos apresenta assimetria positiva, ou
seja, dispersam-se para os valores maiores.
O grfico Box Plot pode ser utilizado para fazer comparaes entre vrias
distribuies. Essa comparao feita atravs de vrios desenhos esquemticos numa mesma
figura conforme a seguir. Nota-se que para o sexo feminino, no ocorrncia de valores
discrepantes e a distribuio apresenta assimetria positiva, com idade mediana inferior ao do
sexo masculino.




44


A representao do diagrama de extremos e quartis tem o seguinte aspecto:


Existem fundamentalmente 3 caractersticas, que nos do idia da simetria ou
enviesamento e da sua maior ou menor concentrao: distncia entre a linha indicadora da
mediana e os lados do retngulo; comprimento das linhas que saem dos lados dos retngulos e
comprimento da caixa. Apresentamos a seguir 3 exemplos de boxplot, correspondentes a
tipos diferentes de distribuio de dados.







Os dados so assimtricos
Os dados so simtricos
Os dados so assimtricos



45
6 PROBABILIDADE

6.1 Conceitos Bsicos

Nos captulos anteriores vimos como caracterizar um conjunto de dados, a fim de organizar e
resumir informaes. Porm a principal preocupao da estatstica tirar concluses acerca dos
parmetros populacionais, baseando-se nos resultados observados em uma amostra.
Em particular a distribuio de freqncia um instrumento importante para avaliarmos a
variabilidade das observaes do fenmeno em estudo (medidas de posio e disperso). Essas
freqncia e medidas calculadas a partir dos dados so estimativas de quantidades desconhecidas,
associadas em geral a populaes das quais os dados foram extrados na forma de amostras e forem
aleatrias no podemos determinar, ou prever apriori, os resultados.
Assim, em particular, a distribuio de freqncia so estimativas de probabilidades de
ocorrncias de certos eventos de interesse. Com as suposies adequadas podemos construir modelos
probabilsticos que permitem calcular as chances de ocorrncia dos possveis resultados, atravs da
teoria de probabilidades.
Portanto, a teoria das probabilidades permite construir modelos matemticos que explicam um
grande nmero de fenmenos coletivos e fornecem estratgias para a tomada de deciso.

Experimento o processo pelo qual uma observao (ou medida) obtida. Experimento Aleatrio:
procedimento que, ao ser repetido sob as mesmas condies, pode fornecer resultados diferentes
Exemplos:
1. Resultado no lanamento de um dado;
2. Hbito de fumar de um estudante sorteado em sala de aula;
3. Condies climticas no prximo domingo;
4. Taxa de inflao do prximo ms;
5. Tipo sangneo de um habitante escolhido ao acaso.

Espao amostral ( O): o conjunto de todos os resultados possveis de um experimento aleatrio.
Exemplos:
1. Lanamento de um dado. O = {1, 2, 3, 4, 5, 6}
2. Exame de sangue (tipo sangneo). O = {A, B, AB, O}
3. Hbito de fumar. O = {Fumante, No fumante}
4. Tempo de durao de uma lmpada. O = {t: t 0}
O espao amostral relativo a um experimento pode ser representado de diferentes maneiras.
Ex.: o espao amostral relativo ao lanamento de duas moedas
=> S={KK, KC, CK, CC} onde: K=cara e C=coroa..
=> rvore de probabilidade ou diagrama em rvore (rvore de eventos)






1
o
lanamento 2
o
lanamento
K K
K C
..
..
.
K
....
..
..
.
K
....
..
..
.
K
....
..
..
.
K
....



46
Evento: o resultado de um experimento ou um subconjunto do espao amostral O.

Notao: A, B, C, ...
C (conjunto vazio): evento impossvel
O : evento certo

Exemplo: Lanamento de um dado alguns eventos so:
A: sair face par A = {2, 4, 6} c O
B: sair face maior que 3 B = {4, 5, 6} c O
C: sair face 1 C = {1} c O
Mais alguns exemplo:

Experimento Espao Amostral Evento
Selecionar uma pea para inspeo Defeituosa, no defeituosa Defeituosa
Jogar uma moeda Cara, Coroa Cara
Jogar um dado 1, 2, 3, 4, 5, 6 Par
Oferta de compra Aceita, rejeitada Aceita
Jogar futebol Ganhar, perder e empatar Ganhar


6.2 Probabilidade

a) Definio clssica: a freqncia relativa do evento A, ao quociente entre ele e o nmero de casos
observados.







b) Definio frequentista: o quociente entre o nmero de vezes que ele ocorrer (evento A) e o total
de repeties
repeties de total Nmero
ocorrer A que vezes de Nmero
) ( = A P
Probabilidade objetiva: So aplicadas a eventos que podem ser repetidos sob as mesmas condies.
(Escola frequentista)
Experimento Espao Amostral Evento
Jogar uma moeda Cara, Coroa Cara
Jogar um dado 1, 2, 3, 4, 5, 6 Par

Probabilidade subjetiva: Considera a probabilidade como uma crena pessoal de que determinado
evento tenha ocorrido ou possa ocorrer. So usadas as informaes disponveis, experincias ou
intuio. (quando os dados experimentais no so igualmente provvel).
Exemplo: Casal faz uma oferta de compra. E1 Aceita E2 rejeitada

Homem P(E1) = 0,8 e P(E2) = 0,2
Casos de Total Nmero
A Evento ao Favorveis Casos de Nmero
) ( = A P
T.C. N.
A Evento ao F. C. N.
) ( = A P



47
Mulher P(E1) = 0,6 e P(E2) = 0,4


Experimento Espao Amostral Evento
Selecionar uma pea para inspeo Defeituosa, no defeituosa Defeituosa
Oferta de compra Aceita, rejeitada Aceita
Jogar futebol Ganhar, perder e empatar Ganhar



6.3 Axiomas de probabilidades

Sendo A e B dois eventos de um espao amostral E, temos:

1. 1 ) ( 0 s s A P
2. P(S) = 1
3. P(C) = 0
4. Regra da soma de probabilidades. Se A e B forem dois eventos mutuamente exclusivos P(A
B) = C, ento P(A U B) = P(A) +
P(B)
5. Se A e B no so mutuamente excludentes ento P(A U B) =
P(A) + P(B) P(A B)
6. Se A o evento complementar de A, ento
P( A ) =1 P(A)

Exemplo1: Lanamento de um dado
A = (sair o nmero 3)
B = (sair um nmero par)
C = (sair nmero impar)
Pede-se:
P(A); P(B); P(C); P(A U B); P(A C); P(A U C); P( A ).























48


Exemplo2: Retirar uma carta de um baralho de 52 cartas.
S = ( c
1
, c
2
, ...........c
52
)
P(c
i
) = 1/52 tem a mesma probabilidade de ocorrer.
Evento A = (retirar uma carta com o nmero 16) P(A) = 0/52

Exemplo 3: Retirar uma carta vermelha ou um rei
A = (carta vermelha) B = (um rei)

A e B no so mutuamente exclusivos (h duas cartas de reis vermelhas)
P(A B) = P(A) +P(B) P(A B)
P(A B) = 26/52 + 4/52 2/52 = 7/13 ou 52,8%

Exemplo 4: Retirar uma carta de espada ou uma dama de ouros.
A = Carta de espadas B = rei de ouros
A e B so mutuamente excludentes P(A B) = C
P(A B) = P(A) +P(B)
P(A B) = 13/52 + 1/52 = 14/52 = 7/26 ou 26,9%


7. Probabilidade Condicional. Se
A e B so eventos de um espao amostral S, com P(B) 0, ento a probabilidade condicional
do evento A, tendo ocorrido o evento B, indicada por P(A/B) e definida por:
) (
) (
) / (
B P
B A P
B A P

=
B evento ao . .
A evento ao . .
. . .
B evento ao . .
. . .
A evento ao . .
) / (
F C N
B F C N
C T N
F C N
C T N
B F C N
B A P

=

=


Exemplo: Um nmero sorteado ao acaso entre os inteiros 1,2,....,15. Se o nmero sorteado
for par, qual a probabilidade de que seja o nmero6?.

S = (1, 2, 3,....., 15)
A = (nmero ser 6)
B = (o nmero ser par)
P(A/B)=









8. Regra do produto
A probabilidade da ocorrncia simultnea de dois eventos de um mesmo espao
amostral igual probabilidade de um deles ocorrer, pela probabilidade condicional do outro,
dado o primeiro.




49
P(A B) = P(B) . P(A/B)
ou
P(A B) = P(A) . P(B/A)

Exemplo: Retiram-se sem reposio duas peas de um lote de 10 peas, onde quatro so boas.
Qual a probabilidade de que ambas sejam defeituosas.




9. Regra do produto para dois eventos independentes: Dois eventos so independentes
quando a ocorrncia de um deles no depende ou no est vinculada ocorrncia do outro,
isto , P(A/B)= P(A) e P(B/A) = P(B). A regra do produto definida por:

P(A B) = P(A) . P(B)

Exemplo: Retira-se com reposio duas cartas de um baralho com 52 cartas. Qual a
probabilidade de que ambas sejam de paus.












10. Teorema de Bayes
Sejam E
1
, E
2
,....E
k
, eventos mutuamente exclusivos, tais que P(E
1
) + P(E
2
) +....+P(E
k
)
= 1. Seja A um evento qualquer, que se sabe ocorrer em conjunto com, ou em conseqncia
de, um dos eventos E
i
. Ento a probabilidade de ocorrncia de A, dada por:


) / ( ) ( ... ) / ( ) ( ) / ( ) (
) / ( ) (
) / (
2 2 1 1 k k
i i
i
E A P E P E A P E P E A P E P
E A P E P
A E P
+ + +

=
Relaciona probabilidade
a priori (probabilidade antes de realizar o experimento) P(E
i
)
com
posteriori (obtida aps a realizao de um experimento qualquer). P(E
i
/A)

Exemplo: Escolhe-se uma urna ao acaso e dele extraiu-se uma bola ao acaso, verificando-se que
a bola branca. Qual a probabilidade de a bola ter vindo da urna 2
Urna 1 Urna 2 Urna 3
Preta 3 4 2
Branca 1 3 3
Vermelha 5 2 3





50











rvore de Eventos

























O clculo da probabilidade de ocorrncia de um evento se reduz a um processo de contagem
dos casos favorveis e do total de casos.
Anlise combinatria pode ser usada.

o A combinao de n elementos (combinados) x a x (n x) dada por:
)! ( !
!
,
x n x
n
x
n
C
x n

= =

Exemplo: Num lote de 12 peas, quatro so defeituosas e oito so boas. Duas peas so retiradas
aleatoriamente. Calcule:
a) A probabilidade de ambas serem defeituosas.
b) A probabilidade de ambas no serem defeituosas.
c) A probabilidade de ao menos uma ser defeituosa.





51










52
7- DISTRIBUIES DE PROBABILIDADES

7.1 Conceitos Bsicos

Varivel aleatria

Uma varivel aleatria uma varivel (geralmente representada por X) que tem um
valor numrico nico (determinado aleatoriamente) para cada resultado de um experimento.
Toda vez que uma varivel influenciada pelo acaso (fatores no-controlados), diz-se
que uma varivel aleatria.

Exemplos:
a) X = nmero de peas defeituosas num lote de 1000.
b) X = nmero de clientes que entram no supermercado entre 12h e 14h.
c) X= altura dos alunos entre 1,60 m e 1,70 m

As variveis aleatrias podem ser classificadas em discretas e contnuas.

Varivel aleatria discreta

A varivel aleatria discreta quando s assume valores que podem ser associados aos
nmeros naturais. Assume, portanto, um nmero finito de valores ou tem uma quantidade
enumervel de valores. As variveis aleatrias do exemplo anterior a, b e c so discretas.

Varivel aleatria contnua

A varivel contnua assume infinitos valores em um dado intervalo. Podem, portanto,
tomar um nmero infinito de valores, e esses valores podem ser associados a mensuraes em
um escala contnua, de tal forma que no haja lacunas ou interrupes. A varivel aleatria do
exemplo d contnua.

Distribuio de probabilidade

Alm de identificar valores de uma varivel aleatria, freqentemente podemos
atribuir uma probabilidade a cada um desses valores. Quando conhecemos todos os valores de
uma varivel aleatria juntamente com suas respectivas probabilidades, temos uma
distribuio de probabilidades.
Assim, uma distribuio de probabilidade d a probabilidade de cada valor de uma varivel
aleatria.
Seja X a varivel aleatria discreta. Sejam x1, x2, x3, .... seus possveis resultados. A
cada resultado x
i
associaremos um nmero p(x
i
) = P(X=x
i
), denominado probabilidade de x
i
,
tal que:
a) 0 ) ( >
i
x p para todo x
i

b) 1 ) ( =
i
x p
Essa funo denominada funo de probabilidade da varivel aleatria X.



53

Exemplo: Vamos determinar a distribuio discreta de probabilidade da varivel nmero de
caras em um lanamento de trs moedas.
lanamento de trs moedas
S = (CCC, CCK, CKC, CKK, KCC, KCK, KKC, KKK)
X = nmero de caras = 0, 1, 2, 3.

X = O KKK
X = 1 CKK, KCK, KKC
X = 2 CCK, CKC, KCC
X = 3 CCC

x
i
0 1 2 3
P(x
i
) 1/8 3/8 3/8 1/8

A distribuio de probabilidade tambm pode ser expressa graficamente:


Esperana Matemtica

Na distribuio de probabilidade os valores assumidos pela varivel aleatria
podem ser interpretados como freqncias relativas em um sempre crescente de
provas. Dessa forma, podemos definir medidas de tendncia central e disperso.
A mdia de uma varivel aleatria chamada de valores esperados ou
simplesmente esperana de X.

Mdia | | ) (x P x x E
i
= =



Varincia
| | ( ) | |
2 2
o = = x E x Var
| |
2 2 2
o = x E
onde: | |

= ) (
2 2
x p x x E e ) (x P x =





54
Desvio padro
2
o o =

Exemplo: Considere que no exemplo de nmero de caras no lanamento de trs
moedas se recebe dois reais por cada cara que aparea. Quanto se esperaria ganhar, se
se pudesse fazer o jogo apenas uma vez. Qual o valor esperado de uma jogada?

Nmero de caras

0 1 2 3
x
i
:valor a ser recebido em R$ 0 2 4 6
P(x
i
) 1/8 3/8 3/8 1/8

Mdia
| | ) (x P x x E
i
= =


= 0. 0,125 + 2 . 0,375 + 4 . 0,375 + 6. 0,125
= 0 + 0,75 + 1,5 + 0,75
= R$ 3,00
O valor esperado a mdia a longo prazo. No caso, aps vrias jogas se esperaria ganhar R$
3,00.
Varincia
| |
2 2 2
o = x E
| |

= ) (
2 2
x p x x E = 0
2
. 0,125 + 2
2
. 0,375 + 4
2
. 0,375 + 6
2
. 0,125 =12
| |
i
x E = = 3
| |
2 2 2
o = x E = 12 3
2
= 3
x
i
P(x
i
) x
i
P(x
i
) x
i

2
P(x
i
)
0 0,125 0 0
2 0,375 0,75 1,5
4 0,375 1,5 6
6 0,125 0,75 4,5
3 12
Exemplo 2: Suponha que um gerente de loja tenha construdo a distribuio para as vendas de
foges por semana. Pede-se: a) a venda semanal esperada; b) a varincia das vendas semanal.
x
i
P(x
i
) x
i
P(x
i
) x
i

2
P(x
i
)
0 0,2 0 0
1 0,3 0,3 0,3
2 0,3 0,6 1,2
3 0,15 0,45 1,35
4 0,05 0,2 0,8
1 1,55 3,65
O nmero esperado de vendas ser de:



55
| | ) (x P x x E
i
= =

= 1,55
Varincia | |
2 2 2
o = x E = 3,65 1,55
2
= 1,25
2
o o = = 25 , 1 =1,11


Exerccio de distribuio de probabilidades

Um empresrio pretende montar uma firma para montagem de um produto composto
de uma esfera e um cilindro. As duas partes so adquiridas em fbricas diferentes (A e B), e a
montagem consistir em juntar as duas partes e pinta-las. O produto acabado deve ter o
comprimento (definido pelo cilindro) e a espessura (definida pela esfera) dentro de certos
limites, isso s poder ser verificado aps a montagem. Para estudar a viabilidade de seu
empreendimento, o empresrio quer ter uma idia da distribuio do lucro por pea montada.
Sabe-se que cada componente pode ser classificado como bom, longo ou curto,
conforme sua medida esteja dentro das especificaes, maiores ou menores que a
especificao, respectivamente. Segundo informaes dos fabricantes as probabilidades de
produo de cada um dos componentes so:
Produto Fabrica A Cilindro Fabrica B Esfera
Dentro das especificaes ....bom (B) 0,8 0,7
Maior que as especificaes...longo (L) 0,1 0,2
Menor que as especificaes...curto (C) 0,1 0,1
Pede-se:
a) Construa a rvore de eventos para todas as possveis composies de montagem
(cilindro com esfera);
b) Determine a probabilidade para cada uma das possveis composies;

Sabendo-se ainda que:
I - O preo de cada componente R$ 5,00
II - Se o produto final apresentar algum componente com a caracterstica C (curto), ele
ser classificado como irrecupervel, e o conjunto (Cilindro e Esfera) ser vendido
como sucata ao preo de R$ 5,00.
II - Cada componente L (longo) poder ser recuperado a um custo adicional de R$
5,00.
IV - O preo de venda de cada pea montado de R$ 25,00.
Pede-se:
c) Lucro para cada um dos conjuntos montados (v.a. X: lucro por conjunto montado).
d) Distribuio da v.a. Lucro por conjunto montado.
e) Lucro mdio por conjunto montado.
f) Varincia da varivel lucro por conjunto montado.





56
7.2 DISTRIBUIES DISCRETAS

Como vimos a varivel discreta aquela que assume valores finitos, ou infinitos
enumervel, de valores. Assim, todos os possveis valores dessa varivel podem ser listados
numa tabela com as possibilidades correspondentes

Def. Uma funo X, definida no espao amostral O e com valores num conjunto enumervel
de pontos da reta dita uma varivel aleatria discreta.


7.2.1 Distribuio Binomial

Trata-se de uma distribuio de probabilidade do nmero de sucessos quando so
realizadas n provas do mesmo tipo. O experimento repetido n vezes. Cada experimento
admite dois resultados (sucesso ou fracasso) com probabilidade p de sucesso e 1 p de
fracasso, constantes em cada uma das provas.
Exemplo:
Lanamento de uma moeda
Resposta a um teste do tipo F ou V
Escolha entre um produto bom ou defeituoso
Sexo de uma criana
Atirar em um alvo (acertar ou errar)
De um grupos de adultos fumantes e no fumantes
Alunos de uma disciplina aprovados e reprovados


Caractersticas:
1. so realizadas n provas do mesmo tipo (idnticas);
2. cada prova admite dois resultados possveis: sucesso e fracasso;
3. as probabilidades p, de sucesso, e 1 p de fracasso, permanecem constantes em todas
as provas;
4. os resultados das provas so independentes.


Frmula:

x - n
! )! (
!
) ( q p
x x n
n
x X P
x

= =

onde:

n = nmero de provas
x = nmero de sucessos em n provas
n x = nmero de fracassos
p = probabilidade de sucesso em qualquer prova
q = probabilidade de fracasso em qualquer prova


Exemplo: Admite-se que uma vlvula eletrnica, instalada em determinado circuito, tenha
probabilidade de 30% de funcionar mais de 600 horas. Se amostramos 10 vlvulas, qual a



57
probabilidade de que, entre elas, exatamente x funcione mais de 600 horas.

X = varivel aleatria: nmero de sucessos nos 10 ensaios. Assim, x = 0, 1, 2, ..., 10.
p = 0,3 sucesso (funcionar + de 600 h)
q = 1 0,3 = 0,7 fracasso (funcionar menos de 600 h)
n = 10
x - 10
7 , 0 3 , 0
! )! 10 (
! 10
) (
x
x x
x X P

= =
P (X=0) =
10 0
7 , 0 3 , 0
! 0 )! 0 10 (
! 10

= 0,0282
P (X=1) =
1 - 10 1
7 , 0 3 , 0
! 1 )! 1 10 (
! 10

= 0,1211
P (X=2) =
2 - 10 2
7 , 0 3 , 0
! 2 )! 2 10 (
! 10

= 0,2335
..

P (X=10) =
10 - 10 10
7 , 0 3 , 0
! 10 )! 10 10 (
! 10

= 0,000056

Distribuio de probabilidades

X 0 1 2 3 4 5 6 7 8 9 10
P(X) 0,0282 0,1211 0,2335 0,2668 0,2001 0,1029 0,0368 0,0092 0,0024 0,0001 0,000056

Medidas de tendncia central e de disperso para a Binomial
Mdia: np X E = = ) (
Varincia: npq X Var = = ) (
2
o
Desvio padro: npq = o
Moda: o nmero inteiro entre np + p e np p.

Exemplo

3 3 , 0 . 10 = = = np 1 , 2 7 , 0 . 3 , 0 . 10
2
= = o 45 , 1 7 , 0 . 3 , 0 . 10 = = o
M
o

np+ p = 10. 0,3 + 03 = 3,3 => M
o
= 3
np p = 10. 0,3 0,3 = 2,7





58
Exerccios

1) Uma moeda lanada 10 vezes. Calcule as seguintes probabilidades:
a. De ocorrer seis caras;
b. De dar pelo menos duas coroas;
c. De no dar nenhuma coroa;
d. De dar pelo menos uma coroa;
e. De no dar 5 caras e 5 coroas.

2) Em um teste do tipo certo-errado, com 100 perguntas, qual a probabilidade de um
aluno, respondendo as questes ao acaso, acertar 70% das perguntas.

3) Se 5% das lmpadas so defeituosas, ache a probabilidade de que, numa amostra de
100 lmpadas, escolhidas ao acaso, tenhamos:
a. Nenhuma defeituoso;
b. Trs defeituosas;
c. Mais do que uma boa.






59

7.2.2 - Distribuio de Poisson

A distribuio de Poisson largamente usada quando se deseja contar o nmero de
eventos de certo tipo que ocorrem num intervalo de tempo, ou superfcie ou volume. So
exemplos:
1. nmero de chamadas telefnicas recebidas por um PBX durante cinco minutos;
2. nmero de falhas de um computador num dia de operao;
3. nmero de relatrios de acidentes enviados a uma seguradora durante uma semana.
A expresso que d a probabilidade de x sucessos em um intervalo (tempo, rea, etc..) :
!
) (
x
e
x X P
x


= = , x = 0, 1, 2, 3,....
onde: = taxa de ocorrncia por unidade de tempo ou rea
e= base dos logaritmos naturais (2,71828)
x= nmero de ocorrncias (sucessos)

Medias de tendncia central e disperso
Mdia:
Moda: maior inteiro contido em . Se for inteiro teremos duas modas e -1.
Varincia: o =
2


Exemplo: Experincias passadas indicam que, em mdia, h duas chamadas por hora em certo
telefone. Vamos calcular as probabilidades de, em uma hora, o telefone receber: 0, 1, 2, 3,....

X: v.a. nmero de chamadas por hora
=2
= = =

! 0
2
) 0 (
2 0
e
X P 0,1353
= = =

! 1
2
) 1 (
2 1
e
X P 0,2706
= = =

! 2
2
) 2 (
2 2
e
X P 0,2706
= = =

! 3
2
) 3 (
2 3
e
X P 0,1804
= = =

! 4
2
) 4 (
2 4
e
X P 0,0902
Distribuio de probabilidades

X 0 1 2 3 4 5 6 7 8 9 10
P(X) 0,1353 0,2706 0,2706 0,1804 0,0902 0,0361 0,0120 0,0034 0,0009 0,0002 0,0000

Obs.:

~ = 1 9997 , 0 ) (
i
X P
Exemplo2: O controle de qualidade afirma que os rolos de fita isolante apresentam, em mdia,
uma emenda a cada 50 metros. Admitindo que a distribuio do nmero de ementas dada
pela Poisson, determine a probabilidade de:
a) de nenhuma emenda



60
b) no mximo duas emendas
c) pelo menos uma emenda
d) de nenhuma emenda em um rolo de 100 metros
e) de nenhuma emenda em um rolo de 150 metros
















Aproximao da binomial pela Poisson

Na aplicao do modelo de distribuio binomial, quando n for grande (n > 50), e np < 5,
possvel obter as probabilidades binomiais por meio do modelo de Poisson.
Exemplo: Em um cruzamento de duas avenidas de trfego intenso, a probabilidade de um
carro sofrer um acidente de 0,0001. Se entre as 17h e 19h passam 1000 veculos nesse
cruzamento, qual a probabilidade de que dois ou mais acidentes ocorram durante esse perodo.
Binomial
p=0,0001 n=1000 q=1-p=0,9999
P(X>=2) = 1- (P(X=0)+P(X=1))
(

= >
1 - 1000 1 1000 0
9999 , 0 0001 , 0
! 1 )! 1 1000 (
! 1000
9999 , 0 0001 , 0
! 0 )! 0 1000 (
! 1000
1 ) 2 (X P
=> O clculo desse resultado resultaria em uma srie de dificuldades. Como n> 50 e
np=1000x0,0001 = 0,1 < 5, podemos obter o resultado desejado utilizando o modelo de
Poisson.
Mdia =np= =1000x0,0001 = 0,1
P(X>=2) = 1- (P(X=0)+P(X=1))
= = =

! 0
1 , 0
) 0 (
1 , 0 0
e
X P 0,9048 = = =

! 1
1 , 0
) 1 (
1 , 0 1
e
X P 0,1x 0,9048 =0,0905
P(X>=2) = 1- 0,9048 +0,0905 = 0,00047
Portanto a probabilidade aproximada da ocorrncia de dois ou mais acidentes de 0,045%



61
Exerccios de distribuio Binomial e Poisson

1. Admitindo que X tenha distribuio de probabilidade de Poisson, encontre as
probabilidades:
a. P(X = 5) quando = 3
b. P(X 2) quando = 5,5
c. P(X 4) quando = 7,5
d. P(X = 8) quando = 4
2. Suponha que X tenha distribuio Binomial com n = 100 e p = 0,02. Use a
aproximao de Poisson para encontrar: a) P(X 5); b) P(X = 5); c) P(X = 0); d) P(X
< 2 5).
3. Uma fbrica de pneus verificou que, ao testar seus pneus nas pistas, havia em mdia
um estouro de pneu a cada 5000 Km.
a. Qual a probabilidade de que em um teste de 3000 km haja no mximo um pneu
estourado.
b. Qual a probabilidade de que um carro ande 8000 km sem estourar nenhum
pneu.
4. Uma loja atende em mdia dois clientes por hora. Calcule a probabilidade de em uma
hora:
a. atender exatamente dois clientes;
b. atender trs clientes.
5. Uma fbrica produz tecidos com 2,2 defeitos, em mdia, por peas. Determine a
probabilidade de haver ao menos dois defeitos em duas peas.



62
7.3 - DISTRIBUIO CONTNUA
Como vimos anteriormente as variveis aleatrias contnuas so aquelas para os quais
os possveis valores pertencem a um intervalo de nmeros reais. Para essas variveis no
podem ser listados todos os possveis valores fracionrios da varivel, e desta forma as
possibilidades determinadas por uma funo matemtica f(X) so retratadas, tipicamente, por
uma funo densidade ou por uma curva de probabilidade.
Def. Uma funo X, definida sobre o espao amostral O e assumindo valores num intervalo
de nmeros reais, dita uma varivel contnua.
Como uma varivel contnua (ex.: tempo) inclui, em seus resultados, valores tanto
inteiros como no-inteiros, no pode ser adequadamente descrito por uma distribuio
discreta. Dado o crculo (q ilustra o conceito de varivel contnua).







No se pode esperar que ponteiro, ao girar, venha a para exatamente num dos valores
inteiros do crculo. Se o crculo est dividido em 8 mil partes iguais, a probabilidade de o
ponteiro parar em qualquer valor particular to pequena, para fins prtico, que deve ser
considerada aproximadamente igual a zero (isso devido o mbito infinito de possibilidades).
Assim que a anlise das variveis contnuas tende a focalizar a probabilidade de uma
varivel aleatria tomar um valor num determinado intervalo. A proporo da rea includa
entre dois pontos quaisquer identifica a probabilidade de que a varivel aleatria contnua
selecionada assuma um valor entre dois pontos.
Ento, enquanto a probabilidade de o ponteiro parar no ponto trs, ou no quatro,
aproximadamente zero, a de ele para entre esses dois nmeros no zero, como o crculo est
dividido em oito setores iguais, atribui-se a probabilidade de 1/8 ao resultado. Analogamente,
entre os pontos quatro e seis (1/4 do crculo), a probabilidade de 25% ao evento.
Exemplos: Observamos o peso, em kg, de 1500 pessoas selecionadas ao acaso em uma
populao. O histograma por densidade o seguinte:

A anlise do histograma indica que:
a distribuio dos valores aproximadamente simtrica em torno de 70kg;
a maioria dos valores (88%) encontra-se no intervalo (55; 85);
existe uma pequena proporo de valores abaixo de 48kg (1,2%) e acima de 92kg (1%).
Os modelos que sero analisados representam comportamento de um extensa srie de
variveis do mundo dos negcios e tambm distribuies tericas de probabilidade que so
fundamentais para os mtodos de inferncia estatstica. Tais modelos so expressos por
funes matemticas denominadas funes densidades de probabilidade.
0
1
2
3
4
5
6
7



63
7.3.1 Distribuio Normal

As distribuies normais foram descobertas no sculo XVIII. Astrnomos e outros
cientistas observavam, no sem certa surpresa, que mensuraes repetidas de uma mesma
quantidade (como distncia a lua ou a massa de um objeto) tendiam a variar, e um grande
nmero dessas mensuraes, em uma distribuio de freqncia, elas se representavam em
uma forma anloga a figura acima. Associada a erros de mensurao, deu-se o nome de
distribuio normal dos erros, ou simplesmente distribuio normal. Ou distribuio
Gaussiana (Karl F. Gauss, 1777-1855) pela sua teoria matemtica.
A distribuio de probabilidade normal importante na inferncia estatstica por trs
razes distintas:
1- as medidas produzidas em diversos processos aleatrios seguem essa distribuio;
2- probabilidades normais podem ser usadas freqentemente com aproximaes de
outras distribuies de probabilidade, tais como a binomial e de Poison;
3- as distribuies de estatstica da amostra tais como a mdia e a proporo
freqentemente seguem a distribuio normal independentemente da distribuio
da populao.
As distribuies normais representam, com boa aproximao, as distribuies de
freqncias observadas de muitos fenmenos naturais e fsicos.
Ela simtrica (em relao a sua mdia) e mesocrtica, descrita como tendo uma forma de
sino, como exemplificada pela funo densidade de probabilidade, nunca toca o eixo
horizontal, prolonga-se de - a +, cada curva de distribuio normal fica especificada por
sua mdia e seu desvio padro, a rea total sob qualquer curva normal representa 100% de
probabilidade associada a varivel. As probabilidades se referem sempre a intervalos de
valores.
Vamos definir a varivel aleatria A curva contnua da figura denomina-se curva
Normal. Como se distribuem os valores da varivel aleatria X, isto , qual a distribuio de
probabilidades de X ? X: peso, em kg, de uma pessoa adulta escolhida ao acaso da populao.



A funo densidade de probabilidade de uma varivel normal dada pela expresso:
2
) (
2
1
2
1
) (
o

to

=
x
e x f

em que:
t = 3,1416;
e = 2,7183;
= mdia da distribuio;
o = desvio padro da distribuio.

Cada distribuio normal fica determinada pelos parmetros mdia e desvio padro.



64
Assim, a notao de uma varivel com distribuio normal expressa da seguinte maneira:
( )
2
, o N X ~ . Eis dois exemplos de grficos da distribuio normal:
Exemplo 1: curvas normais com mesma varincia o
2
e diferentes mdias
2
>
1



Exemplo 2: Curvas normais com mesma mdia , mas com varincias diferentes
2
1
2
2
o o > ).


Por trata-se de um modelo de distribuio contnua, a probabilidade de X assumir um
particular valor x
0
zero, isto , P(X = x
0
) = 0, portanto so iguais as probabilidades
( ) ( ) b X a P b X a P s s = < < . Todavia, a probabilidade de uma varivel aleatria distribuda
normalmente tomar um valor entre dois pontos quaisquer a e b, a b, igual rea sob a
curva compreendida entre os dois pontos.

O valor numrico dessa rea hachurada o resultado da integral de f(X) entre a e b,
isto :
dx e b x a P
b
a
x
}

= < <
2
) (
2
1
2
1
) (
o

to
.
Essa integral no pode ser calculada analiticamente e deve ser computada por mtodos
numricos. Na prtica, seria necessrio dispormos de tabelas com resultados das



65
probabilidades desejadas, porem, deveramos ter inmeras tabelas diferentes, para cada
combinao particular de e o que consiste em uma famlia infinita de curva normal, da ser
intil procurar elaborar tabelas que atendessem a todas essas necessidades.
Os clculos das probabilidades, utilizando uma famlia infinita de distribuio pode ser
evitado utilizando valores relativos, ao invs de valores reais. Isto equivale a tomar a mdia
como ponto de referncia (origem) e o desvio padro como medida de afastamento. A nova
escala chamamos de escala Z. Assim, temos:

o

=
X
Z .
Podemos demonstra que a mdia de Z zero, que sua varincia igual a 1. Logo, a
funo densidade da varivel Z dada por:

2
2
1
2
1
) (
z
e Z f

=
t
.




Uso de tabelas da distribuio normal padro.

Existem vrios tipos de tabelas que fornecem reas sob a curva normal padro.
Utilizaremos a tabela de faixa central que d a rea sob a curva normal padro entre Z = 0 e
outros valores positivos da varivel Z. A simetria da distribuio Z em relao a sua mdia
(Z=0) permite obter reas entre Z = 0 e outros valores negativos da varivel, j que a rea
entre Z = 0 e Z
0
ser igual rea entre Z
0
e Z = 0. Na figura a seguir a rea hachurada a
rea a ser obtida.


Assim, P( 0 < Z < 1,17) ser obtido por meio da tabela normal, conforme demonstrado a
seguir:

1,17 => 1,1 e 0,07



66

Z 0,00 0,01 ..... 0,07 .... 0,09
0,0
0,1
0,2
.
.
1,0
1,1 0,3790
.
.
3,9


P( 0 < Z < 1,17) = 37,90%




Exerccios:

1) Determine as probabilidades solicitadas:
a) P(Z > 1,17)
b) P(Z < 1,17)
c) P(Z < 0)
d) P(2,05 < Z < 2,93)
e) P(-0,85 < Z < 1,75)
f) P(0 < Z < 3,42)

2) Na tentativa de se levantar a faixa salarial de um determinado cargo em determinado ramo
de indstria obteve-se uma amostra de tamanho n=80 dessa varivel e calculou-se as
estimativas pontuais obtendo-se uma mdia salarial de R$ 1003,70 e uma varincia de R$
9124,07. Calcular as probabilidade dos salrios populacionais:
a) serem menores ou iguais a R$ 1200,00;
b) serem maiores ou iguais a R$ 930,00;
c) pertencer ao intervalo de R$ 980,00 at R$ 1050,00.
d) serem menores ou iguais a R$ 950,00 ou ento maiores que ou iguais a R$ 1250,00.





67






68
Distribuio normal como aproximao da binomial
Quando nmero de observaes ou de tentativas n for relativamente grande, a
distribuio de probabilidade normal pode ser utilizada para aproximaes das probabilidades
binomiais. Uma regra de bolso conveniente que tal aproximao aceitvel quando n > 30,
e tanto nP > 5 como n(1-P) > 5.
Quando a distribuio normal de probabilidade usada como uma aproximao da
distribuio de probabilidade binomial, a mdia e o desvio padro se baseiam no valor
esperado e na varincia do nmero de sucesso de uma distribuio binomial.
O nmero de sucesso :
np =
O desvio padro do nmero de sucesso:

) 1 ( p np = o

Ex.: Para um grande nmero de clientes potenciais, sabe-se que 20% dos que foram feito
contatos pessoalmente pelos agentes de vendas realizaro uma compra. Se um representante
de vendas visita 30 clientes potenciais, podemos determinar a probabilidade de que 10 ou
mais faro uma compra utilizando as probabilidades binomiais da tabela (Apndice 1).












7.3.2 - Outras distribuies contnuas

Distribuio de Qui-quadrado

As variveis aleatrias contnuas, chamadas de qui-quadrado, so aplicadas em
diferentes testes estatsticos. Suas aplicaes neste caso so referentes variao
populacional.
A varincia amostral (S
2
) um estimador para a varincia populacional (o
2
).
possvel mostrar que pela diviso de
1 n
) X X (
2

, com definio de S
2
ns obtemos
um estimador no viesado para o
2
.
As estimativas para o
2
obtidas em repetidas amostras de uma mesma populao
flutuam em torno da verdadeira varincia populacional.
As estimativas para o
2
so importantes, j que necessita-se avaliar a estatstica t
usada para fazer inferncia sobre a mdia populacional.
Em algumas ocasies o centro de interesse no a mdia, mas a varincia mesmo.
Na verdade necessrio ser capaz de no encontrar apenas a estimativa pontual para a
o
2
, mas tambm construir um intervalo de confiana ou testar uma hiptese referente a este



69
parmetro.
Para isto necessrio introduzir este outro conjunto de variveis aleatrias contnuas,
chamado _
2
.
- O conjunto dessas variveis identificado por um parmetro v, chamado grau de
liberdade (n-1),
2
v
_
;
- O grfico de densidade de cada varivel _
2
uma curva assimtrica direita;
- A varivel _
2
no assume valores negativos.












Exemplo: considerando um
2
10
_
(qui-quadrado com 10 graus de liberdade).
a) P[
2
10
_
s 2,56] =
b) P[
2
10
_
> 16] =
c) P[
2
10
_
> 18,3] =
d) P[3,25 s
2
10
_
s 20,5] =


MARTINS, Gilberto de Andrade. Estatstica Geral e Aplicada. So Paulo: Atlas, 2001. 417p.





_
2

0

Potrebbero piacerti anche