Sei sulla pagina 1di 22

UNIVERSIDADE FEDERAL DA PARABA

DEPARTAMENTO DE ECONOMIA
DISCIPLINA: ECONOMETRIA
Prof. Dr. Paulo Amilton Maia Leite Filho
REVISO: ESTATSTICA DESCRITIVA
Estatstica Descritiva a parte da estatstica que tem a finalidade
de descrever os dados amostrais por meio de medidas de posio, de
disperso, de assimetria, de curtose e da apresentao em tabelas ou
grficos, sem fazer nenhuma inferncia sobre a populao dos dados.
I - Distribuies de Freqncias
Ao estudar grandes conjuntos de dados, conveniente resumi-
los numa tabela, atravs do agrupamento dos dados em classes, com
suas respectivas freqncias.
Quando os dados so discretos com valores repetidos, a simples
identificao dos mesmos com as respectivas freqncias, pode ser um
procedimento adequado.
Quando os dados so contnuos, pode acontecer que poucos, ou
at nenhum deles, apresente freqncia. Nestes casos, o
procedimento comea pela definio de classes. Cada classe
determinada por um intervalo (diferena entre os limites superior e
inferior).
Uma distribuio de freqncia uma tabela na qual os possveis
valores de uma varivel se encontram agrupados em classes,
registrando-se o nmero de valores observados em cada classe. Os
dados organizados em uma distribuio de freqncia so chamados
de dados agrupados.
1.1 - Intervalos de Classe
Para cada classe, em uma distribuio de freqncia, os limites
de classe inferior e superior indicam os valores compreendidos pela
classe. H diversos mtodos para determinar o nmero de classes (k).

REGRAS BSICAS
1. Efetua-se um ROL ESTATSTICO (ordenao crescente ou
decrescente de grandeza) nos Dados Brutos (aqueles ainda no
organizados numericamente).
2. Determina-se a AMPLITUDE TOTAL dos dados
AT = Xmx Xmn, onde Xmx: maior valor observado e Xmn: menor
valor observado
3. Escolhe-se convenientemente o nmero de classes K (n inteiro), 5
K 15 onde podemos tomar n K ou a frmula de Sturges
n K log 3 , 3 1 +
, n 25 (total de observaes). Se possvel
determina-se, ou seja, constri-se classes de mesma amplitude,
tomando
K
AT
h
.
4. Efetua-se o AGRUPAMENTO EM CLASSES e, a seguir, toma-se as
FREQNCIAS SIMPLES DE CLASSES, elaborando-se, portanto, a
tabela de distribuio de freqncias.
1.2 - CONCEITOS ESSENCIAIS
LIMITES DE CLASSES: Li: Limite inferior de classe; LS: Limite
superior de classe
Classe ou Intervalo de classe Li (incluir) | LS (excluir)
Por exemplo, distribuio das Idades, tabela 1.5:
1 classe Li = 18 | LS = 20; 2 classe Li = 20 | LS =
22; etc.
AMPLITUDE DE CLASSE: hi = LS Li, amplitude da i-sima classe.
Por exemplo, distribuio da Idade, tabela 1.5:
1 classe h1 = 20 18 = 2; 2 classe h1 = 22 20 = 2; ;
5 classe h1 = 28 26 = 2
Como as classes tm mesma amplitude, denominamos,
simplesmente, por h = Li LS 2
PONTO MDIO DE CLASSE:
2
S i
i
L L
X
+
, ponto mdio da i-sima
classe.
Por exemplo, distribuio das Idades, tabela 1.5:
1 classe
19
2
20 18

i
X
; 2 classe
21
2
22 20

i
X
No caso de classes com mesma amplitude h, tomamos:
h X X
i i
+
+1 , ou seja por ex.:
2 classe
21 2 19
1
+ + h X
3 classe
23 2 21
2
+ + h X
etc.
1.3 - TIPOS DE FREQNCIAS
FREQNCIA SIMPLES OU ABSOLUTA DE CLASSE
fi: freqncia simples da i-sima classe (nmero de observaes)
n f f
i
k
i
i


1
(nmero total de observaes)
Por ex.: f1 = 12; f2 = 11; f3 = 4; f4 = 1; f5 = 2 e
30

n f
i
FREQNCIA RELATIVA E PERCENTUAL DE CLASSE
FREQNCIA RELATIVA (i-sima classe do valor):
n
f
fr
i
i
(Razo entre a freqncia simples e o total de observaes)

1
i
fr
(Soma das freqncias relativas)
FREQNCIA PERCENTUAL (i-sima classe ou valor):
100 %
i i
fr f
ou 100 %
n
f
f
i
i
100 %
i
f
(Soma das freqncias percentuais)
FREQNCIA SIMPLES ACUMULADA (do tipo abaixo de)
i i
f fr fr F + + +
2 1 , freqncia simples acumulada da i-sima classe ou
valor.
FREQNCIA RELATIVA E PERCENTUAL ACUMULADA
i i
f fr fr Fr + + +
2 1 , freqncia relativa acumulada da i-sima classe
ou valor;
% % % % %
3 2 1 i i
f f f f F + + + +
, freqncia percentual acumulada da i-sima
classe ou valor
Tabela 1.1 Freqncias de determinadas classes obtidas de observaes
originais
Intervalo
de
Classes
Freqncia Freqncia
Acumulada
Freqncia
Relativa
Frequ. Relativa
Acumulada
Ponto Mdio
f
i
F
i
fr
i
Fr
i
PM
i
1 LI
1
LS
1
f
1
f
1
f
1
/F
t
f
1
/F
t
(LI
1
+LS
1
)/2
2 LI
2
LS
2
f
2
F
1
+f
2
f
2
/F
t
(f
1
+f
2
)/F
t
(LI
2
+LS
2
)/2
3 LI
3
LS
3
f
3
f
1
+f
2
+f
3
f
3
/F
t
(f
1
+f
2
+f
3
)/F
t
(LI
3
+LS
3
)/2
4 LI
4
LS
4
f
4
f
1
+f
2
+f
3
+f
4
f
4
/F
t
(f
1
+f
2
+f
3
+f
4
)/F
t
(LI
4
+LS
4
)/2

K LI
k
LS
k
f
k
F
t
f
k
/F
t
1 (LI
k
+LS
k
)/2
LI = Limite Inferior; LS = Limite Superior
Pontos importantes na construo de tabelas de
freqncias
Intervalos de classes inadequados podem conduzir os usurios a erros:
a) os intervalos de classe devem ser representativos, isto , a
mdia dos valores dentro do intervalo devem ser
aproximadamente igual ao ponto mdio da classe;
b) os intervalos de classe devem ser do mesmo tamanho, a menos
que determinada amplitude de valores precise de ateno
particular;
c) o nmero de intervalos de classe deve ser um meio-termo entre
a quantidade exigida de detalhes e a facilidade com que o
usurio pode assimilar os dados;
d) a tabela de freqncia deve atender o objetivo de identificar as
caractersticas de uma varivel.
Em algumas situaes, nossos interesses no so as freqncias,
ou seja, quantas observaes caem em cada intervalo, mas a
freqncia acumulada, isto , quantas observaes caem acima (ou
abaixo) de determinado valor.
A partir dos dados originais ou dos dados distribudos em classes,
podem-se represent-los graficamente.
1.4 - REPRESENTAO GRFICA
O grfico estatstico uma forma de apresentao dos dados
estatsticos, cujo objetivo o de produzir, no investigador ou no
pblico em geral, uma impresso rpida e viva do fenmeno em
estudo, j que os grficos falam mais rpidos que as sries (tabelas).
Para tornarmos possvel uma representao grfica,
estabelecemos uma correspondncia entre os termos da srie e
determinada figura geomtrica, de tal modo que cada elemento da
srie seja representado por uma figura proporcional.
- REQUISITOS
A representao grfica de um fenmeno deve obedecer aos seguintes
requisitos primordiais:
a)Simplicidade - indispensvel devido necessidade de levar a uma
rpida apreenso do sentido geral do fenmeno apresentado a fim
de no nos perdermos na observao de mincias de importncia
secundaria.
b)Clareza - o grfico deve possibilitar uma correta interpretao dos
valores representativos do fenmeno em estudo.
c) Veracidade - indispensvel qualquer comentrio, posto que, se no
representa uma realidade, o grfico perde sua finalidade.
Os principais tipos de grficos estatsticos para as distribuies de
freqncias so os DIAGRAMAS, os quais so grficos geomtricos
de, no mximo duas dimenses. Para sua construo, em geral,
fazemos uso do sistema cartesiano.
Dentre os principais tipos de diagramas destacamos, segundo a
varivel em estudo:
Varivel Qualitativa GRFICOS EM BARRAS OU COLUNAS,
GRFICOS EM SETORES
Distribuio por Valores GRFICO EM COLUNAS
Varivel Quantitativa Distribuio por Intervalos HISTOGRAMA,
POLGONO DE FREQNCIAS.
1.4.1 - Histograma
uma representao grfica dos resultados das distribuies de freqncias
construdas de retngulos justapostos, cujas alturas so os segmentos de retas
dados pelas freqncias de cada classe e cujas larguras so proporcionadas pelo h.
Dito de outra forma, o histograma , simplesmente, o equivalente grfico de uma
tabela de freqncias onde o eixo X esto os extremos inferiores de cada intervalo
de classe e no eixo Y, esto as freqncias correspondentes a cada classe. O
histograma no claro nos extremos dos intervalos de classe.
Grfico 3 - Alturas dos estudantes.
Altura
188,3 181,9 175,4 169,0 162,6 156,1 149,7
F
r
e
q

n
c
i
a
14
12
10
8
6
4
2
0
1.4.2 - Polgono de Freqncia
Polgono um grfico de linha de uma distribuio de freqncia.
O polgono uma verso suavizada do histograma, porque
constitudo unindo os pontos mdios do topo de cada bloco do
histograma. Uma outra maneira de representar graficamente, os
dados analisados, atravs do polgono de freqncia acumulada
(ogiva), que traado utilizando-se as freqncias acumuladas a partir
dos limites superiores de cada classe. A ogiva permite perceber qual a
proporo de observaes maior/menor do que um dado valor.
Grfico 4 - Alturas dos estudantes

Altura
188,3 181,9 175,4 169,0 162,6 156,1 149,7
F
r
e
q

n
c
i
a
14
12
10
8
6
4
2
0
Polgonode
freqncia
II - Medidas de Posio
So chamadas medidas de tendncia central, pois representam
as caractersticas avaliadas pelos seus valores mdios, em torno dos
quais tendem a concentrar-se os dados. Tais medidas possibilitam
comparaes de sries de dados pelo confronto de seus valores.
2.1 - Mdia
a medida mais comumente usada para descrever
resumidamente uma srie de dados. H vrios tipos de mdias, sendo
que as mesmas podem ser influenciadas pelos valores extremos da
srie. Uma alternativa seria remover os valores mais baixos (5%) e os
valores mais altos (5%) para calcular a mdia com os 90% das
observaes restantes.
2.1.1 - Mdia Aritmtica
A mdia aritmtica obtida pela soma de todos os valores de
uma varivel X dividida pelo nmero total de observaes (n):
n
X
n
X X X
X
n
i
i
n

+ + +

1 2 1
...

entretanto, se na srie existirem dados repetidos, os k diferentes
valores da varivel X podem ser agrupados, ou seja, a cada valor Xi
estar associada uma respectiva freqncia fi, obtendo-se ento, a
mdia aritmtica ponderada:

+ + +
+ + +

k
i
i
k
i
i i
k
k k
f
X f
f f f
X f X f X f
X
1
1
2 1
2 2 1 1
...
...
em que:
n f
k
i
i

1

2.1.2 - Mdia Geomtrica
A mdia geomtrica definida como a raiz de ordem n no
produto de todos os valores que uma varivel X assume, sendo dada
por:
n
i
n
i
n
n G
X X X X X
1
2 1
...


Se cada Xi estiver associada uma respectiva freqncia f, ento:

k
i
i
i
k
i
i
k
f
f
i
k
i
f
f
k
f f
G
X X X X X
1
1 2 1
1
2 1
...
uma propriedade importante desta medida, que o produto das
razes de cada observao pela mdia geomtrica igual a um. Como
desvantagem, se a srie de dados tiver valores menores ou igual a
zero, a mdia geomtrica no poder ser calculada.
2.2 - Mediana
Colocados os valores em ordem crescente de grandeza (rol), a
mediana (Md) ser o valor que ocupa a posio central da srie de
dados, ou seja, o valor que divide a srie em duas partes com
nmeros iguais de elementos. A mediana prefervel mdia quando
se est interessado em conhecer exatamente o centro da distribuio
dos dados, ou ainda, quando os valores extremos podem afetar
sensivelmente a mdia. O clculo da mediana feito sob duas
condies:
a) n par: Md ser o valor do rol que ocupa a posio entre as duas
observaes do meio na disposio ordenada. A mediana a
mdia dos valores numricos correspondentes quelas duas
observaes centrais:
2
1 + n
X

b) n impar: Md ser o valor do rol que ocupa o ponto de
posicionamento (n+1)/2 das observaes aps a ordenao
2.3 - Moda
A moda (Mo) o valor que ocorre com maior freqncia ou o
valor que mais se repete. Quando a srie de dados tal que as
freqncias so maiores nos extremos, ou quando se quer destacar
um valor de alta freqncia ou quando se pretende obter uma medida
rpida e aproximada da tendncia central, a moda pode ento, ser
considerada para a interpretao dos dados. Com relao moda,
uma srie de dados pode ser classificada em amodal (no possui
moda), unimodal (possui apenas uma moda), bimodal (possui duas
modas) ou multimodal (possui mais de duas modas).
Exemplo: Dez funcionrios do departamento de pessoal obtiveram as
seguintes notas, em ordem crescente: 7,0; 7,0; 7,5; 7,9; 8,0; 8,6;
8,6; 8,6; 8,6; 9,5;
Moda= 8,6
2.4 Quartis, Decis e Percentis
Essa idia de dividir o conjunto ordenado de dados em partes
iguais pode ser estendida em: quartil, decil e percentil. Os quartis Q1,
Q2 e Q3 dividem a srie de dados em quatro partes iguais, cada parte
com 25% dos dados. Os decis D1, D2, ..., D5, ... , D9 dividem a srie
em dez partes iguais, cada parte com 10% dos dados. Os percentis
P1, P2, ..., P50, ..., P99 dividem a srie em cem partes iguais, cada com
1% dos dados. Em termos de comparaes entre estas medidas, tem-
se
Q2=D5=P50=Md
Q3 =
2
1
4
3
+
n
X
Exemplo: Oito vendedores venderam os seguintes nmeros de
unidades de um produto, em ordem crescente: 5, 8, 8, 11, 11, 11, 14,
16
Q3 =
5 , 12
5 , 6
2
1
4
24
2
1
4
8 3

1
]
1

+
1
]
1

X X X
Exemplo 2: Dez funcionrios do departamento de pessoal obtiveram as
seguintes notas, em ordem crescente: 7,0; 7,0; 7,5; 7,9; 8,0; 8,6;
8,6; 8,6; 8,6; 9,5;
Q2 =
3 , 8
5 , 5
2
1
4
20
2
1
4
10 2

1
]
1

+
1
]
1

X X X
III - Medidas de Disperso
So utilizadas para avaliar o grau de variabilidade dos dados.
No se justifica calcular uma mdia de um conjunto de dados onde
no haja variao, todavia se a variabilidade desses dados for muito
grande, a representatividade da mdia ser muito pequena. Assim,
importante caracterizar a disperso dos dados, uma vez que diferentes
amostras com mdias semelhantes, podem apresentar diferentes
variabilidades.
3.1 - Amplitude Total
a diferena entre o maior e o menor dos valores da srie de
dados, ou seja, o maior desvio da amostra. A sua utilizao, alm de
mostrar o mximo desvio, serve para uma avaliao preliminar dos
dados, verificando-se a possibilidade de possveis erros nas coletas dos
dados ou das digitaes, j que as variveis podem apresentar
extremos conhecidos.
AT = X
maior
X
menor
A amplitude , na verdade, uma medida fraca de disperso,
porque ela considera somente os valores extremos e no diz nada
sobre a distribuio dos valores intermedirios.
3.2 - Intervalo Interquartil
Para algumas finalidades, a desvantagem da amplitude o fato
de seu clculo basear-se apenas nos dois valores extremos. A medida
que mantm as propriedades da amplitude, sem essa desvantagem,
a amplitude interquartlica. Para calcularmos, organizamos todas as
observaes por ordem de grandeza e calculamos Q1 como o valor da
observao que est a um quarto na fila de ordenao; Q3 est a trs
quartos e, a distncia entre Q1 e Q3 agrega 50% das observaes.
Q1: Ponto de posicionamento = observao ordenada
4
1 + n
Q3: Ponto de posicionamento = observao ordenada
4
) 1 ( 3 + n

A distncia entre os quartis superior e inferior mede a disperso
da metade central das observaes e conhecida como intervalo
interquartil:
Amplitude Interquartil = Aiq = 1 3
Q Q
Quanto maior for o valor da amplitude que incorpora o valor
50% das observaes, maior ser a disperso dos dados. Alm disso,
a amplitude interquartlica no afetada pelos valores extremos.
Exemplo
Figura 2.2 Amplitude interquartlica
50%
25% 25%
Menor Q1 Mediana Q3 Maior
3.3 - Desvio Mdio Absoluto
O desvio mdio absoluto, ou DMA, baseado na diferena entre
cada valor do conjunto de dados e a mdia do grupo. O calculado a
mdia destes desvios (alguns estatsticos usam a diferena entre cada
valor e a mediana). Se fosse calculada a mdia das diferenas
positivas e negativas entre cada valor e a mdia aritmtica, o
resultado iria ser, de fato, sempre igual a zero. Por esta razo, so
tomadas as diferenas em valores absolutos (ou em mdulo),
DMA =
n
X X



3.4 - Varincia
A varincia similar ao desvio mdio no sentido de que
tambm baseada nas diferenas entre cada valor do conjunto de
dados e a mdia do grupo. A varincia dada pela soma dos
quadrados dos desvios de cada observao em relao mdia,
dividida pelo nmero de graus de liberdade da amostra, ou seja, ela
a mdia dos (n-1) desvio quadrtico e independente.
Para uma populao, a varincia representada pela letra grega
mins-cula
2
(ler sigma dois) e a varincia de uma amostra
representada por s
2
(em alguns livros pode ser representado por
2

(ler sigma dois chapu).
Para uma amostra de n valores X1, X2, ..., Xn de uma varivel X,
a varincia dada por:
1 1
) (
2
1
1
2
1
2
2

,
_




n
n
X
X
n
X X
s
n
i
i
n
i
i
n
i
i

Se na srie existirem dados repetidos, a varincia dos k
diferentes valores X1, X2, ..., Xk de uma varivel X, associados s
freqncias f1, f2,..., fk respectivamente, ser dada por:
1 1
) (
1
1
2
1
1
2
1
1
2
2

,
_

k
i
i
k
i
i
k
i
i i
k
i
i i
k
i
i
k
i
i i
f
f
X f
X f
f
X X f
s
3.5 - Desvio Padro
Para se retornar unidade original de avaliao de uma varivel
X e obter uma medida de melhor interpretao, define-se o desvio
padro como sendo a raiz quadrada positiva da varincia:
2
s s

intuitivamente, o desvio representa uma mdia dos desvios
(absolutos) que todos os valores amostrais possuem ao redor da
mdia. Valores da srie prximos uns dos outros originam um desvio
padro menor, enquanto valores muito afastados uns dos outros do
um desvio padro maior. Em outras palavras, a srie de dados que
apresentar desvio padro maior, ter uma distribuio de freqncias
mais aberta que a srie com desvio padro menor.
3.6 - Coeficiente de Variao
uma medida admensional, til para comparar variabilidades de
diferentes amostras, onde as mdias so muito desiguais ou as
unidades de medidas so diferentes. O coeficiente de variao (CV) o
desvio padro expresso em porcentagem da mdia, isto , magnitude
relativa do desvio padro quando comparado com a mdia da
distribuio das medidas. O coeficiente dado por:
100
X
s
CV

Esse coeficiente , em geral, usado para medir variaes na
disperso ao longo do tempo quando a mdia se move para cima ou
para baixo.
3.7 - Erro Padro da Mdia
O erro padro da mdia representa a variabilidade mdia entre
as mdias amostrais possveis de serem coletadas. Intuitivamente, d
a idia da preciso da estimativa obtida para a mdia, sendo que
aquela que apresentar maior erro padro ter menos preciso.
inversamente proporcional ao tamanho da amostra e diretamente
proporcional ao desvio padro, sendo definido como:
n
s
s
x


usual apresentar a mdia e o erro padro da mdia com a
seguinte indicao:
[ ]
x x x
s X s X s X + t

IV Formato de uma distribuio
O terceiro e quarto momentos
1
de uma distribuio so
freqentemente usados para estudar a aparncia de uma
distribuio, em especial sua assimetria e sua curtose. Em outras
palavras, a distribuio dos dados pode ser simtrica ou no, ou ainda
achatada ou pontiaguda e, isso, dar um formato curva de
distribuio.
4.1 - Medida de Assimetria
Denomina-se assimetria o grau de afastamento da simetria de
uma distribuio de dados. Em uma distribuio simtrica, tem-se
igualdade dos valores da mdia, mediana e moda. Entretanto, se
numa distribuio ocorrer:
1
O primeiro momento a mdia e o segundo momento a varincia.
a) Mo Md X : existiro mais dados da srie maiores do que a
mdia, porem a curva de distribuio ter uma cauda mais longa
para os dados menores do que a mdia, isto , diz-se que a
distribuio tem assimetria negativa;
b) Mo Md X : existiro mais dados da srie menores do que a
mdia, porm a curva da distribuio ter uma cauda mais longa
para os dados maiores do que a mdia, isto , diz-se que a
distribuio tem assimetria positiva.
A estimativa do coeficiente de assimetria (S) de uma varivel X dada
por:
N
s
X X
S
n
I
i

,
_

1
3


Interpretao
a) S = 0 : se o resultado for zero, a distribuio simtrica,
b) S < 0 : se o valor for negativo, a distribuio assimtrica
negativa (inclinada para a esquerda) e,
c) S > 0 : se o resultado for positivo, a distribuio assimtrica
positiva (inclinada para a direita).
4.2 - Medida de Curtose
Denomina-se curtose o grau de achatamento da distribuio.
Para se estimar o grau de curtose (K), utiliza-se a seguinte
frmula:
n
s
X X
K
n
i
i

,
_

1
4

O resultado pode ser assim definido:
a) K = 3 : Mesocrtica a distribuio de freqncias a
prpria distribuio normal;
b) K < 3 : Platicrtica a distribuio achatada (alta
variabilidade);
c) K > 3 : Leptocrtica a distribuio concentrada em
torno da mdia (alta homogeneidade).
Obs: A assimetria positiva surge quando a mdia aritmtica
aumentada por algum valor extraordinariamente elevado e, a
assimetria negativa ocorre quando a mdia reduzida por algum valor
extremamente baixo. Os dados so simtricos quando no existem
valores realmente extremos em uma direo especfica, de modo que
os valores baixos e altos se equilibram entre si.
Alguns Conceitos Bsicos de varivel aleatria
As variveis econmicas so, por sua natureza, aleatrias. No
sabemos quais sero seus valores seno depois de observ-los. A
probabilidade uma forma de expressar a incerteza sobre eventos e
resultados econmicos.
Variveis Aleatrias
Grande parte dos dados cientficos so obtidos atravs de
experimentao. Entretanto, a economia uma cincia social, em que
muitos dos dados no se originam de um processo experimental
controlado.
Um experimento controlado aquele possvel reproduzi-lo
mantendo-se controlada pelo pesquisador as condies originais. Ele
pode ser repetido sob diferentes variveis de controle para verificar o
efeito sobre o resultado. No entanto, embora possa ser repetido, os
valores observados no so iguais em cada repetio, dado que as
condies de experimento para outro no so realmente idnticas.
Neste caso, o resultado uma varivel aleatria.
Um experimento no controlado aquele em que o pesquisador
um mero expectador dos dados. Ele no tem controle sobre a
gerao dos dados. Os valores das variveis econmicas esto sob
efeito de um sem nmero de variveis simultaneamente. Neste caso,
esses dados so com certeza uma varivel aleatria.
Varivel Aleatria uma varivel cujo valor no conhecido at
que seja observado. O valor de varivel no pode ser previsto
acuradamente. A varivel aleatria pode ser discreta ou continua.
Varivel Aleatria Discreta - so aquelas que s podem assumir
valores finitos os quais possam ser contados utilizando-se os nmeros
inteiros positivos.
Varivel Aleatria Contnua so aquelas que podem tomar
qualquer valor real em pelo menos um intervalo na reta real.
S se conhecem os valores de uma varivel aleatria aps a
realizao de um experimento e nem todos os valores so igualmente
provveis. Poe-se fazer apenas afirmaes probabilsticas sobre certos
valores, especificando uma distribuio de probabilidade para a
varivel aleatria.
Temos o evento A. Este o resultado de um experimento, ento
a probabilidade de A, que ser representada aqui por P(A), a
freqncia relativa com que o evento A ocorre em muitas provas
repetidas do experimento. Para qualquer evento, 0P(A)1 e p(A)=
1.
Funo de probabilidade quando se relacionam os valores de uma
varivel aleatria discreta com a probabilidade de ocorrncia, o
resultado uma funo de probabilidade. No caso de uma varivel
continua temos a funo densidade de probabilidade.
Para uma varivel aleatria discreta X, o valor da funo de
probabilidade f(X) a probabilidade de X tomar valor x, f(x)= P(X=x).
por conseguinte, 0f(x)1 e se x tomar valores x1,x2,x3...,xn ento
f(x1) + f(x2) + ..... + f(xn) = 1.
Para uma varivel aleatria continua Y a funo densidade de
probabilidade uma por uma equao de uma curva a rea abaixo
desta curva corresponde probabilidade. Ento,
b
P[aYb] = y=af(y)dy.
Regras de somatrio
1. se X tem n valores x1,x2,x3...,xn ento sua soma xi=
x1+x2+x3...+xn.
2. Se a uma constante, axi= a xi .
3. Se X e Y so duas variaveis, assim, (xi + yi)= xi+ yi .
4. Se X e Y so duas variaveis, ento (axi + byi)= axi+ byi .
5. a mdia de uma varivel aleatria x , x
*
=(xi)/n ou
x
*
= (xi x
*
)/n.
6. f(xi)= f(x1),...,f(xn).
7. f(xi + yj)= (xi + yj).
Mdia de uma varivel aleatria E(X) se X uma varivel
aleatria discreta que pode tomar valores x1,x2,x3...,xn com
probabilidades f(x1),...,f(xn) o valor esperado de X :
E(X)= x1f(x1),...,xnf(xn)= xnf(xn).
Para um varivel aleatria continua substituirmos o somatrio
pela integrao.
Varincia de uma varivel aleatria
2
(X) a diferena
quadrtica mdia entre o seu valor mdio e o valor assumido pela
varivel aleatria. Ela uma medida que caracteriza a escala de
mensurao e a disperso da distribuio de probabilidades.

2
(X) = var(X) = E[X E(x)]
2
= E(X)
2
[E(X)]
2
.
Propriedade da varincia Var (a + cX ) = E[(a + cX )- E(a +
cX )]
2
= c
2
var(x).
A raiz quadrada da varincia o desvio padro e simbolizado por
. este tambm mede a disperso, mas tem a vantagem de expressar
na mesma unidade de medida da varivel aleatria.
Covarincia (cov) em economia, interessa-nos em geral explorar
relaes entre variveis econmicas. Uma questo freqente : quo
estreitamente juntas caminham duas variveis? Uma resposta pode
ser dada pelo conceito de covarincia. Ela indica o grau de variao
conjunta apresentada por duas variveis. Sua expresso matemtica
:
cov(X,Y) = E[X E(x)] E[Y E(Y)]
O sinal da covarincia entre duas variveis aleatrias indica se
sua associao positiva (direta) ou negativa (inversa). A covarincia
igual a zero implica que no h associao positiva nem negativa entre
pares de valores.
Correlao () uma medida que serve para medir o grau de
associao linear entre duas variveis aleatrias. A correlao deve
apresentar valor no intervalo -1 1 .
= [cov(x,y)]/[var(x)var(y)]
1/2
Se =1 ou =-1 implica que existe uma perfeita correlao
positiva ou negativa entre as duas variveis aleatrias, ou seja, uma
funo linear perfeita, positiva ou negativa. Se =0 e cov=0 ento
pode-se dizer que no existe relao nenhuma entre X e Y. A
magnitude || indica a fora da associao entre os valores das
variveis aleatrias. Quanto maior for || maior associao linear
entre os valores.
Distribuio Normal
Nas sees anteriores abordamos de uma maneira geral as
variveis aleatrias e suas funes densidade de probabilidade
especficas se revelam extremamente teis. A mais importante delas
a distribuio normal. ||
Se x uma varivel aleatria distribuda normalmente com
mdia e varincia
2
, simbolizada por X ~ N(,
2
) ento sua funo
densidade de probabilidade :
f(x)= -1/(2
2
)
1/2
exp[-(x- )
2
/2
2
], -< x< .
Onde exp[a] expressa a funo exponencial. A mdia e a
varincia
2
so os parmetros desta funo e determinam sua
localizao, como tambm sua disperso. A funo de densidade
acima gera uma curva simtrica, em forma de sino, centrada na mdia
. Quanto maior
2
, mais disperso so os valores em torno de .
Como acontece com todas as variveis aleatrias continuas, as
probabilidades que envolvem variveis aleatrias normais so reas
sob funes densidade de probabilidade. Infelizmente, no fcil
calcular diretamente tais reas. Alternativamente, fazer uma
transformao em uma varivel aleatria normal padronizada.
Esta uma varivel com funo densidade normal de media zero (0) e
desvio padro igual a 1. Se X ~ N(,
2
) , ento,
Z= [X - ]/ ~ N(0,1)
Regras de calculo.
P[Xa] = p{ z [a - ]/ }
P[aXb]= P{[a - ]/ Z [a - ]/ }
Distribuio relacionadas com a distribuio normal
A distribuio qui-quadrado esta distribuio surge quando
elevamos ao quadrado variveis aleatrias normais padronizadas( V=
Z
2
1+....+ Z
2
m ~ X
2
(m) . Onde m so os graus de liberdade. Ele indica o
nmero de variveis aleatrias N(0,1) independentes que so elevadas
ao quadrado e somadas para forma V.
E(V)= E(X
2
(m))=m e var(V)=var(X
2
(m))= 2m
A distribuio t uma distribuio que obtida dividindo-se uma
varivel aleatria normal padronizada pela raiz quadrada de uma
varivel aleatria qui-quadrado dividida pelo seu grau de liberdade.
t= Z/(V/m)
1/2
~ t(m)
O formato de t determinada por m.
A distribuio F obtm-se pela diviso de duas variveis qui-
quadrado pelos seus respectivos graus de liberdade.
F= [V1/m1]/[V2/m2]
Diz-se tem m1 graus de liberdade no numerador e m2 no denominador.
Os valores de m1 e m2 definem a forma de F. Seu intervalo (0, ).
Bibliografia Bsica
BUSSAB, W. O e MORETTIN, P. A. Estatstica Bsica. 5
a
Edio. So
Paulo: Editora Saraiva, 2002.
KAZMEIR, L. J. Estatstica Aplicada Economia e Administrao. So
Paulo: McGraw Hill, 1982.
LEVINE, D. M. et all Estatstica: Teoria e Aplicaes. Rio de Janeiro:
Livros Tcnicos e Cientficos Editora S.A. LTC, 2000.
MILONE, G. e ANGELINI, F. Estatstica Aplicada. So Paulo: Editora
Atlas, 1995.
SILVER, M. Estatstica para Administrao. So Paulo: Atlas, 2000.