Sei sulla pagina 1di 12

1

Amostras Aleatrias e Distribuies Amostrais


Probabilidade e Estatstica: afinal, qual a diferena?
At agora o que fizemos foi desenvolver modelos probabilsticos que se adequavam a
situaes reais. Por exemplo, indicamos quando os modelos Binomial, Poisson,
Exponencial, Normal, Uniforme, etc ... eram adequados. Todos estes modelos referem-se
a distribuies de probabilidade que envolvem parmetros, que at agora foram
supostos conhecidos. Para que as probabilidades associadas a eventos sejam
calculadas necessrio conhecer o valor destes parmetros.
No estudo das probabilidades, o nosso objetivo calcular a probabilidade de eventos prespecificados. De agora em diante teremos um novo objetivo. A partir de uma amostra
de uma distribuio de probabilidade especificada pretendemos aprender alguma coisa
sobre os parmetros da distribuio, isto , estaremos interessados em estimar os
parmetros da distribuio de probabilidade.
Esta a grande diferena entre Probabilidade e Estatstica. No estudo de Probabilidade
estamos interessados em definir modelos que possam ser aplicados a situaes reais.
Estes modelos envolvem distribuies de probabilidade totalmente conhecidas, isto , no
apenas a forma da densidade, mas tambm os seus parmetros so conhecidos. No
estudo da Estatstica supe-se que o modelo probabilstico conhecido, isto , sabe-se
qual a distribuio de probabilidade que modela a situao real, mas os parmetros desta
distribuio so desconhecidos, e devem ser estimados a partir dos dados.
O nosso objetivo em Estatstica descobrir alguma coisa sobre os parmetros
desconhecidos de uma distribuio de probabilidade. Os mecanismos mais usuais para
"inferir" alguma coisa sobre estes parmetros so:
1) Estimao pontual - o objetivo "chutar" os valores do parmetro desconhecido.
2) Estimao por intervalos - o objetivo encontrar um intervalo que contenha o
parmetro de interesse com uma probabilidade especificada.
3) Testes de hipteses - o objetivo criar conjecturas sobre os valores possveis do
parmetro e verificar se estas conjecturas so muito ou pouco provveis (isto , testar as
hipteses).

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

Todos estes procedimentos so baseados na noo de amostra aleatria.


Definio (amostra, ou amostra aleatria)
Uma amostra aleatria um conjunto de variveis aleatrias independentes e
identicamente distribudas (iid).
Notao : a.a. = amostra aleatria
O que se faz na prtica?
Para ganhar informao sobre os parmetros desconhecidos de uma distribuio de
probabilidade usamos um conjunto de variveis aleatrias independentes e identicamente
distribudas. Isto equivale a repetir a experincia aleatria que est sendo descrita pelo
modelo em questo n vezes, em condies idnticas e de maneira independente. A partir
dos valores observados das variveis X1, X2, ...., Xn calcularemos funes que nos
permitiro aprender sobre os parmetros desconhecidos do modelo. Estas funes sero
chamadas de "estatsticas".
Definio (estatstica)
Seja X1, X2, ...., Xn uma a.a. de uma varivel aleatria X. Sejam x1, x2, ...., xn os
valores observados de X1, X2, ...., Xn .
Seja Y = h(X1, X2, ...., Xn ) uma funo apenas das variveis X1, X2, ...., Xn . Y
chamado de "estatstica".
Note que uma estatstica no funo de parmetros desconhecidos, ela s envolve as
variveis na amostra aleatria, ou seja, pode ser diretamente computada a partir dos
valores observados numa amostra.
Por definio, qualquer estatstica Y uma varivel aleatria, e tem uma distribuio de
probabilidade que depende da distribuio de X1, X2, ...., Xn .
O nosso problema ento encontrar estatsticas que sirvam como bons estimadores
pontuais de parmetros desconhecidos. Tambm importante definir critrios que nos
permitam dizer que uma estatstica "melhor" que outra para estimar um dado parmetro.

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

De uma maneira geral, as estatsticas devem conter "toda" a informao presente numa
amostra. Se no fosse assim, no valeria a pena calcular uma estatstica, a gente
simplesmente usaria uma nica observao da amostra. Este acrscimo de informao
representado pelo uso de uma estatstica (ao invs de uma nica observao) geralmente
se traduz por uma considervel reduo na varincia. Por exemplo, a varincia da mdia
amostral igual varincia de cada observao dividida pelo tamanho da amostra.
Quanto maior o tamanho da amostra, menor a varincia da mdia amostral, isto , mais
"precisa" a mdia amostral.
As estatsticas mais famosas
Sejam X1, X2, ...., Xn uma amostra aleatria de uma distribuio qualquer. As estatsticas
mais comuns, calculadas a partir desta amostra so:
1) Mdia amostral
1 n
X = Xi
n i =1
2) Varincia amostral
2
1 n
S2 =
Xi X )
(

n 1 i =1
3) Desvio padro amostral
2
1 n
2
S= S =
Xi X )
(

n 1 i =1
4) Mnimo da amostra
X(1) = min( X1 , X2 ,..., Xn )
5) Mximo da amostra
X( n ) = max ( X1 , X2 ,..., Xn )
6) Amplitude da amostra
A = X(n) - X(1)

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

7) k-sima estatstica de ordem


o k-simo elemento da amostra ordenada. Por exemplo, X(2) o segundo menor
elemento da amostra X1, X2, ...., Xn .
Um dos nossos objetivos aqui desenvolver as distribuies de estatsticas obtidas a
partir de uma amostra aleatria da distribuio Normal.
O prximo teorema refere-se mdia amostral de uma amostra aleatria da densidade
Normal.

Teorema
Sejam X1, X2, ...., Xn uma amostra aleatria da distribuio N(, 2). Seja X a mdia
amostral. Ento:
2
X N ,
n

A demonstrao do teorema trivial , e segue das propriedades da funo geradora de


momentos.
Este teorema pode ser generalizado para uma amostra aleatria de uma distribuio
qualquer.

Teorema
Sejam X1, X2, ...., Xn uma amostra aleatria de uma distribuio qualquer tal que E(Xi) =
e VAR(Xi) = 2. Seja X a mdia amostral. Ento:
1) E( X ) =
2) VAR( X ) = 2 / n
3) Se n grande, pelo teorema central do limite podemos concluir que:
( X )
n.

aproximadamente N(0,1).

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

Note que, neste caso, nada dito a respeito da distribuio de X. Apenas a sua mdia e
varincia so conhecidas, e so funes da mdia e varincia de cada Xi.
A princpio a distribuio de X poderia ser uma coisa estranha, que no tem nada a ver
com a distribuio original de cada Xi. No entanto, se o tamanho da amostra grande
podemos concluir que a distribuio de X , devidamente escalonada, aproximadamente
N(0,1).
O prximo teorema refere-se distribuio do mximo e do mnimo de uma amostra.
Teorema
Sejam X1, X2, ...., Xn uma amostra aleatria de uma distribuio contnua qualquer com
densidade f(.) e funo de distribuio F(.). Sejam X(1) e X(n) respectivamente, o mnimo
e o mximo da amostra. Ento as densidades de X(1) e X(n) so dadas por:
1) Densidade do mnimo
n 1
g1 ( x ) = n. f ( x ). (1 F( x ))
2) Densidade do mximo
n 1
gn ( x ) = n. f ( x ). ( F( x ))
Demonstrao
S faremos a demonstrao do segundo item (mximo da amostra). A demonstrao do
outro item semelhante.
Note que se X(n) o mximo da amostra, ento X(n) < k equivale a : todo Xi < k, para
qualquer nmero k. Logo, a funo de distribuio do mximo pode ser facilmente
encontrada, e dada por:

Gn ( k ) = Pr X( n ) k = Pr( X1 k, X2 k,...., Xn k )
Tambm, os Xi 's so independentes, e esta ltima probabilidade pode ser escrita como o
produto das probabilidades para cada Xi . Ento:
Gn ( k ) = Pr( X1 k, X2 k,...., Xn k ) = Pr( X1 k ). Pr( X2 k )... Pr( Xn k )

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

Como os Xi so identicamente distribudos, estas probabilidades so as mesmas para


todo Xi e correspondem funo de distribuio F(.) com argumento k.
Gn ( k ) = ( Pr( X1 k )) = ( F( k )) n
n

A densidade de X(n) encontrada derivando-se a funo de distribuio com relao ao


argumento k, e lembrando que a derivada de F(.) f(.), a densidade de cada Xi . Ento :

gn ( k ) =

dGn ( k )
dF( k )
= n. ( F( k )) n 1 .
= n. f ( k ). ( F( k )) n 1
dk
dk

Exemplo
Sejam X1, X2, ...., Xn uma amostra aleatria da densidade Exponencial com parmetro
. Encontre a densidade de X(1), o mnimo da amostra.
Soluo
A densidade de cada Xi :

f ( x ) = . e x
A funo de distribuio :
x

F( x ) = Pr( X x ) = . e t dt = 1 e x
0

A densidade do mnimo , pelo teorema anterior:

g1 ( y) = n. (1 F ( y))

( )

= n. . e y

n 1+1

n 1

. f ( y) = n. 1 1 + e y

) . (. e ) =
n 1

= n. . e n. . y

Ou seja, X(1) tem densidade Exponencial com parmetro n. .

Exemplo
A durao de um componente eletrnico uma varivel aleatria T com distribuio
Exponencial com parmetro = 0.001.
Testou-se 100 componentes e observou-se a durao de cada um deles, gerando uma
amostra aleatria T1, T2 , ....., T100 .
Calcule as seguintes probabilidades:
a) Pr ( 950 < T < 1100)
M. Barros Consultoria Ltda.
e-mail: barrosm@alumni.utexas.net
info@mbarros.com

b) Pr ( W > 7200) onde W = mx( T1, T2 , ....., T100)


c) Pr ( V < 10) onde V = mn( T1, T2 , ....., T100)
Soluo
a) Note que, se Ti ~ Expo( 0.001) para i =1 , 2, ..., 100 ento :
E(Ti) = 1/ 0.001 = 1000 e
VAR(Ti) = 1/(0.001)2 = 106
Assim:
E(T) = E(Ti) = 1000 e VAR(T) = VAR(Ti)/100 = 104
Pelo teorema central do limite:
Z=

T 1000
10 4

T 1000
100

tem aproximadamente a distribuio N(0,1) .


Assim:
950 1000 T 1000 1100 1000
Pr( 950 T 1100) = Pr

100
100
100
= Pr( 0.5 Z 1) = (1) ( 0.5) = 0.532

Onde estas ltimas probabilidades foram obtidas da tabela N(0,1).


b) Pr ( W > 7200) = Pr{ mx( T1, T2 , ....., T100) > 7200 } =
= 1 - Pr{ mx( T1, T2 , ....., T100) 7200 }
Mas, se W = mx( T1, T2 , ....., T100) 7200 ento todos os Ti so 7200.

Pr( W 7200) = Pr(T1 7200, T2 7200,...., T100 7200) =

= ( Pr(T1 7200))

100

= 1 e 0.001( 7200 )

100

= 1 e 7.2

100

= ( 0.99925)100 = 0.928

c) Pr ( V < 10) onde V = mn( T1, T2 , ....., T100)


Pr ( V < 10) = 1 - Pr( V 10) = 1- Pr(mn( T1, T2 , ....., T100) 10)
Mas, se mn( T1, T2 , ....., T100) 10 ento todos os Ti tambm so 10.
Logo, Pr( V < 10) = 1 - Pr(T1 10, T2 10, ...., T100 10) =

= 1 Pr( T1 10)

100

= 1 e 0.001(10 )

100

= 1 e 0.01

100

= 1 e 1 = 0.632

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

A distribuio Qui-Quadrado
Definio (densidade Qui-Quadrado com k graus de liberdade)
Seja X uma varivel aleatria contnua e positiva com densidade dada por:
k
1
1
f ( x) =
.x 2 .e x / 2 onde x > 0
k
2 k / 2.
2
Ento X tem densidade Qui-Quadrado com k graus de liberdade, e escrevemos : X ~ 2k
A densidade Qui-Quadrado com k graus de liberdade apenas um caso particular da
densidade Gama. Na verdade:
k2

= Gama( = k/2, = 1/2)

Densidades Qui-Quadrado com 2, 3, 4 e 8 Graus de Liberdade


0.50
0.45
0.40
0.35
0.30
0.25
0.20
0.15
0.10
0.05

Qui Quadrado(3)

Qui Quadrado(4)

00

8.

50

75

7.

7.

00

25

7.

75

7.

50

6.

6.

25

00

6.

6.

75

50

5.

5.

00

25

5.

5.

50

75

4.

25

4.

00

4.

4.

50

75

3.

25

3.

00

3.

3.

75

50

Qui Quadrado(2)

2.

2.

00

25

2.

2.

50

75

1.

25

1.

1.

75

00

1.

50

0.

0.

00

0.

0.

25

0.00

Qui Quadrado(8)

Teorema
Se X tem densidade Qui-Quadrado com k graus de liberdade ento sua mdia, varincia
e funo geradora de momentos so dadas por:

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

E(X) = k
VAR(X) = 2.k
1
M (t ) =
(1 2t ) r / 2
Demonstrao
Segue direto dos resultados correspondentes para a densidade Gama.
A densidade Qui-Quadrado tabelada. As tabelas desta densidade fornecem os pontos
tais que a probabilidade da varivel estar acima deles especificada. Uma pequena
poro de uma tabela da densidade Qui-Quadrado mostrada a seguir.
graus de

0.990

0.950

0.050

0.01

0.020

0.100

5.99

9.21

0.870

1.640

12.59

16.81

12

3.570

5.23

21.03

26.22

liberdade

Por exemplo:
Supondo que X seja uma varivel aleatria com densidade Qui-Quadrado com 6 graus de
liberdade, a probabilidade de X exceder 0.87 99%. Analogamente, a probabilidade de X
exceder 12.59 5% e a probabilidade de X estar acima de 16.81 apenas 1%.
Uma propriedade muito importante da densidade Qui-Quadrado a preservao da
mesma famlia de densidades quando somamos variveis independentes. Ou seja, se X1,
X2, ...., Xn so variveis independentes, cada uma com distribuio Qui-Quadrado, a
soma de X1, X2, ...., Xn tambm uma varivel aleatria Qui-Quadrado.
Teorema (aditividade da densidade Qui-Quadrado)
Sejam X1, X2, ...., Xn variveis aleatrias independentes, e suponha que Xi tem
densidade Qui-Quadrado com ki graus de liberdade. Seja Y = X1 + X2 + .... + Xn . Ento Y
tem tambm uma densidade Qui-Quadrado, mas com k = k1 + k2 + .... + kn graus de
liberdade.

O prximo teorema exibe a relao existente entre as densidades Normal padro e QuiQuadrado.
M. Barros Consultoria Ltda.
e-mail: barrosm@alumni.utexas.net
info@mbarros.com

10

Teorema
Seja Z ~ N(0,1) . Ento V = Z2 tem densidade Qui-Quadrado com 1 grau de liberdade.
Demonstrao
A demonstrao feita usando-se o mtodo da funo de distribuio, j que a funo V
= Z2 no injetora, o que nos impede de usar o mtodo do jacobiano :
G(v) = Pr( V v) = Pr( Z2 v) = Pr( - v Z +v ) = (+v ) - (-v )
onde (.) indica a funo de distribuio de uma varivel aleatria N(0,1).
Derivando esta expresso em relao a v resulta na densidade de V, que :
2

v 2

v 1 1/ 2 1
1

. 1 . v 1/ 2 =

g(v) =
.exp
. .v
.exp

2 2
2
2 2

( )

1
v
2
= . v 1/ 2 .
exp =
2
2
2

1 1/ 2 v / 2
v .e
2

Isto :

g(v) =

1
21/ 2

1
1
v 2 . ev/2

1
1
21/ 2
2

1
1
v 2 . ev/2

Substituindo k = 1 na definio da densidade Qui-Quadrado resulta na expresso acima,


o que prova o teorema.
A combinao dos 2 ltimos teoremas leva a um resultado importante.
Teorema
Sejam Z1, Z2, ....., Zn variveis aleatrias independentes e identicamente distribudas
com densidade N(0,1). Ento:
n

V = Zi2 = Z12 + Z22 +...+ Zn2


i =1

tem densidade Qui-Quadrado com n graus de liberdade.

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

11

Este resultado segue trivialmente dos dois ltimos teoremas, se lembrarmos que cada Zi2
tem densidade Qui-Quadrado com 1 grau de liberdade ( e so todos independentes).
Por que a densidade Qui-Quadrado importante?
Esta densidade est relacionada com a distribuio da varincia amostral obtida a
partir de uma amostra aleatria Normal, como indicado no prximo teorema.
Teorema
Sejam X1, X2, ...., Xn uma amostra aleatria da distribuio N(, 2). Seja S2 a varincia
amostral, dada por:
2
1 n
S =
Xi X )
(

n 1 i =1
2

Ento:
n

(n 1)S

( Xi X )
i =1

tem distribuio Qui-Quadrado com (n-1) graus de liberdade.


A partir deste teorema podemos deduzir facilmente a mdia e varincia de S2.

Teorema
Sejam X1, X2, ...., Xn uma amostra aleatria da distribuio N(, 2). Seja S2 a varincia
amostral. Ento :

E( S 2 ) = 2
VAR( S 2 ) =

2 4
n 1

Demonstrao
Pelo teorema anterior e sabendo a mdia e varincia de uma varivel aleatria QuiQuadrado temos:

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

12

( n 1) S 2
(n 1) 2
2
E
n
E
S
=

=
1
=2

2
(n 1)

( )

( )

2. ( n 1). 2
( n 1) S 2
2
VAR
= 2. ( n 1) VAR S =
2
( n 1) 2

( )

2. 4
n 1

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

Potrebbero piacerti anche