Sei sulla pagina 1di 48
Universidade Federal do Piauí Campus Universitário “Prof a . Cinobelina Elvas” – Bom Jesus, PI

Universidade Federal do Piauí Campus Universitário “Prof a . Cinobelina Elvas” – Bom Jesus, PI Profa. Gisele

V - VARIÁVEIS ALEATÓRIAS

1. INTRODUÇÃO

Ao descrever o espaço amostral de um experimento aleatório, o resultado individual não necessariamente é um número. Por exemplo: no lançamento de duas moedas consecutivas podemos obter: S = {cara-cara, cara-coroa, coroa-cara, coroa-coroa}. Contudo, em muitas situações experimentais, estaremos interessados na mensuração de alguma coisa e no seu registro como um número. Ou seja, desejamos atribuir um número real x a todo elemento a do espaço amostral S. Portanto, no caso do lançamento consecutivo de duas moedas, podemos transformar os resultados de S em números, atribuindo-se de acordo com a contagem do NÚMERO DE COROAS obtidas, ou seja, S ={0, 1, 2}, ou de acordo com o NÚMERO DE CARAS obtidas, ou seja, S ={2, 1, 0}. A este procedimento de obter uma função X, que associe aos elementos a pertencentes

a S um número real, X (a) , é denominada VARIÁVEL ALEATÓRIA.

2. CONCEITOS DE VARIÁVEL ALEATÓRIA Definição simplificada: Uma vez que os valores da variável estão relacionados a um

experimento aleatório ou probabilístico, VARIÁVEL ALEATÓRIA é toda variável cujos resultados estão associados a uma probabilidade.

cujos resultados estão associados a uma probabilidade. Experimentos aleatórios são aqueles que, repetidos em

Experimentos aleatórios são aqueles que, repetidos em idênticas condições, podem produzir resultados diferentes. Embora não se saiba qual o resultado que irá ocorrer num experimento, em geral, consegue-se descrever o conjunto de todos os resultados possíveis que podem ocorrer. As variações de resultados, de experimento para experimento, são devidas a uma multiplicidade de causas que não podemos controlar, as quais denominam acasoacaso.acasoacaso

Definição estatística: Seja E um experimento aleatório e S o espaço amostral

associado a este experimento. Uma função X, que associe a cada elemento a pertencente a S

um número real, X (a) , é denominada VARIÁVEL ALEATÓRIA. v.a.X a X (a) S
um número real, X (a) , é denominada VARIÁVEL ALEATÓRIA.
v.a.X
a
X (a)
S

R

Ex: Considere o experimento probabilístico ou aleatório: lançamento de duas moedas

consecutivas, logo:

S = {cara-cara; cara-coroa; coroa-cara; coroa-coroa}

Considere agora que X é a variável aleatória definida como o NÚMERO DE COROAS

obtidas, ou seja:

X = {0, 1, 2},

Portanto,

X (cara-cara) = 0 (NENHUMA COROA NO LANÇAMENTO DE DUAS MOEDAS) X (cara-coroa) = X
X
(cara-cara) = 0 (NENHUMA COROA NO LANÇAMENTO DE DUAS MOEDAS)
X
(cara-coroa) = X (coroa-cara) = 1 (UMA COROA NO LANÇAMENTO DE DUAS MOEDAS)
X
(coroa-coroa) = 2 (DUAS COROA NO LANÇAMENTO DE DUAS MOEDAS)
Cara-cara
0
Cara-coroa
1
Coroa-cara
Coroa-coroa
2
R
S

Em que,

S = espaço amostral original correspondente a todos os possíveis resultados do experimento

(numérico ou não);

R = novo espaço amostral associado à variável aleatória X, representando todos os valores

numéricos de interesse (todos os valores possíveis e definidos de X (a) de a em S).

Observações:

a) Apesar da terminologia “variável aleatória”, ela é uma função cujo domínio é o conjunto S e o contradomínio é o conjunto R;

b) O uso de variáveis aleatórias equivale a descrever os resultados de um experimento aleatório por meio de números ao invés de palavras, o que apresenta a vantagem de possibilitar melhor tratamento estatístico;

c) Nem toda função é uma variável aleatória, pois uma vez que ao mesmo s forem atribuídos diferentes X (a) , a relação não poderá se caracterizar uma relação funcional ou função.

Lembrete: Uma quantidade é uma função de outra quando, para cada quantidade da variável independente (x), corresponde a um único valor denominado f(x) (variável dependente). O conjunto em que os valores de x podem ser tomados é chamado de domínio da função, e o conjunto dos valores que f assume para cada x é denominado imagem da função.

As variáveis aleatórias serão sempre representadas por letras maiúsculas (X, Y, Z, W, etc.). As realizações (ou variações) dessas variáveis em um dado elemento da população serão sempre representadas por letras minúsculas (x, y, z, w, etc.). Quando o resultado do experimento probabilístico for registrado como um único número x ter-se-á uma VARIÁVEL ALEATÓRIA UNIDIMENSIONAL, que poderá ser discreta ou contínua. Porém, quando para um determinado experimento, cada resultado é proveniente da avaliação simultânea de dois caracteres, como por exemplo, estudar a estatura X e o peso Y, de alguma pessoa escolhida ao acaso, o resultado será (x,y), e ter-se-á uma VARIÁVEL ALEATÓRIA BIDIMENSIONAL. Nota-se, nesse caso, que cada resultado é identificado por cada um dos valores que as variáveis aleatórias unidimensionais assumem.

X (a) v.a.X a S v.a.Y Y (a)
X (a)
v.a.X
a
S v.a.Y
Y (a)

3. VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS 3.1. Variável Aleatória Discreta

3.1.1. Definição: Seja X uma variável aleatória (v.a.). Se o número de valores possíveis de

X (a) (isto é o seu contradomínio) for finito ou infinito enumerável, denominaremos X de

variável aleatória discreta, assim, os valores possíveis de X são x 1 , x 2 ,

lista de valores de x acaba e no caso infinito enumerável, a lista continua indefinidamente.

n. No caso finito a

,x

Em geral uma variável aleatória é obtida mediante alguma forma de contagem.

3.1.2. Função de probabilidade (f.p.)

Utilizando o conceito de função em que uma quantidade é uma função de outra quando, para cada quantidade da variável independente (x), corresponde a um único valor denominado f(x) (variável dependente), chama-se FUNÇÃO DE PROBABILIDADE (f.p.) da variável aleatória discreta X, a função:

F(x) = P (X = x i ) = P (x i ) Pois a cada valor de x i associa-se sua probabilidade de ocorrência.

A função P (x i ) será uma f. p. se satisfizer às seguintes condições:

* P(x i ) 0, para todo x i, e,

*

P(x )

i

=

1

=

P(S)

OBS.: Mesmo que a variável assuma um número infinito enumerável de valores não há nenhum problema em comprovar que cada x i contribui com uma quantidade f(x i ) ao total, de modo que,

i

= 1

f

(

x

i

)

=

i =

1

p

(

x

i

)

=

i =

1

P

(

X

=

x

i

)

=

1

À coleção de

pares [x i , P(x i )], i

1,

2,

n, denominamos DISTRIBUIÇÃO DE

=

, PROBABILIDADE da v. a. d. X, que pode ser representada por meio de tabelas e gráficos.

3.1.2.1. Representação tabular da DISTRIBUIÇÃO DE PROBABILIDADE de variável aleatória discreta É dada por:

x

i

x 1

x 2

x n

P(X=x i )

P(x 1 )

P(x 2 )

P(x n )

1,0

3.1.2.1. Representação gráfica da DISTRIBUIÇÃO DE PROBABILIDADE de variável aleatória discreta É obtida alocando-se no eixo das abscissas os valores de x e no eixo das coordenadas os valores de suas respectivas probabilidades. Uma linha horizontal é feita em cada valor de x na altura de sua respectiva probabilidade.

Exemplo 1:

Considere o experimento probabilístico ou aleatório: lançamento de duas moedas

consecutivas, logo:

S = {cara-cara; cara-coroa; coroa-cara; coroa-coroa}

Considere agora que X é a variável aleatória definida como o NÚMERO DE COROAS

obtidas, ou seja:

X = {0, 1, 2},

Portanto,

X (cara-cara) = 0, X (cara-coroa) = X (coroa-cara) = 1, X (coroa-coroa) = 2. Cujas probabilidades de ocorrência

são: P (0) = 1/4, P (1) = 2/4 e P (2) = 1/4. Logo, a representação tabular da DISTRIBUIÇÃO DE PROBABILIDADE de X é:

x

i

0

1

2

P(X=x i )

1/4

2/4

1/4

1,0

Em que,

k

P (x i ) 0 e

i = 1

P X

[

=

x

i

]

=

1

Nota-se que para uma variável aleatória discreta as probabilidades de cada valor x correspondem à própria função, por isso esta é chamada de FUNÇÃO DE PROBABILIDADE.

E a representação gráfica da DISTRIBUIÇÃO DE PROBABILIDADE de X é:

2/4

1/4

0

1

2

x

Exemplo 2:

Tem-se 5 animais: 2 animais de uma raça bovina A (A 1 e A 2 ) e 3 animais de uma raça bovina B (B 1 , B 2 e B 3 ). Deseja-se obter uma amostra de 2 animais da raça A, escolhidos ao acaso dentre os 5 animais.

a) Obter o espaço amostral desse experimento aleatório

S: {A 1 A 2 , A 1 B 1 , A 1 B 2 , A 1 B 3 , A 2 B 1 , A 2 B 2 , A 2 B 3 , B 1 B 2 , B 1 B 3 , B 2 B 3 }

b) Obter a variável aleatória X “número de animais da raça A” na amostra.

{B 1 B 2 , B 1 B 3 , B 2 B 3 }, ou seja, nenhum animal da raça A. {A 1 B 1 , A 1 B 2 , A 1 B 3 , A 2 B 1 , A 2 B 2 , A 2 B 3 }, ou seja, um animal da raça A. {A 1 A 2 }, ou seja, dois animais da raça A. No entanto, na estatística, é mais fácil utilizar valores numéricos do que trabalhar diretamente com elementos de um espaço como o anterior. Assim, se X se for a variável aleatória NÚMERO DE ANIMAIS DA RAÇA A, os valores assumidos por X são x = 0, 1, 2. Como essa associação de números aos pontos do espaço amostral, define-se uma função sobre cada elemento desse espaço. Essas funções sobre os elementos do espaço são as variáveis aleatórias. No caso, tem-se uma variável aleatória discreta, em que se atribui um único número real a cada elemento do espaço amostral S.

c) Obter a tabela da DISTRIBUIÇÃO DE PROBABILIDADE de X.

Seja a v. a d. X o NÚMERO DE ANIMAIS DA RAÇA A, a representação tabular da função de probabilidade da variável número de animais da raça A é dada por:

x

i

0

1

2

P(X=x i )

3

6

1

1,0

10

10

10

Em que,

k

P (x i ) 0 e

i = 1

[

P X

=

x

i

]

=

1

d) Obter o gráfico da DISTRIBUIÇÃO DE PROBABILIDADE de X.

A representação gráfica da função de probabilidade da variável número de animais da

raça A é dada por:

6/10

3/10

1/10

0

1

2

x

Figura 1. Função de probabilidade da variável NÚMERO DE

ANIMAIS DA RAÇA A.

3.1.3. Variável aleatória discreta uniformemente distribuída

Este é o caso mais simples de variável aleatória discreta, em que cada possível valor

ocorre com a mesma probabilidade.

Definição: A variável aleatória discreta X, assumindo os valores x 1 , x 2 ,

uniforme, se e se somente se:

, x n , tem distribuição

f(x) = P (X = x i ) = P (x i ) = p =

1 n , para todo i = 1, 2, …, n

Exemplo:

Considere o experimento aleatório o lançamento de um dado não-viciado.

S = {1, 2, 3, 4, 5, 6}

Considere a variável aleatória discreta X dada pelo NÚMERO DE PONTOS OBTIDOS.

Essa variável assume obviamente os valores de 1 a 6, e a cada valor é possível associar um

único número real, ou seja, um valor de probabilidade, que no caso, para todos é igual a 1/6.

Portanto, a representação tabular da função de probabilidade F(x) = P (X = x i ) = P (x i ), ou seja, a DISTRIBUIÇÃO DE PROBABILIDADE de X:

x

i

1

2

3

4

5

6

P(X=x i )

1/6

1/6

1/6

1/6

1/6

1/6

1,0

3.1.3.1. Representação gráfica da DISTRIBUIÇÃO DE PROBABILIDADE de X.

1/6

gráfica da DISTRIBUIÇÃO DE PROBABILIDADE de X. 1/6 1 2 3 4 5 6 Figura 1.
gráfica da DISTRIBUIÇÃO DE PROBABILIDADE de X. 1/6 1 2 3 4 5 6 Figura 1.

1

2

3

4

5

6

Figura 1. Função de probabilidade da variável NÚMERO DE PONTOS OBTIDOS no lançamento de um dado.

3.2. Variável aleatória contínua 3.2.1. Definição:

Seja X uma variável aleatória (v.a.). Se o número de valores possíveis de X (a) (isto é o seu contradomínio) for infinito não-enumerável como, por exemplo, um intervalo, X será denominada de variável aleatória contínua. Consideremos por exemplo o experimento que consiste em selecionar, ao acaso, um fruto de tomate de uma área de produção e determinar o valor do peso do fruto em gramas. Nesse caso, dentro de um determinado grau de precisão decorrente da limitação do equipamento de mensuração, a variável aleatória X = PESO DO FRUTO pode assumir um valor qualquer em um determinado intervalo da reta real, sendo, portanto, uma variável aleatória contínua. Como uma variável aleatória contínua pode assumir uma infinidade de valores em um intervalo real, ou seja, o conjunto de valores que a variável pode assumir é infinito não- enumerável, a cada um dos infinitos valores da reta real é atribuída probabilidade nula. Portanto, não faz sentido fazer uma soma das probabilidades de cada um dos valores como no

caso das variáveis aleatórias discretas, mas sim fazer a soma das probabilidades dos valores

em intervalos da reta real. Nesse caso, o que generaliza o conceito de é o de integral ( ),

ou seja, calcular a integral significa “integrar” ou somar os valores da função.

3.2.2. Função de densidade probabilidade (f.d.p.) Como para variável aleatória contínua a probabilidade de cada um dos infinitos valores na reta real é igual a zero, não se tem uma função de probabilidade F(x) = P (X = x i ) = P (x i ) como para variável aleatória discreta. Nesse caso, as probabilidades de ocorrência de cada um dos possíveis resultados do experimento aleatório são determinadas por uma função contínua f(x) denominada FUNÇÃO DENSIDADE PROBABILIDADE (f.d.p.), que satisfaça as seguintes condições:

a) f (x) 0 para todo x

As probabilidades não podem ser negativas.

b)

+∞

f ( x )dx = 1

−∞

A probabilidade do espaço amostral é 1, isto é, a probabilidade de ocorrência dos resultados dentro do intervalo é sempre 100% possível.

b

c) P(a X b) =

a

f ( x )dx

A probabilidade de que a variável aleatória assuma valores em um intervalo é a área sob a curva da função densidade probabilidade no intervalo entre a e b. É importante ressaltar que, no cálculo da probabilidade de um intervalo, este pode ser fechado ou aberto, pois a inclusão ou não dos extremos a e b do intervalo não altera o valor desse cálculo, visto que a probabilidade de um ponto é nula.

cálculo, visto que a probabilidade de um ponto é nula. IMPORTANTE: A f(x) de uma v.

IMPORTANTE: A f(x) de uma v. a c., função de densidade probabilidade, não é probabilidade. Somente quando a função for integrada entre dois limites, ela produzirá uma probabilidade, que será a área sob a curva da função X = a e X = b, a < b, ou seja, a probabilidade de x em intervalo entre a e b da reta real.

Exemplo 1: Seja X a variável diâmetro (em mm) de frutos de mamão colhidos no estado inicial, cuja função de x [f(x)] é dada por:

f(x) =

kx,

se

10 x 20

0, outros valores de x.

Dada a função desta variável, calcule k de modo que f (x) seja uma f.d.p.

Resposta:

Para isto, a f (x) deve atender as duas condições f (x) 0 para todo x

Assim,

+∞

−∞

f (x)dx = 1

20

∫ ( kx dx = ) 1 10 20 2 x k .( ) =
∫ (
kx dx =
)
1
10
20
2
x
k .(
)
= 1
2
10
2
k
.
1 (20
2
10

2

) =

1

150

+∞

e

f ( x )dx = 1.

−∞

Logo, k = 1/150 também atende a primeira condição de f (x) 0 x .

Portanto qualquer fruto com diâmetro entre 10 e 20 terá a mesma probabilidade de

ocorrência, ou seja, será igual a 1 ou 100%, e fora desse intervalo a probabilidade será sempre

igual a zero. Porém, se desejarmos saber a probabilidade de encontrarmos um fruto com

diâmetro entre 10 e 12, a forma de obtenção da mesma será pela resolução da integral

considerando esse intervalo, qual seja:

P

(10

x

12)

=

P

(10

x

12)

=

P

(10

x

12)

=

12 1 ∫ ( x dx ) = 150 10 12 2 1 x .(
12
1
∫ (
x dx
)
=
150
10
12
2
1
x
.(
)
150
2
10
1
2
(12
10
300

?

2

)

=

0,15 ou 15%

Exemplo 2: Considerando que a demanda diária, em quilogramas, de determinado produto

em um supermercado é uma variável aleatória, dada pela seguinte função densidade

probabilidade (f. d. p.):

f(x) =

a) Determinar o valor de k.

Para isto,

a

f

(x) ser f.d.p

deve

+∞

f ( x )dx = 1.

−∞

Assim, +∞ ∫ f (x)dx = 1 −∞ 1/ 2 1 ∫ ( kx dx
Assim,
+∞
f (x)dx = 1
−∞
1/ 2
1
(
kx dx
)
+
[
k
(1
x
)]
dx
=
1
0
1/ 2
1/ 2
1
1
2
2
x
x
x
k .(
)
+
k .(
)
k .(
)
= 1
2
1
2
1/ 2
0
1/ 2
2
2
2
2
k
.
1 [(1/ 2)
2
0
)]
+ k
.[(1)
(1/ 2)
]

k

k = 4

Logo, k = 4

Portanto,

f(x) =

kx,

se

0 x 1/2

k(1 - x),

se 1/2 x 1

0, outros valores de x.

atender as duas condições

1

.

2

[(1)

2

(1/ 2)

2

]

=

1

4x,

se

0 x 1/2

4(1 - x),

se 1/2 x 1

0, outros valores de x.

f (x) 0 para todo x

e

b) Calcular a probabilidade de que a demanda diária do produto esteja entre 250 e 750g.

Sabe-se que para a demanda diária entre 0 e 500 g (ou 0 e 1/2) a função é 4x, e que

para a demanda entre 500g e 1000g (ou 1/2 e 1) a função é 4(x – 1). Logo, para saber a

demanda diária entre 250 e 750 deve-se integrar e somar nos intervalos de 250 a 500g (ou 1/4

e 1/2) e de 500 a 750g (ou 1/2 e 3/4). Ou seja:

750

1/ 2

3/ 4

∫ ∫

f (x)dx

=

f (x)dx

250

1/ 4

750

f

250

(

x dx

)

750

f x dx

(

)

250

750

f x dx

(

)

=

=

=

1/ 2

(4

1/ 4

1/ 2

(4

1/ 4

1/ 2

(4

x dx

)

x dx

)

x dx

)

+

+

+

+

f (x)dx

1/ 2

3/ 4

[4(1

1/ 2

3/ 4

(4

1/ 2

x

dx

)]

4

x dx

)

3/ 4

(4)

dx

3/ 4

(4

x dx

)

250 1/ 4 1/ 2 1/ 2 750 2 x x ∫ f ( x
250
1/ 4
1/ 2
1/ 2
750
2
x
x
f
(
x
)
dx =
4.(
)
+ 4.(
)
2
1
250
1/ 4
750
4
2
f
(
x
)
dx =
.[(1/ 2)
+
(1/ 4)
2
250
750
f
(
x
)
dx
=
0,75
ou 75%

3/ 4

1/ 2

2

]

1/ 2

3/ 4 2 x − 4.( ) 2 1/ 2 + 4.(3 / 4 −
3/ 4
2
x
− 4.(
)
2
1/ 2
+
4.(3 / 4
1/ 2)

250

4

2

.[(3 / 4)

2

(1/ 2)

2

]

Logo, a probabilidade de que a demanda diária do produto esteja entre 250 e 750 é 75%.

3.2.3. Variável aleatória contínua uniformemente distribuída

É o caso mais simples de variável aleatória contínua.

Definição: A v.a. contínua tem distribuição uniforme no intervalo [a,b], sendo a e b finitos, se

a sua função densidade de probabilidade (f. d. p.) for dada por:

f

(

x

) =

  , para a

1

b

a

x

b

  0, para outros valores de x

4. VARIÁVEIS ALEATÓRIAS BIDIMENSIONAIS

Seja E um experimento aleatório e S um espaço amostral associado a E. Seja X uma

variável aleatória e Y outra variável aleatória e X (a) e Y (a) são duas funções, cada uma

associando um número real a cada resultado de a S, então determinaremos (X,Y) uma

variável aleatória bidimensional. Na prática, significa que para um determinado experimento

aleatório, cada resultado é proveniente da avaliação simultânea de duas variáveis.

Do mesmo modo que no caso unidimensional (X,Y) deve ter associada a cada valor

que pode assumir uma probabilidade de sua ocorrência. Assim, são definidas as funções e

distribuições de probabilidades da v.a. bidimensional (X,Y). Para o nosso estudo

consideraremos que X e Y são ambas discretas ou ambas contínuas.

4.1. Quando (X,Y) é variável aleatória discreta bidimensional

Se os valores possíveis da variável (X,Y) forem finitos ou infinitos enumeráveis, esta

será uma v.a. discreta bidimensional. Assim, os valores possíveis de (X,Y) podem ser

representados por (x i , y j )

i = 1, 2,

,

n

j = 1, 2,

, m

4.1.1. Função de probabilidade conjunta de X e Y

É dada por:

P

(

X = x

i

,

Y = y

j

)

= P

(

x

i

,

y

j

)

Em que a cada valor de (x i , y i ) associa-se a sua probabilidade de ocorrência.

Para que P(x i , y i ) seja uma função de probabilidade conjunta é necessário que satisfaça

às seguintes condições:

i) P(x i , y i ) 0, (x i ,y j )

m n

ii) ∑∑ P ( x , y ) = 1 ,0 i j j =
ii) ∑∑
P
(
x
,
y
)
= 1
,0
i
j
j =
1
i =
1
4.1.2.
Distribuição de probabilidade conjunta de X e Y
É
o conjunto {(xi,y j ), P(x i ,y j )} ∀ i = 1, 2,
,
n
j = 1, 2,
,
m
Y
Total
X
y 1
y 2
K
y m
m
P(X = x 1 ) = P(x 1 ) = ∑
P
(
x
y
)
x
P(x 1 , y 1 )
P(x 1 , y 2 )
K
P(x 1 , y m )
1 ,
j
1
j
= 1
m
P(X = x 2 ) = P(x 2 ) = ∑
P
(
x
y
)
X
P(x 2 , y 1 )
P(x 2 , y 2 )
K
P(x 2 , y m )
2 ,
j
2
j
= 1
M
M
M
M
M
M
m
P(X = x n ) = P(x n ) = ∑
P
(
x
,
y
)
x
P(x n , y 1 )
P(x n , y 2 )
K
P(x n , y m )
n
j
n
j
= 1
P(Y = y 1 ) =
P(y 1 )
P(Y = y 2 ) =
P(y 2 )
P(Y = y m ) =
P(y m )
1,0
Total
K
n
n
n
= ∑
P
(
x
,
y
)
= ∑
P
(
x
,
y
)
= ∑
P
(
x
,
y
)
i
1
i
2
i
m
i = 1
i = 1
i = 1

A partir da distribuição conjunta das duas variáveis aleatórias X e Y podemos determinar a distribuição de X sem considerar Y e a de Y sem considerar X. São as chamadas DISTRIBUIÇÕES MARGINAIS. A distribuição marginal é constituída pelos valores da variável aleatória e suas respectivas probabilidades marginais. A probabilidade marginal para cada valor é obtida da seguinte forma:

m

Para X:

P(X = x i ) = P (x i ) =

P

(

j

= 1

 

n

Para Y:

P(Y = y i ) = P (y i ) =

P

(

i = 1

x

x

i

i

,

,

y

y

j

j

)

)

Ou seja, a marginal de X é a função de probabilidade da v.a. X sem considerar a v.a.Y, e a marginal de Y é a função de probabilidade da v. a.X sem considerar a v.a.X.

Com as probabilidades marginais para cada valor, podemos construir a distribuição marginal para a variável aleatória:

Para X:

Para Y:

x i

x 1

x 2

x n

P(X=x i )

P(x 1 )

P(x 2 )

P(x n )

y i

y 1

y 2

y m

P(Y=y i )

P(y 1 )

P(y 2 )

P(y m )

Exemplo:

Seja a variável discreta bidimensional (X, Y), cuja distribuição de probabilidade conjunta é dada pela tabela:

X

 

Y

-3

0

1

-2

1/9

0

2/9

0

0

2/9

2/9

1

1/9

1/9

0

a) Obter as probabilidades marginais de X e Y.

m

Para X:

n

1

P

(

x

P(X = x i ) = P (x i ) =

P

(

x

i

,

y

j

)

 

j = 1

i

,

y

j

) = 3/9 + 4/9 + 2/9 = 1,0

 
 

x i

-2

 

0

1

 

P(X = x i )

3/9

 

4/9

2/9

1,0

 

n

P(Y = y i ) = P (y i ) =

P

(

x

i

,

y

j

)

 

i =

1

i

,

y

j

) = 2/9 + 3/9 + 4/9 = 1,0

 
 

y i

-2

 

0

1

 

P(Y = y i )

2/9

 

3/9

4/9

1,0

P(X = -2) = P (-2) = 1/9 + 0 + 2/9 = 3/9

P(X = 0) = P (0) = 0 + 2/9 + 2/9 = 4/9

P(X = 1) = P (1) = 1/9 + 1/9 + 0 = 2/9

m

Logo, P x

j = 1

Ou seja,

Para Y:

P(Y = -3) = P (-3) = 1/9 + 0 + 1/9 = 2/9

P(Y = 0) = P (0) = 0 + 2/9 + 1/9 = 3/9

P(Y = 1) = P (1) = 2/9 + 2/9 + 0 = 4/9

Logo,

i =

(

Ou seja,

4.2. Quando (X,Y) é variável aleatória contínua bidimensional

Se a variável (X,Y) puder assumir todos os valores em algum conjunto infinito não- enumerável, esta será uma v.a. contínua bidimensional.

4.2.1. Função de densidade probabilidade conjunta de X e Y

Seja (X,Y) uma v.a.c. bidimensional. Diz-se que f(x,y) é uma função de densidade probabilidade conjunta de X e Y, se satisfazer as seguintes condições.

i) f(x,y) 0, todo (x,y)

m n

ii)

=

j =

1

i

1

f

(

x

,

y dx dy =

.

)

1

Em que, f(x,y) = 0 para (x,y) aos intervalos de x e y.

4.2.2. Distribuição de probabilidade conjunta de X e Y

A partir da distribuição conjunta das duas variáveis aleatórias X e Y podemos

determinar a distribuição de X sem considerar Y e a de Y sem considerar X. São as chamadas

DISTRIBUIÇÕES MARGINAIS. Porém, para (X,Y) variável aleatória contínua, as funções

de densidade probabilidade marginais de X e Y são dadas por:

+∞

f

(x) =

f

( y) =

f (x, y)dy

−∞

+∞

f (x, y)dx

−∞

Exemplo:

Sejam X e Y variáveis aleatórias contínuas com f.d.p. conjunta dada por:

f(x,y) =

a) Calcular o valor de k

∫∫ 5

6

2

0

∫∫ 5

6

2

0

∫∫ 5

6

2

0

∫∫ 5

6

2

0

f

(

x

,

y ) dxdy =

1,0

k

k

k

(2

(2

(2

x

+

y ) dxdy

=

x ) dxdy

x ) dxdy

+

+

∫∫ 5

6

2

0

∫∫ 5

6

2

0

1,0

(

(

ky ) dxdy

ky ) dxdy

k (2x +y),

0, para outros valores de x e y

se 2 x 6

=

=

1,0

1,0

0 y 5

6 6 2 1 x x ∫ 5 2 k .( ) dy + ∫
6
6
2
1
x
x
∫ 5
2
k
.(
)
dy
+
∫ 5
ky .(
)
dy = 1,0
0
2
2
1
2
2
2
2
∫ 5
k .(6
− 2
)
dy
+
∫ 5
ky .(6
2)
dy = 1,0
0
2
5
0 32k.dy
+
∫ 5
4ky.dy
=
1,0
2
5
5
1
2
y
y
32
k
(
)
+ 4
k
(
)
= 1,0
1
2
0
0
2
2
32
k
(5
0)
+
2
k
(5
0
)
=
1,0

160k + 50 = 1,0

210k = 1,0

k =

1

210

b) Obter as funções marginais de X e Y Função marginal de X: 1 f
b) Obter as funções marginais de X e Y
Função marginal de X:
1
f
(
x
) =
∫ 5
(2
x
+
y dy
)
0
210
5 2
x
y
f
(
x
) =
dy +
∫ 5
dy
0 210
0
210
5
2
2 x
1
y
5
f
(
x
) =
y
.
0 +
210
210
2
0
x
1
(5
2
0)
f
(
x
)
=
(5
0)
+
105
420
x
5
f
(
x
) =
+
21
84
4
x
+ 5
f
(
x
)
=
84

Função marginal de Y:

f

f

(

(

y

x

) =

) =

6

1

2

6

210

2 x

2 210

dx

(2

x

+

+

y dx

)

6

2

y

dx

210

f

f

f

f

f

f

f

(

(

(

(

(

(

(

y

y

y

y

y

y

y

) =

)

)

)

)

)

)

=

=

=

=

=

=

f f ( ( ( ( ( ( ( y y y y y y y

6

2

( ( ( ( ( ( ( y y y y y y y ) =

6

2

+

+

( ( ( y y y y y y y ) = ) ) ) )

6

2

( y y y y y y y ) = ) ) ) ) ) )

6

2

1

210

1

210

208

210

16

105

16

+

(6

3

2

(216

+

+

4 y

210

2 y

105

2 y

3

)

8)

105

+

+

y

210

y

210

(6 2)

4

5. MEDIDAS DE POSIÇÃO E DISPERSÃO DE VARIÁVEIS ALEATÓRIAS 5.1. Medidas de posição 5.1.1. Esperança matemática (média ou valor esperado de uma v. a.) - E(X)

A ESPERANÇA MATEMÁTICA é a média ou valor esperado de uma variável aleatória. A esperança matemática de uma distribuição é também denominada uma medida de tendência central. Do ponto de vista científico, a esperança matemática corresponde ao que se espera que aconteça em média.

Se X for uma variável aleatória discreta Definição. Dado uma v.a. X discreta, assumindo os valores x 1 , x 2 , médio ou esperança matemática de X o valor:

n

E(X) =

i 1

x

i

.

P

(

X

=

x

i

)

,x

n , chamamos valor

Exemplo:

Considerando o experimento probabilístico ou aleatório: lançamento de duas moedas consecutivas, em que X é a variável aleatória definida como o NÚMERO DE COROAS obtidas, ou seja: X = {0, 1, 2}, cujas probabilidades de ocorrência são: P (0) = 1/4, P (1) = 2/4

e P (2) = 1/4.

n

E(X) =

i 1

x

i

.

P

(

X

=

x

i

) =

0.

1

4

+

1.

2

4

+

2

1

4

=

1,0

Interpretação: Se esse experimento aleatório constituído pelo lançamento de duas moedas for realizado n vezes, espera-se, em média, obter 1,0 coroa.

Se X for uma variável aleatória contínua Definição. Dado uma v. a. X contínua, assumindo os valores x 1 , x 2 , médio ou esperança matemática de X o valor:

+∞

E(X)=

−∞

x. f (x)dx

,x

n , chamamos valor

Exemplo: Seja X a variável diâmetro (em mm) de frutos de mamão colhidos no estado inicial, cuja função de x [f(x)] é dada por:

20 1 E ( X ) = ∫ x ( x)dx 150 10 20 3
20
1
E
(
X
)
=
∫ x
(
x)dx
150
10
20
3
1
x
E
(
X
)
=
.(
)
150
3
10
1 1
3
E
(
X
)
=
.
(20
150
3

f(x) =

1

150

x,

se

10 x 20

0, outros valores de x.

10

3

)

=

15,56mm

Interpretação: Se esse experimento aleatório constituído pela colheita ao acaso de fruto de mamão for realizado n vezes, espera-se, em média, obter fruto de 15,56 mm de diâmetro.

As propriedades da Esperança Matemática são:

1º) E (K) = K, sendo K uma constante. 2º) E (X + K) = E (X) + K 3º) E (K.X) = K. E (X) 4º) E (X + Y) = E (X) + E (Y) 5º) E (XY) = E(X).E (Y), se X e Y são independentes (Cov (X,Y) = 0)

3.2. Medidas de dispersão

3.2.1. Variância - V(X) ou

Definição. A variância quantifica a dispersão dos dados em torno da média. É dada por:

σ

2

V(X) = E[X - µ X ] 2

V(X) = E[X 2 – 2.X.µ X + µ X 2 ]

V(X) = E(X 2 ) – 2.E(X.µ X ) + E(µ X 2 )

V(X) = E(X 2 ) – 2. µ X .E(X) + µ X V(X) = E(X 2 ) – 2. E(X).E(X) + [E(X)] 2 V (X) = E(X 2 ) – 2.[E(X)] 2 +[E(X)] 2 V (X) = E(X 2 ) – [E(X)] 2

2

A obtenção da variância depende se X é variável aleatória discreta ou contínua.

Se X for uma variável aleatória discreta Definição. A variância de uma variável aleatória discreta quantifica a dispersão dos dados em torno da média esperada. É definida por:

V (X) = E(X 2 ) – [E(X)] 2

Em que,

E

(

X

2

)

=

n

=

i

n

x

2

i

.

P

(

x

i

)

Exemplo:

Considerando o experimento probabilístico ou aleatório: lançamento de duas moedas consecutivas, em que X é a variável aleatória definida como o NÚMERO DE COROAS obtidas, ou seja: X = {0, 1, 2}, cujas probabilidades de ocorrência são: P (0) = 1/4, P (1) = 2/4 e P (2) = 1/4.

n

E(X) =

i

1

x

i

.

P

(

X

=

x

i

) = 1,0 e

E

(

X

2

)

=

n

=

i

n

x

2

i

.

P

(

x

i

)

=

2

0 .1

1

4

+

1

2

.

2

4

+

2

2

1

4

V (X) = E(X 2 ) – [E(X)] 2

=

V (X) =1,5 – 1,0 2 V(X) = 0,5

Se X for uma variável aleatória contínua Definição. A variância de uma variável aleatória contínua quantifica a dispersão dos dados em torno da média esperada. É definida por:

V (X) = E(X 2 ) – [E(X)] 2

Em que E( X

2

)

=

−∞

2

x . f (x)dx

Exemplo: Seja X a variável diâmetro (em mm) de frutos de mamão colhidos no estado

inicial, cuja função de x [f(x)] é dada por:

1

150

x,

se

10 x 20

f(x) =

0, outros valores de x.

20 1 2 V ( X ) = ∫ x 2 ( x dx )
20
1
2
V
( X
) =
∫ x
2 (
x dx
)
[15,56]
150
10
20
1
2
2
V
(
X
) =
x
(
x dx
)
[15,56]
150
10
20
4
1
x
V (
X
)
=
.(
)
- [242,1136]
150
4
10
1 1
4
4
V (
X
) =
.
(20 −10 ) - [242,1136] =
150 4
As propriedades da Variância são:

7,8864 mm 2

1º) V (K) = 0, sendo k uma constante.

2º) V (X + K) = V (X) + V(K) = V(X)

3º) V (K.X) = K 2 . V (X)

4º) V (XY) = V(X).V (Y)

5º) V (X + Y) = V (X) + V (Y) + 2Cov (X, Y), se X e Y são dependentes (Cov (X,Y) 0)

6º) V (X + Y) = V (X) + V (Y), se X e Y são independentes (Cov (X,Y) = 0)

4.2.2. Desvio padrão -σ

O desvio padrão de X, DP(X), é definido como a raiz quadrada positiva da variância. É

mais usada como medida de dispersão que a variância por estar na mesma unidade dos dados.

4.2.3. Covariância - Cov (X,Y)

É uma medida de associação entre variáveis aleatórias. É necessário que se tenha pelo

menos duas variáveis para que se obtenha a covariância.

A covariância entre duas v. a. X e Y é o produto dos desvios das variáveis (medida de discrepância), qual seja:

Cov (X,Y) = E[(X - µ X ).(Y - µ Y )]

Desenvolvendo a expressão acima, temos:

Cov (X, Y) = E [(XY – X. µ Y Yµ X + µ X µ Y ] Cov (X, Y) = E [(XY – X.E(X) –YE(X) + E(X)E(Y)] Cov (X, Y) = E (XY) – E(X)E(Y) –E(Y)E(X) + E(Y)E(X)]

Cov (X,Y) = E(XY) – E(X).E(Y)

Em que,

E

(

X

)

=

E ( X ) =

n

1

i

x

i

.

P

(

X

=

x

i

)

+∞

−∞

x. f ( x)dx e E

(

e

(

E XY

)

=

m

n

∑∑

j =

1

i

1

XY

) =

+∞ +∞

∫∫

−∞ −∞

xy f

.

(

x

,

x

i

y

j

.

P

(

y dxdy

)

x

i

,

y

j

) para (X,Y) discreta

para (X,Y) contínua

Como a covariância é, por definição, a média dos produtos dos desvios (X - µ x ) por (Y -

µ y ), a covariância será positiva se ocorrerem desvios do mesmo sinal com maior probabilidade, e negativa se correrem, com maior probabilidade, desvios com sinais contrários. Ou seja,

- ∞∞∞∞ <<<< Cov (X,Y) <<<< + ∞∞∞∞

Assim, o sinal da covariância indica a relação entre as variáveis:

- Se Cov (X,Y) = 0, as variáveis X e Y não possuem dependência linear, ou seja, são

independentes;

- Se Cov (X,Y) > 0, as variáveis X e Y possuem uma relação linear de dependência, cuja

variação ocorre no mesmo sentido, ou seja, à medida que uma variável aumenta a outra

também aumenta, ou à medida que uma variável diminui a outra também diminui;

- Se Cov (X,Y) < 0, as variáveis X e Y possuem uma relação linear de dependência, cuja

variação ocorre no sentido contrário, ou seja, à medida que uma variável aumenta a outra

diminui e vice-versa.

As propriedades da Covariância são:

1º) Cov (X, K) = 0, sendo k uma constante. 2º) Cov (X,Y) = Cov (Y,X)

3º) Cov (X,X) = V(X) 4º) Cov (aX, bY) = ab.Cov(X,Y) 4º) Cov (X + Z, Y) = Cov (X,Y) + Cov (Z,Y) 5º) Cov (X,Y) = 0, se X e Y são independentes 6º) Cov (X,Y) 0, se X e Y são dependentes

Exemplo 1: Sabendo-se que Y = 3X – 5 e que E(X) = 2 e V(X) = 1, calcular:

a) E(Y)

E(3X – 5) = E (3X) – E (5) E(3X – 5) = 3.E (X) – E (5)

E(3X – 5) = 3.2 – 5 E(3X – 5) = 1,0

b) V(Y)

V(3X – 5) = 3 2 .V(X) – V(5) = 9.1 – 0 = 9

c) Cov (X,Y)

Cov (X, 3X – 5) = Cov (X, 3X) - Cov (X, 5) = 3. Cov (X,X) – 0 = 3. V(X) = 3. 1 = 3

d) V(X/3 – Y)

V(X/3) – V(Y) = (1/3) 2 .V(X) + V(Y) – 2.Cov (X/3,Y) = 1/9.V(X) + V(Y) – 2.1/3.Cov (X,Y) V(X/3 – Y) = 1/9.1 + 9 – 2/3.(3) = 64/9

Exemplo 2: Seja a variável aleatória bidimensional DISCRETA (X,Y), cuja distribuição de probabilidade conjunta é dada pela tabela:

 

X

Y

-1

0

2

P (y i )

1

1/9

2/9

0

3/9

3

3/9

1/9

2/9

6/9

P(x i )

4/9

3/9

2/9

1,0

Verificar se as variáveis possuem dependência linear, ou seja, se Cov (X,Y) 0. Cov (X,Y) = E(XY) – E(X). E(Y)

E(X) =

n

i 1

x

i

.

P

(

x

i

E(Y) =

m

j 1

y

j

.

P

E(XY) =

m

n

∑∑

j =

1

i

1

(

y

x

i

.

)

1.

4

+

3

9

6

9

=

0.

= −

9

j

)

y

j

=

1.

3

9

.

P

(

x

i

,

+ 3.

y

j

)

+ 2.

2

9

= 2,33

1.(

1).

Logo, Cov (X,Y) = 0,22 – 0. 2,33 Cov (X,Y) = 0,22

= 0

1

+

1.0.

2

+

1.2.0

+

3.(

1).

3

+

3.0.

1

+ 3.2.

2

9

9

9

9

9

= 0,22

Interpretação: Como a Cov (X,Y) 0, X e Y são dependentes, havendo uma relação linear

positiva entre as duas variáveis, ou seja, à medida que ocorre aumento em X ocorre aumento em Y, ou à medida que ocorre decréscimo em X ocorre decréscimo em Y.

Exemplo 3: Sejam X e Y variáveis aleatórias CONTÍNUAS com f.d.p. conjunta dada por:

f(x,y) =

1 210
1
210

(2x +y),

se 2 x 6

0, para outros valores de x e y

0 y 5

E funções de densidade probabilidade marginais:

f(x) =

f(y) =

0, para outros valores de xprobabilidade marginais: f ( x ) = f ( y ) = f ( x )

f

(

x

)

=

4

x

+

5

84

se 2 x 6

0, para outros valores de yvalores de x f ( x ) = 4 x + 5 84 se 2 ≤

f

(

y

)

=

16

+

2 y

105

se 0 y 5

Verificar se as variáveis possuem dependência linear, ou seja, se Cov (X,Y) 0.

Cov (X,Y) = E(XY) – E(X). E(Y)

E

E

(

(

XY

XY

) =

)

=

+∞ +∞

∫∫

−∞ −∞

xy f

.

(

x

,

5

6

∫∫

0

2

xy

.

1

210

y dxdy

)

(

2

x

+

y ) dxdy

2 E XY    2 y xy   ( ) = ∫
2
E XY
2
y
xy
(
) =
∫ 5
∫ 6
  2 x
+
 dx
0
2
 210
dy
210
 
2
2 y
y
E XY
(
) =
∫ 5
∫ 6
x
2 dx
+
∫ 6
xdx dy
0
210
2
210
2
6
3
2
2
6 
2 y
x
y
x
E XY
(
) =
∫ 5
+
dy
0
210
3
210
2
2
2  
[
3
3
2
2
2
E (
XY
)
=
∫ 5
0,00317
y
(6
2
)
+
0,00238
y
(6
2
) ]dy
0
[
E (
XY
)
=
∫ 5
0,65936
y
+
0,07616
y
2 ]dy
0
E (
XY )
=
∫ 5
0,65936 ydy
+
∫ 5
0,07616 y
2 dy
0
0
E ( XY )
= 0,65936
∫ 5
ydy
+
0,07616
∫ 5
y
2 dy
0
0
5
5
2
3
y
y
E
( XY
)
= 0,65936
+ 0,07616
2
3
0
0
2
2
3
3
E XY
(
)
=
0,32968 (5
0
)
+
0,0254 (5
0
)
E ( XY ) = 11,4153
+∞
4
x +
5
E
(
X
)
=
x f
.
(
x
)
dx
=
∫ 6
x
 
dx = 4,2540
2
84
 
−∞

E

(

Y

)

=

+∞

−∞

y

.

f

(

y

)

dy

=

5

0

y

16

+

2 y

105

dy

= 2,1429

Logo, Cov (X,Y) = 11,4153 – 4,2540.2,1429 Cov (X,Y) = 2,2996

Interpretação: Como a Cov (X,Y) 0, X e Y são dependentes, havendo uma relação linear positiva entre as duas variáveis, ou seja, à medida que ocorre aumento em X ocorre aumento em Y, ou à medida que ocorre decréscimo em X ocorre decréscimo em Y.

4.2.4. Coeficiente de correlação (ρρρρ XY )

Uma vez que a covariância varia de - a + , é difícil determinar a intensidade da relação linear entre as duas variáveis observando simplesmente a partir do valor da covariância, pois a mesma apenas indica o sentido da relação. Para contornar essa dificuldade, Karl Pearson propôs uma versão padronizada da covariância (caracterizada pela divisão da

covariância pelos desvios-padrão de X e Y), que é o coeficiente de correlação linear

populacional de Pearson, representado por ρρρρ XY .

O parâmetro é definido por:

ρ

XY

Cov X ( , Y ) = = V ( X ). V ( Y
Cov X
(
,
Y
)
=
=
V
(
X
).
V
(
Y
)
E XY ( ) V
E XY
(
)
V

E X

(

).

E Y

(

)

(

X

).

V

(

Y

)

É fácil notar que o coeficiente de correlação linear é uma medida mais eficiente de

associação entre variáveis que a covariância, por possibilitar a quantificação da associação.

Em outras palavras, a covariância apenas indica a existência ou não de relação linear entre as

variáveis e, se existir, se essa é positiva ou negativa. O coeficiente de correlação por sua vez,

além de fazer as mesmas indicações que a covariância sobre a relação linear entre as

variáveis, ainda a quantifica!

O intervalo de variação do coeficiente de correlação é - 1 <<<< ρρρρ XY <<<< 1. Isso é facilmente

demonstrado pelo seguinte teorema:

Se X e Y são duas variáveis aleatórias, tem-se:

 

 

 

 

2

X

µ

X

±

Y

µ

Y

E

E

 


 

σ

X

Y

µ

Y

 

 

2

0

0

OU

)

2

X σ

µ

X

±

Y

X σ

µ X

)

 

2

+

σ X

  (

 

σ

X

Y

(

Y

µ

Y

σ

Y

 

(

 

µ

X

)

   

(

Y

σ

µ

Y

   0

)

 

± 2

X

σ

X

Y

 

1

σ

2

X

E

(

Como,

X

µ

X

)

2

+

1

σ

2

Y

E Y