Sei sulla pagina 1di 16

Estadstica Inferencial-Clase 2

Cusco 2015

II. Variable aleatoria continua y su funcin de densidad de probabilidad


Aquellas variables aleatorias cuyo recorrido no est conformado por un nmero contable de puntos sino que
es un intervalo o unin de intervalos se dice que son variables aleatorias del tipo continuo. La distribucin de
probabilidad de una variable aleatoria continua, X, es el conjunto de pares ( x, f ( x )) ; donde:

x , representa a un valor observado de la variable aleatoria X y,


f x , la correspondiente funcin de densidad de probabilidad.

La funcin de densidad de probabilidad f x , es una funcin definida en todos los nmeros reales que

satisface las siguientes condiciones:


(i) f x 0, x R .
(ii)

f x dx 1 .
R

(iii)

P a X b f x dx
a

Una consecuencia de que X sea una variable aleatoria continua es que, para cualquier valor dentro en el rango
de X, por ejemplo x,
P X x 0 .
Este resultado se desprende de inmediato del hecho de que
x

f t dt 0
x

Definicin La funcin de distribucin de una variable aleatoria continua X es


F x P X x

f t dt

x .

Si X es una variable aleatoria continua, entonces, para cualquier x1 y x 2 ,

P x1 X x 2 P x1 X x 2 P x1 X x 2 P x1 X x 2 F x 2 F x1

Ejemplo En los ltimos 50 aos, el instituto Geofsico registra informacin relacionada a las erupciones
volcnicas, las que nos indican que X, el tiempo (en segundos) transcurrido entre los temblores y la erupcin
del volcn, tiene la funcin de densidad de probabilidad siguiente.

f x

ex x 0
0 c.c.

P a X b f x dx
a

Probabilidad obtenida a partir del rea


bajo f(x).

26

Estadstica Inferencial-Clase 2
Cusco 2015

Funcin de densidad de probabilidad


f(x).

Se demostrar que esta funcin de densidad de probabilidad (fdp), cumple la condicin de que el rea
total bajo f(x) es igual a 1. es decir,

f x dx

dx e x

lim e a e 0 0 1 1
a

La funcin de distribucin es la siguiente


x

F x f t dt e t dt e t / 0 e x lim e a e x 1
x

a 0

As,

1 ex , x 0

F x

0, c.c
Funcin de distribucin del ejemplo

Se determinar la probabilidad de que el tiempo transcurrido entre los temblores y la erupcin del volcn sea
inferior a 2 segundos; de dos formas: primero usando la funcin de densidad de probabilidad y luego haciendo
uso de la funcin de distribucin. Ambos procedimientos nos conducen al mismo resultado.
(i) Haciendo uso de la funcin de densidad de probabilidad:
2

P X 2 e x dx e x
0

2
0

e 2 e 0 0.1353 1 0.8647

(ii) Haciendo uso de la funcin de distribucin:

P X 2 F 2 1 e 2 1 0.1353 0.8647
La probabilidad de que de que el tiempo transcurrido entre los temblores y la erupcin del volcn sea inferior
a 2 segundos es de 0.8647.
La funcin de densidad de probabilidad de una variable aleatoria continua puede obtenerse a partir de la
funcin de distribucin mediante la operacin de derivacin. Esto es, dada la funcin de distribucin F(x),
entonces

f x

dF x
,
dx

siempre y cuando exista la derivada.

Media, varianza y desviacin estndar


La media y la varianza de una variable aleatoria continua se definen de manera similar al caso de la variable
aleatoria discreta. En las definiciones, la integracin remplaza a la sumatoria.
27

Estadstica Inferencial-Clase 2
Cusco 2015
Definicin Para una variable aleatoria continua X, con funcin de densidad de probabilidad f x , la media
o valor esperado de X denotada por

o E(X), es

x f x dx

E( X )

Definicin Suponga que la media de X es

y que la funcin de densidad de probabilidad de X es f x .

La varianza de una variable aleatoria continua X, denotada por 2 Var ( X ) , es


2 E X

f x dx

Definicin

La desviacin estndar de la variable aleatoria X, Suponga que la media de X es

y que la

funcin de densidad de probabilidad de X es f x . La varianza de una variable aleatoria discreta X,


denotada por 2 Var ( X ) , es
2 E X

f x dx

Ejemplo Con el ejemplo anterior se obtendr la media, la varianza y la desviacin estndar.


Media:
E X

x f x dx
0

xe

dx xe x

Varianza:
V X

2
2
x
x 1 f x dx x 1 e dx 1

Integrando por partes dos veces :


u x 1

1.

dv e x dx

du 2 x 1 dx

v e x

As : uv vdu lim x 1 e x
0

Solucionando

()

x
x
e x 1 dx lim x 1 e
b

x 1 dx

2.

/ 2 e

lim x 1 e
b

e x dx
0

b
0

11
0
Remplazando este ltimo resultsdo en ()

uv vdu 1 2(0) 1
0

Desviacin estndar

La desviacin estndar es la raz

cuadrada positiva de la varianza.

1 1.

28

Estadstica Inferencial-Clase 2
Cusco 2015

Distribucin normal
Una de las distribuciones tericas ms estudiadas en los textos de estadstica y ms utilizada en la prctica es
la distribucin normal, tambin llamada distribucin gaussiana. Su importancia se debe
fundamentalmente a la frecuencia con la que distintas variables asociadas a fenmenos naturales y cotidianos
siguen, aproximadamente, esta distribucin. Caracteres morfolgicos (como la talla o el peso), o psicolgicos
(como el cociente intelectual) son ejemplos de variables de las que frecuentemente se asume que siguen una
distribucin normal. El uso extendido de la distribucin normal en las aplicaciones estadsticas puede
explicarse, adems, por otras razones. Muchos de los procedimientos estadsticos habitualmente utilizados
suponen normalidad de los datos observados. La simple exploracin visual de los datos puede sugerir la
forma de su distribucin. No obstante, existen otras medidas, grficos de normalidad y contrastes de hiptesis
que pueden ayudarnos a decidir, de un modo ms riguroso, si la muestra de la que se dispone procede o no de
una distribucin normal. Cuando los datos no siguen una distribucin normal, pueden ser transformados o
emplear mtodos estadsticos como los no paramtricos.

X , tiene una distribucin normal si su funcin de densidad de

Definicin Una variable aleatoria continua


probabilidad est dada por:

1 x


1
f ( x)
e 2
2

, x , , 0

que determina la curva en forma de campana As, se dice que una variable aleatoria

X sigue una distribucin

normal con media y varianza . 3.14159 , e 2.71828 . En la Figura 13 se muestra la


representacin grfica de la distribucin de probabilidad normal.
2

Figura 13. Representacin grfica de la distribucin


Normal
Distribution Plot
Normal, Mean=0, StDev=1
0.4

Density

0.3

0.2

0.1

0.0

-3

-2

-1

29

Estadstica Inferencial-Clase 2
Cusco 2015

X ~ N , 2

Notacin :
2
y .

X tiene una distribucin Normal con parmetros

, se lee

La distribucin normal posee ciertas propiedades importantes destacando las siguientes:

El rea total bajo la curva es igual a 1.

La distribucin es simtrica respecto de su media.

La media, mediana y moda son iguales, que es el punto ms alto de la curva normal.

La distancia entre la recta

La distribucin normal constituye realmente una familia de distribuciones, puesto que para cada valor

x y el punto de inflexin de la curva es igual a .

de y existe una distribucin de probabilidad diferente.

La curva de la distribucin normal se extiende de - hasta +.

Si levantamos perpendiculares entre :


-

Corresponde aproximadamente al 68.3% del rea total.

- 2

+2

Corresponde aproximadamente 95.4% del rea total.

- 3

+3

Corresponde aproximadamente 99.7% del rea total.

Figura 14. reas bajo la curva de la distribucin normal


Distribution Plot

Distribution Plot
0.683

0.3

Density

0.2

0.2

0.1

0.1

0.0

-1.001

1.001

0.997

0.4

0.3

Density

Density

Normal, Mean=0, StDev=1

0.954

0.4

0.3

0.0

Distribution Plot

Normal, Mean=0, StDev=1

Normal, Mean=0, StDev=1


0.4

0.2

0.1

-1.995

1.995

0.0

-2.968

2.968

En la Figura 14 se representan grficamente las propiedades anteriores.


Si una variable aleatoria

X tiene una distribucin normal, pueden calcularse las probabilidades de que X


X es una variable aleatoria continua se cumple que ,

tome valores entre a y b, P(a X b). Puesto que


P(a X b) = P(a < X < b).

Distribucin normal estndar Corresponde a una variable aleatoria con distribucin normal con media 0 y
varianza 1.

f ( z)

1
e
2

1
z2
2

y cuyas probabilidades P Z z estn tabuladas en la denominada tabla normal.


30

Estadstica Inferencial-Clase 2
Cusco 2015

Estandarizacin de una variable con distribucin normal


Una variable aleatoria X con distribucin normal con media y varianza 2 puede

Z normal estndar:

ser transformada en una variable

X
~ N (0,1) ,

se lee Z tiene una distribucin Normal con media 0 y varianza 1.


Ejemplo
El peso de una poblacin de personas de tercera edad que practican natacin sigue una
distribucin normal, con una media de 63 Kg y una desviacin estndar de 10 Kg. si se elige aleatoriamente
una persona, responda las siguientes preguntas.
a) Cul es la probabilidad de que tenga ms de 69 Kg de peso?.
b) Cul es la probabilidad de que tenga menos de 58 Kg de peso?.
c) Cul es la probabilidad de que una persona elegida al azar, tenga entre 60 y 65 Kg. inclusive?
a)
X ~ N ( , ) Z

P X 69

complemento

1 P X 69

estandarizando

tablas

X 63 69 63

10
10

1 P

1 P Z 0 .6

1 0.7257

0.2743

b)

P X 58

es tan darizando

X 63 58 63

10
10

P Z 0.5
0.309

c)

P 60 X 65

es tan darizando

60 63 X 63 65 63

10
10
10

X 63

P 0.3
0.2
10

P Z 0.2 P Z 0.3

P Z 0.2 P Z 0.3 - 1

0.593 0.6179 1

0.197
Para resolver usando el SPSS procedemos de la siguiente manera:
a)
Ingresar al EDITOR DATA y acceder a TRANSFORM / COMPUTE
Muestra la pantalla COMPUTE VARIABLE y se escoge la funcin CDF.NORMAL (q, mean,
stddev) con parmetros mean , stddev para resolver el ejercicio anterior se realiza la

siguiente operacin:

P X 69 CDF.NORMAL69, 63, 10

31

Estadstica Inferencial-Clase 2
Cusco 2015

b) Ingresar al EDITOR DATA y acceder a TRANSFORM /COMPUTE

Muestra la pantalla COMPUTE VARIABLE y se escoge la funcin CDF.NORMAL (q, mean,


stddev) con parmetros

siguiente operacin:

mean , stddev

para resolver el ejercicio anterior se realiza la

P X 58 CDF.NORMAL58, 63, 10

OK.

Se obtiene la probabilidad requerida

Ingresar al EDITOR DATA y acceder a TRANSFORM / COMPUTE

Muestra la pantalla COMPUTE VARIABLE y se escoge la funcin CDF.NORMAL (q, mean,


stddev) con parmetros mean , stddev para resolver el ejercicio anterior se realiza la
siguiente operacin:

c)

P60X 65CDF.NORMAL65, 63, 10CDF.NORMAL60, 63, 10

32

Estadstica Inferencial-Clase 2
Cusco 2015

Distribucin Ji cuadrado
La distribucin ji cuadrado juega un papel importante en la inferencia estadstica. Tiene una aplicacin
considerable en la metodologa y en la teora.
Si una variable aleatoria

n
2

X tiene distribucin gamma con parmetros r , entero positivo, y

1
se
2

dice que sigue la distribucin ji cuadrados con n grados de libertad. En la estadstica, se usa mucho el
trmino grados de libertad, que significa el nmero de observaciones independientes menos el nmero de
parmetros desconocidos que se tratan de estimar sobre la base de dichas observaciones.
Definicin. Si la variable aleatoria
probabilidad es dada por,
f ( x)

X
1

n
2 n / 2
2

tiene una distribucin ji cuadrado su funcin de densidad de


x

n 2 1

x 2

si x 0

La distribucin ji cuadrado es una distribucin asimtrica y su representacin grfica se muestra en la figura


16.
2
Notacin: X ~ ( n ) , se lee

X tiene una distribucin j cuadrado con n grados de libertad.

Figura 16. Funcin de densidad de probabilidad


de la distribucin ji cuadrado

33

Estadstica Inferencial-Clase 2
Cusco 2015

Distribution Plot
Chi-Square, df=4
0.20

Density

0.15

0.10

0.05

0.00

10

12

14

16

Esperanza matemtica. La media de una variable aleatoria


por:

con distribucin ji cuadrado est definida

E(X)

X con distribucin ji cuadrado est definida por

Varianza. La varianza de una variable aleatoria

Var(X) 2n

La distribucin ji cuadrado y su relacin con la distribucin normal


Si,
S2

n 1

es la varianza de una muestra aleatoria X 1 , X 2 ,..., X n de tamao

n , seleccionada de una poblacin

distribuida normalmente con media y 2 , entonces

(n 1) S 2
2

tiene distribucin ji cuadrado con n 1 grados de libertad.


El nmero de grados de libertad en toda operacin estadstica es igual al nmero de observaciones menos toda
restriccin impuesta a tales observaciones. Una restriccin es cualquier valor que deba calcularse en base a
dichas observaciones.
La variable que sigue una distribucin ji cuadrado se representa por la letra griega 2
y toma solamente
valores no negativos.
Ejemplo. Un grupo de investigadores conoce que los coeficientes intelectuales de una poblacin de nios
sigue una distribucin normal con varianza igual a 4. Seleccionan una muestra aleatoria de tamao
17 de esta poblacin y desean conocer la probabilidad de que la varianza muestral sea a lo ms
4.85.
Solucin
34

Estadstica Inferencial-Clase 2
Cusco 2015

Consideremos la variable aleatoria como X , donde

X : Coeficiente intelectual de nios de una poblacin especfica

X ~ N ,4 , 2 = 4,

=17 .

P(S 2 4.85) P

(n 1)S 2 (n 1)

4.85

2
2

16
2 4.85

(16) 4

P 219.4
(16)

0.75

P(S 2 4.85) 0.75 .


Para resolver usando el SPSS procedemos de la siguiente manera
Ingresar al EDITOR DATA y acceder a TRANSFORM / COMPUTE

Muestra la pantalla COMPUTE VARIABLE y se escoge la funcin CDF.CHISQ(q, df) con


parmetro n df grados de libertad, para resolver el ejercicio anterior se realiza la siguiente
operacin:

P 216 19.4 CDF .CHISQ (19.4,16)

OK.

Se obtiene la informacin requerida

Propiedades
Si una variable aleatoria con distribucin N(0,1), Z, se eleva al cuadrado se genera una variable ji
cuadrado con un grado de libertad, es decir:

X
Z i
~ N (0,1) Z 2 ~ 2 .
i
i
(1)

35

Estadstica Inferencial-Clase 2
Cusco 2015

Si se tiene n variables aleatorias independientes con distribucin normal estndar, N(0,1), la suma de los
cuadrados de dichas variables tiene distribucin ji cuadrado con n grados de libertad.
2
n 2
n X i
~ 2

Zi

(n)

i 1
i 1

Distribucin t de Student
Esta distribucin es muy importante en estadstica y fue propuesta por el cientfico ingls W. Gosset (1876
1937), quien trabajaba en la compaa productora de cerveza Guinness, en Dubln, Irlanda, y
escriba sus trabajos bajo el seudnimo Student (el estudiante).
Definicin
Si la variable aleatoria

X tiene una funcin de densidad dada por:

n 1

f ( x)

1
n


2 1

n 1
2

x2

se dice que tiene distribucin t de Student con n grados de libertad. La representacin grfica se muestra en la
siguiente figura.

X ~ t (n) , se lee X tiene una distribucin t de Student con n grados de libertad


Figura. Funcin de densidad de probabilidad
de la distribucin t de Student.
Distribution Plot
T, df=2
0.4

0.3

Density

Notacin:

0.2

0.1

0.0

-5.0

-2.5

0.0

2.5

5.0

7.5

36

Estadstica Inferencial-Clase 2
Cusco 2015

X con distribucin t de Student est definida por

Esperanza. La media de una variable aleatoria

E(X)
Varianza. La varianza de una variable aleatoria

X con distribucin t de Student est definida por

n
Var(X)
,
n2

n 2.

En 1908, W.S. Goset, quien escriba bajo el seudnimo de Student, describi la distribucin de la variable

como una variable con distribucin

X
S
n

t con n 1 grados de libertad, cuando la muestra es seleccionada

desde una poblacin normal con media y varianza 2 . Esta distribucin permitir realizar
inferencias relacionadas a la medias poblacionales cuando la varianza es desconocida. Se debe
notar que el denominador de la variable t , contiene la desviacin estndar muestral S en
lugar de .
Ejemplo
La administradora de una Universidad privada de prestigio quiere investigar el coeficiente intelectual de los
profesores que laboran en esa institucin. Como es muy costoso hacer una prueba a todos los profesores, se
extrae una muestra aleatoria de 20 profesores de toda la poblacin. Cada profesor recibe un examen diseado
para medir el coeficiente intelectual; los resultados proporcionan una desviacin estndar de 8. Por
informaciones pasadas se sabe que el coeficiente intelectual tiene una distribucin normal con media 135. Ella
desea saber lo siguiente:
a) Cul es la probabilidad de que el promedio muestral del coeficiente intelectual de profesores sea
inferior a 160 puntos?
b) Cul es la probabilidad de que el promedio muestral del coeficiente intelectual de profesores sea
superior a 150 puntos?
c) Cul es la probabilidad de que el promedio muestral del coeficiente intelectual se profesores se
encuentre entre 155 y 165 puntos?
Solucin
Consideremos la variable aleatoria como X , donde
X : Coeficiente intelectual de profesores
2
X ~ N 135,

Se conoce que:

X
S
n

tiene una distribucin t con n-1 grados de libertad,


a) La probabilidad de que el promedio muestral del coeficiente intelectual de los profesores sea inferior a 110
es

37

Estadstica Inferencial-Clase 2
Cusco 2015

P X 110 P

X 160

P
S

20

t (19)

160 135

20

P t(19) 13.98 0.2151

La representacin grfica de esta probabilidad est representada en la siguiente figura.


Distribution Plot
Chi-Square, df=19
0.07
0.06

Density

0.05
0.04
0.03

0.2151

0.02
0.01
0.00

13.98

b) La probabilidad de que el promedio muestral del coeficiente intelectual de profesores sea superior a 120
es

P X 120 P

150 135
t

20

P t 8.39 0.0177

La representacin grfica de esta probabilidad est representada en la siguiente figura


Distribution Plot
Chi-Square, df=19
0.07
0.06

Density

0.05
0.04
0.03
0.02
0.01
0.00

0.01770
0

8.39

c) La probabilidad de que el promedio muestral del coeficiente intelectual de profesores se encuentre entre
155 y 165 puntos es,

165 135
155 135
t

8
/
20
8 / 20

P 155 X 165 P

P 11.18 t 16.77 0.3122

La representacin grfica de esta probabilidad est representada en la siguiente figura

38

Estadstica Inferencial-Clase 2
Cusco 2015

Distribution Plot
Chi-Square, df=19
0.07

0.3122

0.06

Density

0.05
0.04
0.03
0.02
0.01
0.00

11.18

16.77

Distribucin F
La distribucin F, la cual fue denominad as en 1924 en honor a Sir Ronald A. Fisher (1890 1962). Esta
distribucin se utiliza en Inferencia Estadstica, cuando estamos interesados en comparar varianzas de dos
variables aleatorias independientes distribuidas normalmente.
Si la variable aleatoria

X tiene funcin de densidad por,


mn

f ( x)
m n


2 2

x2

n x 1

mn
2

,x 0

se dice que X tiene distribucin F con m y n grados de libertad. La Figura 17 muestra la


representacin grfica de la funcin de densidad de la distribucin F.
Notacin:

X ~ F( m , n ) se lee X tiene distribucin F con m y n grados de libertad.


Figura. Funcin de densidad de probabilidad
de la distribucin F

39

Estadstica Inferencial-Clase 2
Cusco 2015

Distribution Plot
F, df1=5, df2=20
0.8
0.7

Density

0.6
0.5
0.4
0.3
0.2
0.1
0.0

Propiedades de la Distribucin F
Si X e Y son variables aleatorias independientes con distribuciones ji cuadrado de parmetros m y
respectivamente; la variable aleatoria

n,

X
U m ,
Y
n

tiene distribucin F con parmetros m y n . EL primer parmetro es el nmero de grados de libertad en el


numerador y el segundo es el nmero de grados de libertad en el denominador.
La distribucin F y su relacin con la distribucin normal
Sean X 1 , X 2 , ..., X n1 una muestra aleatoria seleccionadada de una poblacin normal con media 1 y
varianza 12 ,

N 1 ,12

y Y1 , Y2 ,..., Yn 2 una muestra aleatoria extrada de una poblacin normal

con media 2 y varianza 22 . Adems ambas poblaciones son independientes, entonces la variable
aleatoria

S12
12
F 2
S2
22
n1

tiene distribucin F con n1 1 y n2 1 grados de libertad, donde


n2

S12

y
j 1

x2

S12

x
i 1

x1

n1 1

n2 1

Esperanza matemtica. La media de una variable aleatoria

E(X)

n
,
n2

X con distribucin F est definida por,


n2

Varianza
40

Estadstica Inferencial-Clase 2
Cusco 2015

X con distribucin F est definida por,


2n22 m n 2
Var(X)
,
n4
2
m n 2 n 4

La varianza de una variable aleatoria

Ejemplo.
La consistencia en el sabor del vino es una cualidad importante para mantener la lealtad de la clientela. La
variabilidad en el sabor de un vino dado puede verse afectado por la longinutd del perodo de fermentacin,
variacin en los ingredientes y diferenciales en el equipo de fermentacin . El fabricante del vino Queirolo
con dos lneas de produccin, 1 y 2, ha hecho ligeros cambios a la lnea 2 buscando reducir la variabilidad. Se
toman al azar muestras de 21 vasos de vino de cada lnea de produccin y se determina el ndice de sabor con
un instrumento apropiado. Cul es la probabilidad de que la razn de las variabilidades de las lneas 1 y 2 sea
inferior a 0.56? Se sabe que por informacin pasada que el ndice de sabor para cada lnea de produccin,
sigue una distribucin normal con varianzas desconocidas e iguales.
Solucin.
Se consideran las variables aleatorias
X : Indice de sabor del vino para la lnea 1 de produccin
Y : Indice de sabor del vino para la lnea 2 de produccin
tal que :

X ~ N 1 , 2

Y ~ N 2 , 2

S12

0.56 P F 20,20 0.56 0.1017 , esto es porque


2
S2

S12
~ F 20,20 y el valor 0.1017 es hallado
S 22

en la tabla de la distribucin F, para m n 20 grados de libertad y el quantil 0.56.


Luego, la probabilidad de que la razn de las variabilidades de las lnea 1 y 2 sea inferior a 56% es 0.1017.
Distribution Plot
F, df1=20, df2=20
1.0

Density

0.8

0.6

0.4

0.1017
0.2

0.0

0.56

41

Potrebbero piacerti anche