Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Cusco 2015
La funcin de densidad de probabilidad f x , es una funcin definida en todos los nmeros reales que
f x dx 1 .
R
(iii)
P a X b f x dx
a
Una consecuencia de que X sea una variable aleatoria continua es que, para cualquier valor dentro en el rango
de X, por ejemplo x,
P X x 0 .
Este resultado se desprende de inmediato del hecho de que
x
f t dt 0
x
f t dt
x .
P x1 X x 2 P x1 X x 2 P x1 X x 2 P x1 X x 2 F x 2 F x1
Ejemplo En los ltimos 50 aos, el instituto Geofsico registra informacin relacionada a las erupciones
volcnicas, las que nos indican que X, el tiempo (en segundos) transcurrido entre los temblores y la erupcin
del volcn, tiene la funcin de densidad de probabilidad siguiente.
f x
ex x 0
0 c.c.
P a X b f x dx
a
26
Estadstica Inferencial-Clase 2
Cusco 2015
Se demostrar que esta funcin de densidad de probabilidad (fdp), cumple la condicin de que el rea
total bajo f(x) es igual a 1. es decir,
f x dx
dx e x
lim e a e 0 0 1 1
a
F x f t dt e t dt e t / 0 e x lim e a e x 1
x
a 0
As,
1 ex , x 0
F x
0, c.c
Funcin de distribucin del ejemplo
Se determinar la probabilidad de que el tiempo transcurrido entre los temblores y la erupcin del volcn sea
inferior a 2 segundos; de dos formas: primero usando la funcin de densidad de probabilidad y luego haciendo
uso de la funcin de distribucin. Ambos procedimientos nos conducen al mismo resultado.
(i) Haciendo uso de la funcin de densidad de probabilidad:
2
P X 2 e x dx e x
0
2
0
e 2 e 0 0.1353 1 0.8647
P X 2 F 2 1 e 2 1 0.1353 0.8647
La probabilidad de que de que el tiempo transcurrido entre los temblores y la erupcin del volcn sea inferior
a 2 segundos es de 0.8647.
La funcin de densidad de probabilidad de una variable aleatoria continua puede obtenerse a partir de la
funcin de distribucin mediante la operacin de derivacin. Esto es, dada la funcin de distribucin F(x),
entonces
f x
dF x
,
dx
Estadstica Inferencial-Clase 2
Cusco 2015
Definicin Para una variable aleatoria continua X, con funcin de densidad de probabilidad f x , la media
o valor esperado de X denotada por
o E(X), es
x f x dx
E( X )
f x dx
Definicin
y que la
f x dx
x f x dx
0
xe
dx xe x
Varianza:
V X
2
2
x
x 1 f x dx x 1 e dx 1
1.
dv e x dx
du 2 x 1 dx
v e x
As : uv vdu lim x 1 e x
0
Solucionando
()
x
x
e x 1 dx lim x 1 e
b
x 1 dx
2.
/ 2 e
lim x 1 e
b
e x dx
0
b
0
11
0
Remplazando este ltimo resultsdo en ()
uv vdu 1 2(0) 1
0
Desviacin estndar
1 1.
28
Estadstica Inferencial-Clase 2
Cusco 2015
Distribucin normal
Una de las distribuciones tericas ms estudiadas en los textos de estadstica y ms utilizada en la prctica es
la distribucin normal, tambin llamada distribucin gaussiana. Su importancia se debe
fundamentalmente a la frecuencia con la que distintas variables asociadas a fenmenos naturales y cotidianos
siguen, aproximadamente, esta distribucin. Caracteres morfolgicos (como la talla o el peso), o psicolgicos
(como el cociente intelectual) son ejemplos de variables de las que frecuentemente se asume que siguen una
distribucin normal. El uso extendido de la distribucin normal en las aplicaciones estadsticas puede
explicarse, adems, por otras razones. Muchos de los procedimientos estadsticos habitualmente utilizados
suponen normalidad de los datos observados. La simple exploracin visual de los datos puede sugerir la
forma de su distribucin. No obstante, existen otras medidas, grficos de normalidad y contrastes de hiptesis
que pueden ayudarnos a decidir, de un modo ms riguroso, si la muestra de la que se dispone procede o no de
una distribucin normal. Cuando los datos no siguen una distribucin normal, pueden ser transformados o
emplear mtodos estadsticos como los no paramtricos.
1 x
1
f ( x)
e 2
2
, x , , 0
que determina la curva en forma de campana As, se dice que una variable aleatoria
Density
0.3
0.2
0.1
0.0
-3
-2
-1
29
Estadstica Inferencial-Clase 2
Cusco 2015
X ~ N , 2
Notacin :
2
y .
, se lee
La media, mediana y moda son iguales, que es el punto ms alto de la curva normal.
La distribucin normal constituye realmente una familia de distribuciones, puesto que para cada valor
- 2
+2
- 3
+3
Distribution Plot
0.683
0.3
Density
0.2
0.2
0.1
0.1
0.0
-1.001
1.001
0.997
0.4
0.3
Density
Density
0.954
0.4
0.3
0.0
Distribution Plot
0.2
0.1
-1.995
1.995
0.0
-2.968
2.968
Distribucin normal estndar Corresponde a una variable aleatoria con distribucin normal con media 0 y
varianza 1.
f ( z)
1
e
2
1
z2
2
Estadstica Inferencial-Clase 2
Cusco 2015
Z normal estndar:
X
~ N (0,1) ,
P X 69
complemento
1 P X 69
estandarizando
tablas
X 63 69 63
10
10
1 P
1 P Z 0 .6
1 0.7257
0.2743
b)
P X 58
es tan darizando
X 63 58 63
10
10
P Z 0.5
0.309
c)
P 60 X 65
es tan darizando
60 63 X 63 65 63
10
10
10
X 63
P 0.3
0.2
10
P Z 0.2 P Z 0.3
P Z 0.2 P Z 0.3 - 1
0.593 0.6179 1
0.197
Para resolver usando el SPSS procedemos de la siguiente manera:
a)
Ingresar al EDITOR DATA y acceder a TRANSFORM / COMPUTE
Muestra la pantalla COMPUTE VARIABLE y se escoge la funcin CDF.NORMAL (q, mean,
stddev) con parmetros mean , stddev para resolver el ejercicio anterior se realiza la
siguiente operacin:
P X 69 CDF.NORMAL69, 63, 10
31
Estadstica Inferencial-Clase 2
Cusco 2015
siguiente operacin:
mean , stddev
P X 58 CDF.NORMAL58, 63, 10
OK.
c)
32
Estadstica Inferencial-Clase 2
Cusco 2015
Distribucin Ji cuadrado
La distribucin ji cuadrado juega un papel importante en la inferencia estadstica. Tiene una aplicacin
considerable en la metodologa y en la teora.
Si una variable aleatoria
n
2
1
se
2
dice que sigue la distribucin ji cuadrados con n grados de libertad. En la estadstica, se usa mucho el
trmino grados de libertad, que significa el nmero de observaciones independientes menos el nmero de
parmetros desconocidos que se tratan de estimar sobre la base de dichas observaciones.
Definicin. Si la variable aleatoria
probabilidad es dada por,
f ( x)
X
1
n
2 n / 2
2
n 2 1
x 2
si x 0
33
Estadstica Inferencial-Clase 2
Cusco 2015
Distribution Plot
Chi-Square, df=4
0.20
Density
0.15
0.10
0.05
0.00
10
12
14
16
E(X)
Var(X) 2n
n 1
(n 1) S 2
2
Estadstica Inferencial-Clase 2
Cusco 2015
X ~ N ,4 , 2 = 4,
=17 .
P(S 2 4.85) P
(n 1)S 2 (n 1)
4.85
2
2
16
2 4.85
(16) 4
P 219.4
(16)
0.75
OK.
Propiedades
Si una variable aleatoria con distribucin N(0,1), Z, se eleva al cuadrado se genera una variable ji
cuadrado con un grado de libertad, es decir:
X
Z i
~ N (0,1) Z 2 ~ 2 .
i
i
(1)
35
Estadstica Inferencial-Clase 2
Cusco 2015
Si se tiene n variables aleatorias independientes con distribucin normal estndar, N(0,1), la suma de los
cuadrados de dichas variables tiene distribucin ji cuadrado con n grados de libertad.
2
n 2
n X i
~ 2
Zi
(n)
i 1
i 1
Distribucin t de Student
Esta distribucin es muy importante en estadstica y fue propuesta por el cientfico ingls W. Gosset (1876
1937), quien trabajaba en la compaa productora de cerveza Guinness, en Dubln, Irlanda, y
escriba sus trabajos bajo el seudnimo Student (el estudiante).
Definicin
Si la variable aleatoria
n 1
f ( x)
1
n
2 1
n 1
2
x2
se dice que tiene distribucin t de Student con n grados de libertad. La representacin grfica se muestra en la
siguiente figura.
0.3
Density
Notacin:
0.2
0.1
0.0
-5.0
-2.5
0.0
2.5
5.0
7.5
36
Estadstica Inferencial-Clase 2
Cusco 2015
E(X)
Varianza. La varianza de una variable aleatoria
n
Var(X)
,
n2
n 2.
En 1908, W.S. Goset, quien escriba bajo el seudnimo de Student, describi la distribucin de la variable
X
S
n
desde una poblacin normal con media y varianza 2 . Esta distribucin permitir realizar
inferencias relacionadas a la medias poblacionales cuando la varianza es desconocida. Se debe
notar que el denominador de la variable t , contiene la desviacin estndar muestral S en
lugar de .
Ejemplo
La administradora de una Universidad privada de prestigio quiere investigar el coeficiente intelectual de los
profesores que laboran en esa institucin. Como es muy costoso hacer una prueba a todos los profesores, se
extrae una muestra aleatoria de 20 profesores de toda la poblacin. Cada profesor recibe un examen diseado
para medir el coeficiente intelectual; los resultados proporcionan una desviacin estndar de 8. Por
informaciones pasadas se sabe que el coeficiente intelectual tiene una distribucin normal con media 135. Ella
desea saber lo siguiente:
a) Cul es la probabilidad de que el promedio muestral del coeficiente intelectual de profesores sea
inferior a 160 puntos?
b) Cul es la probabilidad de que el promedio muestral del coeficiente intelectual de profesores sea
superior a 150 puntos?
c) Cul es la probabilidad de que el promedio muestral del coeficiente intelectual se profesores se
encuentre entre 155 y 165 puntos?
Solucin
Consideremos la variable aleatoria como X , donde
X : Coeficiente intelectual de profesores
2
X ~ N 135,
Se conoce que:
X
S
n
37
Estadstica Inferencial-Clase 2
Cusco 2015
P X 110 P
X 160
P
S
20
t (19)
160 135
20
Density
0.05
0.04
0.03
0.2151
0.02
0.01
0.00
13.98
b) La probabilidad de que el promedio muestral del coeficiente intelectual de profesores sea superior a 120
es
P X 120 P
150 135
t
20
P t 8.39 0.0177
Density
0.05
0.04
0.03
0.02
0.01
0.00
0.01770
0
8.39
c) La probabilidad de que el promedio muestral del coeficiente intelectual de profesores se encuentre entre
155 y 165 puntos es,
165 135
155 135
t
8
/
20
8 / 20
P 155 X 165 P
38
Estadstica Inferencial-Clase 2
Cusco 2015
Distribution Plot
Chi-Square, df=19
0.07
0.3122
0.06
Density
0.05
0.04
0.03
0.02
0.01
0.00
11.18
16.77
Distribucin F
La distribucin F, la cual fue denominad as en 1924 en honor a Sir Ronald A. Fisher (1890 1962). Esta
distribucin se utiliza en Inferencia Estadstica, cuando estamos interesados en comparar varianzas de dos
variables aleatorias independientes distribuidas normalmente.
Si la variable aleatoria
f ( x)
m n
2 2
x2
n x 1
mn
2
,x 0
39
Estadstica Inferencial-Clase 2
Cusco 2015
Distribution Plot
F, df1=5, df2=20
0.8
0.7
Density
0.6
0.5
0.4
0.3
0.2
0.1
0.0
Propiedades de la Distribucin F
Si X e Y son variables aleatorias independientes con distribuciones ji cuadrado de parmetros m y
respectivamente; la variable aleatoria
n,
X
U m ,
Y
n
N 1 ,12
con media 2 y varianza 22 . Adems ambas poblaciones son independientes, entonces la variable
aleatoria
S12
12
F 2
S2
22
n1
S12
y
j 1
x2
S12
x
i 1
x1
n1 1
n2 1
E(X)
n
,
n2
Varianza
40
Estadstica Inferencial-Clase 2
Cusco 2015
Ejemplo.
La consistencia en el sabor del vino es una cualidad importante para mantener la lealtad de la clientela. La
variabilidad en el sabor de un vino dado puede verse afectado por la longinutd del perodo de fermentacin,
variacin en los ingredientes y diferenciales en el equipo de fermentacin . El fabricante del vino Queirolo
con dos lneas de produccin, 1 y 2, ha hecho ligeros cambios a la lnea 2 buscando reducir la variabilidad. Se
toman al azar muestras de 21 vasos de vino de cada lnea de produccin y se determina el ndice de sabor con
un instrumento apropiado. Cul es la probabilidad de que la razn de las variabilidades de las lneas 1 y 2 sea
inferior a 0.56? Se sabe que por informacin pasada que el ndice de sabor para cada lnea de produccin,
sigue una distribucin normal con varianzas desconocidas e iguales.
Solucin.
Se consideran las variables aleatorias
X : Indice de sabor del vino para la lnea 1 de produccin
Y : Indice de sabor del vino para la lnea 2 de produccin
tal que :
X ~ N 1 , 2
Y ~ N 2 , 2
S12
S12
~ F 20,20 y el valor 0.1017 es hallado
S 22
Density
0.8
0.6
0.4
0.1017
0.2
0.0
0.56
41