Sei sulla pagina 1di 10

10.

FUNCIN DE DISTRIBUCIN NORMAL


Principales leyes de distribucin de variables aleatorias. Como complemento al
captulo anterior en el que definimos todos los conceptos relativos a variables
aleatorias, describimos en ste las principales leyes de probabilidad que encontramos
en las aplicaciones del clculo de probabilidades. Es necesario hacer referencia en el
estudio de las funciones de mayor aplicacin en forma detallada y segura de forma
que faciliten una herramienta para el estudiante y le permitan un trabajo seguro y
eficiente en su desarrollo profesional y su investigativo.
LA DISTRIBUCIN NORMAL
La distribucin normal o de Gauss es sin duda la ms importante de cuantas hay,
tanto por razones prcticas como tericas. En la seccin sobre anlisis normal se
vern algunas de sus aplicaciones. Formalmente, una variable aleatoria o poblacin X
es normal de media m y varianza s
2
, lo que se expresa como N(,), si su funcin de
densidad es
( )

x e
2
1
) x ( f
2
2
2
x


Los valores que toma la funcin de probabilidad acumulada,
( )
dx e
2
1
) x ( F
2
2
2
x

se pueden calcular a continuacin, sin ms que introducir los parmetros de media ()


y desviacin tpica (), junto con el argumento x. Como ya se ha indicado, la media y
la varianza de la variable aleatoria normal X son E[X]= y V[X]=2,
respectivamente.
Un 50% de los valores estn a la derecha de este valor central y otro 50% a la
izquierda. Esta distribucin viene definida por dos parmetros N (, 2), siendo el
valor medio de la distribucin y es precisamente donde se sita el centro de la curva y
1
2: es la varianza. Indica si los valores estn ms o menos alejados del valor central:
si la varianza es baja los valores estn prximos a la media; si es alta, entonces los
valores estn muy dispersos.
Cuando la media de la distribucin es 0 y la varianza es 1se denomina normal
tipificada, y su ventaja reside en que hay tablas donde se recoge la probabilidad
acumulada para cada punto de la curva de esta distribucin. Adems, toda
distribucin normal se puede transformar en una normal tipificada aplicando

x
z
La distribucin normal tipificada tiene la ventaja de que las probabilidades para cada
valor de la curva se encuentran recogidas en una tabla que se indica en el anexo a este
documento
Los parmetros de esta funcin son E(X)= y V(X)=
2
En la figura siguiente
se muestran distribuciones gaussianas de diferente varianza
Ejemplo, La renta media de los habitantes de un pas es de 4 millones de pesos/ao,
con una varianza de 1,5. Se supone que se distribuye segn una distribucin Normal.
Calcular:
a) Porcentaje de la poblacin con una renta inferior a 3 millones de pesos.
b) Renta a partir de la cual se sita el 10% de la poblacin con mayores ingresos.
c) Ingresos mnimo y mximo que engloba al 60% de la poblacin con renta
media.
a) Porcentaje de la poblacin con una renta inferior a 3 millones de pesos.
22 . 1
4 x
z

2
a) El valor de z para 3 millones de pesos es de -0,816.
P(X<3) = P(Z<-0,816)
P (z>-0,816) = 1-P(z<0,816) = 1 - 0,7925 (aprox.) = 0,2075
Luego, el 20,75% de la poblacin tiene una renta inferior a 3 millones pesos.
b) Nivel de ingresos a partir del cual se sita el 10% de la poblacin con renta ms
elevada.
Vemos en la tabla el valor de la variable tipificada cuya probabilidad acumulada
es el 0,9 (90%), lo que quiere decir que por encima se sita el 10% superior.
Ese valor corresponde a z=1,282. Ahora calculamos la variable normal x
equivalente a ese valor de la normal tipificada: 1.282=(x-4)/1.22
Despejando x=5,57. Por lo tanto, aquellas personas con ingresos superiores a 5,57
millones de pesos constituyen el 10% de la poblacin con renta ms elevada.
c) Nivel de ingresos mnimo y mximo que engloba al 60% de la poblacin con
renta media. Vemos en la tabla el valor de la variable normalizada Y cuya
probabilidad acumulada es el 0,8. Como sabemos que hasta la media la
probabilidad acumulada es del 50%, quiere decir que entre la media y este valor
de z hay un 30% de probabilidad.
Por otra parte, al ser la distribucin normal simtrica, entre -z y la media hay otro
30% de probabilidad. En definitiva, el segmento (-z,z) engloba al 60% de
poblacin con renta media.
El valor de z que acumula el 80% de la probabilidad es 0,842 (aprox.), por lo que
el segmento viene definido por (-0,842, +0,842). Ahora calculamos los valores de
la variable x correspondientes a estos valores de z. Los valores de x son 2,97 y
5,03. Por lo tanto, las personas con ingresos superiores a 2,97 millones de pesos e
inferiores a 5,03 millones de pesos constituyen el 60% de la poblacin con un
nivel medio de renta.
Ejemplo. La vida media de los habitantes de un pas es de 68 aos, con una varianza
de 25. Se hace un estudio en una pequea ciudad de 10.000 habitantes:
a) Cuntas personas superarn previsiblemente los 75 aos?
b) Cuntos vivirn menos de 60 aos?
a) Personas que vivirn (previsiblemente) ms de 75 aos
Calculamos el valor de la normal tipificada equivalente a 75 aos: z=(75-68)/5=
1.40
Por lo tanto, P (x>75) = (z>1,4) = 1 - P (z<1,4) = 1 - 0,9192 = 0,0808
Luego, el 8,08% de la poblacin (808 habitantes) vivirn ms de 75 aos.
3
b) Personas que vivirn (previsiblemente) menos de 60 aos
Calculamos el valor de la normal tipificada equivalente a 60 aos, z=(60-
68)/5=1.60
Por lo tanto P (x<60) = (z< -1,6) = P(z> 1,6) = 1 - P (z<1,6) = 0,0548
Luego, el 5,48% de la poblacin (548 habitantes) no llegarn probablemente a esta
edad.
La funcin caracterstica de la distribucin normal y sus parmetros son
2
) 2 / t ( it
x
2 / z itz
Z
) X ( V ) X ( E
x
z siendo e ) t ( e
2
1
e ) t (
2 2 2

Ejemplo, Supongamos que cierto fenmeno pueda ser representado mediante una
variable aleatoria
) 9 , 45 ( N X
, y queremos calcular la probabilidad de que X tome
un valor entre 39 y 48, es decir,
) 48 X 39 ( P
Solucin, hallamos la variable estandarizada
333 . 0
9
45 48
z y 666 . 0
9
45 39
z
2 1

de modo que
378 . 0 ) 333 . 0 Z 666 . 0 ( P ) 48 X 39 ( P
Remitimos al lector a la tabla de la funcin de distribucin Normal para evaluar los
valores de la funcin acumulada, que se anexan a este captulo
Aproximacin a la Normal de la ley Binomial. Se puede demostrar (teorema central
del lmite) que una variable aleatoria discreta con distribucin binomial, X~B(n,p) se
puede aproximar mediante una distribucin normal si n es suficientemente grande y p
no est ni muy prximo a 0 ni a 1. Como el valor esperado y la varianza de X son
respectivamente np y npq, la aproximacin consiste en decir que X~N(np,(npq)^1/2).
El convenio que se suele utilizar para poder realizar esta aproximacin es:
( ) npq . np N X
4 nq
4 np
30 n
si ) p , n ( B X

'

>
>
>

Ejemplo, Durante cierta epidemia de gripe, enferma el 30% de la poblacin. En un


aula con 200 estudiantes, Cul es la probabilidad de que al menos 40 de ellos
padezcan la enfermedad? y Calcular la probabilidad de que haya 60 estudiantes con
gripe.
4
Solucin: La variable aleatoria que contabiliza el nmero de alumnos que padece la
gripe es
) 30 . 0 , 200 ( B X
cuya media es np=60 y varianza es npq=42. Realizar los clculos con la Binomial es
muy engorroso, ya que intervienen nmeros combinatorios de gran tamao, y
potencias muy elevadas. Por ello utilizamos la aproximacin normal de X, teniendo
en cuenta que se verifican las condiciones necesarias para que el error sea aceptable:
n=200>30, np=60>4, y nq=140>4, entonces ) 42 , 60 ( N X
As aproximando la variable aleatoria discreta binomial X, mediante la variable
aleatoria continua normal,
999 . 0 P : tablas las en
) 09 . 3 Z ( P
42
60 40
42
60 X
P ) 40 X ( P


,
_



Tambin es necesario calcular P(X=60). Esta probabilidad se calcula exactamente
como:
063 . 0 e
2
1
) 60 ( f o q * p *
60
200
) 60 X ( P
2
60
2
1
140 60

,
_



,
_

TEOREMA CENTRAL DEL LMITE


El Teorema Central del Lmite dice que si tenemos un grupo numeroso de variables
independientes y todas ellas siguen el mismo modelo de distribucin (cualquiera que
ste sea), la suma de ellas se distribuye segn una distribucin normal.
Ejemplo, la variable tirar una moneda al aire sigue la distribucin de Bernoulli. Si
lanzamos la moneda al aire 50 veces, la suma de estas 50 variables (cada una
independiente entre si) se distribuye segn una distribucin normal.
Este teorema se aplica tanto a suma de variables discretas como de variables
continuas. Los parmetros de la distribucin normal son Media: n* (media de la
variable individual multiplicada por el nmero de variables independientes), y
Varianza: n*2(varianza de la variable individual multiplicada por el nmero de
variables individuales)
Ejemplo, Se lanza una moneda al aire 100 veces, si sale cara le damos el valor 1 y si
sale Sello el valor 0. Cada lanzamiento es una variable independiente que se
distribuye segn el modelo de Bernoulli, con media 0,5 y varianza 0,25. Calcular la
probabilidad de que en estos 100 lanzamientos salga ms de 60 caras.
5
La variable suma de estas 100 variables independientes se distribuye, por tanto, segn
una distribucin normal.
Media = 100 * 0,5 = 50
Varianza = 100 * 0,25 = 25
Para ver la probabilidad de que salgan ms de 60 caras calculamos la variable normal
tipificada equivalente z=(60-50)/5=2.0
Por lo tanto P(x>60) = P(z>2,0) = 1- P(z< 2,0) = 1 - 0,9772 = 0,0228
Es decir, la probabilidad de que al tirar 100 veces la moneda salgan ms de 60 caras
es tan slo del 2,28%
DISTRIBUCIN LOGNORMAL
Cuando en una muestra con valores positivos se observa que el histograma dista de
ser simtrico, suele ser til una transformacin logartmica de los datos para que los
valores resultantes tengan una apariencia ms gaussiana, lo que permitir utilizar
despus tcnicas de anlisis normal. Se dice en estos casos que los datos originales
tienen distribucin lognormal.
La distribucin lognormal de parmetros m y s tiene tambin categora propia como
modelo de sucesos aleatorios, no siendo extraa su aparicin en contextos tales como
los de las ciencias naturales o de la industria. Su funcin de densidad toma la forma
0 x e
2 s
1
) x ( f
2
2
) m Lnx (
s 2
1
x
>

en la que se observar su similitud con la funcin de densidad de la distribucin


normal, aunque tomando valores no nulos slo en el semieje positivo de la recta real.
Su funcin de probabilidad acumulada es

,
_

x
m m
) x ( F
x

siendo la distribucin de la normal tipificada (media 0 y desviacin tpica 1).


DISTRIBUCIN NORMAL BIDIMENSIONAL
Si X
*
es una variable aleatoria N(0,1), ) , ( N
X
X
*


. Sea X
*
y Y
*
variables
aleatorias normales independientes con
) 1 , 0 ( N
, entonces tienen distribucin
6
conjunta de densidad f (x , y ) =
1
2
* * *

e
x y + ( )/
*2 *2
2
. Las curvas de nivel f
*
constantes son
de probabilidad
Sea
X
X *
X
X

y 1
]
1

X
X
Y
Y
2
*
X Y
1
1
Y
, por tanto,
*
X X
X X +
y
*
Y
2 *
Y Y
Y 1 Y Y + +
Densidad f(x,y), trabajando con le Jacobiano de la transformacin
2
Y X
2
Y
2
X
X
1
1
1
1
1
0
1
D


por lo cual,
2 / ) y , x ( h * * *
e
2
1
= y)) (x, y y), (x, (x f

, entonces,
1
1
]
1

,
_

,
_

,
_

,
_

2
Y
Y
Y
y
X
X
2
X
X
2
Y
Y
x
2
x
1
1
) y , x ( h
,
por tanto, la forma
2 / ) y , x ( h
2
Y X
e
1 2
1
) y , x ( f

es la distribucin marginal
correspondiente con densidad
1
1
]
1

,
_

2
x
x
x
2
1
X
1
e
2
1
) x ( f
y
1
1
1
]
1

,
_

2
y
y
Y
2
1
y
2
e
2
1
) y ( f
y dado que X y Y son Normales con medias
X
y

y
y varianzas
X
2
y
Y
2
,
respectivamente
Excentricidad, si
X Y
, entonces,
) 1 (
2
2
+


. Adems, si
0
, entonces,
f(x,y)=f
1
(x)f
2
(y)
A medida que se consideran mas eventos, mejor es la aproximacin alrededor del
valor medio que en los extremos. Es una funcin simtrica respecto al valor centra
(media), cncava hacia abajo su parte central, con tendencia a cncava hacia arriba en
sus extremos. La varianza representa el achatamiento, esto es, dos curvas con la
caracterstica
2
2
2
1
> , la primera ser mas achatada que la segunda.
Sea f x ke
X
c x m
( )
( )


2
, con x , la distribucin al centro es m
7
1
1
]
1

,
_

2
x
x
m x
2
1
x
X
e
2
1
) x ( f
, por lo cual,
dv e
2
1 m x
F
m x
U P ] x X [ P ) x ( F
u
2
v
x
x
U
c
x
X
2

,
_

1
]
1


con
x
x
m x
u

, entonces, F(-u)=1-F(u)
Si X y Y son variables aleatorias con distribucin ) , m ( N X
2
x x
y
) , m ( N Y
2
y y

,
entonces
) , m m ( N Y X
2
y
2
x y x
+ + + +
Se tiene la funcin Lognormal, en la cual
n 2 1 0 n 1 n 2 n n 1 n n
W ... W W Y ... W W Y W Y Y

,
y sacando logaritmos naturales se puede aplicar la distribucin normal comn y
corriente.
Tabulacin. Sea
) 1 , 0 ( N X
, luego
dx e
2
1
] b X a [ P
b
a
2 / x
2


La funcin de distribucin acumulada de la distribucin es
( )
/
s e dx
x
s

1
2
2
2

.
Y de las tablas se obtienen los valores de , de forma que,
) a ( ) b ( ] b X a [ P
Si ) , ( N X
2
entonces,

X
Y tiene
) 1 , 0 ( N
, por tanto,

,
_



,
_



1
]
1



a b b
Y
a
P ] b X a [ P
por lo cual,
) x ( 1 ) x (
Aunque estos temas se analizan por aparte, se har aqu una introduccin,
FUNCIN NORMAL BIVARIADA
Sea (X,Y) una variable aleatoria continua bidimensional que toma valores en el plano
Euclideo, tiene una distribucin normal bivariada si su funcin de distribucin de
probabilidad conjunta es,
8

'

1
1
]
1

,
_

,
_

2
y
y
y x
y x
2
x
x
2
2
y x
y ) y )( x (
2
x
) 1 ( 2
1
exp
1 2
1
) y , x ( f
en los intervalos, < < < < y y x .
Las distribuciones marginales de X y Y son
) , ( N y ) , ( N
2
y y
2
x x

es el coeficiente de correlacin entre las variables X y Y.


Las distribuciones Condicionales presentan la caracterstica de ser
)] 1 ( ), x ( [ N y )] 1 ( ), y ( [ N
2 2
y x
x
y
y
2 2
x y
y
x
x

+

Normal Truncada. El truncamiento a veces es una necesidad ara manejar
informacin que tiene ciertas propiedades, y no es necesario considerar las colas de
las funciones.
- A la derecha de X=t, la funcin de distribucin de probabilidad es f(x)=0, si x>t,
esto es,

'

1
1
]
1

,
_

2
x
2
1
exp
2
1
K ) x ( f
, si x t , siendo ] t Z [ P
1
t
1
K

1
]
1

- A la izquierda de X=t, la funcin de distribucin de probabilidad es f(x)=0, si x<t,


esto es,

'

1
1
]
1

,
_

2
x
2
1
exp
2
1
K ) x ( f
, si x t , siendo
1
t
1 K

1
]
1

,
_



Normal Multivariable. Sea la distribucin Bivariable
1
]
1

+

) v uv 2 u (
) 1 ( 2
1
exp k ) v , u ( f
2 2
2
UV
siendo

el coeficiente de correlacin y k un factor normalizado,


2
1 2
1
k

,
entonces,
[ ]

'


C B A
) 1 ( 2
1
exp
1 2
1
) y , x ( f
2
2
Y X
XY
en donde,
2
X
X
m x
A

,
_

,
_




Y X
Y X
) m y )( m x (
2 B
, y
2
Y
Y
m y
C

,
_

9
teniendo en cuenta que x y
y
Con distribucin marginal de X:


dy ) y , x ( f ) x ( f
XY X
y similarmente lo es para Y,
y se tiene,
) m x ( m m
X
X
Y
Y X / Y

+
y
2
Y
2 2
X / Y
) 1 (
10

Potrebbero piacerti anche