Sei sulla pagina 1di 17

DEPARTAMENTO DE MATEMATICAS Y ESTADISTICA

NOTAS SOBRE FUNCIONES DE PROBABILIDAD


DE VARIABLE CONTINUA
Facilitador José Vicente Sánchez Frank jvsfrank@gmail.com
INTRODUCCIÓN

Existen diferencias sustanciales entre variables aleatorias discretas ya revisadas y las variables
aleatorias continuas, pero la principal está en que los valores de la v.a.d. los valores que toman se
pueden contar y en la v.a.c. no se pueden contar.

1. VARIABLE CONTINUA.
Son magnitudes que toman valores dentro de un conjunto infinito y se originan de procesos de
medición, se notan v.a.c. Lo anterior implica que los valores que toman no son suceptibles de ser
contados, ejemplo la precipitación pluvial diaria en cierto lugar, la resistencia del concreto
(medida en Lbs./ Pulg2), el peso entre otras. La función de distribución de una v.a.c. se denomina
funcion de densidad. Se dice también que las v.a.c. no contempla empates, es decir valores
iguales, se presentan por la imprecisión de los elementos de medida.

2. FUNCIÓN DE DENSIDAD

Es la que mide la probabilidad de ocurrencia de una variable aleatoria contínua en un intervalo


determinado (no mide probabilidades puntuales, ya que las mismas son cero).
Notación: f(x)

Ejemplo:

3/8 (4x – 2x2) para 0  x  2


f(x) =
0 demás casos

b
P(a  x  b) = P (a  x  b) = 
a
f(x)dx (se asocian con un área específica)

Describe la forma como varían las probabilidades


2

P(1  x  2) = P(1  x  2) = 
1
3/8 (4x – 2x2) dx = ½

En ambos casos para que se cumpla que sea FUNCION DE PROBABILIDAD o FUNCIÓN DE
DENSIDAD debe ser consistente con los axiomas de probabilidad y eso puede mostrarse en cada
caso.

2.1 Condiciones que se deben cumplir para ser función de Probabilidad o función de
Densidad
Variable Aleatoria Continua
I) f(x)  0
2
II)  f(x) dx = 1
Rx

3.-Función de Distribución Acumulada. F(X)

También se le denomina DISTRIBUCIÓN ACUMULADA de la variable aleatoria X, y se define


como la función que mide la probabilidad f(x), de que la variable aleatoria X sea menor o igual
que un número dado x que esta en el recorrido de la variable X.
Notación: F(x) = P (X  x)
x
F(x) = P (X  x) =  f  x  dx


Si el número dado es h:
h
F(h) = P(X  h) =  f  x  dx


Es decir la probabilidad acumulada se evalua desde donde inicia el recorrido de la variable


aleatoria X hasta el número dado h.

Ejercicio 2:

En el ejemplo 1: Calcular F(1)


F(1) = P(X  1) = P(0  X  1) =  P(xi) = P(x = 0) + P(x = 1)
xi  1
F(1) = ¼ + ½ = ¾

En el ejemplo 2. Calcular F(1).

1
F(1) = P(X  1) =  3/8 (4x – 2x2) dx
0
1
F(1) = P(X  1) = 3/8 (4X2/2 - 2x3/3) 0 = 3/8 2 (12 – 02)-2/3 (13 – 03)

F(1) = P(X  1) = 3/8 (2.1 – 2/3.1) = 3/8 4/3 = 4/8 = ½

3.1Propiedades de la Función de Distribución Acumulada.

Si X es una variable continua la función F(x) es continua excepto para los valores posibles de x,
llamados x1, x2,...xn.

3.1Propiedades de la Función de Distribución Acumulada.

La función F(x) es continua excepto para los valores posibles de X, llamados x1, x2,...xn.

3
Si X es una variable aleatoria continua, F(x), será una función continua para todo x  Rx.

La función F(x) es no decreciente, es decir, si:


x1  x2, se tiene:
l)F(x1)  F(x2)
ll) lim F(x) = 0 lim F(x) = 1
x  - x  +
Lo cual puede escribirse como:
F (- ) = 0 y F () = 1
lll) Sea F(x) una función de distribución acumulada de una variable aleatoria continua con f.d.p.
f(x) entonces:
F(x) = d/dx F(x)

Ejemplos:

Sea X una v.a. continua con f.d.a. F(x) dada por:


0 si x  0
F(x) =
1 – e – x si x  0

Según propiedad No III

f(x) = d/dx F(x)


f(x) = e –x si x 0 entonces la f.d.p. será:

e–x si x  0
f(x) =
0 en los demás casos

4.-Caracterización de una Variable Aleatoria.

Una variable aleatoria es necesario caracterizarla para poder identificar que tipo de distribución
que sigue o si la distribución es libre (no se puede identificar con alguna de las ya existentes).
Existen varios parámetros, pero los más importantes son la ESPERANZA MATEMATICA o
VALOR ESPERADO (valor medio o primer momento respecto al origen) y la VARIANZA
( valor esperado, de las desviaciones de la variable con respecto a su media segundo momento
respecto a la media).

4.1Esperanza Matemática de una Variable Aleatoria.

Notación:  = E(x)

4
Muchas decisiones se toman en base a este concepto, en la rama de los seguros para calcular
índice de mortalidad, en personas a determinadas edades, en general índices de siniestralidad; en
las ventas, producción, en ingenieria para medir la homogeneidad del material con que se trabaja,
en educación muchas áreas que se toman decisiones en condiciones de incentindumbre.

Definición: como una media ponderada por los valores de probabilidad (en el caso v.a.d.).

= E(x) =  x f(x) dx
Rx

También se define como el promedio de todos los promedios de todas las muestras posibles de
tamaño n, de una población.

4.2 Varianza  x ó V(x)


2

Es una medida de dispersión, es la magnitud que mide la dispersión de los valores de la variable
aleatoria alrededor de su media, o es el promedio de las desviaciones cuadráticas de todos los
valores posibles de la variable x alrededor de su media.

 x2 = Var(x) = x-E(x)2 f(x) = E x – E (x)2 = E (x2) – E(x)2


x
 x2 = E(x2) - 2

 x2 = Var(x) =  x – E(x)2 f(x) dx v.a.c.


 x2 = Var(x) = Ex-E(x)2 = E(x2) – E(x)2 ambos casos

Propiedades:

Var(cx) = c2 Var(x) = c2  x2
Var(c) = 0
Var (xy) = Var(x) Var(y) si x, y son independientes
Var(ax+b) = a2 Var(x) = a2 Var(x) = a2 x2

5.DISTRIBUCIÓN NORMAL O GAUSSIANA

Es la distribución más importante en todo el campo de la estadística, es la base de la inferencia.


Existen muchas razones que pueden esgrimirse para esta afirmación, pero se pueden señalar las
más importantes.

-Tienen algunas propiedades que las hace aplicables a muchas situaciones donde es preciso hacer
inferencias sobre poblaciones cuando se estudian muestras de ellas.

5
-Gran cantidad de fenómenos dentro del campo de la Ingenierías: , la educación y la gerencia en
general se ajustan exacta o aproximadamente a una distribución normal o multinormal (varias
variables normales distribuidas conjuntamente).

-Es la base para el desarrollo de los modelos lineales o intrínsecamente lineales.

5.1Caracteristicas de la distribución normal.

-Permite explicar alrededor de 95% de los comportamientos de fenomenos aleatorios.

-Es simétrica alrededor de su media , la moda y mediana, que coinciden con su centro de
gravedad.

-Es asintótica respecto al eje X, es decir, sus colas se extienden de manera indefinida sin tocar el
eje x.

-El punto máximo se encuentra f().

-Si  es grande (gran dispersión), el gráfico tiende a ser achatado, si  es pequeño (poca
dispersión), el gráfico tiende a ser apuntado. No hay una sola curva normal, sino una familia.

-El área total bajo la curva y arriba del eje horizontal es igual a , con
-  X .

F(Z) = P(Z  z) ; P(Zz) = 1-P(Z z); además

   incluye el 68,27% del àrea o probabilidad.


 2, incluye el 95,43% del àrea o probabilidad.
 3 incluye el 99,73% del àrea o probabilidad.

Con frecuencia se hace referencia a la cantidad 6 comno el ancho de la distribución normal, ya


que el área bajo la función de densidad normal despues de 3 más alla de la media es muy
pequeña.

La gráfica de la curva normal se denomina CAMPANA DE GAUSS.

6
123
1= 2 =3 =

1  2 3
1= 2 = 3

1  2 3
1  2  3

Los parámetros que caracterizan la curva normal o distribución normal son:

7
E (x) =  Var(x) = 2

X  N (,2) y su función de densidad es:

1 x2
(X; ,2) = 2
2 Exp. (- ½   )
  

La normal cuya media  = 0 y varianza 2 = 1 se denomina normal estándar.

Z  N (0,1) y su función de densidad es:

1
(z; 0,1) = Exp. (- ½ z2)
2

Se acostumbra a simbolizar con Z los valores estandarizados de la variable normal.

1 x
(z) = Exp. (- ½ z2) z= si X  N (,2)
2 

Los problemas que se plantean en el cálculo de probabilidades en una función de variable


continua se asocian con el cálculo de área bajo la curva dado un valor, es decir calcular el
percentil, o problemas en los cuales es conocida el área, es decir el percentil (probabilidad o área
bajo la curva) calcular el valor máximo de la variable que deja esa área a la izquierda, o el valor
mínimo de la variable que deja esa área a la derecha.

Problema:
1.Dado el valor correspondiente calcular el área o el percentil.
Si x  N (2,9) calcular

P(X2)
P(X1)
P(X3)

NOTA: En las variables continuas se cumple que:

P (X1) = P(X1) ó P(X3) = (P3)

Ilustrar con una gráfica

8
P(X1) P(X3)
P(X1) P(X3)

2.Dado el área hallar el valor correspondiente del percentil.


Si X  N (5000,1002), calcular k
Tal que P(Xk) = 0.6

Problemas de Aplicación:

1. Suponiendo que los pesos de las pelotas de tenis de mesa se distribuyen normalmente con
media 1 y varianza 0.25. Calcular las siguientes probabilidades de seleccionar un pelota
aleatoriamente que el peso sea:
a) Al menos sea 1.3 R: 0.2743
b) A lo más su peso sea 0.75 R: 0.3085
c) Que el peso este entre 0.90 y 1.5 R: 0.4206

2. La resistencia a romperse de un tipo de un maya de una raqueta de tenis, es una variable


aleatoria X que sigue una distribución normal (165,9). Una raqueta se considera defectuosa si
la resistencia es menor a 162 ¿Cuál es la probabilidad de que al seleccionar una raqueta al
azar sea defectuosa?

R: 0.159

3. Las calificaciones obtenidas en el primer parcial de estadística en un curso específico siguen


una distribución normal (75,16). Se desea clasificar el grupo A como el que obtuvo el 10%
superior de las calificaciones. Obtenga la nota mínima de un alumno de ese grupo.

4. Un programa de capacitación de profesores en una nueva tecnología de información y


comunicación, es auto aplicable y los profesores requieren diferentes números de horas para
terminarlo. Un estudio en participantes anteriores revela que el tiempo utilizado es una
variable aleatoria que se distribuye normalmente con media de 500 horas y desviación
estándar 100 horas. Se desea saber lo siguiente: ¿Cuál es la probabilidad de que un
participante elegido al azar:

a) Tarde más de 500 horas?


9
b) Tarde más de 600 horas?
c) Tarde entre 500 y 600 horas?
d) Tarde menos de 550 horas?
e) Cual fue el número máximo de horas que utilizó el mejor grupo que constituyó el 20%.

6. DISTRIBUCIÓN Ji CUADRADA DE PEARSON  2.

Después de la distribución normal, la Ji Cuadrada es una de las distribuciones más aplicadas, se


utiliza para probar el grado de asociación o independencia entre variables, por ejemplo entre
métodos de enseñanza aprendizaje y rendimiento estudiantil; para pruebas de bondad de ajuste, es
decir, para saber si un conjunto de variables siguen una distribución determinada y como prueba
de homogeneidad de varianzas (homocedasticidad).
Suponga que se tiene un conjunto de variables X 1, X2.......Xn, que son independientes y se
distribuyen normalmente, con medias,  = 1 = .... = n y varianzas 2 = 12 = 22 =..... = n2
respectivamente. Si estas variables se estandarizan se obtienen:

X1  
Z1 = , Z1  N (0,1)

X2  
Z2= Z2  N (0,1)

. .
. .
. .

X 
Zn = n , Zn  N (0,1)

Es decir que cada Zi tiene una distribución normal estándar.

Zi  N (0,1) con E (Zi) = 0 y V (Zi) = 1


Si las variables Zi se elevan al cuadrado y se suman entonces se obtiene la variable:

2 2
n n
X 
U = Z   1 
i 1 i i 1   
Este estadístico (variable) U sigue una distribución denominada Ji cuadrada 2(n), con n grados de
libertad.

f (U)

10
U
 2
(1-/2)(n)  2
(/2)(n)

U   2 (n)

U se distribuye Ji – cuadrada con n g.l.

Grados de Libertad (g.l)

Este término utilizado en las distribuciones, se refiere al número de elementos que se pueden
elegir libremente o el número de variables independientes. Los grados de libertad de un
estadístico dependen del número de parámetros estimados en dicho estadístico y es igual a n – k,
donde n es el tamaño de la muestra y k el número de estimaciones.

Por ejemplo:

1 n
S2 = 
n  1 i 1
( X i  X )2

Tiene (n-1) g.l., ya que X es estimador de 

1 n
S2 =  ( X i  X )2
n i 1

También tiene (n-1) g.l. Ya que para calcular S2 utiliza X .


Ejercicio con una muestra de tamaño 3 y estimar la media

La distribución Ji – cuadrado 2 tiene gran cantidad de aplicaciones, entre ellas:

 Como prueba de bondad de ajuste


 Como prueba de independencia
 Como prueba de homogeneidad de varianzas, etc.

Ejemplo 1:
Dado un valor de la variable calcular el percentil correspondiente, la probabilidad ( el área) a la
derecha o la izquierda, o el percentil entre dos valores de un intervalo.

Calcular:

11
P(U  36.4) si U  2 (24)
P(U  12.8) si U  2 (3)
P(U  10.8) si U  2 (20)
P(0.115  U  7.81) si U  2 (3)

En los casos anteriores al problema trataba de obtener una probabilidad (área a la derecha o a la
izquierda o entre dos valores). También puede presentarse el caso: dado el área hallar el valor
correspondiente del percentil lo cual se explica a continuación.

La expresión  2(n), hace referencia a un número k tal que la probabilidad de que una variable
aleatoria 2 con n grados de libertad, sea mayor que él, sea:
P(U2 (n)) =  un numero tal que a su derecha se ubique un área igual a  (área es probabilidad).

2(n), es el valor de una variable que sigue la distribución 2, con n g.l. y que deja a su derecha un
área igual a .

Ejemplo 2:

 20.05   4  , es buscar el número que deje a la derecha de él 0.05. del área (probabilidad 5%)
Es buscar el valor del percentil 0.95 (95%) de una variable 2(4), o de una variable que sigue la
distribución 2 con 4 g.l.

Hallar:

2.1.-  20.05   5 
2.2.-  20.025   20 
2.3.-  20.1O   15 

7-Distrubución “” de Student.

En muchas situaciones prácticas la muestra es pequeña y la desviación estándar (por lo tanto la


varianza) se desconoce. En estos casos generalmente se estima a partir de datos muéstrales.
Aunque las variables de la muestra se obtengan de una población normal con desviación estándar
o típica (por lo tanto varianza desconocida).

La media de una distribución normal estandarizada


x x
Z =  ̂ = S el estimador de 

ˆ / n S/ n

La distribución que más se ajusta para la media muestral es la distribución t de STUDENT, cuyo
estadístico viene dado por la expresión:

12
x  
t=
S/ n

Donde x la media de la muestra x1.....xn y se distribuye después de la estandarización como una


t (n-1) (t con n-1 grados de libertad)

La variable t también se puede obtener por el cociente de una variable normal estandarizada y la
raíz cuadrada una variable Ji – cuadrada dividida entre sus grados de libertad:

Se sabe que x tiende siempre a distribuirse normalmente, S2 se estima de la muestra y la función


de S2 tiene su distribución:


x ~ N  , 2 / n  y
nS 2
 2
~  2 ( n 1)

además x y S2 son independientes, ya que t se obtiene del cociente de una variable normal
estándar entre la raíz cuadrada de una variable Ji-cuadrada dividida entre sus grados de libertad
entonces:

z
t
así t=
 x   / nS 2

x
=
 2
/ n   n  1 S / n
2

n 1

y la distribución de t es
x
t ~ t ( n 1) gl
S/ n

x   /  x U

t = donde Z= y con Z  N (0,1) y U  2 (n)
/ n  n

La función de densidad viene dada por:

(t) =  (n-1)/2 ! 1 para -  t 


n(n-2)/2! 1+ t /n (n+1)/2
2

La representación gráfica de f(t) es una curva simétrica con respecto a su media, que es cero,
cuando el número de los g.l. es pequeño la curva es aplanada con las colas pesadas (gran
proporción de área en los extremos), a medida que n se hace grande la distribución tiende a la
forma de la distribución normal, así si n 30 se puede utilizar los valores de la tabla normal.

Observaciones:

1. El valor percentil p es igual al del percentil 1 – p con signo contrario.


0.95 tn = -0.5 tn. t0.95 (n-1) = - t0.05(n-1)

13
2. Similar a la distribución ji – cuadrado también se da el caso,dado un valor calcular el área o
probabilidad a la derecha o izquierda y dado dos valores calcular el área comprendido entre ellos,
lo cual implica hallar el percentil correspondiente.

Ejemplo 3:

Hallar:

3.1.- P (t  1,36) si t  t (11)


3.2.- P (t  1,72) si t  t (20)
3.3.- P (t 1,35) si t  t (13)
3.4.- P (t  2,65) si t  t (13)
3.5. - P (0.53  t  1,43)    (5)
3.6. - P (-1.17  t  0.694)    (13)
Dada el percentil hallar el número t (n), en el número tal que la probabilidad de que una variable
que siga la distribución , con n grados de libertad sea mayor que el es igual, es decir: un
numero mínimo tal que a su derecha se ubique un área igual a  (área es probabilidad).

Pt  t =
(n)  área a la derecha

 (n)

Ejemplo 4:
t0.05(15) es un valor de t que deja a la derecha el 0.05 de área (5% probabilidad o área).

R: t 0.05(15) = 1.75

Hallar:

4.1. t 0.90(15) = -1,341


4.2. t 0.05(12) = 1.782
4.3. t 0.975(13) = -2,16

8.-Distribución F.

14
Esta distribución fue elaborada por R.A. Fisher a comienzos de 1920 y perfeccionada por
Snedecor, por eso muchos libros se habla de la F de Snedecor.
La aplicación más importante de este estadístico, es la prueba de igualdad de varianzas, y su
utilización en el análisis de varianza para determinar la variabilidad total (prueba de igualdad de
medias en un conjunto de más de dos medias), es su principal utilidad.

Se sabe que si X1......Xn son variables normales e independientes media  y varianza 2(siendo
de la misma población) entonces:

n
 Xi    2
U =  
i 1  

2
1 n
Como S2 =   Xi  
n i 1

X  
2
nS2 = i
i 1

Dividiendo por 2 ambos miembros se obtienen:


n
ns =  (Xi – )2
2

2 i=1 2

n
ns = 2
 (Xi – )2
2 i=1 2

nS2 es otra expresión para U


2

nS2 = U 2 (n-1), g.1 ya que se estimó 2 por S2


2

En todo caso, dado dos variables U  2 (m), y V2 (n), independientes se define la variable:

W = U/m
V/n

Que es una variable que sigue la distribución F de Snedecor con m y n g.l. (parámetros) es decir,
el cociente de dos variables 2 independientes, divididos por sus respectivos gl. Una razón de dos
varianzas.

La función de densidad es:

15
(m+n-2) W(m-2)
(W) = 2 (m/n) m/2 2 para W0
(m-2) (n-2) (1+mW) m+n/2

2 2 n

F(m1,n)

Ejemplo 5:

Hallar:

5.1 P(W  9.84) W  F(12.5)


5.2. P (W  3.81) W  F (30.6)
5.3. P (W  3.09) W  F (6.11)
5.4. P (1.03  W  2.04) W  F (24.12)

P (2.69  W  4.01)

De manera similar que las dos distribuciones anteriores; dado el área, hallar el número (percentil)
F  (m, n) PF  F(m, n) = 

F 0,05 (8,6) PF  F(8,6) = 0.05

F 0,01 (10,2) F 0,05 (10,20)

También se puede hallar a través de la equivalencia:

F(1,-) (m, n) = ___1___


F (n, m)

16
F(1-/2) (m,n) F/2 (m,n)

Por ejemplo:

F 0.95 (3,4) = _____1_____


F 0.05 (4,3)

17