Sei sulla pagina 1di 35

DISTRIBUCIÓN

NORMAL
VARIABLE ALEATORIA: Clasificación

Variables aleatorias discretas Variables aleatorias continuas

Función Cuantía Función de densidad

Función de distribución
Distribuciones continuas de probabilidad
La distribución normal
También conocida como campana de Gauss en
honor al matemático Karl Gauss ( siglo 19).
Es importante por:
Es muy aplicable para inferencia estadística
Se ajusta (casi) a las distribuciones de frecuencias
reales observadas.
Se utiliza para describir el comportamiento de una variable
continua.
(a) Características
1. Tiene un sólo pico (unimodal). Forma acampanada.
2. La media cae en el centro
3. La media, media y moda coinciden
4. Es asintótica al eje horizontal
Media
Mediana
Moda

La distribución normal de
probabilidad es simétrica con
respecto a una línea vertical que
pase por la media

El extremo izquierdo se extiende de


manera indefinida y nunca toca el
El extremo derecho se extiende
eje horizontal
de manera indefinida y nunca
toca el eje horizontal
b) Fórmula

La función de densidad: f(x), para la distribución


normal tiene la siguiente formula:
2
 x 
1 1  
2 
f (x)  e 

2
donde:
e : constante matemática: 2.71828
 :constante matemática: 3.14159
 : media de la población
 : desviación estándar de la población
x : cualquier valor de la variable
aleatoria continua
Areas debajo de la curva normal

No importa cuales son los valores de  y , para


una distribución de probabilidad normal el área total
bajo la curva es 1.00, de manera que podemos
pensar en áreas bajo la curva como si fuesen
probabilidades. Matemáticamente es verdad que:
1: Aproximadamente 68% de todos los valores de
una población normalmente distribuida se
encuentra datos 1 desviación estándar de la
media .



  
    
 

68% datos
2: Aproximadamente 95.5% de todos los valores
de una población normalmente distribuida se
encuentra datos 2 desviación estándar de la
media.

   2
 
   2 
 

94.6% datos
3: Aproximadamente 99.7% de todos los valores de
una población normalmente distribuida se
encuentra datos 3 desviación estándar de la
media

  3     3 

   

99% datos
La distribución normal estándar (Z)

La distribución normal tiene diferente  y  para calcular


probabilidades habría que integrar la función de densidad.
Por este motivo se estandariza la variable.
La estandarización es un proceso estadístico que consiste
en restar la media a la variable y el resultado dividirlo por
la desviación estándar.
x
Z

Distribución
normal estándar

  50
 1
La tabla de distribución normal estándar, es la siguiente:

z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08


0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714
: : : : : : : : : :
: : : : : : : : : :
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810
1.2 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162
:
:
2.4
2.5
:

Cuando Z=1.27 entonces el área vale: ......


Ejercicio:
Un terapista físico piensa que
los puntajes en una prueba de
destreza manual tiene una
  2.5
distribución aproximadamente
normal, con una media de 10
y una desviación estándar de
2,5. Si a un individuo, elegido
    
 10  15  
aleatoriamente, se le aplica el
examen, ¿cuál es la probabi-
lidad de que logre un puntaje
de 15 o mas puntos?.
Obtenemos la siguiente información:

     2.5   2.5
x 15  10
Calculando Z: z  2
 2.5



  
 
 


  10 15
Para Z=2, buscamos en la tabla cual es la
probabilidad (o área) que le corresponde:
Área = .4772
Como deseamos conocer esta área:   2.5
P( x  15)  0.5  0.4772  0.0228  2.28%

    1015


    
¿Cuál es la probabilidad de que se logre un pontaje entre 11 y 14?

Calculando Z:

11  10
Cuando x  11  z   0.4  A  0.1554
2.5
14  10
Cuando x  14  z   1.6  A  0.4452
2.5
     1114
  

El área sombreada se encuentra restando del área mayor (0.4452) el


área menor (0.1554)

P(11  x  14)  0.4452  0.1554  0.2898  28.98%


Aplicaciones
Una empresa aplica un programa de
entrenamiento diseñado para mejorar la
habilidades de supervisión en los diferentes
procesos que se desarrollan en un hospital.
Debido a que el programa es autoadministrado,
los supervisores requieren un número diferente
de horas para concluirlo Un estudio de los
participantes anteriores indica que el tiempo
medio que se lleva completar el programa es de
500 horas y que esta variable aleatoria
normalmente distribuida tiene una desviación
estándar de 100 horas.
Pregunta 1. ¿Cuál es la probabilidad de que un
participante elegido al azar requiera más de 500
horas para completar el programa?

Solución:
En la figura, podemos ver que la
mitad del área bajo la curva está
P(X>500)=0.5
localizada a ambos lados de la
media de 500 horas. Por lo tanto
podemos deducir que la
probabilidad de que la variable
aleatoria tiene un valor mayor a
500 es el área sombreada, es
decir, 0.5.
Pregunta 2:¿Cuál es la probabilidad de que un
supervisor elegido al azar se tome entre 500 y 650
horas para completar el programa de
entrenamiento.
Solución:
La gráfica se muestra la
respuesta como zona
P(500 X 650)=0.4332 sombreada, representada por
el área entre la media (500
horas) y el valor de X, en el
cual estamos interesados
(650 horas). Estandarizando
la variable tenemos un valor
para Z
x
Z

650  500
Z  1.5
100

Si buscamos Z = 1.5 en la tabla, encontraremos


una probabilidad de 0,4332. En consecuencia, la
probabilidad de que un candidato escogido al
azar requiera entre 500 y 650 horas para
terminar el programa de entrenamiento es
ligeramente mayor a 0,4.
Pregunta 3:¿Cuál es la probabilidad de que un
supervisor elegido al azar se tome más de 400 horas
en completar el programa?

Solución:
Estamos interesados en el área a la derecha de 700.

Estandarizamos
x
Z
P(X >700)= 0..0228


700  500
Z 2
100
Tabla: si Z = 2.0  Area: 0.4772

En consecuencia, la probabilidad mayor a 700


será
0,5 - 0,4772 = 0,0228

Por lo tanto hay un poco más de 2 oportunidades


en 100 de que un participante elegido al azar se
lleve más de 700 horas en completar el curso.
Pregunta 4:Suponga que el director del programa
desea saber la probabilidad de que un participante
escogido al azar requiera entre 550 y 650 horas para
completar el trabajo requerido en el programa.
Solución:
Primero calculamos el valor de Z para 650
x
Z

650  500 P(550 X 650)
Z  1.5
100
A este valor le
corresponde un área
de 0,4332
Después calculamos un valor de Z para 550

x
Z

550  500
Z  0.5
100

Correspondiéndole un área de 0,1915


Para responde la pregunta debemos
estar restar las áreas:

Probabilidad de que la variable aleatoria 0,4332


esté entre la media y 650 horas

(-) Probabilidad de que la variable aleatoria


0,1915
esté entre la media y 550 horas

(=) Probabilidad de que la variable aleatoria 0,2417


esté 550 y 650 horas
Así pues, la probabilidad de que un supervisor
elegido al azar se tome entre 550 y 650 horas
para completar el programa de entrenamiento
es un poco menor de 1 entre 4
Ejemplo

Supóngase que la estancia promedio de internación en un


hospital es de 5,5 días con una desviación estándar de 1,8 días. Si
se supone que la duración de la internación se distribuye
normalmente, encuentre la probabilidad de que un paciente
seleccionado al azar de dicho grupo, tenga una duración de
internación :
• de más de 6 días
• entre 4 y 7 días
La distribución t

a) Características
Al igual que la normal, también es simétrica
es algo más plana que la distribución normal
hay una distribución t para cada tamaño de
muestra cuando el tamaño de la muestra es
mayor a 30, la distribución t se asemeja tanto
a la normal que se prefiere utilizar ésta.
CUANDO UTILIZAR Z o t

SI
¿S E CONOCE  ? US A R Z

NO

SI
¿es n  30? US A R Z

NO

US A R t
TABLA DE DISTRIBUCION t DE STUDENT
d.f. t .90 t .95 t .975 t .99 t .995
d.f. Grados de libertad 1 3.08 6.31 12.7 31.8 63.7

d. f .  n 1
2 1.89 2.92 4.3 6.97 9.92
3 1.64 2.35 3.18 4.54 5.84
Ejemplo:
:
n= 28 N.C. = 95%
:
t=?
:
:
d.f. = 28 - 1 = 27
26 1.32 1.71 2.06 2.48 2.78
t = 2,0518
27 2.31 1.7 2.05 2.47 2.77
28 1.31 1.7 2.05 2.47 2.76
:
:
:
b) Fórmula
x
t
s
n
c) Grados de libertad
Se definen como el número de valores que
podemos escoger libremente.
La distribución Ji-Cuadrada

a) Características

Es una distribución asimétrica a la izquierda


Sólo considera valores positivos

b) Definición

La distribución Ji-cuadrada
n esta definida por
 2   Z i2
i 1
c) Aplicaciones

Las aplicaciones más importantes están en


la prueba de bondad de ajuste la prueba de
independencia estadística

d) Distribución
La Distribución F
Características
Es una distribución asimétrica a la derecha
Sólo tiene valores positivos
Se utiliza para comparar variancias de dos
poblaciones, con distribución normal
Fórmula

2
S mayor
F 2
S menor
11-3

• Existe una “familia” de distribuciones F.


• Cada miembro de la familia está determinado por
dos parámetros: los grados de libertad (gl) en el
numerador y los grados de libertad en el
denominador.
• El valor de F no puede ser negativo y es una
distribución continua.
• La distribución F tiene sesgo positivo.
• Sus valores varían de 0 a  . Con forme
F   la curva se aproxima al eje X.

Potrebbero piacerti anche