Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Distribución normal
La distribución continua de probabilidad más importante en todo el campo de la
estadística es la distribución normal. Se ha usado en una gran variedad de aplicaciones
prácticas en las que las variables son altura, peso de una persona, coeficientes de
inteligencia, mediciones científicas, mediciones físicas en áreas tales como los
experimentos meteorológicos, los estudios acerca de las lluvias y las mediciones sobre
partes manufacturadas, etc.
A la distribución normal, frecuentemente, se le llama distribución gaussiana, en honor de
Karl Friedrich Gauss (1777-1855), quien en investigaciones realizadas sobre la naturaleza
de errores experimentales, observó que las discrepancias existentes entre mediciones
repetidas de la misma cantidad física mostraban un sorprendente grado de regularidad;
sus patrones (distribución), como se descubrió, se podían aproximar muy cercanamente
por medio de cierto tipo de curva de distribución continua, que se denomina “curva
normal de errores” y que se atribuye a las leyes de la casualidad.
Se dice que una variable aleatoria X sigue una distribución normal de parámetros µ y σ ,
2
lo que representamos del modo X → n(µ, σ ) . Empleando cálculos bastante laboriosos, puede
2
Características:
• Puede tomar cualquier valor (- ∞, + ∞) .
• Es simétrica con respecto a su eje vertical.
• Es asintótica con respecto a su eje horizontal; esto quiere decir que jamás va a tocar
el eje de las equis.
• Ésta curva alcanza un único máximo (moda) en µ, que es simétrica con respecto al
mismo, y en ese máximo coinciden la media, la mediana y la moda. La mayor parte de
la masa de probabilidad (área comprendida entre la curva y el eje de abcisas) se
encuentra concentrado alrededor de la media, y las ramas de la curva se extienden
asintóticamente a los ejes, de modo que cualquier valor "muy alejado" de la media es
posible (aunque poco probable).
• σ 2 (o
equivalentemente) será el parámetro de dispersión. Cuanto menor sea, mayor
cantidad de masa de probabilidad habrá concentrada alrededor de la media (grafo de f
muy apuntado cerca de µ ) y cuanto mayor sea "más aplastado" será.
TIPIFICACIÓN
La integral anterior nos daría el área bajo la curva de la función, desde a hasta b, que
corresponde o es igual a la probabilidad buscada.
Como es físicamente imposible, e innecesario, construir tablas separadas para todas las
parejas de valores concebibles de µ y σ se ha logrado estandarizar la distribución normal
por un nuevo conjunto de observaciones de una variable aleatoria para una distribución
que tiene µ=0 y σ=1. Si la variable x es N(µ, σ) entonces la variable tipificada x es:
x−µ
z=
σ
n
σ
Donde σx = es el error estándar.
n
Ejemplo
El acero que se utiliza para tuberías de agua a menudo se recubre
internamente con un mortero de cemento para evitar la corrosión. En un
estudio de los recubrimientos de mortero de una tubería empleada en un
proyecto de transmisión de agua en California (Transportation
Engineering Journal, Noviembre de 1979) se especificó un espesor de
7/16 pulgadas para el mortero. Un gran número de mediciones de
espesor dieron una media de 0.635 pulgadas y una desviación estándar
de 0.082 pulgadas. Sí las mediciones de espesor, tenían una distribución
Normal, ¿qué porcentaje aproximado fue inferior a 7/16 de pulgada?
7
− 0.635
Z= 16 = −2.4085 ≈ 2.41
0.082
p(z = -2.41) = 0.492
p(x < 7/16 pulgadas) = 0.5- p(z = -2.41) = 0.5-
0.492 = 0.008
Por tanto, 0.008 x 100% = 0.8% de los recubrimientos de mortero tienen un espesor
menor de 7/16 pulgadas.
Ejemplo
Un tubo fluorescente estándar tiene una duración distribuida
Normalmente, con una media de 7,000 horas y una desviación estándar
de 1,000 horas. Un competidor ha inventado un sistema de iluminación
fluorescente compacto que se puede insertar en los receptáculos de
lámparas incandescentes. El competidor asegura que el nuevo tubo
compacto tiene una duración distribuida Normalmente con una media de
7,500 horas y una desviación estándar de 1,200 horas.
a. ¿Cuál tubo fluorescente tiene mayor probabilidad de tener una
duración mayor de 9,000 horas?
b. ¿Cuál tubo tiene mayor probabilidad de tener una duración de menos
de 5,000 horas?
a) Tubo 1
X1 = variable que nos define la duración en horas de un tubo fluorescente
µ = 7,000 horas
σ = 1,000 horas
Tubo 2
X2 = variable que nos define la duración del tubo fluorescente del competidor
µ = 7,500 horas
σ = 1,200 horas
9000 − 7000
z= = 2.0
1000
p(z1 = 2.00) = 0.4772
p(x1 > 9,000 horas) = 0.5 – p(z1 = 2.00) = 0.5 –
0.4772 = 0.0228
9000 − 7500
z= = 1.25
1200
p(z2 = 1.25) = 0.3944
p(x2 > 9,000 horas) = 0.5 – p(z2 = 1.25) = 0.5 –0.3944 = 0.1056
Por tanto el tubo fluorescente del competidor tiene una probabilidad mayor de durar más
de 9,000 horas.
5000 − 7000
b) z = = −2.0
1000
p(z1 = -2.00) = 0.4772
p(x1 < 5,000 horas) = 0.5 – p(z1 = -2.00) = 0.5 –
0.4772 = 0.0228
5000 − 7500
z= = −2.8
1200
p(z2 = -2.08) = 0.4812
p(x2 < 5,000 horas) = 0.5 – p(z2 = - 2.08) = 0.5 – 0.4812 = 0.0188
Por tanto, el tubo fluorescente que tiene una mayor probabilidad de durar menos de
5,000 horas es el del primer fabricante.
Ejemplo
La distribución de la demanda (en número de unidades por unidad de
tiempo) de un producto a menudo puede aproximarse con una
distribución de probabilidad Normal. Por ejemplo, una compañía de
comunicación por cable ha determinado que el número de interruptores
terminales de botón solicitados diariamente tiene una distribución
Normal, con una media de 200 y una desviación estándar de 50.
a) ¿En qué porcentaje de los días la demanda será de menos de 90
interruptores?
b) ¿En qué porcentaje de los días la demanda estará entre 225 y 275
interruptores?
c)Con base en consideraciones de costos, la compañía ha determinado
que su mejor estrategia consiste en producir una cantidad de
interruptores suficiente para atender plenamente la demanda en 94% de
todos los días. ¿Cuantos interruptores terminales deberá producir la
compañía cada día?
interruptores.
c) En este caso se trata de determinar que valor toma x cuando se pretende cumplir con
el 94% de la demanda de todos los días.
Por tanto despejaremos de la fórmula de z;
x = µ + zσ
x = µ + z(p = 0.44)σ = 200 + z(p = 0.44)(50)
= 200 + (1.55)(50) = 277.5 = 278
interruptores terminales por día
¿cómo se obtiene el valor de z?
En la tabla buscamos la z que corresponde a
una probabilidad de 0.94 y nos damos cuenta
de que no existe un valor exacto de 0.94 por lo
que tomamos los valores de área más
cercanos; luego,
z(p = 0.94394) = 1.50; z(p = 0.94406) = 1.60
Por tanto si interpolamos, encontramos que el valor de z para una probabilidad de
0.944 es de 1.55, y es el valor que se sustituye en la ecuación.
Se puede apreciar en los gráficos anteriores como a medida que aumenta n mejora el
parecido de las gráficas de barras de las distribuciones binomiales (discretas) a la gráfica
de la distribución normal estándar (continua), pero con el inconveniente de que se produce
un desplazamiento hacia la derecha de la distribución binomial a medida que aumenta n.
De hecho, se pueden usar las distribuciones normales para obtener una aproximación de
las probabilidades binomiales cuando n no es un número tan alto y p difiere un poco de ½.
σ
µx =µ y σx = para muestras aleatorias infinitas con media µ y desviación típica σ y n
n
x −µ
z=
σ
n
grande, entonces:
Este teorema es muy importante, puesto que justifica el uso de los métodos de la curva
normal en una gran cantidad de problemas. se utiliza para poblaciones infinitas y para
poblaciones finitas cuando n a pesar de ser grande representa una porción muy pequeña
de la población.
Es difícil señalar con precisión qué tan grande debe ser n de modo que podamos aplicar el
Teorema Central del límite, pero a no ser que la distribución sea muy inusual, por lo
general se considera que n =30 es lo suficientemente alto.