Sei sulla pagina 1di 11

ESTADÍSTICA GENERAL

DISTRIBUCION NORMAL
La distribución continua de mayor uso entre las distribuciones de probabilidad es la
distribución normal. Gran parte de las variables que se encuentran en los estudios de
ciencias y físicas, naturalezas o sociales siguen este tipo de distribución. Por ejemplo
talla, peso edad, ingresos anuales por familia. Temperatura, precipitaciones pluvial,
mediciones taxonómicas, altura de una planta, calificaciones en pruebas de aptitud,
errores de instrumentación, etc.
El origen de la distribución normal se encuentra en el estudio de los errores
experimentales.
Las propiedades matemáticas y el desarrollo teórico de esta distribución se deben a
Laplace, Moivre y Gauss.
CARACTERÍSTICAS:
o La curva normal tiene forma de campana
y un solo pico en el centro de la
distribución. De esta manera, la media
aritmética, la mediana y la moda de la
distribución son iguales y se localizan en el
pico. Así, la mitad del área bajo la curva se
encuentra a la derecha de este punto central
y la otra mitad está a la izquierda de dicho
punto.
o La distribución de probabilidad normal es
simétrica alrededor de su media.
o La curva normal desciende suavemente en
ambas direcciones a partir del valor central.
Es asintótica, lo que quiere decir que la curva
se acerca cada vez más al eje X pero jamás
llega a tocarlo. Es decir, las “colas” de la
curva se extienden de manera indefinida en ambas direcciones.
Para indicar que una variable aleatoria (v.a.) sigue una distribución normal de media 𝜇
y desviación estándar 𝜎 usaremos la expresión: 𝑋~𝑁(𝜇, 𝜎)
DISTRIBUCION GENERAL:
Depende de dos parámetros µ y σ
Se dice que una v.a. X sigue una distribución normal de parámetros 𝜇 𝑦 𝜎, y se escribe
𝑋~𝑁(𝜇, 𝜎), si esta definida ∀𝑥 ∈ 𝑅 y su función de densidad es:
El modelo matemático

El modelo o expresión matemática que representa una función de densidad de


probabilidad se denota mediante el símbolo . Para la distribución normal, se tiene
la siguiente función de probabilidad.

Ing. Brígida De La Cruz Lazo


1
ESTADÍSTICA GENERAL

1 𝟏 𝒙−𝝁 𝟐
𝑒 𝟐 𝝈 )
− (
𝑓(𝑥) =
𝜎√2𝜋
Siendo 𝜇 ∈ 𝑅 𝑦 𝜎 > 0

Donde:

 −∞ < 𝑥 < + ∞
 −∞ < 𝜇 < ∞
 𝜎>0

La función de densidad de la v.a. 𝑋~𝑁(𝜇, 𝜎), tiene un máximo para 𝑥 = 𝜇 y tiene dos
puntos de inflexión, cuya abscisas son 𝑥 = 𝜇 ± 𝜎 cuanto mayor sea el valor de 𝜎 la curva
está más extendida.

𝟏 𝒙−𝝁 𝟐
+∞ +∞ 𝟏 − ( )
La comprobación de que ∫−∞ 𝒇(𝒙)𝒅𝒙 = ∫−∞ 𝝈√𝟐𝝅
𝒆 𝟐 𝝈 𝒅𝒙 = 𝟏

Precisa utilizar integrales dobles y realizar un cambio a coordenadas polares, por no


𝟏

𝟏 𝒙−𝝁 𝟐
𝟐( )
poderse hallar una primitiva de la función 𝝈√𝟐𝝅
𝒆 𝝈

MEDIA Y VARIANZA DE LA DISTRIBUCION NORMAL

La media o la esperanza matemática de la variación aleatoria (v.a.) 𝑋~𝑁(𝜇, 𝜎), es:

+∞ 𝟏 𝒙−𝝁 𝟐
𝟏 − ( )
𝑬(𝑿) = 𝑿 𝒆 𝟐 𝝈 𝒅𝒙 = 𝝁
−∞ 𝝈√𝟐𝝅
𝑳𝑨 𝑴𝑬𝑫𝑰𝑨 = 𝑬(𝑿) = 𝝁

La varianza es:

+∞ 𝟏 𝒙−𝝁 𝟐
𝟏 − ( )
𝑽𝒂𝒓(𝑿) = 𝑿𝟐 𝒆 𝟐 𝝈 𝒅𝒙 − 𝝁𝟐
−∞ 𝝈√𝟐𝝅
= 𝝈𝟐

𝑽𝑨𝑹𝑰𝑨𝑵𝒁𝑨 = 𝑽𝒂𝒓(𝑿) = 𝝈𝟐

Ing. Brígida De La Cruz Lazo


2
ESTADÍSTICA GENERAL

Desviación típica:

𝝈= 𝑽𝒂𝒓(𝑿)

CURTOSIS DE LA DISTRIBUCION NORMAL


o Coeficiente de sesgo de la curtosis de la 𝑁(𝜇, 𝜎)
La simetría de la función de densidad de la distribución normal 𝑁(𝜇, 𝜎) respecto a la 𝑥 =
𝜇, permite asegurar sin necesidad de efectuar los cálculos que 𝜇3 momento de orden 3
respecto de la media, es nulo. En consecuencia, se puede afirmar que el coeficiente de
sesgo de la distribución 𝑁(𝜇, 𝜎) y 𝛾 = 0.
o Coeficiente de curtosis de la 𝑁(𝜇, 𝜎)

Para la normal de media 𝜇 y de desviación típica 𝜎 se calcula


+∞ 𝟏 𝒙−𝝁 𝟐
𝟏 − ( )
𝝁𝟒 = (𝒙 − 𝝁)𝟐 𝒆 𝟐 𝝈 𝒅𝒙 = 𝟑𝝈𝟒
−∞ 𝝈√𝟐𝝅
De donde se obtiene el coeficiente de curtosis de la distribución 𝑁(𝜇, 𝜎) que es 𝛾2 =
𝜇4
𝜎
−3 = 0
4

La distribución 𝑁(𝜇, 𝜎) es la que se toma como patrón para definir el apuntamiento de


las restantes distribuciones que tiene una misma varianza que ella.
DISTRIBUCION NORMAL ESTÁNDAR O TIPIFICADA:
Se observó que no existe una sola distribución de probabilidad normal, sino una “familia”
de ellas. Como sabemos, cada una de las distribuciones puede tener una media (𝜇) o
una desviación estándar distinta (𝜎). Por tanto, el número de distribuciones normales es
ilimitado y sería imposible proporcionar una tabla de probabilidades para cada
combinación de µ y σ.
Para resolver este problema, se utiliza un solo “miembro” de la familia de distribuciones
normales, aquella cuya media es 0 y desviación estándar 1 que es la que se conoce
como distribución estándar normal, de forma que todas las distribuciones normales
pueden convertirse a la estándar, restando la media de cada observación y dividiendo
por la desviación estándar.
Primero, convertiremos la distribución real en una distribución normal estándar
utilizando un valor llamado Z, o estadístico Z que será la distancia entre un valor
seleccionado, designado X, y la media (µ), dividida por la desviación estándar (σ).
𝒙−𝝁
Formalmente, si 𝑋~𝑁(𝜇, 𝜎) , entonces la v.a. 𝒛 = se distribuye según una normal de
𝝈
media 0 y desviación estándar 1, i.e.: Z ∼ N(0,1) , que es la distribución llamada normal
estándar o tipificada.
Calculo de la probabilidad de que una variable 𝑋~𝑁(𝜇, 𝜎) pertenezca aun intervalo.
La probabilidad de que una variable 𝑋~𝑁(𝜇, 𝜎) pertenezca a un intervalo (a,b) es

Ing. Brígida De La Cruz Lazo


3
ESTADÍSTICA GENERAL

𝟏 𝒙−𝝁 𝟐
𝒃 𝒃 𝟏 − ( )
𝑃(𝑎 < 𝑥 < 𝑏) = ∫𝒂 𝒇(𝒙)𝒅𝒙 = ∫𝒂 𝝈√𝟐𝝅
𝒆 𝟐 𝝈 𝒅𝒙

Efectuando el cambio de variable:


𝒙−𝝁 𝟏 𝒙−𝝁 𝒃−𝝁
= 𝒛 → 𝒅𝒙 = 𝒅𝒛, 𝒔𝒊 = 𝒛𝒂 𝒚 = 𝒛𝒃
𝝈 𝝈 𝝈 𝝈
Se tiene que
𝒃 𝟏 𝒙−𝝁 𝟐 𝒛𝒃
𝟏 − ( ) 𝟏 𝟏 𝟐
(𝒛)
𝑃(𝑎 < 𝑥 < 𝑏) = 𝒆 𝟐 𝝈 𝒅𝒙 = 𝒆 −𝟐 𝒅𝒛
𝒂 𝝈√𝟐𝝅 𝒛𝒂 √𝟐𝝅
Este cálculo requiere utilizar métodos de integración numérica por no poder hallar una
primitiva de la función de densidad de la distribución normal.
𝑿−𝝁
Realizar el cambio 𝑧 = , es decir centrar la variable X o restar su media, reducirla,
𝝈
dividiendo por su desviación típica es tipificar la variable X.
Los cálculos de probabilidad para todas las variables normales 𝑋~𝑁(𝜇, 𝜎) se puede
reducir, tipificando la variable X, a los de una sola utilización la variable centrada y
𝑋−𝜇
reducida 𝑧 = 𝜎 . La variable Z tiene media cero y desviación típica 1. Se dice que
𝑧~𝑁(0,1) y su función de densidad, que no depende de ningún parámetro
𝟏 𝟏 𝟐
(𝒛)
𝒇(𝒛) = 𝒆 −𝟐 , ∀𝒛 ∈ 𝑹
√𝟐𝝅
La grafica de la función de densidad correspondiente a la N(0,1)

Esta función en simétrica con respecto a la recta x=0. La moda de esta distribución
𝟏
𝟏 (𝒙)𝟐
coincide con la media y es igual a 0. La función 𝒇(𝒙) = 𝒆 −𝟐 tiene su máximo para
√𝟐𝝅
x=0.

Ing. Brígida De La Cruz Lazo


4
ESTADÍSTICA GENERAL

𝟏
𝒛 𝟏 (𝒕)𝟐
La función de distribución correspondiente es 𝐹(𝑧) = ∫−∞ 𝒆 −𝟐 𝒅𝒕 y la gráfica
√𝟐𝝅
proporcionada por statgraphics se representa a continuación.

Esta función se obtiene integrando numéricamente la función de densidad de 𝑍~𝑁(0,1)


por la simetría de la función de densidad, se sabe que:
𝟎
𝟏 𝟏 𝟐
(𝒕)
𝐹(0) = 𝒆 −𝟐 𝒅𝒕 = 𝟎, 𝟓
−∞ √𝟐𝝅

Y también que:
𝑃(𝑍 ≤ −𝑐) = 𝑃(𝑍 ≥ 𝐶)∀𝑐 ∈ 𝑅 + ↔ 𝐹(−𝑐) = 1 − 𝐹(𝑐)
El resultado del cálculo numérico de la integral
𝒛
𝟏 𝟏 𝟐
(𝒕)
𝐹(𝑍) = 𝒆−𝟐 𝒅𝒕
−∞ √𝟐𝝅

Ejemplos:
Supongamos ahora que X ∼ N(100,16) .

a) ¿Cuál es la probabilidad de que la variable X tome un valor entre 100 y 115?


100 − 100 X − μ 115 − 100
P(100 < x < 115) = P ( < < ) = P(0 < Z < 0.9375)
16 σ 16
𝑃(𝑍 < 0.94) − 𝑃(𝑍 < 0) = 0.8264 − 0.5000 = 0.3264

b) ¿Cuál es la probabilidad de que X tome un valor mayor de 90?


X − μ 90 − 100
P(X > 90) = P ( > ) = P(Z > −0.63)
σ 16
P(Z < −0.63) = 1 − 0.2643 = 0.7357
c) Para una variable aleatoria X que sigue una distribución normal N(µ=30, σ=2) calcular
las probabilidades:
𝑃(𝑋 < 34), 𝑃(𝑋 > 32), 𝑃(𝑋 ≤ 26), 𝑃(28 < 𝑋 ≤ 34), 𝑃(26 < 𝑋 < 29)
34−30
 𝑃(𝑋 < 34) = 𝑃 (𝑍 < 2
) = 𝑃(𝑍 < 2) = 0,9772
32−30
 𝑃(𝑋 > 32) = 𝑃 (𝑍 < ) = 𝑃(𝑍 > 1) = 1 − 𝑃(𝑍 ≤ 1) = 1 − 0.8413 = 0,1587
2

Ing. Brígida De La Cruz Lazo


5
ESTADÍSTICA GENERAL

26−30
 𝑃(𝑋 ≤ 26) = 𝑃 (𝑍 < 2
) = 𝑃(𝑍 ≥ −2) = 𝑃(𝑍 ≥ 2) = 1 − 0.9772 = 0,0228
28−30 34−30
 𝑃(28 < 𝑋 ≤ 34) = 𝑃( 2 <𝑍≤ 2
) = 𝑃(−1 < 𝑍 ≤ 2)

= 𝑃(𝑍 ≤ 2) − 𝑃(𝑍 ≤ −1) = 0.9772 − (1 − 0.8413) = 0.8185


26−30 29−30
 𝑃(26 < 𝑋 < 29) = 𝑃 ( 2
<𝑍< 2
) = 𝑃(−2 < 𝑍 < 0.5)

= 𝐹(0.5) − (1 − 𝐹(2) = 0.6915 − (1 − 0.9772) = 0.6687

LA DISTRIBUCIÓN NORMAL Y LA TEORIA DE ERRORES DE VARIABLES


CONTINUAS
Todos hemos comprobado que realizar varias mediciones de una variable continua,
como puede ser medir una longitud, la tensión eléctrica o realizar una pesada, los
resultados presenta variabilidad. Se puede decir que al realizar esas mediciones los
resultados vienen afectados de errores aleatorios. Además, si se repite la misma medida
muchas veces cuidadosamente, los errores aleatorios pequeños serán más probable
que los errores muy grande, de tal modo que si e representara el histograma de las
mediciones se obtendría un rectángulo central de frecuencia máxima y a ambos lados
rectángulos de menor frecuencia que formarían una figura con forma de campana, pues
tan probables serán los errores por defecto como por exceso.
Gauss ajusto una función del tipo
−(𝒙−𝝁)𝟐
𝟏
𝒇(𝒙) = 𝒌𝒆 𝟐𝝈𝟐 dx=1 → 𝒌 =
𝝈√𝟐𝝅

Se tiene así función densidad de la distribución normal de media µ y desviación


típica σ

𝟏 −(𝒙−𝝁)𝟐
𝒇(𝒙) = 𝒆 𝟐𝝈𝟐
𝝈√𝟐𝝅

Distribuciones parámetros 𝒇(𝒙) Media varianza


U(a,b) a,b 𝟏 𝒂+𝒃 (𝒃 − 𝒂)𝟐
Uniforme en 𝒇(𝒙) = 𝝁= 𝝈𝟐 =
𝒃−𝒂 𝟐 𝟏𝟐
(a,b) 𝒔𝒊 𝒙 ∈ (𝒂, 𝒃)
𝒐 𝒔𝒊 𝒙∄(𝒂, 𝒃)
N(µ,σ), normal µ,σ 𝟏 − (
𝟏 𝒙−𝝁 𝟐
) 𝝁 𝝈𝟐
o de Laplace- 𝝈>𝟎 𝒇(𝒙) = 𝒆 𝟐 𝝈
𝝈√𝟐𝝅
gauss
Normal 𝟏 𝟏 𝟐
(𝒛) 𝟎 𝝈𝟐 = 𝟏
𝒇(𝒛) = 𝒆−𝟐
tipificada ____ √𝟐𝝅
𝒁~𝑵(𝟎, 𝟏)

Ing. Brígida De La Cruz Lazo


6
ESTADÍSTICA GENERAL

ÁREAS BAJO LA CURVA NORMAL


Independiente de los valore de µ y σ para una distribución normal, el área total que esta
debajo de la curva es 1.00, por lo que estas áreas o porciones de ellas representan
probabilidades. Matemáticamente se ha demostrado que:
Aproximadamente 68% de todos los valores de una población normalmente distribuida
se encuentra dentro de +/- 1 desviación estándar respecto a la media.
Aproximadamente 95.5% de todos los valores de una población normalmente distribuida
se encuentra dentro de +/- 2 desviaciones estándar respecto a la media.
Aproximadamente 97.7% de todos los valores de una población normalmente distribuida
se encuentra dentro de +/- 3 desviaciones estándar respecto a la media.
Estas tres afirmaciones se observan con detalle en la siguiente figura.

En la distribución normal evaluaremos porciones de áreas bajo cualquier curva normal.


Para ello emplearemos la Tabla de la Distribución Normal Estándar.
Manejo de tablas
La tabla anexa representa las probabilidades o áreas bajo la curva normal calculadas
hasta los valores particulares de interés (Transformados). Al observar la tabla se
observa que todos los valores deben registrarse primero con hasta dos lugares
decimales. Por ejemplo, para leer el área de probabilidad bajo la curva hasta, podemos
recorrer hacia abajo la columna Z de la tabla hasta que ubiquemos el valor de interés
(en décimas). Así pues, nos detenemos en la fila. A continuación, leemos esta fila hasta
que intersecamos la columna que contiene el lugar de centésimas del valor ( ). Por

Ing. Brígida De La Cruz Lazo


7
ESTADÍSTICA GENERAL

tanto, en el cuerpo de la tabla, la probabilidad tabulada para z=1.57 corresponde a la


intersección de la fila z=1.5 con la columna z=0.07 y es 0.9418.
Uso de la Tabla de la Distribución Normal Estándar.
En la tabla que hemos suministrado en el Blog se muestra el área bajo la curva normal
y cualquier valor de la variable aleatoriamente distribuida. En la tabla se entra con el
𝒙−𝝁
valor de z. El valor de z se consigue por la siguiente formula: 𝒛 =
𝝈

En la que:
x = valor de la variable aleatoria que nos interesa.
µ = media de la distribución de la variable aleatoria.
σ = desviación estándar de la distribución.
z = número de desviaciones estándar que hay desde x a la media de la distribución.
La tabla está estructurada en base a unidades estándar, mostrando únicamente la mitad
del área bajo la curva normal.
Veremos 4 casos de buscar valores de Probabilidad en la tabla (P) si ya previamente
hemos calculado z con la formula anterior esto será en función del número de cifras de
Caso 1: z es un número entero. Por lo que se observa en la tabla los únicos valores de
z que son números enteros son 1, 2 y 3, que se observan en la 1ra columna. Asumiendo
en este caso que z nos dio 1.
Así:
z = 1 buscado en la tabla z = 1.0 columna 0 tendremos que P = 0.3413

Es decir que si z es un numero entero se busca P siempre en la columna 0.


Caso 2: z tiene una cifra decimal. En este caso se busca el valor de z de una cifra
decimal en la 1ra columna. Analicemos que ya conocemos a z y esta tiene una cifra
decimal como por ejemplo 0.8
Así
z = 0.8 buscado en tabla z = 0.8 columna o P = 0.2881

Ing. Brígida De La Cruz Lazo


8
ESTADÍSTICA GENERAL

Observamos que para un numero con una cifra decimal se busca el valor de P en la
columna 0
Caso 3. Z tiene 2 cifras decimales. En este caso se busca el valor de z con su parte
entera y la 1ra cifra de este en la 1ra columna y luego la 2da cifra decimal se localiza en
la columna que tenga esta misma cifra, dónde coincidan la fila y columna de ambas
estará el valor de P buscado.
Así por ejemplo z es 0.75 lo buscamos como z = 0.7 y la columna 0.05 y en la
intercepción de ambas estará el valor de P buscado:

P = 0.0.2734
Observamos que par 2 cifras decimales lo buscamos en la columna que tiene el mismo
valor de la 2da cifra decimal.
Caso 4. Z tiene más de 2 cifras decimales. En este caso se redondean las cifras
decimales a solo 2 cifras y se trata como el caso 3.
Veamos por ejemplo z= 1.40447
Eliminamos una cifra decimal y tendremos z = 1.4045
Eliminando otra cifra decimal z = 1.405
y eliminando la otra para dejar solo dos cifras decimales z = 1.41
Con este valor vamos a las tablas y determinamos P

Explicación generalizada del problema:

Ing. Brígida De La Cruz Lazo


9
ESTADÍSTICA GENERAL

Así P = 0.4207 en este caso.cimales que tiene z:


Ejercicio de aplicación múltiple para distribución Normal
Una empresa de adiestramiento para gerentes está implementando un programa de
capacitación para directores departamentales que es auto aplicable, por lo que cada
participante puede tomar un número diferente de horas en concluirlo. La aplicación de
este programa en empresas similares ha arrojado que cada participante tarda un
promedio de 500 horas con una desviación estándar de 103 horas.
Se trata de un problema de distribución normal pues se observa como datos el número
promedio y la desviación estándar esto adicional de que estamos trabajando con una
variable continúa como son las horas.
Pregunta 1. ¿Cuál es la probabilidad de que un candidato tarde más de 500 horas en
terminar el programa de capacitación?
Solución: Resulta conveniente esquematizar los datos del problema, para tener una
mejor visualización de este así:

Se observa que el área sombrada es la que es mayor a 500 Horas, que es la 1/2 del
área debajo del gráfico. Así que la probabilidad será de 1/2 o bien el 50%.
P(más de 500Hrs) = 0.5

Ing. Brígida De La Cruz Lazo


10
ESTADÍSTICA GENERAL

Pregunta 2. ¿Cuál es la probabilidad de que un candidato escogido al azar tarde entre


500 y 650 horas en terminar el programa auto-aplicable?
Solución: Sombreamos lo que se nos piden el esquema de la curva así:

UTILIZANDO LA ECUACION:

Buscamos ahora en la tabla de la Distribución Normal Estándar. Con z = 1.4 en la


columna 0.06
P = 0.4279

Ing. Brígida De La Cruz Lazo


11

Potrebbero piacerti anche