Sei sulla pagina 1di 13

DISTRIBUCIÓN NORMAL O GAUSSIANA

La distribución normal es la más importante en toda la probabilidad y estadística. Muchas


poblaciones numéricas tienen distribuciones que pueden ser representadas muy fielmente por
una curva normal apropiada a medida que los datos sean muy numerosos

En 1733, Abraham DeMoivre desarrolló la ecuación matemática de la curva normal, la cual


sento las bases sobre las que descansa gran parte de la teoría de la estadística inductiva,
cómo forma límite de la función de probabilidad condicional, desafortunadamente su trabajo se
perdió en mucho tiempo; Después la estudió Laplace. La distribución normal a menudo se
denomina distribución gaussiana en honor de Karl Friedrich Gauss (1777-1855), quien
independientemente también derivo su ecuación a partir de un estudio de errores en
mediciones repetidas de la misma cantidad.

FUNCIÓN DE DENSIDAD

Por definición, se dice que una variable aleatoria continua X sigue una distribución normal de
media μ y desviación típica σ si su función de densidad es:

Es claro que la probabilidad de que X tome un valor entre x1 y x2 puede calcularse por:

VALOR ESPERADO E(X)

Y desarrollando la integral,
VARIANZA VAR(X)

Integrando ahora por partes, y tomando como:


𝑧2

𝑢 = 𝑧, 𝑑𝑣 = 𝑧𝑒 2 𝑑𝑧
𝑧2

𝑑𝑢 = 𝑑𝑧 𝑣 = 𝑒 2

ESTANDARIZACIÓN

La dificultad de integración de las ecuaciones para calcular probabilidades de una distribución


hace que sea sumamente útil presentar las áreas bajo la curva normal en forma tabular. Para
no tener que presentar estas tablas para todos los posibles valores de μ y σ se define la
variable normal tipificada Z a partir de una transformación lineal de la variable original X de la
forma

donde Z se considera una variable aleatoria normal con μ=0 y σ=1.

GRÁFICA

Las gráficas de esta distribución tienen forma de campana como sigue lo siguiente:
Los grandes valores de σ producen gráficas que están bastante extendidas en torno a μ, en
tanto que los valores pequeños de σ dan gráficas con una alta cresta sobre μ y la mayor parte
del área bajo de la gráfica bastante cerca
de μ. Así pues, una σ grande implica que se puede observar muy bien un valor de X alejado de
μ, en tanto que dicho valor es bastante improbable cuando σ es pequeña.

Puntos de inflexión en μ± σ.
Se extiende sin límite tanto en la dirección positiva como negativa Es asintótica al eje de las
abscisas, simétrica con respecto a la media donde coinciden la mediana y la moda

IMPORTANCIA
Es de gran uso en:
 errores de medición en experimentos científicos,
 mediciones antropométricas en fósiles,
 tiempos de reacción en experimentos psicológicos,
 mediciones de inteligencia y aptitud,
 calificaciones en varios exámenes y numerosas medidas e indicadores económicos.
Incluso cuando la distribución subyacente es discreta, la curva normal a menudo
da una excelente aproximación. Además, aun cuando las variables individuales no estén

EJEMPLO

El tiempo promedio que los estudiantes demoran en llegar a la universidad es de 35 minutos


con una desviación típica de 10 minutos.
µ= 35 minutos. σ= 10 minutos
a) ¿Qué porcentaje de los estudiantes llega entre 35 y 50 minutos?
Solución:
50 − 35
𝑍= = 1,5
10
Observando en la tabla:

x=0,4332, entonces el 43,32% llegan en ese intervalo de tiempo.

b) ¿Qué porcentaje llega entre 18 y 40 minutos?


Solución:
18 − 35
𝑍1 = = −1.7
10
41 − 35
𝑍1 = = 0.6
10
En la tabla 2 : Z(1,7)= 0,4554. Z(0,6)= 0,2257.

En la tabla 1: Z(-1,7)= 0,0446 Z(0,6)= 0,7257.

¿Valores distintos?

A los valores negativos 0,5-x →→ 0,5-0,0446=0,4554


A los valores positivos x-0,5 →→ 0,7257-0,5=0,2257
Respuesta: 0,4552+0,2257=0,6809=68,9% de los estudiantes llegan en ese intervalo de
tiempo.
DISTRIBUCIÓN DE PARETO

La distribución de Pareto fue introducida por el ingeniero civil, economista y sociólogo italiano
Vilfredo Pareto (1848- 1923) como un modelo para explicar la distribución de las rentas de los
individuos de una población, siempre y cuando se partiera de dos supuestos, la existencia de
un umbral inferior (xm) de forma que no haya rentas inferiores a dicho umbral y el decrecimiento
de manera potencial del porcentaje de individuos con una renta superior o igual a un cierto
valor de renta a medida que dicho valor de renta crece. El uso de esta distribución se ha ido
ampliando a diferentes ámbitos de estudio. Se trata de una distribución biparamétrica, con
parámetros de forma () y de situación (xm). El parámetro xm es un indicador de posición (valor
mínimo) que, en términos económicos, puede interpretarse como el ingreso mínimo de la
población. El parámetro  está asociado con la dispersión, donde a mayor valor se obtienen
densidades de Pareto más concentradas en las proximidades de xm, es decir, menos dispersas.

La distribución Pareto es una distribución de probabilidad continua con dos parámetros, que
tiene aplicación en disciplinas como la sociología, geofísica y economía. En algunas disciplinas
a veces se refieren a la ley de Bradford. Por otro lado, el equivalente discreto de la distribución
Pareto es la distribución zeta (la ley de Zipf).

Por ejemplo, en la hidrología, se utiliza la distribución de Pareto para analizar variables


aleatorias como valores máximos de la precipitación y la descarga de ríos, y además para
describir épocas de sequía.

PROBABILIDAD ACUMULADA

Si X pertenece al dominio de la variable de la distribución de Pareto, entonces la probabilidad


de que X sea mayor que un número x viene dada por:

𝑥𝑚 𝛼
( ) , 𝑠𝑖 𝑥 ≥ 𝑥𝑚
𝑃𝑟(𝑋 > 𝑥) = { 𝑥
1, 𝑠𝑖 𝑥 < 𝑥𝑚

donde xm es el valor mínimo posible (positivo) de X, y α es un parámetro. La familia de las


distribuciones de Pareto se parametrizan por dos cantidades, xm y α. Cuando esta distribución
es usada en un modelo sobre la distribución de riqueza, el parámetro α es conocido
como índice de Pareto.

FUNCIÓN DE DENSIDAD

A partir de la probabilidad acumulada, se puede deducir mediante una derivada que la función
de densidad de probabilidad es:
𝛼
𝑥𝑚
𝑓𝑋(𝑥) = { 𝑥 𝛼+1 ,
𝛼 𝑠𝑖 𝑥 > 𝑥𝑚
0, 𝑠𝑖 𝑥 < 𝑥𝑚

VALOR ESPERADO

La media o valor esperado de una variable aleatoria X, que sigue una distribución de Pareto con
parámetro α > 1 es
𝛼𝑥𝑚
𝐸(𝑋) =
𝛼−1

(si α ≤ 1, el valor esperado no existe).

VARIANZA

La varianza es

𝑥𝑚 2 𝛼
𝑣𝑎𝑟(𝑋) = ( )
𝛼−1 𝛼−2

(Si α ≤ 2, la varianza no existe).

COEFICIENTE DE VARIABILIDAD

2 𝛼 𝑥𝑚 𝛼
√( 𝑥𝑚 ) √
√𝑣𝑎𝑟(𝑋) 𝛼−1 𝛼−2 𝛼−1 𝛼−2 √𝛼
𝐶𝑉 = → 𝐶𝑉 = 𝛼𝑥𝑚 → 𝐶𝑉 = 𝛼𝑥𝑚 → 𝐶𝑉 =
𝐸(𝑋) 𝛼√𝛼 − 2
𝛼−1 𝛼−1

1
→ 𝐶𝑉 =
√𝛼(𝛼 − 2)

GRÁFICA
Para estas gráficas el parámetro se denomina k. La gráfica asocia lo valores de x (el eje
horizontal) con su densidad de probabilidad.

Gráfica de distribución de probabilidad.

EJEMPLOS

 Las rentas salariales anuales en cierto sector económico (X, en miles de euros) es una
magnitud aleatoria distribuida según un modelo de Pareto con salario mínimo 9 y x m = 2.4.
¿Cuál es el salario esperado en el sector y cuál es la proporción de asalariados que percibe
más de 18000 euros al año?

9 ∗ 2.4
𝐸(𝑋) = = 15.43
2.4 − 1

𝑃(𝑋 > 18) = 1 − 𝑃(𝑋 < 18)


18 (2.4)(9)2.4
𝑃(𝑋 > 18) = 1 − ∫ 𝑑𝑥
9 𝑥 2.4+1

18
468.1588788
𝑃(𝑋 > 18) = 1 − ∫ 𝑑𝑥
9 𝑥 3.4
18
195.0661995
𝑃(𝑋 > 18) = 1 − [− 12 ]
𝑥 ⁄5 9
𝑃(𝑋 > 18) = 1 − 0.8105

𝑃(𝑋 > 18) = 0.1895 = 18.95%

 El ingreso de una determinada población tiene la distribución de Pareto con parámetro 3


y un ingreso mínimo de $1000. Encuentre:

a) La proporción de la población con ingresos entre 1000 y 4000.


b) El ingreso medio.

1000 3
a) 𝑃(𝑋) = 1 − (4000) = 0.9844 = 98.44%

1000∗3
b) 𝐸(𝑋) = 3−1
= 1500

DISTIBUCION DE PROBABILIDAD UNIFORME:

La distribución o modelo uniforme puede considerarse como proveniente de un proceso de


extracción aleatoria. El planteamiento radica en el hecho de que la probabilidad se distribuye
uniformemente a lo largo de un intervalo. Así dada una variable aleatoria continua, x, definida
en el intervalo [a,b] de la recta real, diremos que x tiene una distribución uniforme en el
intervalo [a,b] cuando su función de densidad para:

sea: para x Є [a,b].

La distribución Uniforme es el modelo (absolutamente) continuo más simple. Corresponde al


caso de una variable aleatoria que sólo puede tomar valores comprendidos entre dos
extremos a y b, de manera que todos los intervalos de una misma longitud (dentro de (a, b))
tienen la misma probabilidad. También puede expresarse como el modelo probabilístico
correspondiente a tomar un número al azar dentro de un intervalo (a, b).

.
FUNCION DE DENSIDAD:

De la anterior definición se desprende que la función de densidad debe tomar el mismo valor
para todos los puntos dentro del intervalo (a, b) (y cero fuera del intervalo). Es decir,

Gráficamente:
PROBABILIDAD ACUMULADA

La función de distribución se obtiene integrando la función de densidad y viene dada por:

Gráficamente:

VALOR ESPERADO

En cuanto a las ratios de la distribución tendremos que la media tiene la expresión:


VARIANZA

La varianza tendrá la siguiente expresión:

De donde

Por lo que

Este modelo tiene la característica siguiente:

Si calculamos la probabilidad del suceso

Tendremos:

Este resultado nos lleva a la conclusión de que la probabilidad de cualquier suceso depende
únicamente de la amplitud del intervalo (ΔX), y no de su posición en la recta real [a, b]. Lo que
viene a demostrar el reparto uniforme de la probabilidad a lo largo de todo el campo de
actuación de la variable, lo que, por otra parte, caracteriza al modelo.

COEFICIENTE DE VARIABILIDAD

El coeficiente de variabilidad:

√𝑣𝑎𝑟(𝑋) 𝑏−𝑎
𝐶𝑉 = → 𝐶𝑉 =
𝐸(𝑋) (𝑏 + 𝑎)√3
EJEMPLO

En una cierta fábrica se fabrican cada día una media de 40 mil metros de cable. Unos
días más, otros días menos. Aunque el mínimo seguro que siempre es 30 mil metros.
La variable aleatoria que recoge el número de metros de cable fabricados en un día
sigue una distribución uniforme continua.

Pregunta: ¿Cuál es el máximo de metros fabricados en un día?

Definamos nuestro Experimento Aleatorio:

Experimento Aleatorio: “Analizar los metros de cable fabricados en un día al azar”.

Sea la variable aleatoria continua X: “Metros de cable fabricados ese día”.

Tenemos que esa variable X sigue una distribución uniforme continua donde:

El límite inferior del intervalo es 30’000 metros.

La media es 40’000 metros.

¿Cómo averiguamos el máximo de metros fabricados en un día?, pues reconociendo que


coincide con el límite superior del intervalo.

El límite superior del intervalo es desconocido, pero sabemos que:

Por lo que:

Directamente observamos que b es 50 mil.

El máximo de cable fabricado en un día, según esa distribución, es de 50’000 metros.

Si la pregunta fuese:

¿Qué porcentaje de días se fabrican más de 34 mil metros de cable?

𝑃(𝑋 > 34000)


Pues tendremos que integrar la función de densidad de probabilidad a partir de ese valor, hasta
el infinito.

Recordamos que la función de densidad de probabilidad para una distribución uniforme


continua es el inverso de la diferencia entre los extremos del intervalo.
Obviamente para los valores de la variable que están dentro del intervalo, en otros casos la
densidad de probabilidad es nula.

Entonces, integrarla desde 34’000 hasta el infinito es en realidad integrarla desde 34’000 hasta
el límite superior del intervalo, porque después empieza a valer cero todo el tiempo.

Dado que la constante sale de la integral, nos queda que:

Es decir, que en el 80% de los días se fabrican más de 34’000 metros de cable.

Potrebbero piacerti anche