Sei sulla pagina 1di 29

1.

Distribuciones continuas univariadas de probabilidad

1.1. Distribución uniforme continua

Es una de las distribuciones continuas de probabilidad más simples ya que se define en un


intervalo [ a , b ] donde la probabilidad es constante, a y b pueden tomar cualquier valor real.

Diremos que la variable aleatoria continua X tiene una distribución uniforme en [ a , b ], a y b


parámetros, si su función de densidad de probabilidad está dada como sigue:

1
{
f ( x )= b−a
si a≤ x ≤ b
0 en otro caso

Utilizaremos también la notación X U ( a , b ) para decir que X tiene una distribución


uniforme.

La gráfica de densidad de la distribución uniforme continua podemos verla en la figura 1,


donde podemos notar que se forma un rectángulo entre f (x) , x y las rectas verticales a y b, en
el cual medimos el área como probabilidad.

La demostración de que esta función es en realidad una función de densidad de


probabilidad es muy sencilla. Vemos primeramente que f (x ; a ,b)≥ 0 para todo x en [ a , b ].
Además, la integral de la función desde a hasta b da como resultado 1, es decir,
b b
1 1 b
∫ f ( x ) dx=∫ b−a dx= [ x ] =1
b−a a
a a

Figura 1: Función de densidad de una variable aleatoria uniforme


continua.

La función de distribución de una variable aleatoria uniforme continua es:


0 si x <a
F ( x )=
b−a{
x −a
si a ≤ x <b
1 si x ≥b

Este hecho también es fácil de demostrar. Utilizando t como una variable auxiliar en vez de x
en la función de densidad, la función de distribución queda:
x x
1 1
[ t ]t =a= x−a si a ≤ x <b
t =x
F ( x )=P ( X ≤ x ) =∫ f ( t ) dt=∫ dt=
a a b−a b−a b−a

La gráfica de la función de distribución para este modelo es como se muestra en la figura 2,

Fx

a b

Figura 2: Gráfica de la función de distribución de una variable aleatoria uniforme continua

La media y la varianza de la distribución uniforme continua son:

2
a+b ( b−a )
E ( X )= ; Var ( X ) =
2 12

En efecto, la esperanza de una variable aleatoria continua X se define como,



E ( X ) =∫ xf ( x ) dx
−∞

Para este modelo tenemos entonces,

∞ b b
1 1 x2 b2−a2 a+b
E ( X ) =∫ xf ( x ) dx=∫ x ∙
−∞ a
b−a
dx= = [ ]
b−a 2 a 2 ( b−a )
=
2
Lo mismo hacemos para obtener la varianza, pero usando el hecho que la varianza podemos
obtenerla de la siguiente manera,
2
Var ( X )=E ( X 2 )−( E ( X ) )

E ( X ) ya lo obtuvimos, nos faltaría obtener E ( X 2) de la misma manera,

∞ b b
1 1 x3 b3−a3 b 2+ ab+a 2
2

−∞
2
E ( X ) =∫ x f ( x ) dx=∫ x ∙
a
b−a
dx= 2
=
b−a 3 a 3 ( b−a )
=[ ]
3

Y llevando este resultado en la expresión de la varianza tenemos,

b2 + ab+a2 a+b 2 b 2+ ab+a 2 a 2+2 ab+ b2 4 b 2+ 4 ab+ 4 a2−3 a2−6 ab−3 b2 b 2−2 ab+a 2
Var ( X )=
3

2
= ( ) 3

4
=
12
=
12

Con lo que demostramos las expresiones dadas para la media y la varianza.

Por otra parte, la función generadora de momentos de la distribución uniforme continua es:

e tb −e ta
M X ( t )=
t ( b−a )

Es fácil comprobar este resultado por definición de función generadora de momentos,


b tb ta
1 1
[ etx ]a= e −e
b
M X ( t )=E ( e tx ) =∫ e tx dx=
a b−a t ( b−a ) t ( b−a )

Como lo habíamos definido.

Ejemplo 2.1: En las botellas de un detergente líquido se indica que el contenido es de 200
mililitros por botella. En la operación de producción se llenan las botellas uniformemente de
acuerdo con la siguiente función de densidad de probabilidad

1
f ( x )= si191 ≤ x ≤ 209 y f ( x )=0 en otro caso
18

a. ¿Cuál es la probabilidad de que el contenido de una botella esté entre 200 y 207 mililitros?
b. ¿Cuál es la probabilidad de que el contenido de una botella sea 205 mililitros o más?
c. Obtén el promedio de contenido de detergente en las botellas.

Solución: Definamos X como el contenido de detergente de una botella en mililitros.


Entonces,
207
1 1 207 7
a . P (200 ≤ x ≤ 207 )= ∫ dx= [ x ] 200 =
200 18 18 18
209
1 1 209 2
b . P (205 ≤ x ≤ 209 )= ∫ dx= [ x ] 205 =
205 18 18 9
c . El promedio se calcula directamente utilizando la fórmula descrita anteriormente
a+b 191+ 209
E ( X )= = =200
2 2

1.2. Distribución normal

La distribución normal, también conocida como distribución Gaussiana, es una de las


distribuciones continuas más importantes en el campo de la estadística ya que muchos
fenómenos, de casi todos los ámbitos, pueden aproximarse utilizando este modelo. Esta
distribución tiene forma de campana por lo que generalmente se acostumbra llamarlo
campana normal o campana Gaussiana. La distribución normal tiene dos parámetros, la
media y la varianza, que dependiendo de los valores que tomen se obtienen diversas gráficas
lo que lo hace muy flexible para modelar muchos fenómenos aleatorios. En la figura 3
podemos observar distintas gráficas de la función de densidad de la distribución normal
tomando valores diferentes, tanto para la media como para la varianza. Definimos a
continuación de manera formal a la distribución normal.

Diremos que la variable aleatoria continua X tiene una distribución normal con media μ y
varianza σ 2 si la función de densidad de probabilidad puede ser escrita como sigue:
2
− ( x− μ)
1 2σ
2
−∞< x < ∞ ;
f ( x )= e ;
σ √2 π −∞< μ <∞; σ 2 >0

donde E ( X ) =μ y Var ( X )=σ 2, X N ( μ , σ2)

Figura 3: Gráficos de la distribución normal para distintos valores de μ y σ .


La distribución normal cuenta con múltiples propiedades, la primera es que es simétrica con
respecto a su media, es decir tiene su centro en el valor de μ. En segundo lugar, su punto de
inflexión se da en los puntos μ−σ y μ+σ por tanto la grafica es achatada o alargada
dependiendo de los valores que tome σ . Además, la gráfica se extiende indefinidamente hacia
−∞ y + ∞ sin tocar el eje de abscisa.

Para calcular las probabilidades de un modelo normal se utiliza la expresión siguiente:


2
b b − ( x−μ )
1 2σ
2

P ( a ≤ X ≤ b )=∫ f ( x ) dx=∫ e dx
a a σ √2 π

Sin embargo, esta integral es difícil de resolver por lo que recurrimos a una transformación
llamada estandarización de una variable aleatoria. Esta transformación se ajusta a un tipo
especial de distribución normal donde el valor de la media es cero y el valor de la varianza es
uno, o sea, μ=0 y σ 2=1. Cuando se tiene este caso especial la función se llama distribución
normal estándar. Y para todos los cálculos de probabilidades de una variable aleatoria
normal utilizaremos la normal estándar, ya que para esta distribución se tiene una tabla de
valores posibles de la variable estandarizada con las respectivas probabilidades asociadas.

La función generadora de momentos de una variable aleatoria normal de media μ y varianza


σ 2es:

2 2
σ t
μt +
2
M X ( t )=e

El proceso de estandarización se realiza de la siguiente manera:

Se toma una nueva variable aleatoria llamada Z que es de la distribución normal estándar
obtenida de la operación,

Z=( X−μ)/σ

Esta variable aleatoria, como ya mencionamos, tiene una distribución normal estándar
definida de la siguiente forma:

2
−z
1 2
f ( z )= e ;−∞< z < ∞; Z N ( 0 ,1 )
√2 π

En la siguiente figura mostramos el paso de una variable aleatoria X a una variable aleatoria
normal estándar Z.
Figura 4: Traslado de la variable aleatoria X a una normal estándar Z.

La probabilidad, como toda distribución continua, se define como el área encerrada entre la
función, el eje de abscisa y las rectas verticales a y b. Este hecho la observamos en la figura 5

Figura 5: Área bajo la curva de la función de densidad normal estándar.

Esta representación es de manera general. Nosotros utilizaremos la tabla de la normal estándar


cuyos valores de las probabilidades son determinadas desde el centro de la gráfica hasta un
valor especifico de z. Observemos la figura siguiente:
Figura 6: Área de la normal estándar desde z=0 hasta un valor especifico de z, P ( 0 ≤ z ≤ z i )

Debemos notar que la tabla solo nos da valores positivos de z (ver apéndice), sin embargo
como la distribución es simétrica se cumple siempre que P ( 0 ≤ z ≤ z i ) =P (− zi ≤ z ≤ 0 ).
Supongamos que se tiene dos valores -1 y 1, entonces P ( 0 ≤ z ≤1 )=P (−1 ≤ z ≤ 0 )=0,3416.

La función de distribución del modelo normal se obtiene con la siguiente expresión:

2
x −( t− μ)
1 2σ
2

F ( x )=P ( X ≤ x ) =∫ e dt para−∞< x <∞


−∞ σ √2 π

En la figura 7 apreciamos algunos aspectos de la función de distribución acumulativa de la


normal.

Figura 7: Gráficas de la función de distribución del modelo normal para algunos valores de μ

La función de distribución acumulativa de la normal estándar es de amplio uso en la


construcción de modelos estadísticos.

Ejemplo 2.2: Los errores de ciertas observaciones astronómicas siguen una distribución
normal con media 4 u. y una desviación típica de 2 u.

a. Calcula la probabilidad de que en una observación realizada al azar el error observado sea
superior a 4,5 u.
b. ¿Cuál será el valor del error de la observación que deje una probabilidad de 0,90 por
encima de él?

Solución: Sea X el valor del error de observación. Sabemos que X N ( μ=4 , σ 2 =22 ),
a. Necesitamos calcular P ( X > 4,5 ) por lo que estandarizando esta variable obtenemos

4,5−4
(
P ( X > 4,5 )=P Z >
2 )
=P ( Z >0,25 )

Y si graficamos nos quedaría como se muestra en la figura 8. Allí podemos ver que la
probabilidad de que Z sea mayor a 0,25 está pintada en azul oscuro mientras lo que nos da la
tabla de la normal estándar está pintado en un color más claro, por lo que debemos restar de
0,5 el área que obtengamos de la tabla, es decir,

P ( Z >0,25 ) =0,5−0,0987=0,4013

Por tanto, en términos de X queda, P ( X > 4 )=0,4013

Figura 8: Gráfica de la normal estándar para el cálculo de P ( Z >0,25 )

b. Ahora procedemos del paso inverso a lo realizado en el inciso anterior, es decir tenemos el
valor del área y a partir de él calculamos el valor de X .

Sabemos que Z=( X−μ)/σ , entonces X =μ+ Zσ. El valor de Z obtenido de la tabla es −1,28.
Le agregamos el signo negativo porque se encuentra a la izquierda de la media que es cero
justamente. Esto lo vemos en la figura 9.

X =μ+ Zσ=4 + (−1,28 ) 2

X =1,44
Figura 9: Valores de las áreas, el valor de la Z y la X correspondiente

El valor exacto de 0,40 no se encuentra en la tabla, así que escogemos aquel valor que más se
aproxime y extraemos el valor deZ asociado.

1.3. Distribución Gamma

Antes de definir la distribución gamma nos detendremos a conocer algunas propiedades de la


función gamma que nos servirá en los cálculos de probabilidades.

La función gamma se define de la siguiente manera:



Γ ( α )=∫ x α−1 e− x dx , donde α > 0
0

Una de las propiedades importantes de esta función es que para valores enteros de α se
cumple que Γ ( α + 1 )=α Γ ( α ) lo que conduce a Γ ( α )=( α −1 ) !. Otra propiedad es que para
α =1/2 la función gamma toma el valor √ π , o sea Γ ( 1/2 )=√ π.

Ahora procedemos a definir la distribución gamma.

Sea una variable aleatoria continua X , diremos que la variable X tiene una distribución
gamma con parámetros α y β si su función de densidad de probabilidad es:

−x
1

{ α−1 β
f ( x )= Γ ( α ) β α x e si x> 0
0 en otro caso

Esta distribución es muy utilizada ya que proporciona diferentes perfiles que dependen de los
valores de α y β. Algunas de los perfiles podemos observarla en la siguiente figura:
Figura 10: Diferentes perfiles de la distribución gamma para algunos valores de α y β.

La función de distribución de la variable aleatoria gamma se determina como sigue:

0 si x ≤ 0
F ( x )=P ( X ≤ x ) =
{ 1
α∫
Γ (α ) β 0
x −t
t α−1 e β dt si x >0

La media y la varianza para la distribución gamma son:

E ( X ) =αβ Var ( X )=α β 2

Realizaremos la demostración para la media, la demostración para la varianza se puede


realizar de la misma manera.

Utilizando la definición de media para este modelo tenemos,


∞ −x ∞ −x
1 α −1 β 1 α β
E ( X ) =∫ x α
x e dx= α∫
x e dx
0 Γ (α) β Γ ( α) β 0

Realicemos la sustitución u=x /β, luego dx= βdu


∞ ∞
1 β
E ( X )= α∫
( uβ )α e−u βdu= ∫ α −u
u e du
Γ (α ) β 0 Γ (α ) 0

Y por definición de función gamma,

β αβ
E ( X )= Γ ( α + 1 )= Γ ( α)
Γ (α ) Γ (α )
Por lo que concluimos que E ( X ) =αβ

La función generadora de momentos una variable aleatoria gamma se define como:

M X ( t )=( 1−βt )−α

Demostración
∞ −x ∞ x
tx tx 1 α −1 β 1 tx−
β α −1
M X ( t )=E ( e ) =∫ e α
x e dx= α ∫ e x dx
0 Γ (α ) β Γ (α ) β 0


1 ( −1
) x α −1
¿ α∫
e− − t + β x dx
Γ (α) β 0

Hagamos la transformación u=(−t+ β−1) x , luego x=u / ( −t+ β−1 ), por tanto dx=du/ (−t + β−1 )

∞ α −1
1 u du
M X ( t )= α∫
Γ ( α) β 0
e
−u
(
−t + β−1 ) −t + β−1

Pero −t + β−1=(−βt +1)/ β, y llevando esta resultado en la expresión de arriba nos queda,

∞ α−1 ∞
1 uβ βdu 1 1
M X ( t )= α∫
Γ ( α) β 0
e−u
1−βt ( ) = α∫
1−βt Γ ( α ) ( 1−βt ) 0
uα −1 e−u du=
Γ ( α ) ( 1−βt )
α
Γ ( α)

−α
Por lo tanto M X ( t )=( 1−βt )

Ejemplo 2.3: Una máquina industrial requiere para su mantenimiento un cierto tiempo cada
semana. Este tiempo de mantenimiento, en horas, suponemos que tiene una distribución
gamma con parámetros α =3 , β=2.

a. Calcula la probabilidad de que en una semana la maquina industrial requiera más de 5


horas de mantenimiento.
b. Encuentra el tiempo promedio de mantenimiento que requiere la maquina en una semana.

Solución: Consideramos que X es el tiempo requerido por la máquina para su mantenimiento


semanal, entonces

a. La probabilidad de que el tiempo supere 5 horas es,


∞ −x ∞ −x
1 3−1 2 1 2 2
P ( X >5 ) =∫ 3
x e dx= ∫ x e dx
5 Γ (3) 2 16 5

Y realizando la integral por partes correspondiente llegamos al siguiente resultado,


P ( X >5 ) =0,5438

Este resultado lo podemos visualizar en la figura 11 que muestra el área correspondiente a la


probabilidad de que X sea mayor a 5 horas.

b. El tiempo promedio de mantenimiento de la máquina en una semana es,

E ( X ) =αβ=3 ∙ 2=6 horas semanales en promedio para el mantenimiento

Figura 11: Distribución gamma con α =3 , β=2 y P ( X >5 )

1.4. Distribución exponencial

La distribución exponencial es una caso particular de la distribución gamma en donde α =1.

Por lo tanto la función de densidad de probabilidad para este modelo es:

−x
1 β
{
f ( x )= β e para x >0
0 en otro caso

En la siguiente figura se muestra algunos perfiles de la distribución exponencial,


Figura 12: Perfiles de la distribución exponencial para algunos valores de β .

La función de distribución para una variable exponencial es:

0 para x ≤ 0
F ( x )=P ( X ≤ x ) =
{
1−e
−x
β
para x >0
Por otro lado, la media y la varianza
de la distribución exponencial las
deducimos de las expresiones dadas en la distribución gamma, dándole valor 1 a α es decir

E ( X ) =αβ=1 ∙ β=β , y Var ( X )=α β 2=1 ∙ β2 =β 2

En resumen, para una variable aleatoria exponencial,

E ( X ) =β Var ( X )=β 2

La función generadora de momentos de una variable exponencial es:

M X ( t )=( 1−βt )−1

Que obtenemos directamente si tomamos α =1 en la función generadora de momentos de la


distribución gamma.

Existe una relación muy importante entre la distribución exponencial y la distribución


de Poisson. Si X es una variable aleatoria de Poisson con parámetro λ, entonces el
tiempo de llegada que transcurre entre dos éxitos que son consecutivos la podemos
modelar mediante una distribución exponencial con β=1/ λ.
Ejemplo 2.4: Supongamos que una variable aleatoria X tiene una distribución exponencial.
Calcula la probabilidad de que la variable X tome valores mayores a su promedio.

Solución: Como X es una variable aleatoria exponencial, entonces E ( X ) =β y Var ( X )=β 2 La


probabilidad de que la variable X tome valores mayores a su promedio es
∞ −x
1 β
P ( X > β )= ∫e dx
β β

Sea u=x /β, entonces uβ=x. Luego βdu=dx. Ahora definamos los límites superior e inferior
de la integral. Si x=β ,→ u=1 y si x=∞ , →u=∞. Por tanto nos queda,
∞ −x ∞
1 β β ∞
P ( X > β )= ∫e dx= ∫ e−u du=−e−u|1 =0,3679
β β β 1

Ejemplo 2.5: La llegada de ciertas personas a un bar tiene distribución de Poisson con λ=4
por día. Calcula la probabilidad que el tiempo transcurrido entre la llegada de dos personas de
manera consecutiva en un día sea menor a 4 horas.

Solución: Definamos como X al tiempo entre dos llegadas de manera consecutiva de dos
personas en días. Por los tanto X tendrá una distribución exponencial con β=1/ λ.

1
Como X esta medida en días, la pasamos en horas: 4 horas= días , entonces
6
1/ 6
1
( )
P ( X < 4 horas )=P X< días =4 ∫ e−4 x dx =0,4866
6 0

1.5. Distribución chi cuadrada

Otro caso particular de la distribución gamma es la distribución chi cuadrada, distribución


muy importante en inferencia estadística, que se obtiene tomando α =v /2 y β=2, siendo v un
entero positivo llamado grados de libertad. Por tanto, una variable aleatoria X tiene una
distribución chi cuadrada si su función de densidad de probabilidad se puede escribir como:

−x
1

{
f x = Γ ( v /2 ) 2v/ 2 x
( )
v/ 2−1

0 en otro caso
e 2 si x> 0

La función de distribución para una variable aleatoria chi cuadrada es:


0 si x ≤ 0
F ( x )=P ( X ≤ x ) =
{ 1
x

v/ 2 ∫
Γ ( v /2 ) 2 0
−t
t v/ 2−1 e 2 dt si x >0

Inmediatamente de las fórmulas dadas en la distribución gamma obtenemos la media y la


varianza para la distribución chi cuadrada:

E ( X ) =v Var ( X )=2 v

La función generadora de momentos de una variable aleatoria chi cuadrada es:

−v
2 1
M X ( t )=( 1−2 t ) para 0 ≤ t<
2

Figura 13: Perfiles de la distribución chi cuadrada con algunos valores de v

1.6. Distribución beta

Antes de definir la distribución beta haremos mención de la función beta. La función beta, al
igual que la función gamma, cuenta con múltiples perfiles que dependen de los valore de α y
β, que son sus parámetros respectivos.

La función beta se define como:


1
Γ (α ) Γ ( β )
B ( α , β )=∫ x α −1 ( 1−x )β −1 dx= para α , β >0
0 Γ (α + β)

Donde Γ ( ) ya lo habíamos definido como la función gamma.


Procedemos entonces a definir la distribución beta.

Sea una variable aleatoria continua X , diremos que esta variable tiene una distribución beta
si su función de densidad de probabilidad se puede escribir como:

Γ ( α + β ) α−1

{ β −1
f ( x )= Γ ( α ) Γ ( β ) x ( 1−x ) para 0< x <1
0 en otro caso

Podemos notar que la distribución beta está definida para valores de x mayores que cero y
menores que uno. Esto es útil ya que muchos fenómenos pueden modelarse en términos de
proporciones o porcentajes.

La función de distribución para una variable aleatoria beta es:

0 si x ≤0

{ ( )
x
F ( x )=P ( X ≤ x ) = Γ α + β ∫ t α−1 ( 1−t )β −1 dt si 0< x< 1
Γ (α ) Γ ( β ) 0
1 si x ≥1

La media y la varianza de la variable aleatoria beta son:

α αβ
E ( X )= Var ( X )=
α+β 2
( α + β ) ( α + β+1 )
2.5

 2,   3
 0.5,   0.5
 5,   1
2.0

 1,   5
 2,   5
1.5
1.0
0.5
0.0

0.0 0.2 0.4 0.6 0.8 1.0


Figura 14: Perfiles de la distribución beta para distintos valores de α y β

Ejemplo 2.6: La proporción de productos con algún tipo de defecto producidos semanalmente
se puede modelar mediante una distribución beta con α =4 y β=2

a. Encuentra la probabilidad de que en cualquier semana la proporción de productos


defectuosos supere el 90%.
b. Calcula el promedio de productos defectuosos producidos semanalmente.

Solución: Definamos con X a la proporción de productos defectuosos producidos


semanalmente. Entonces,

a. La probabilidad de que en cualquier semana la proporción de productos defectuosos


supere el 90% calculamos así,
1 1
Γ ( 4 +2 )
P ( X >0,90 ) = ∫ x 4−1 ( 1−x )2−1 dx=20 ∫ x 3 ( 1−x ) dx=0,08
Γ ( 4 ) Γ ( 2 ) 0,90 0,90

b. El promedio de productos defectuosos producidos semanalmente la calculamos de la


siguiente manera,

α 4 2
E ( X )= = =
α + β 4+2 3

1.7. Distribución t de Student

Sea el cociente entre una variable aleatoria normal estándar ( Z) y una variable aleatoria chi
cuadrada (V ) independientes entre sí. La variable aleatoria T =Z / √ V / v , con v grados de
libertad, sigue una distribuciónt de Student con función de densidad de probabilidad:

( v+ 1 )
[ ]
{
Γ ( πv )−1/ 2 − ( v +1) /2
2 t2
f ( t )= v ( ) 1+
v
si−∞<t <∞
Γ() 2
0 en otro caso

v es un entero positivo

La función de distribución de la distribución t de Student es:

( v +1 )
Γ [ ] 2
( πv )−1 /2 t
p2
− ( v+1 ) / 2
F ( t )=P ( T ≤ t ) =
v ( )
∫ v1+ dp
()
Γ
2
−∞
La media y la varianza para la distribución t de Student son:

v
E ( T )=0 si v>1 Var ( T )= si v >2
v−2
En la figura 15 mostramos
algunos perfiles de la distribución
t para ciertos valores de v. Debemos notar que a medida que v toma valores mayores la
distribución t se aproxima a una distribución normal estándar. Podemos denotar este hecho
utilizando la noción de límite,

lim ( t de Studen )=Normal ( 0 , 1 )


v→∞

Figura 15: Perfiles de la distribución t de Student para algunos valores de v con la


normal estándar

La distribución t de Student al igual que la normal estándar está tabulada para algunos valores
de grados de libertad y ciertos valores de probabilidades acumuladas.

1.8. Distribución F de Fisher-Snedecor

La distribución de F es ampliamente utilizado en inferencia estadística cuando trabajamos


con distribuciones de varianzas de una o de varias muestras.

Definamos una variable aleatoria F que es el cociente entre dos variables chi cuadradas
independientes digamos U y V divididas entre sus grados de libertad. En efecto,

U /v 1
F=
V / v2

Donde v1 y v1 son los grados de libertad del numerador y denominador respectivamente.


La función de densidad de probabilidad de la distribución F de Fisher-Snedecor es:

v 1/ 2
( v 1 + v 2) v 1
[ ]( )
g ( f )=
{ Γ
2 v2 f( )
v 1/ 2 −1

Γ ( v 1 /2 ) Γ ( v 2 /2 ) ( 1+ v 1 f /v 2 )( v + v )/ 2
0 en otro caso
1 2
si f > 0

Esta distribución también esta tabulada para valores distintos de los grados de libertad
(numerador y denominador) y ciertos valores de probabilidades acumuladas.

La media y la varianza de esta distribución son:

v2 2 v 22 ( v 1+ v 2−2 )
E ( X )= si v 2> 2Var ( X ) = 2
si v2 > 4
v 2−2 v 1 ( v 2−2 ) ( v 2−4 )

Figura 16: Perfiles de la distribución F de Fisher-Snedecor

La distribución F siempre tiene una distribución asimétrica a hacia la derecha para cualquier
valor que puedan tomar v1 y v1 .

1.9. Aproximación de la distribución de Normal a la distribución binomial y a la


distribución de Poisson

Si consideramos una variable aleatoria discreta X que tiene una distribución binomial con
μ= E ( X )=np y σ 2=Var ( X )=npq , entonces Z=( X −np ) / √ npq tiene una distribución normal
estándar cuando n → ∞ siempre que p no sea tan distinto de 0,5.
Consideremos ahora una variable aleatoria discreta X que tiene una distribución de Poisson
con μ= E ( X )=λ y σ 2=Var ( X )=λ , entonces Z=( X −λ ) / √ λ tiene una distribución normal
estándar cuando λ es grande.

En la figura 17 se presentan algunos perfiles de la distribución binomial aproximada por la


distribución normal. Debemos notar que en este caso utilizamos histogramas en vez de las
barras verticales ya que con este gráfico podemos apreciar de manera exacta como realizar los
cálculos cuando se tiene una aproximación de la normal a la binomial.

Cuando calculamos las probabilidades debemos realizar ciertas correcciones al estar


aproximando una distribución discreta con una continua. Por esta razón, mencionamos
algunos criterios que nos servirá para facilitar los cálculos. En la tabla 1, X es una variable
aleatoria binomial,

Tabla 1: Corrección de la probabilidad normal por aproximación a la binomial

Probabilidad Binomial Probabilidad normal

P ( X=x ) P ( X −0,5−np
√ npq
≤Z ≤
X +0,5−np
√ npq )
X +0,5−np
P(Z ≤
√ npq )
P(X ≤x)

X−0,5−np
P(Z <
√ npq )
P ( X <x)

X−0,5−np
P(Z ≥
√ npq )
P(X ≥x)

X +0,5−np
P(Z >
√ npq )
P ( X >x)

X 1−0,5−np X +0,5−np
P ( x1 ≤ X ≤ x2 ) P ( √ npq
≤Z ≤ 2
√ npq )
X 1 +0,5−np X −0,5−np
P ( x 1< X < x 2) P ( √ npq
<Z < 2
√ npq )
Figura 17: Aproximación de la distribución normal a la binomial para algunos valores de n y
p

Ejemplo 2.7: Se lanza una moneda legal 300 veces al aire. Utiliza la distribución normal para
calcular la probabilidad de obtén,

a. Entre 120 y 170 caras inclusive


b. Más de 150 caras
c. Exactamente 160 caras

Solución: Primeramente definamos con X como la cantidad de caras de la moneda, y como la


moneda es legal la probabilidad de obtener una cara en un lanzamiento es p=1 /2, además
n=300

a . P (120 ≤ X ≤170 )=P ( 120−0,5− ( 300 ∙1 /2 )


√300 ∙ 1/2 ∙ 1/2
≤ Z≤
170+ 0,5−( 300 ∙1 /2 )
√300 ∙ 1/2∙ 1/2 )
¿ P (−3,52≤ Z ≤ 2,37 )=0,4998+ 0,4911

Por tanto P ( 120≤ X ≤ 170 )=0,9909


150+0,5− (300 ∙ 1/2 )
(
b . P ( X >150 )=P Z >
√ 300 ∙1/2 ∙1/2 )
=P ( Z >0,06 )=0,5−0,0239

Así, P ( X >150 )=0,4761

c . P ( X =160 )=P ( 160−0,5− ( 300 ∙ 1/2 )


√ 300∙ 1/2∙ 1/2
≤Z≤
160+0,5− (300 ∙ 1/2 )
√ 300 ∙1/2 ∙1/2 )
¿ P ( 1,21≤ Z ≤1,10 )=0,3869−0,3643

Entonces, P ( X=160 )=0,0226

2. Teorema Central del Límite

Este teorema es uno de los más importantes e influyentes en el mundo de la estadística ya que
proporciona, de manera general, resultados coherentes y consistentes. A continuación
enunciaremos el teorema.

Sean X 1 , X 2 ,... , X n variables aleatorias independientes (discretas o continuas), con idéntica


distribución de probabilidad (cualquier distribución de probabilidad), con media μ y varianza
σ 2 , entonces la distribución de la variable aleatoria Z definida como:
n
X −nμ
( X 1 + X 2 +...+ X n ) −nμ ∑i=1
i
Z= =
σ √n σ √n

Tiene aproximadamente una distribución normal estándar conforme n aumenta. Es decir,


Z N ( 0 ,1 ) cuando n → ∞.

Es importante resaltar que si multiplicamos y dividimos Z por n resulta la distribución de una


media muestral que también tiene una distribución aproximadamente normal cuando n es
grande, habitualmente tomamos n ≥ 30, pero cabe resaltar que en algunos casos no es
suficiente esta cantidad, nosotros en este curso tomaremos n ≥ 30. En efecto,

( X 1+ X 2+ ...+ X n )−nμ
n X́ −μ
Z= =
σ √n σ
n √n
Ejemplo 3.1: Se tiene una variable aleatoria X que representa la estatura de ciertos
estudiantes de una universidad. Se sabe por experiencia que el promedio de la estatura del
colegio es de 1,72 m. y con una desviación estándar de 0,20 m. Calcula la probabilidad de que
al seleccionar 50 estudiantes al azar la suma de sus alturas supere 88 m.

Solución: Sabemos que X es la estura de los estudiantes, μ=1,72 y σ =0,20, entonces,


50
88−50 ( 1,72 )
P ( ) (
∑ X i >88 =P
i=1
Z>
0,20 √ 50 ) =P ( Z >1,41 )=0,5−0,4207=0,0793

Por tanto, la probabilidad de que al seleccionar 50 estudiantes al azar la suma de sus alturas
supere 88 m. es del 7,93%

Ejemplo 3.2: Una empresa que fabrica tanques de agua sabe que la capacidad máxima en
promedio que tienen sus tanques es de 100 litros con una desviación estándar de 3 litros. Un
comerciante adquiere 70 tanques. ¿Cuál es la probabilidad de que los tanques tengan una
capacidad máxima promedio inferior a 98 litros?

Solución: Nuestra variable aleatoria es el promedio de litros que pueden tener los tanques.
Entonces la probabilidad de que los tanques tengan una capacidad máxima promedio inferior
a 99 litros es,

99−100
P ( X́ <99 )=P Z<
( 3
√ 70 )
=P ( Z ←2,79 )=0,5−0,4974=0,0026

Figura 18: Representación de la distribución normal para P ( Z ←2,79 ) del ejemplo 3.2

3. Distribución continua multivariada de probabilidad

3.1. Distribución normal bivariada

Sean X y Y dos variables aleatorias continuas con μ X =E ( X ) , μY =E ( Y ) , σ 2X =Var ( X ) ,


σ Y2 =Var ( Y ) y ρ=Cor ( X , Y ). La distribución conjunta de X y Y es una distribución normal
bivariada si su función de densidad conjunta se puede escribir como:

2 2

f ( x , y )=
1
2 π σ X σ Y √ 1−ρ 2
exp
{ −1
2
2 ( 1−ρ )
( x−μ X )
[ 2
σX (
−2 ρ
x−μ X
σX )( y−μ Y ( y −μ Y )
σY
+) σ 2Y ]}
Definamos ahora la matriz de varianza covarianza:
σ 2X ρσXσY
Σ=
( ρ σ X σY σ 2Y )
Donde podemos notar que esta matriz es simétrica, o sea Σ=Σ ' , ( Σ ' es la transpuesta de Σ),
2 2 2
también es definida positivamente. Además, el determinante de Σ es σ X σ Y −ρ ( σ X σ Y ), que es
siempre positiva, y la inversa de Σ es:

1 σ 2Y − ρ σ X σY
Σ−1= 2 2 2
(
σ X σ Y −ρ ( σ X σ Y ) −ρ σ X σ Y σ 2X )
Teniendo en cuenta todo lo anterior, podemos escribir f ( x , y ) de manera más compacta:

1 −1 x−μ X
f ( x , y )=
2 π √ det Σ
exp
{
−1
2
( x−μ X , y−μY ) Σ
y−μ Y ( )}
x −μ X
Donde ( x−μ X , y −μY ) es un vector fila y ( y −μY )
es un vector columna. Esta expresión nos

permitirá generalizar la distribución normal en el espacio n-dimensional.

Si tomamos los siguientes valores; μ X =μY =0 y σ 2X =σ 2Y =1 nos encontramos en el caso de una


distribución normal bivariada estándar, en donde la función de densidad conjunta toma la
forma siguiente:

1 −1 2 2
f ( x , y )=
2 π √ 1−ρ 2
exp
2 {
(x +y ) }
Una gráfica de la distribución normal estándar bivariada con ρ=0 la podemos observar en la
figura 19.
Figura 19: Densidad normal estándar bivariada con ρ=0

En general si las variables aleatorias X y Y son independientes, o sea ρ=0, entonces f ( x , y )


que es la distribución normal bivariada se puede escribir de la siguiente manera:

2 2

f ( x , y )=
1
2π σXσY
exp
2 σ 2X { [
−1 ( x−μ X ) ( y−μ Y )
+
σ Y2 ]}
Y esto a su vez podemos escribirlo así,

−( x−μ X )2 −( y−μY )2
f ( x , y )=
1
√2 π σ X
exp
{
2σ 2X

1
}
√ 2 π σY
exp
{
2σ 2Y }
Por lo tanto,

f ( x , y )=g ( x ) h ( y )

Donde g ( x ) y h ( y ) son las funciones de densidades marginales de X y Y respectivamente.

−( x−μ X )2 −( y−μY )2
g ( x )=
1
√2 π σ X
exp
{
2 σ 2X
y h ( y )=
} 1
√2 π σY
exp
{
2 σ 2Y }
Generalizamos la forma de la distribución normal para n variables aleatorias que es muy
utilizada en la rama de la estadística llamada Análisis Multivariado.

Sea ( X 1 , X 2 , ..., X n) un vector de variables aleatorias continuas con vector de promedios


( μ1 , μ 2 , ... , μ n ) y Σ la matriz de varianza covarianza de nxn definida positivamente. Diremos
que ( X 1 , X 2 , ..., X n) tiene una distribución normal multivariada si su función de densidad de
probabilidad es:

x 1−μ1
f ( x 1 , x 2 , ..., x n )=
1

{
2 π √ det Σ
exp
−1
2
( )}
x −μ
( x 1−μ1 , x 2−μ2 , … , xn −μn ) Σ−1 2 2

x n−μn
1)- Suponga que X tiene una distribución continua uniforme de 1 a 5. Determina la
probabilidad condicional P( X > 2,5∨X ≤ 4).

2)- Un autobús llega cada 10 minutos a una parada. Se supone que el tiempo de espera para un
individuo en particular es una variable aleatoria con distribución continua uniforme.

a. ¿Cuál es la función de densidad asociada?


b. ¿Cuál es la probabilidad de que un individuo espere más de 7 minutos?
c. ¿Cuál es la probabilidad de que un individuo espere entre 2 y 7 minutos?

3)- Dada una distribución normal estándar, calcula el valor de k tal que;

a. P( Z> k )=0,2946
b. P( Z< k )=0,0427
c. P(−0,93< Z <k )=0,7235

4)- Encuentra las probabilidades de que una variable aleatoria normal con media μ y varianza
σ 2 se encuentre entre

a. Una desviación estándar de su media.


b. Dos desviaciones estándar de su media
c. Tres desviaciones estándar de su media.

5)- Un periódico llevo a cabo una encuesta entre 400 personas seleccionadas aleatoriamente
en una ciudad para conocer la opinión sobre el control de armas. 220 de las 400 opinaron a
favor de un estricto control.

a. ¿Qué tan probable resulta el hecho de tener 220 o más personas a favor del control de
armas, si la población es esa ciudad se encuentra dividida en igual opinión?
b. Suponga que se encuesta a 2000 personas teniendo la misma proporción de estas a favor
del control de armas, que en el inciso anterior. ¿Cómo cambiará la respuesta con relación
al inciso anterior?

6)- La proporción de unidades defectuosas en un proceso de fabricación es una variable


aleatoria que se encuentra aproximada por una distribución beta de parámetros α =1 y β=20.

a. Encuentre la media y la varianza.


b. Calcula la probabilidad de que la proporción de artículos defectuosos sea mayor que 82%
y menor que 18%

7)- Una persona con una buena historia crediticia tiene una deuda promedio de $15015.
Suponga que la desviación estándar es de $3540 y que los montos de las deudas están
distribuidos normalmente.
a. ¿Cuál es la probabilidad de que la deuda de una persona con buena historia crediticia sea
mayor a $18000?
b. ¿De que la deuda de una persona con buena historia crediticia sea de menos de $10000?
c. ¿De que la deuda de una persona con buena historia crediticia esté entre $12000 y
$18000?
d. ¿De que la deuda de una persona con buena historia crediticia sea mayor a $14000?

8)- Los tiempos entre las llegadas de vehículos a un determinado entronque siguen una
distribución de probabilidad exponencial cuya media es 12 segundos.

a. ¿Cuál es la probabilidad de que los tiempos de llegada entre vehículos sean 12 segundos o
menos?
b. ¿Cuál es la probabilidad de que los tiempos de llegada entre vehículos sean 6 segundos o
menos?
c. ¿Cuál es la probabilidad de 30 o más segundos entre los tiempos de llegada?

9)- Un proceso produce 10% de artículos defectuosos. Si se seleccionan al azar 100 artículos
del proceso, ¿cuál es la probabilidad de que el número de defectuosos

a. Exceda los 13?


b. Sea menor que 8?

10)- En cierta ciudad, el consumo diario de agua (en millones de litros) sigue
aproximadamente una distribución gamma con α = 2 y β = 3. Si la capacidad diaria de dicha
ciudad es de 9 millones de litros de agua, ¿Cuál es la probabilidad de que en cualquier día
dado el suministro de agua sea inadecuado?

11)- En cierta ciudad el consumo diario de energía eléctrica, en millones de kilowatts-hora, es


una variable aleatoria X que tiene una distribución gamma con media igual a 6 y una varianza
igual a 12.

a. Calcula los valores de α y β.


b. Calcula la probabilidad de que en cualquier día dado el consumo diario de energía exceda
los 12 millones de kilowatts-hora.

12)- El costo medio de la colegiatura en una universidad estatal de Estados Unidos es $ 4260
anuales. Considera este valor como media poblacional y asuma que la desviación estándar
poblacional es σ =$ 900. Suponga que selecciona una muestra aleatoria de 50 universidades.

a. ¿Cuál es la probabilidad de que la muestra aleatoria simple proporcione una media


muestral que no difiera de la media poblacional en más de $ 250?
b. ¿Cuál es la probabilidad de que la muestra aleatoria simple proporcione una media
muestral superior a $ 100?

13)- La cantidad de tiempo que le toma al cajero de un banco con servicio en el automóvil
atender a un cliente es una variable aleatoria con una media μ=3,2 minutos y una desviación
estándar σ =1,6 minutos. Si se observa una muestra aleatoria de 64 clientes, calcula la
probabilidad de que el tiempo medio que el cliente pasa en la ventanilla del cajero sea

a. A lo sumo 2,7 minutos.


b. Más de 3,5 minutos.
c. Al menos 3,2 minutos pero menos de 3,4 minutos.

14)- Un contenedor tiene una capacidad máxima de 4 toneladas. Se sabe que ciertos paquetes
tienen en promedio 100 kilogramos. Calcula la probabilidad de que 11 paquetes cargados en
el contenedor superen la capacidad máxima. Utiliza una desviación estándar igual a 0,03
toneladas.

15)- Verifica que la media y la varianza de una distribución gamma son αβ y α β 2


respectivamente, utilizando la función generadora de momentos de esta distribución.

Potrebbero piacerti anche