Sei sulla pagina 1di 22

FACULTAD DE CIENCIAS EXACTAS Y NATURALES

Algunas distribuciones discretas


31 de mayo de 2018

Algunas distribuciones discretas


Las distribuciones discretas son aquellas donde las variables asumen un número limitado de valores, por ejemplo el
número de años de estudio.
La distribución de probabilidad para una variable aleatoria discreta puede ser:

1. Una relación teórica de resultados y probabilidades que se puede obtener de un modelo matemático y que representa
algún fenómeno de interés.

2. Una relación empírica de resultados y sus frecuencias relativas observadas.

3. Una relación subjetiva de resultados relacionados con sus probabilidades subjetivas o articiales que representan el
grado de convicción del encargado en tomar decisiones sobre la probabilidad de posibles resultados.

Distribución uniforme discreta


Consiste en distribuir en partes iguales la masa de probabilidad entre un número nito de valores.
Se dice que una variable aleatoria X tiene distribución uniforme discreta de parámetro N, con N ∈ Z+ , si su función
de masa de probabilidad está dada por:

1

N , si x = 1, 2, . . . , N


f (x) = P (X = x) =


0, e. o. c.

d
Se escribe X = U{1, 2, . . . , N } para indicar que la variable aleatoria X tiene distribución uniforme discreta de parámetro
N.
La función de distribución de una variable aleatoria X con distribución uniforme discreta está dada por:



 0, si x<1
1
1≤x<2

 , si
N


2
F (x) = N , si 2≤x<3
 . .
.. .

.




1, si x ≥ N.

Una variable aleatoria X tiene una distribución uniforme discreta sobre el conjunto {x1 , x2 , . . . , xN } si la probabilidad de
1
que X tome cualquiera de estos valores es constante . Esta distribución surge en espacios de probabilidad equiprobables,
N
esto es, en situaciones en donde tenemos N resultados diferentes y todos ellos tienen la misma probabilidad de ocurrir. Los
juegos de lotería son un ejemplo donde se puede aplicar esta distribución de probabilidad. También, cuando se observa el
número obtenido tras el lanzamiento de un dado legal, los valores posibles siguen una distribución uniforme discreta en
1
{1, 2, 3, 4, 5, 6}, y la probabilidad de cada cara es .
6
Propiedad 1.
Sea X es una variable aleatoria con distribución uniforme discreta de parámetro N. Entonces:

1 Pn 1 N (N + 1) N +1
1. E[X] = k=1 k = = .
N N 2 2

1
N2 − 1 1 Pn 1 N (N + 1)(2N + 1) (N + 1)(2N + 1)
2. V ar(X) = . Puesto que E[X 2 ] = k2 = = .
12 N k=1 N 6 6
Ejemplo 1.
En R se pueden generar valores al azar de la distribución uniforme discreta usando el comando sample().
Por ejemplo, 15 valores al azar de la distribución U{1, 2, . . . , 10}.
> sample(1:10,15,replace=TRUE)
[1] 10 4 3 5 8 2 3 5 6 5 8 7 5 10 6

Distribución binomial
La distribución binomial se usa frecuentemente en la descripción de aquellos experimentos aleatorios en los que el
resultado es la ocurrencia o no ocurrencia de un evento. Si la variable aleatoria discreta X indica el número de éxitos en
las n pruebas independientes de ese experimento, entonces X sigue una distribución binomial de parámetros n y p, siendo
p la probabilidad de ocurrencia del evento (éxito). Se acostumbra denotar la probabilidad de fracaso, 1 − p, con la letra
q.
Este modelo se aplica a poblaciones nitas de las que se toma elementos al azar con reemplazo, y también a poblaciones
conceptualmente innitas, como por ejemplo las piezas que produce una máquina, siempre que el proceso de producción
sea estable (la proporción de piezas defectuosas se mantiene constante a largo plazo) y sin memoria (el resultado de cada
pieza no depende de las anteriores).
Esta distribución se aplica en cualquier situación donde el resultado de un proceso es dicotómico y los resultados del
proceso son independientes y la probabilidad de éxito p es constante de una prueba a otra.

Denición 1.
Se dice que una variable aleatoria X tiene distribución Binomial de parámetros n y p, si su función de masa de probabilidad
está dada por: ( 
n
x px (1 − p)n−x , si x = 0, 1, 2, . . . , n
f (x) = P (X = x) =
0, e. o. c.

donde n es un entero positivo y 0 < p < 1.


d
Se escribe X = B(n, p) para indicar que la variable aleatoria X tiene distribución Binomial de parámetros n y p.
Observe que se trata de una verdadera distribución de probabilidad, pues:

n  
X n
px q n−x = (p + q)n = 1n = 1.
x=0
x

De hecho, esta expresión justica el nombre de la distribución, pues lo anterior no es sino el desarrollo del binomio
(p + q)n .
El cálculo de la función f (x) puede representar un reto desde el punto de vista numérico pues se ven involucradas varias
multiplicaciones particularmente cuando n es grande. En R esta función de probabilidad se obtiene usando el comando
dbinom():
Por ejemplo, dbinom(x, n, p) evalúa f (x) de la distribución B(n, p).
> dbinom(8,10,0.3)
[1] 0.001446701
Ejemplo 2.
La probabilidad de éxito de un medicamento para aliviar el dolor de cabeza es 0,89. Si 15 pacientes toman el medicamento,
¾cuál es la probabilidad de que ninguno siga con el dolor de cabeza?
Sea X la variable aleatoria que denota el número de pacientes en lo que tendrá éxito el medicamento. Deseamos calcular
la probabilidad de que ninguno siga con dolor de cabeza, que es lo mismo que decir que el medicamento tenga éxito en los
15 pacientes, esto es, P (X = 15).
d
De acuerdo con los datos del problema se tiene que X = B(15, 0,89), entonces la probabilidad pedida es:
 
15
P (X = 15) = (0,89)15 (0,11)0 ≈ 0,174.
15
La probabilidad de que ninguno de los quince pacientes sufra de dolor de cabeza después de tomado el medicamento es
de 0,174.

2
Ejemplo 3.
Suponga que para personas de determinada edad, la probabilidad de que mueran por una enfermedad transmitible es 0,001.
Si 356 personas de este grupo están expuestas a la enfermedad. ¾Cuál es la probabilidad de que a lo más una persona
muera a causa de la enfermedad?
Sea X la variable aleatoria que denota el número de muertes que ocurren entre las 356 personas expuestas a la
enfermedad. Deseamos hallar P (X ≤ 1).
d
De acuerdo con los datos del problema se tiene que X = B(356, 0,001), entonces la probabilidad pedida es:
   
356 0 356 356
P (X ≤ 1) = P (X = 0) + P (X = 1) = (0,001) (0,999) + (0,001)(0,999)355 ≈ 0,95.
0 1
Ejemplo 4.
Un examen tiene 20 preguntas y cada una tiene 4 opciones como respuesta, siendo solamente una de ellas la correcta. Si
un estudiante contesta cada pregunta al azar, ¾cuál es la probabilidad de que apruebe el examen?

Solución.
1
Si X denota el número de preguntas contestadas correctamente, entonces X tiene distribución B(n, p) con n = 20 y p = .
4
Suponiendo que la calicación mínima aprobatoria es 12, entonces la respuesta es

20  
X 20
P (X ≥ 12) = 0,25k 0,7520−k
k
k=12
     
20 12 8 20 13 7 20
= 0,25 0,75 + 0,25 0,75 + · · · + 0,2520 0,750
12 13 20
= 0,0009.

Esta probabilidad es sorprendentemente pequeña y por lo tanto la estrategia seguida por el estudiante para contestar
el examen no parece ser la mejor.

Ejemplo 5.
Con base en encuestas al consumidor se sabe que la preferencia de éste respecto a dos marcas A y B de un producto dado
se encuentra muy pareja. Si las opciones de compra entre estas marcas son independientes. ¾Cuál es la probabilidad de
que entre 25 personas seleccionadas al azar, no más de diez tengan preferencia por la marca A?
Sea X
la variable aleatoria que denota el número de personas que preeren la marca A. De acuerdo con la información
d
dada en el problema se tiene que X = B(25, 1/2). Deseamos hallar P (X ≤ 10).
Por lo tanto,
10  
X 25
P (X ≤ 10) = (1/2)k (1/2)25−k ≈ 0,2122.
k
k=0

Ejemplo 6.
De una población de animales, se sabe que el 60 % son machos. Si se extrae un conjunto de 10 animales, ¾cuál es la
probabilidad de que en ese conjunto haya 7 hembras?
d
Sea X= Número de hembras en un conjunto de 10 animales, se ve claramente que X = B(10, 0,4).
La probabilidad de que haya 7 hembras es:
 
10
P (X = 7) = 0,47 × 0,63 = 0,0425.
7
d
La gráca de la función de masa de probabilidad de una variable aleatoria con distribución X = B(10, 0,4) está dada
en la gura 1.

3
Distribución Binomial: n = 10, p = 0.4

0.25

0.20

0.15
Probabilidad

0.10
0.05
● ●

0.00

● ●

0 2 4 6 8 10

Número de Éxitos

Figura 1: Función de masa de probabilidad de una distribución binomial con parámetros n = 10 y p = 0,4.

La función de distribución de una variable aleatoria X con distribución Binomial de parámetros n y p, viene dada por

0,  

 si x < 0
Px n k n−k
F (x) = p q , si 0 ≤ x < n
k=0 k


si x ≥ n.
1,

La función de distribución F (x) se escribe simplemente como la suma de los valores f (u) para valores de u menores o
iguales a x. Los valores de esta función se pueden obtener en R con el comando pbinom():
Por ejemplo, pbinom(x, n, p) evalúa F (x) de la distribución B(n, p).
> pbinom(4,10,0.4)
[1] 0.6331033
d
La gráca de la función de distribución de una variable aleatoria con distribución X = B(10, 0,4) está dada en la
gura 2.

Distribución Binomial: n = 10, p = 0.4


1.0
0.8
Probabilidad Acumulada

0.6
0.4
0.2
0.0

0 2 4 6 8 10

Número de Éxitos

Figura 2: Función de distribución de una distribución binomial con parámetros n = 10 y p = 0,4.

A continuación se presentan las propiedades más importantes de la distribución binomial.

4
Propiedad 2.
Sea X es una variable aleatoria con distribución binomial de parámetros n y p. Entonces:

1. E[X] = np.
2. V ar[X] = npq .

3. mX (t) = (pet + q)n .


4. ϕX (t) = (peit + q)n .
Ejemplo 7.
En una urna hay 20 balotas, 5 negras y el resto verdes. Se elige una balota al azar y el proceso se repite ocho veces,
devolviendo la balota a la urna después de sacarla. Determine cuantas balotas negras se espera que salgan una vez realizado
el proceso y calcule la desviación estándar.
Sea X
la variable aleatoria que denota el número de balotas negras que salgan una vez realizado el proceso. De acuerdo
d p
con la información dada en el problema se tiene que X = B(8, 1/4). Deseamos hallar E(X) y V ar(X).
Por lo tanto,
r r
1 p p 1 3 3
E(X) = np = 8 × = 2 y V ar(X) = np(1 − p) = 8× × = = 1,225.
4 4 4 2
Se espera que se saquen 2 balotas negras, con una desviación 1,225.
Ejemplo 8.
La probabilidad de que un estudiante obtenga el título de matemático es 0,25. Si se matriculan 40 estudiantes determine
el valor esperado y la desviación estándar de los estudiantes que se gradúan.
Sea X
la variable aleatoria que denota el número de estudiante que obtenga el título de matemático. De acuerdo con
d p
la información dada en el problema se tiene que X = B(45, 0,25). Deseamos hallar E(X) y V ar(X).
Por lo tanto,
p p p p
E(X) = np = 40 × 0,25 = 10 y V ar(X) = np(1 − p) = 40 × 0,25 × 0,75 = 7,5 = 2,74.

Se espera que se gradúen 10 estudiantes, con una desviación estándar de 2,74.


Propiedad 3.
k
d P d
Si X1 , X2 , . . . , Xk son variables aleatorias independientes tal que Xi = B(ni , p) con i = 1, 2, . . . , k , se tiene que Xi =
 k  i=1
P
B ni , p .
i=1
Recíprocamente, toda variable aleatoria con distribución B(n, p) se puede expresar como una suma de la forma anterior.
En R se pueden obtener valores al azar de la distribución B(n, p) usando el comando rbinom().
Por ejemplo, rbinom(k, n, p) genera k valores al azar de la distribución B(n, p).
> rbinom(25,10,0.4)
[1] 2 4 4 5 5 5 4 5 4 5 4 3 3 6 1 7 6 3 6 4 1 7 2 2 6
Para el caso particular de que n sea igual a 1 se obtiene la distribución de Bernouilli, B(p).
La función de masa de probabilidad de una distribución de Bernouilli, de parámetro p, está dada por:

(
px (1 − p)1−x , si x = 0, 1
f (x) = P (X = x) =
0, e. o. c.,

donde p es la probabilidad de éxito en una sola prueba y x es el número de éxitos en la prueba.


d
Se escribe X = B(p) para indicar que la variable aleatoria X tiene distribución Bernoulli de parámetro p, siendo p la
probabilidad de ocurrencia del evento.

5
La función de distribución de una variable aleatoria X con distribución Bernoulli de parámetro p, está dada por

0,
 si x<0
F (x) = 1 − p, si 0≤x<1

1, si x ≥ 1.

La función de probabilidad f (x) puede obtenerse en R usando el comando dbinom().


Por ejemplo, dbinom(x, 1, p) evalúa f (x) de la distribución B(p).

> dbinom(0,1,0.7)
[1] 0.3

Para la función de distribución F (x) se usa el comando pbinom().


Por ejemplo, pbinom(x, 1, p) evalúaF (x) de la distribución B(p).
> pbinom(0.2,1,0.7)
[1] 0.3
A continuación se presentan las propiedades más importantes de la distribución Bernoulli.

Propiedad 4.
Sea X es una variable aleatoria con distribución Bernoulli de parámetro p. Entonces:

1. E[X] = p.
2. V ar[X] = pq .
3. mX (t) = pet + q .
4. ϕX (t) = peit + q .
Ejemplo 9.
Un agente de seguros dedicado a la venta de seguros de vida realiza visitas a posibles clientes con el n de contratar un
seguro de vida. Se sabe de su trayectoria como agente que en el 60 % de las visitas tiene éxito y contrata un seguro. Denir
la variable aleatoria asociada a este experimento aleatorio y obtener la media y varianza.

Solución.
El experimento aleatorio es realizar la visita a un posible cliente, y hay dos resultados posibles: conseguir que el cliente
contrate el seguro (suceso éxito) o no conseguirlo (suceso fracaso). La variable aleatoria X asociada al experimento toma
los valores

X = 1 si el cliente contrata el seguro.

X=0 si el cliente no contrata el seguro.

Es, por tanto, una variable de tipo Bernouilli, y su función de masa de probabilidad será

P (X = 1) = 0,6 = p
P (X = 0) = 1 − 0,6 = 0,4 = q = 1 − p

Por consiguiente, la media y la varianza valen E(X) = p = 0,6 y V ar(X) = pq = 0,6 × 0,4 = 0,24.
Ejemplo 10.
Sea Ω el espacio muestral de un experimento aleatorio y sea A un evento con probabilidad p > 0. Sea X la variable aleatoria
dada por (
1, si ω∈A
X(ω) =
0, si ω∈
/ A.
Entonces X tiene distribución B(p). A esta variable aleatoria X se le llama la función indicadora del evento A y se
le denota también por IA (ω). Así, al efectuar un ensayo del experimento aleatorio, la función indicadora señala cuando
ocurre el evento A tomando el valor 1, e indica que no ha ocurrido el evento A tomando el valor 0.

6
En R se pueden generar k valores al azar de la distribución B(p) usando el comando rbinom().
Por ejemplo, rbinom(k, 1, p) genera k valores al azar de la distribución B(p).
> rbinom(25,1,0.7)
[1] 1 1 0 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 0 0 1 1 0 0
Nota 1.
Supóngase que X es una variable aleatoria con distribución binomial de parámetros n y p.
n k n−k
Sea B(k) : = p q .
 k  
n n−k+1 n
Puesto que = , se obtiene para k = 1, 2, . . . , n:
k k k−1
 
n−k+1 n
B(k) = p × pk−1 × q n−k+1 × q −1
k k−1
n−k+1 p
= × × B(k − 1).
k q
Luego comenzando con B(0) = q n se obtiene en forma recurrente los valores de B(k) para k = 1, 2, . . . , n.
n−k+1 p
Ahora bien, B(k) > B(k − 1), si y sólo si × > 1.
k q
De donde se obtiene que B(k) > B(k − 1), si y sólo si (n + 1)p > k .
d
Por lo tanto, si X = B(n, p), entonces P (X = k) crece inicialmente de manera monótona y luego decrece monótona-
mente, alcanzando su valor mayor cuando k = [(n + 1)p], donde [(n + 1)p] denota la parte entera de (n + 1)p.

Distribución Binomial: n = 50, p = 0.3


0.12




0.10


0.08


Probabilidad

0.06



0.04

● ●
0.02

● ●





0.00

● ●
● ● ● ● ● ● ● ● ● ● ● ●

0 5 10 15 20 25 30

Número de Éxitos

Figura 3: Función de masa de probabilidad de una distribución binomial con parámetros n = 50 y p = 0,3.

Distribución hipergeométrica
Si nos interesa la probabilidad de seleccionar x éxitos de los R artículos considerados como éxito y n − x fracasos de los
cuales N −R artículos que se consideran fracasos cuando se selecciona una muestra aleatoria de tamaño n de N artículos.
Esto se conoce como experimento hipergeométrico; es decir, uno que posee las siguientes dos propiedades:
1. Se selecciona sin reemplazo una muestra aleatoria de tamaño n de N artículos.

2. R de los N artículos se pueden clasicar como éxitos y N −R se clasican como fracasos.

El número X de éxitos de un experimento hipergeométrico se denomina variable aleatoria hipergeométrica. En


consecuencia, la distribución de probabilidad de esta variable se llama distribución hipergeométrica.
Esta distribución de probabilidad surge en el contexto de la toma de una muestra de un conjunto de objetos de dos
tipos. Supongamos que tenemos N objetos dentro de una caja, de los cuales K son de un primer tipo y N −R son de

7
un segundo tipo. Véase la Figura 4. Los objetos del primer tipo pueden corresponder a artículos en buen estado y los del
segundo tipo a artículos en mal estado, o bien a personas con una cierta característica y aquellas que no poseen dicha
característica.

··· R Objetos tipo 1

··· N −R Objetos tipo 2

Caja

Figura 4:

Supongamos que de esta caja tomamos al azar una muestra de tamaño n de tal forma que la selección es sin reemplazo
y el orden de los objetos seleccionados no es relevante. Así, el espacio muestral de este experimento consiste de todos los
posibles subconjuntos de tamaño n que se pueden obtener de esta colección de N objetos y su cardinalidad es entonces
N

. Si para cada subconjunto seleccionado se dene la variable aleatoria X como el número de objetos seleccionados que
n
son del primer tipo, entonces es claro que X puede tomar los valores 0, 1, 2, . . . , n. Observe que X toma el valor n si y sólo
si todos los objetos escogidos son del tipo 1, mientras que toma el valor 0 cuando todos los objetos escogidos son del tipo
2. Para que tales casos puedan ocurrir supondremos que el tamaño n de muestra es sucientemente pequeño de tal forma
que:
n ≤ mı́n{K, N − K}
La probabilidad de que X tome un valor x está dada por la siguiente expresión:

Denición 2 (Distribución hipergeométrica).


Se dice que una variable aleatoria X tiene distribución hipergeométrica de parámetros n, R y N, si su función de masa
de probabilidad está dada por:
R N −R
  
 x n−x

N
 , si x = 0, 1, 2, . . . , n
f (x) = n

0, e. o. c.

donde N es un entero positivo, R es un entero no negativo menor o igual a N y n es un entero positivo menor o igual a
N.
d
Se escribe X = Hg (n, R, N ) para indicar que la variable aleatoria X tiene distribución hipergeométrica de parámetros
n, R y N.
La gráca de esta función de masa de probabilidad para N = 40, R = 8 y n = 25 aparece en la Figura 5.

Gráfica de la función de densidad Hg(25, 8, 40)


0.30
0.25
0.20
0.15
fx

0.10
0.05
0.00

0 2 4 6 8 10

Figura 5: Función de masa de probabilidad de una distribución hipergeométrica de parámetros n = 25, R = 8 y N = 40.

8
En R pueden obtenerse los valores de f (x) con el comando dhyper(). Observe con cuidado la diferencia en el orden y
la forma de expresar los parámetros de esta distribución en R: después del argumento x se especica el número de objetos
R de tipo 1, después el número de objetos N − R de tipo 2 y nalmente se especica el tamaño de la muestra n.
Por ejemplo, dhyper(x, R, N − R, n) evalúa f (x) de la distribución Hg (n, R, N ).
> dhyper(5,8,32,25)
[1] 0.3143391
La distribución hipergeométrica suele aparecer en procesos muestrales sin reemplazo, en los que se investiga la presencia
o ausencia de cierta característica. Piénsese, por ejemplo, en un procedimiento de control de calidad en una empresa
farmacéutica, durante el cual se extraen muestras de las cápsulas fabricadas y se someten a análisis para determinar su
composición. Durante las pruebas, las cápsulas son destruidas y no pueden ser devueltas al lote del que provienen. En esta
situación, la variable aleatoria que cuenta el número de cápsulas que no cumplen los criterios de calidad establecidos sigue
una distribución hipergeométrica. Por tanto, esta distribución es la equivalente a la binomial, pero cuando el muestreo se
hace sin reemplazo.

Ejemplo 11.
Considérese un fabricante de automóviles que compra los motores a una compañía donde se fabrican bajo estrictas con-
diciones. El fabricante recibe un lote de 40 motores. Su plan para aceptar el lote consiste en seleccionar ocho, de manera
aleatoria, y someterlos a prueba. Si encuentra que ninguno de los motores presenta serios defectos, el fabricante acepta
el lote; de otra forma lo rechaza. Si el lote contiene dos motores con serios defectos, ¾cuál es la probabilidad de que sea
aceptado?
Sea X
la variable aleatoria que denota el número de motores que presenta serios defectos. Deseamos hallar P (X ≤ 0).
d
De acuerdo con los datos del problema se tiene que X = Hg (8, 2, 40), entonces la probabilidad pedida es:

2 40−2 38
  
0 8−0 8
P (X = 0) = 40
 = 40
 ≈ 0,6359.
8 8

La función de distribución de una variable aleatoria X con distribución distribución hipergeométrica de parámetros n,
R y N, está dada por


 0, si x<0
R N −R
  
P x
k n−k
F (x) = N
 , si 0≤x<n
k=0

 n
x ≥ n,

1, si

donde N es un entero positivo, R es un entero no negativo menor o igual a N y n es un entero positivo menor o igual a
N.
d
La gráca de la función de distribución de una variable aleatoria con distribución X = Hg (25, 8, 40) está dada en la
gura 6.

Gráfica de la función de distribución Hg(25, 8, 40)


1.0
0.8
0.6
Fx

0.4
0.2
0.0

0 2 4 6 8 10

Figura 6: Función de distribución de una distribución hipergeométrica de parámetros n = 25, R = 8 y N = 40.

9
Los valore de la función de distribución F (x) pueden encontrarse usando R mediante el comando phyper():
Por ejemplo, phyper(x, K, N − K, n) evalúa F (x) de la distribución Hg (n, R, N ).
> phyper(5,8,32,25)
[1] 0.6503779
A continuación se presentan las propiedades más importantes de la distribución hipergeométrica.

Propiedad 5.
Sea X es una variable aleatoria con distribución hipergeométrica de parámetros n, R y N. Entonces:

nR
1. E[X] = .
N
R N −R N −n
2. V ar[X] = n × × × .
N N N −1
Ejemplo 12.
Se selecciona al azar un comité de cinco personas entre tres químicos y cinco físicos. Calcular la distribución de probabilidad
para el número de químicos en el comité.

Solución.
Sea la variable aleatoria X = número de químicos en el comité. Se satisfacen las dos condiciones de un experimento
hipergeométrico.
  
3 5
0 5 1
P (X = 0) = Hg (0; 5, 3, 8) =   =
8 56
5
  
3 5
1 4 15
P (X = 1) = Hg (1; 5, 3, 8) =   =
8 56
5
  
3 5
2 3 30
P (X = 2) = Hg (2; 5, 3, 8) =   =
8 56
5
  
3 5
3 2 10
P (X = 3) = Hg (3; 5, 3, 8) =   =
8 56
5

Ejemplo 13.
De una urna que contiene seis bolas negras y nueve bolas rojas se extraen cinco bolas, ¾cuál es la probabilidad de obtener
tres bolas rojas?
Sea X= Número de bolas rojas al extraer cinco bolas de la urna. La probabilidad pedida es:
  
6 9
2 3
P (X = 3) =   = 0,4196.
15
5
Ejemplo 14.
Lotes de 40 componentes cada uno se denominan aceptables si no contienen más de tres defectuosos. El procedimiento para
muestrear el lote es la selección de cinco componentes al azar y rechazar el lote si se encuentra un componente defectuoso.
¾Cuál es la probabilidad de que se encuentre exactamente un defectuoso en la muestra si hay tres defectuosos en todo el
lote?

10
Solución.
Utilizando la distribución hipergeométrica con n = 5, R = 3, N = 40 y x = 1, entonces
  
3 37
1 4
P (X = 1) = Hg (1; 5, 3, 40) =   = 0,3011.
40
5

Ejemplo 15.
Si el experimento del ejemplo anterior se repite tres veces, reintegrando las bolas extraídas y añadiendo el mismo número
de bolas negras y rojas obtenidas, ¾cuál es la probabilidad de obtener una secuencia de una, dos y tres bolas rojas?

Solución.
Sea Xi = Número de bolas rojas extraídas en la extracción i-ésima. La probabilidad pedida es:

P (Xi = i) = P (X1 = 1) × P (X2 = 2/X1 = 1) × P (X3 = 3/(X1 = 1, X2 = 2))


        
6 9 10 10 13 12
4 1 3 2 2 3
=   ×   ×  
15 20 25
5 5 5
= 0,0051.

Cuando el tamaño de la población es grande, los muestreos con y sin reemplazo son equivalentes, por lo que la
R
distribución hipergeométrica se aproxima en tal caso a la binomial. Por ello, cuando N y R tiende a innito y converge
N
R
a un valor p, la distribución hipergeométrica Hg (n, R, N ) se aproxima a una distribución binomial B(n, p), con p= .
N
Teorema 1.
R
Sea 0 < p < 1. Si N, R → ∞ de tal forma que → p, entonces Hg (x; n, R, N ) → B(x; n, p).
N
Ejemplo 16.
Un fabricante asegura que sólo el 1 % de su producción total se encuentra defectuosa. Supónganse que se ordenan 1000 ar-
tículos y se seleccionan 25 al azar para inspeccionarlos. Si el fabricante se encuentra en lo correcto, ¾cuál es la probabilidad
de observar dos o más artículos defectuosos en la muestra?

Solución.
Sea X = Número de artículos defectuosos en la muestra. Entonces x = 0, 1, 2, . . . , 25.
d
X = Hg (25, 10, 1000). Como N ≫ n,
Observe que es decir, 1000 ≫ 25, se puede aproximar a una Binomial. Es decir,
d R 10
X = B(25, 0,01), donde p = = = 0,01.
N 1000
Luego se procede a resolver el problema como una Binomial.
Se pide hallar la probabilidad de que por lo menos 2 artículos estén defectuosos en la muestra.
25 25
 
Por lo tanto, P (X ≥ 2) = 1−P (Y < 2) = 1− 0 (0,01)0 (0,99)25 − 1 (0,01)(0,99)24 = 1−0,7778−0,1964 = 0,0258.
Ejemplo 17.
Se estima que 4000 de 10000 votantes residentes en la ciudad están en contra de un nuevo impuesto a las ventas. Si se
seleccionan al azar 15 votantes y se les pide la opinión. ¾Cuál es la probabilidad de que por lo menos 7 estén a favor del
nuevo impuesto?

Solución.

11
Sea X = Número de votantes a favor de un nuevo impuesto a las ventas. Entonces x = 0, 1, 2, . . . , 15.
d
Observe que X = Hg (15, 6000, 10000). Como N ≫ n, es decir, 10000 ≫ 15, se puede aproximar a una Binomial. Es
d R 6000
decir, X = B(15, 0,6), donde p = = = 0,6.
N 10000
Luego se procede a resolver el problema como una Binomial.
Se pide hallar la probabilidad de que por lo menos 7 estén a favor del nuevo impuesto.
Por lo tanto, P (X ≥ 7) = 1 − P (Y < 7) = 1 − 0,0951 = 0,9049.
Mediante el comando rhyper() en R se pueden obtener valores al azar de la distribución hipergeométrica.
Por ejemplo, rhyper(k, K, N − K, n) genera k valores al azar de la distribución Hg (n, R, N ).

> rhyper(30,8,32,25)
[1] 5 4 5 6 4 6 6 5 6 5 6 6 3 4 5 4 2 7 6 4 3 4 3 2 5 5 4 5 5 6

Distribución de Poisson
Supongamos que deseamos observar el número de ocurrencias de un cierto evento dentro de un intervalo de tiempo
dado, por ejemplo, el número de clientes que llegan a un cajero automático durante la noche, o tal vez deseamos registrar
el número de accidentes que ocurren en cierta avenida durante todo un día, o el número de reclamaciones que llegan a
una compañía aseguradora. Para modelar este tipo de situaciones podemos denir la variable aleatoria X como el número
de ocurrencia de este evento en el intervalo de tiempo dado. Es claro entonces que X puede tomar los valores 0, 1, 2, . . .,
y en principio no ponemos una cota superior para el número de observaciones del evento. Adicionalmente supongamos
que conocemos la tasa media de ocurrencia del evento de interés, que denotamos por la letra λ (lambda). El parámetro
λ es positivo y se interpreta como el número promedio de ocurrencias del evento por unidad de tiempo o espacio. La
probabilidad de que la variable aleatoria X tome un valor entero x≥0 se denirá a continuación.

Denición 3.
Se dice que una variable aleatoria X tiene distribución Poisson de parámetros λ > 0, si su función de masa de probabilidad
está dada por:
λx

e−λ , si x = 0, 1, 2, . . .

f (x) = x!
0, e. o. c.

donde λ es el número promedio de resultados por unidad de tiempo o región.

d
Se escribe X = P(λ) para indicar que la variable aleatoria X tiene distribución Poisson de parámetro λ.
Puede demostrarse que la función f (x) arriba denida es efectivamente una función de probabilidad para cada valor
de λ>0 jo, y para ello conviene recordar el desarrollo de la serie de Taylor de la función ex alrededor del cero, es decir,


X xk
ex =
k!
k=0

La forma de esta función de probabilidad se muestra en la Figura 7 cuando λ = 2.

12
Distribución Poisson: Media = 2

● ●

0.25
0.20

Probabilidad

0.15

0.10

0.05


0.00 ● ● ● ●

0 2 4 6 8 10

Figura 7: Función de masa de probabilidad de una distribución Poisson de parámetro λ = 2.

En R pueden obtenerse los valores de f (x) usando el comando dpois().


Por ejemplo, dpois(x, λ) evalúa f (x) de la distribución P(λ).

> dpois(3,2)
[1] 0.180447
Ejemplo 18.
El número medio de vehículos por minuto que llegan a una gasolinera es igual a 2. ¾Cuál es la probabilidad de que en un
minuto lleguen 5 vehículos?, ¾y la de que en 5 minutos no llegue ninguno?
Se trata de una distribución de Poisson, para la que se conoce el número medio, que es igual al parámetro λ, por lo
d
tanto X = P(2) (gura 7). La primera probabilidad pedida es:

25
P (X = 5) = e−2 = 0,036.
5!
Para calcular la otra probabilidad, hay que hacer un cambio de parámetro pues la longitud del intervalo cambia.
d
Si en un minuto el número medio de vehículos es 2, en cinco minutos será 10. Por lo tanto se tiene Y = P(10).

100
P (Y = 0) = e−10 = 0,000045.
0!
Ejemplo 19.
Por determinado punto de una calle en el que se instala un control, pasa una media de 4 vehículos por minuto. ¾Cuál es
la probabilidad de que en un determinado minuto pasen exactamente 2 vehículos?

Solución.
d
Sea X = número de veces que ocurre ese fenómeno en una unidad de tiempo. Entonces X = P(4).
42
Luego, P (X = 2) = e−4 = 0,1465.
2!
La función de distribución de una variable aleatoria X con distribución Poisson de parámetros λ, está dada por


0,
 si x < 0
x
F (x) = X −λ λk
 e , si x ≥ 0
 xk
k=0
d
La gráca de la función de distribución de una variable aleatoria con distribución X = P(2) está dada en la gura 8.

13
Distribución Poisson: Media = 2

1.0
0.8
Probabilidad Acumulada

0.6
0.4
0.2
0 2 4 6 8 10

Figura 8: Función de distribución de una distribución Poisson de parámetro λ = 2.

La función de distribución F (x) para esta distribución, se dene como la suma de los valores de f (x), sus valores
pueden encontrarse con facilidad en R mediante el comando ppois().
Por ejemplo, ppois(x, λ) evalúa F (x) de la distribución P(λ).

> ppois(3,2)
[1] 0.8571235
A continuación se presentan las propiedades más importantes de la distribución Poisson.

Propiedad 6.
Sea X es una variable aleatoria con distribución Poisson de parámetros λ. Entonces:

1. E[X] = λ.
2. V ar[X] = λ.
t
−1)
3. mX (t) = eλ(e .

it
−1)
4. ϕX (t) = eλ(e .

d
Puede además demostrarse que cuando X = B(n, p)
y hacemos tender n a innito y a probabilidad de éxito, p, tiende
a cero de tal forma que el producto np se mantenga constante igual a λ, entonces la variable aleatoria X adquiere la
distribución Poisson con parámetro λ. Este resultado sugiere que cuando n es grande, la distribución binomial puede
ser aproximada mediante la distribución Poisson de parámetro λ = np. Esto es particularmente útil pues el cálculo de
probabilidades de la distribución binomial involucra el cálculo de factoriales y ello puede ser computacionalmente difícil
para números grandes.

Teorema 2.
Si p(n) es una sucesión con 0 < p(n) < 1 y n(p(n)) → λ cuando n → ∞, entonces B(x; n, p(n)) → P(x; λ).
Ejemplo 20.
Una máquina envasadora rompe de media un elemento de cada 5000 que envasa. Las piezas envasadas se comercializan
en lotes de 40000. ¾Cuál es la probabilidad de que un lote tenga 10 o menos elementos defectuosos?

Solución.
d 1
Sea X = número de elementos defectuosos en el lote. Entonces X = B(40000, 5000 ) y nos piden P [X ≤ 10] = 0,8159056.
d 1 d
La función de probabilidad X = B(40000, ) de es casi idéntica a la de X = P(8).
5000
Por lo tanto, P [X ≤ 10] = 0,8158858.

14
En general, la función de probabilidad de una B(n; p) se puede aproximar por la de una P(np) cuando  n es muy
grande y p es muy pequeña (aplicaremos esta aproximación para n ≥ 20; p < 0,05).
Hemos denido a la variable aleatoria Poisson como el número de ocurrencias de un cierto evento dentro de un intervalo
de tiempo dado, supongamos de longitud unitaria, [0, 1]. Suponga ahora que nos interesa observar las ocurrencias del evento
en un intervalo de longitud diferente, por ejemplo [0, t], con t > 0. Tal conteo de ocurrencias también sigue una distribución
Poisson pero esta vez de parámetro λt. Por ejemplo, si t = 2, entonces el número de ocurrencias del evento en el intervalo
[0, 2] tiene distribución P(2λ). Si se quiere generalizar a cualquier región de tamaño t la función de masa de probabilidad
es:
 −λt (λt)x

e , si x = 0, 1, 2, . . .
f (x) = Pt (X = x) = x!
0, e. o. c.

donde λ es el número promedio de resultados por unidad de tiempo o región.

Ejemplo 21.
El número de aviones que llegan a un aeropuerto internacional se considera como una cantidad aleatoria y se modela
mediante una variable aleatoria con distribución Poisson con una frecuencia de 3 aviones cada 10 minutos. Es decir, la
unidad de medición del tiempo son diez minutos. Entonces

1. La probabilidad de que no llegue ningún avión en un periodo de 20 minutos (dos unidades de tiempo) es P (X = 0)
con λ = 3(2) = 6.
 
1 3
2. La probabilidad de que llegue sólo un avión en el minuto siguiente es P (X = 1) con λ=3 = .
10 10
3. La probabilidad de que lleguen dos o mas aviones en un periodo de 15 minutos es P (X ≥ 2) con λ = 3(1,5) = 4,5.

La distribución Poisson tiene algunas propiedades que resultan muy útiles en su aplicación. La siguiente es una de
ellas.

Propiedad 7.
Si X1 , X2 , . . . , Xn son variables aleatorias independientes
 n  de tipo P(λ1 ), P(λ2 ), ..., P(λn ), respectivamente, entonces la
P n P
variable X = Xi sigue una distribución P λi .
i=1 i=1

Demostración.
Para cualquier entero x≥0 y n = 2, se tiene que:

x
X
P (X1 + X2 = x) = P (X1 = u, X2 = x − u)
u=0
Xx
= P (X1 = u)P (X2 = x − u)
u=0
x
X λu1 −λ2 λx−u
= e−λ1 e 2

u=0
u! (x − u)!
x  
1 X x u x−u
= e−(λ1 +λ2 ) λ λ
x! u=0 u 1 2
(λ1 + λ2 )x
= e−(λ1 +λ2 )
x!

Mediante el comando rpois() en R pueden generarse valores al azar de la distribución Poisson.


Por ejemplo, rpois(k, λ) genera k valores al azar de la distribución P(λ)

> rpois(25,2)
[1] 3 2 2 2 0 1 1 2 1 3 1 1 3 1 3 1 4 1 2 0 0 0 2 2 1

15
Distribución geométrica
La distribución geométrica permite calcular la probabilidad de que tenga que realizarse un número k de repeticiones
hasta obtener un éxito por primera vez. Así pues, se diferencia de la distribución binomial en que el número de repeticiones
no está predeterminado, sino que es la variable aleatoria que se mide y, por otra parte, el conjunto de valores posibles de
la variable es ilimitado.
La distribución geométrica se utiliza en la distribución de tiempos de espera, de manera que si los ensayos se realizan
a intervalos regulares de tiempo, esta variable aleatoria proporciona el tiempo transcurrido hasta el primer éxito.

Denición 4.
Se dice que una variable aleatoria X tiene distribución geométrica de parámetro p, si su función de masa de probabilidad
está dada por: (
p(1 − p)x−1 , si x = 1, 2, . . .
f (x) = P (X = x) =
0, e. o. c.

d
Se escribe X = G(p) para indicar que la variable aleatoria X tiene distribución geométrica de parámetro p.
La gráca de esta función cuando p = 0,5 se muestra en la Figura 9 y en R se pueden encontrar los valores de f (x)
con el comando dgeom().
Por ejemplo, dgeom(x, p) evalúa f (x) de la distribución G(p).
> dgeom(5,0.5)
[1] 0.015625

Gráfica de la función de densidad G(0.5)


0.5
0.4
0.3
fx

0.2
0.1
0.0

0 2 4 6 8 10

Figura 9: Función de masa de probabilidad de una distribución geométrica de parámetro p = 0,5.

La función de distribución de una variable aleatoria X con distribución geométrica de parámetro p, está dada por


0,
 si x<1
x
F (x) = X

 p(1 − p)k−1 , si x ≥ 1.
k=0

d
La gráca de la función de distribución de una variable aleatoria con distribución X = G(0,5) está dada en la gura 10.

16
Gráfica de la función de distribución G(0.5)

1.0
0.9
0.8
Fx

0.7
0.6
0.5
0 2 4 6 8 10

Figura 10: Función de distribución de una distribución geométrica de parámetro p = 0,5.

Estos valores pueden encontrarse en R usando el comando pgeom().


Por ejemplo, pgeom(x, p) evalúa F (x) de la distribución G(p).
> pgeom(5,0.5)
[1] 0.984375
A continuación se presentan las propiedades más importantes de la distribución geométrica.

Propiedad 8.
Sea X es una variable aleatoria con distribución geométrica de parámetro p. Entonces:

1
1. E[X] = .
p
1−p
2. V ar[X] = .
p2
pet
3. mX (t) = .
1 − qet
peit
4. ϕX (t) = .
1 − qeit
Ejemplo 22.
Un fabricante utiliza fusibles en un sistema eléctrico comprados en lotes grandes. Se prueban secuencialmente hasta que
se observa el primero con falla. Asumiendo que el lote contiene 10 % de fusibles defectivos.

a) ¾Cuál es la probabilidad de que el primer fusible defectuoso sea uno de los primeros 5 probados?

b) Encontrar la media, varianza y desviación estándar para el número de fusibles probados hasta que el primer fusible
con falla es observado.

Solución.
d
a) Sea X = Número de fusibles que hay que probar antes de obtener el primero defectuoso. Entonces X = G(0,1).

17
Luego,

5
X
P (X ≤ 5) = p × (1 − p)x−1
x=1
5
X
= (0,1) × (0,9)x−1
x=1
= P (X = 1) + P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5)
= 0,1 + (0,1) × (0,9) + (0,1) × (0,9)2 + (0,1) × (0,9)3 + (0,1) × (0,9)4
= 0,4095

1 1 1−p 1 − 0,1 0,9


b) E[X] = = = 10 y V ar[X] = 2
= 2
= = 90.
p 0,1 p (0,1) 0,01

Ejemplo 23.
Una persona participa cada semana con un boleto en un juego de lotería en donde la probabilidad de ganar el primer
1
premio es p = 10−6 = . ¾Cuántos años en promedio debe esta persona participar en el juego hasta obtener el
1000000
primer premio?

Solución.
Si X denota el número de participaciones en el juego antes de obtener el primer premio, entonces X tiene distribución
geométrica de parámetro p = 10−6 . Y por lo tanto la esperanza de la variable X es el número promedio de semanas que
deben transcurrir hasta obtener el primer premio. Este número es

1 1
E[X] = = −6 = 106 = 1000000.
p 10
1000000
Lo que es equivalente a = 19230,77 ≈ 19230 años aproximadamente.
52
En R se pueden generar valores al azar de la distribución geométrica usando el comando rgeom().
Por ejemplo, rgeom(k, p) genera k valores al azar de la distribución G(p).
> rgeom(25,0.5)
[1] 0 0 1 0 0 0 4 1 0 0 2 2 2 1 0 3 1 0 0 0 0 0 3 3 1
Esta distribución presenta la denominada propiedad de Harkov o pérdida de memoria, que implica que la proba-
bilidad de tener que esperar un tiempo t no depende del tiempo que ya haya transcurrido.

Propiedad 9.
d
Si X = G(p), entonces para cualesquiera n y m se verica que

P (X > m + n|X > m) = P (X ≥ n).

Recíprocamente, si X es una variable aleatoria que toma valores no negativos y se cumple que

P (X > m + n|X > m) = P (X ≥ n)

para todo m y n, entonces se tiene que X se distribuye según una distribución geométrica.

Ejemplo 24.
Para la misma población del ejemplo 6, se extraen animales hasta obtener la primera hembra, ¾cuál es la probabilidad de
en la quinta extracción se obtenga la primera hembra?
Si se considera como éxito extraer una hembra y se dene la variable aleatoria X como: Número de extracciones antes
d
de obtener la primera hembra, se tiene una distribución geométrica, es decir, X = G(0,4).
La probabilidad que se pide es:
P (X = 5) = 0,4 × 0,64 = 0,0518.

18
Distribución binomial negativa
Consideremos un experimento donde las propiedades son las mismas que se indican en el experimento binomial, con
la excepción de que las pruebas se repetirán hasta que ocurra un número jo de éxitos. Por lo tanto, en vez de calcular
la probabilidad de x éxitos en n pruebas, donde n es jo, ahora nos preocuparemos por la probabilidad de que ocurra el
k -ésimo x-ésima prueba. Los experimentos de este tipo se llaman experimentos binomiales negativos.
éxito en la
Denimos ahora la variable aleatoria X como el número de pruebas hasta obtener exactamente k éxitos. Ésta se llama
variable aleatoria binomial negativa y su distribución de probabilidad se llama distribución binomial negativa. En este
caso, el número de éxitos permanece constante mientras que el número de repeticiones X es una variable aleatoria. Es claro
que la variable X puede tomar los valores 1, 2, . . . con las probabilidades dadas por la función de masa de probabilidad:

Denición 5.
Se dice que una variable aleatoria X tiene distribución binomial negativa de parámetros k y p, si su función de masa de
probabilidad está dada por:
 
 x − 1 pk (1 − p)x−k , si x = k, k + 1, k + 2, . . .
f (x) = P (X = x) = k−1
0, e. o. c.

En el caso especial k = 1, se dice que la variable aleatoria tiene una distribución geométrica de parámetro p.
d
Se escribe X = BN (k, p) para indicar que la variable aleatoria X tiene distribución binomial negativa de parámetros k
y p.  
1
Un ejemplo es el número de lanzamientos de un dado antes de obtener un 6 en tres ocasiones, que sigue una BN 3, .
6
La gráca de esta función aparece en la Figura 11 cuando los valores de los parámetros son k = 2 y p = 0,5. Los valores
de f (x) se pueden obtener en R usando el comando dnbinom().
Por ejemplo, dnbinom(x, r, p) evalúa f (x) de la distribución BN (k, p).
> dnbinom(3,2,0.5)
[1] 0.125

Gráfica de la función de densidad BN(2, 0.5)


0.25
0.20
0.15
fx

0.10
0.05
0.00

0 2 4 6 8 10

Figura 11: Función de masa de probabilidad de una distribución binomial negativa de parámetros k=2 y p = 0,5.

La función de distribución de una variable aleatoria X con distribución binomial negativa de parámetros k y p, está
dada por

0,x 


si x<0
F (x) = X j − 1 k
p (1 − p)j−k , si x ≥ 0.
k−1


j=0
d
La gráca de la función de distribución de una variable aleatoria con distribución X = BN (2, 0,5) está dada en la
gura 12.

19
Los valores de la función de distribución F (x) se pueden encontrar en R usando el comando pnbinom().
Por ejemplo, pnbinom(x, r, p) evalúa F (x) de la distribución BN (k, p).
> pnbinom(7,2,0.5)
[1] 0.9804688

Gráfica de la función de distribución BN(2, 0.5)

1.0
0.8
Fx

0.6
0.4

0 2 4 6 8 10

Figura 12: Función de distribución de una distribución binomial negativa de parámetros k=2 y p = 0,5.

A continuación se presentan las propiedades más importantes de la distribución binomial negativa.

Propiedad 10.
Sea X es una variable aleatoria con distribución binomial negativa de parámetros k y p. Entonces:

k
1. E[X] = .
p
k(1 − p)
2. V ar[X] = .
p2
k
pet

3. mX (t) = .
1 − qet
k
peit

4. ϕX (t) = .
1 − qeit
En R se pueden generar valores al azar de la distribución binomial negativa con el comando rnbinom().
Por ejemplo, rnbinom(k, r, p) genera k valores al azar de la distribución BN (k, p).
> rnbinom(25,2,0.5)
[1] 3 2 1 0 3 0 0 0 3 5 1 1 1 1 1 2 3 0 0 2 7 0 2 0 1
Ejemplo 25.
Se quieren reclutar 5 personas para participar en un nuevo programa. Si p = 0,2 la probabilidad de que las personas quieran
participar. ¾Cuál es la probabilidad de que se les deba preguntar a 15 personas antes de encontrar a 5 que estén de acuerdo
en participar?

Solución.
d
Sea X = Número de personas de acuerdo en participar. Entonces X = BN (5, 0,2).
La probabilidad de preguntarle a
  X = 15 personas
 antes
 del k = 5 éxito es:
15 − 1 14
P (X = 15) = (0,2)5 × (1 − 0,2)15−5 = (0,2)5 × (0,8)10 = 0,0344
5−1 4

20
Nota 2.
Supongamos que no interesa conocer el número de ensayos necesarios hasta obtener de manera exacta k éxitos, sino el
número de fracasos Y ocurridos antes de obtener de manera exacta k éxitos. En este caso, se tiene que X = k + Y y por
lo tanto:  
 k + y − 1 pk (1 − p)y , si y = 0, 1, 2, . . .
f (y) = P (Y = y) = k−1
0, e. o. c.

Algunos autores llaman a esta última la distribución binomial negativa y a la dada en la denición anterior la llaman
distribución de Pascal.

Ejemplo 26.
Siguiendo con la población del ejemplo 6, ¾cuál es la probabilidad de extraer 5 hembras antes del tercer macho?
En este caso, el éxito se dene como extraer un macho, por lo que p = P (éxito) = 0,6 y X = Número de hembras
d
antes de obtener el tercer macho. Entonces X = BN (3, 0,6).
La probabilidad pedida es:
   
3+5−1 7
P (X = 5) = 0,63 × 0,45 = 0,63 × 0,45 = 0,0464.
3−1 2

En el caso de que los sucesos ocurran a intervalos regulares de tiempo, esta variable proporciona el tiempo total para
que ocurran k éxitos, por lo que también se denomina distribución binomial de tiempo de espera.
La distribución binomial negativa fue propuesta, originalmente, como una alternativa a la distribución de Poisson
para modelar el número de ocurrencias de un suceso cuando los datos presentan lo que se conoce como variación extra-
Poisson o sobredispersión. En estas situaciones, la varianza es mayor que la media, por lo que se incumple la propiedad
que caracteriza a una distribución de Poisson, según la cual la media es igual a la varianza. La primera aplicación en
bioestadística la realizó Student (William S. Gosset) a principios del siglo XX cuando propuso esta distribución para
modelar el número de glóbulos rojos en una gota de sangre. En este caso, la variabilidad extra se debe al hecho de que
esas células no están uniformemente distribuida en la gota, es decir, la tasa de intensidad no es homogénea.
Por ejemplo, la distribución binomial negativa es más adecuada que la de Poisson para modelar el número de accidentes
laborales ocurridos en un determinado lapso. La distribución de Poisson asume que todos los individuos tienen la misma
probabilidad de sufrir un accidente y que ésta permanece constante durante el período de estudio; sin embargo, es más
plausible la hipótesis de que los individuos tienen probabilidades constantes en el tiempo, pero que varían de unos sujetos
a otros; esto es lo que se conoce en la literatura como la propensión a los accidentes (accident proneness). Esta hipótesis
se traduce en una distribución de Poisson mixta, o de efectos aleatorios, en la que se supone que las probabilidades varían
entre individuos de acuerdo a una distribución gamma y esto resulta en una distribución binomial negativa para el número
de accidentes.

Propiedad 11.
Sean X1 , X2 , . . . , Xk variables aleatorias independientes e idénticamente distribuidas según una distribución geométrica de
X k
parámetro p. Se tiene que Xi sigue una distribución binomial negativa de parámetros k y p.
i=1

Propiedad 12.
Sean X1 , X2 , . . . , Xr variables aleatorias independientes e idénticamente distribuidas según una binomial negativa de pará-
Xr
metros ki y p con i = 1, 2, . . . , r. Se tiene que Xi sigue una distribución binomial negativa de parámetros k y p, siendo
i=1
r
X
k= ki .
i=1

Propiedad 13.
d
Si X = BN (k, p), entonces para la variable aleatoria Y =X −k se obtiene que:

k k(1 − p)
1. E[Y ] = −k = .
p p

21
k(1 − p)
2. V ar[Y ] = V ar[X] = .
p2
 k
p
3. mY (t) = .
1 − qet
 k
p
4. ϕY (t) = .
1 − qeit

22

Potrebbero piacerti anche