Introduccion A Las Distribuciones de Probabilidad

1
UNIVERSIDAD NACIONAL DE JUJUY
Facultad de Ciencias Económicas
Cátedra: ESTADÍSTICA
Variable aleatoria, Valor esperado y

Distribuciones de probabilidad
María Elena Marcoleri
Abril de 2007
2
VARIABLE ALEATORIA
Variables aleatorias
Una variable es aleatoria si toma diferentes valores como resultado de un

experimento aleatorio. Puede ser discreta o continua. Si puede tomar sólo un número
limitado de valores, entonces es una variable aleatoria discreta. En el otro extremo, si
puede tomar cualquier valor dentro de un intervalo dado, entonces se trata de una
variable aleatoria continua.
Se puede pensar en una variable aleatoria como un valor o una magnitud que
cambia de una presentación a otra, sin seguir una secuencia predecible. Los valores de
una variable aleatoria son los valores numéricos correspondientes a cada posible
resultado de un experimento aleatorio.
Para comprender este concepto se plantea el siguiente ejemplo:
Con el objeto de verificar la exactitud de su contabilidad, las compañías realizan

auditorías regularmente. Suponiendo que el 5% de las registraciones realizadas son
erróneas, y el auditor revisa al azar tres registros,
a) realizar un diagrama de árbol de probabilidad

b) indicar los valores que asume la variable aleatoria X: n° de errores detectados
por el auditor.
a) 1er. Registro 2do. Registro 3er. Registr. P.muestr. Probabilidad
0,05 E (E, E, E) 0,053 = 0,000125

E
0,05 0,95 E’ (E, E, E’) 0,052 0,95 = 0,002375
E
0,95 0,05 E (E, E’, E) 0,002375
0,05 E’
0,95 E’ (E, E’, E’) 0,05.0,952 = 0,045125
0.05 E (E’, E, E) 0,002375

0,95 E
0,05 0,95 E’ (E’, E, E’) 0,045125
E’
0,95 0,05 E (E’, E’, E) 0,045125
E’
0,95 E’ (E’, E’, E’) 0,953 = 0,857375
Suma = 1
Los valores que asume la variable aleatoria X son, x i : 0, 1, 2 y 3.
Los resultados del diagrama de árbol de probabilidades se pueden expresar

mediante la tabla siguiente:
xi 0 1 2 3
3
Probabilidad 0,857375 0,135375 0,007125 0,000125
Siendo la Probabilidad = f(xi) = P(X = xi) , para i = 1, 2, 2, . . . , N
El conjunto de pares ordenados [x i , f(xi)] constituye la función de probabilidad,

denominada también distribución de probabilidad de la variable aleatoria.
Introducción a las distribuciones de probabilidad.
Las distribuciones de probabilidad están relacionadas con las distribuciones de

frecuencias. Una distribución de frecuencias teórica es una distribución de probabilidades
que describe la forma en que se espera que varíen los resultados. Debido a que estas
distribuciones tratan sobre expectativas de que algo suceda, resultan ser modelos útiles
para hacer inferencias y para tomar decisiones en condiciones de incertidumbre.
Una distribución de frecuencias es un listado de las frecuencias observadas de

todos los resultados de un experimento que se presentaron realmente cuando se efectuó
el experimento, mientras que una distribución de probabilidad es un listado de las
probabilidades de todos los posibles resultados que podrían obtenerse si el experimento
se lleva a cabo.
Las distribuciones de probabilidad pueden basarse en consideraciones teóricas o

en una estimación subjetiva de la posibilidad. Se pueden basar también en la experiencia.
Una función definida para los valores de una variable aleatoria discreta es una
función de probabilidad, si verifica dos condiciones:
 0 ≤ f(xi) ≤ 1 para todo xi. (f(xi) es una probabilidad, por lo tanto debe tomar
valores entre 0 y 1).
 ∑ f(xi) = 1 para i = 1, 2, 2, . . . , N. (la suma de probabilidades repartidas

i
entre todos los valores de la variable debe ser igual a 1).
La representación gráfica para la variable del ejemplo es un gráfico de bastones,

porque se trata de una variable aleatoria discreta.
f(xi)
1
0,8
0,6
0,4
0,2
0 1 2 3 xi
4
Resumiendo, puede decirse que las distribuciones de probabilidad son modelos
teóricos que describen la forma en que varían los resultados de un experimento aleatorio.
Lista de los resultados de un experimento con las probabilidades que se esperarían ver
asociadas con cada resultado.
De la misma manera que calculamos frecuencias acumuladas, podemos acumular

probabilidades, obteniendo la función de distribución acumulada de probabilidades:
F(x) =  f(xi)
i
Esta función representa la probabilidad de que la variable aleatoria sea menor o

igual que un determinado valor: F(xi) = P (X ≤ xi) o bien
Gráficamente, la función aumenta de "a saltos", ya que entre dos valores

consecutivos de una variable discreta, no puede tomar valores intermedios. Por lo tanto,
el gráfico es escalonado.
Calculando la FDA para el ejemplo de los errores en los registros contables, se

obtiene:
xi 0 1 2 3
f(xi) 0,857375 0,135375 0,007125 0,000125
F(xi) 0,857375 0,99275 0,999875 1
Y la interpretación es similar a la de las frecuencias acumuladas de una variable

discreta, por ejemplo, puede decirse existe un 99% de probabilidad de que los registros
contables tengan hasta 1 error (o un error o menos).
Variables aleatorias continuas.
En este caso, en lugar de trabajar con la probabilidad de valores particulares de la

variable, resulta más apropiado calcular probabilidades asociadas a intervalos. Se usa
una función que mide "concentración" de probabilidades alrededor de un punto, que se
denomina función de densidad de probabilidad (fdp) y se denota como f(x).
Una función de densidad de probabilidad debe cumplir con las siguientes

propiedades:
 f(x) > 0 (la función es no negativa para cualquier valor de x).
  f(x) dx = 1 (la acumulada para todos los valores de la variable suma 1, el área
bajo la curva de la función vale 1).
5
Si se quieren hallar probabilidades se tendrá que recurrir a métodos empíricos y
usar técnicas estadísticas: tomar una muestra, examinar y anotar las frecuencias
observadas. Entonces se tomará como valor de la probabilidad de un suceso s 1 la
frecuencia observada de éste: p(s1) = fr(s1).
Y así se podrá construir un histograma de frecuencias relativas y un histograma de

frecuencias relativas acumuladas. En el primero, la fr(X  x) será la suma de las
frecuencias de todas las clases anteriores a x; lo que, geométricamente, es el área bajo la
curva de frecuencias entre el inicio de la gráfica y el valor x. La obtención de fr(X  x) en la
segunda gráfica es más rápido pues, fr(X  x) es la frecuencia acumulada del valor x y
se lee directamente de la gráfica.
A partir de una situación real con densidades de frecuencias se crea un modelo

teórico con asignación de probabilidades.
Sea X una variable aleatoria continua que toma valores en un intervalo [a, b]. Si
se procede a dividir el intervalo cada vez en más partes el polígono de frecuencias
relativas (densidades de frecuencias) se va aproximando a una curva con un determinado
aspecto.
Una vez realizado este proceso de dividir sucesivamente el intervalo, las

densidades de frecuencias pasan a ser, en el límite, densidades de probabilidad.
La probabilidad de que la variable X tome los valores entre x0 y x0+h es
P(x0  X  x0+h) y corresponde al área bajo la curva en el intervalo [x 0 , x0+h].
La función correspondiente a esta curva, y = f(x), se llama Función de densidad.
Una función y = f(x) es una función de densidad de una variable aleatoria continua si
cumple las siguientes condiciones:
La función de distribución para una variable aleatoria continua se calcula:
F(a) = P(X < a) =  f(x) dx

La probabilidad de que la variable esté dentro de un intervalo [a - b] se calcula:
P (a< x < b) = F(b) - F(a)

6
La probabilidad de que la variable tome un valor particular se puede expresar
como: F(c) - F(c) = 0
Esto explica la idea de que para el caso de una variable aleatoria continua no tiene
sentido trabajar con la probabilidad de un valor particular.
Como hemos visto hay variables aleatorias que pueden tomar cualquier valor de un
intervalo real de la forma (a, b), (a, +), (-, b),  o uniones de ellos. A las
variables de este tipo se las denomina variables aleatorias continuas.
Por ejemplo: Supongamos que vamos a realizar un experimento aleatorio que consiste en
seleccionar una persona y apuntar su peso. Podemos crear una variable aleatoria cuyos valores sean el
número de kilogramos que pesa la persona observada. En este caso, el rango de valores posibles se
extiende entre los límites naturales, pero la continuidad de esta variable aleatoria radica en el carácter
continuo de lo que medimos, el peso, es decir, en el hecho de que entre dos valores posibles se podrían
obtener infinitos valores intermedios, también posibles si utilizáramos aparatos con suficiente precisión.
Estos "infinitos" en el interior del rango de la variable es lo que diferencia a las variables continuas de las
discretas.
Para dos números reales cualesquiera a y b tal que (a < b), los sucesos y
serán mutuamente excluyentes y su suma es el suceso por lo
que tenemos entonces que:
y finalmente,
Por lo tanto, una vez conocida la función de distribución F(x) para todos los valores
de la variable aleatoria X conoceremos completamente la distribución de probabilidad de
la variable.
Como la probabilidad es siempre un número positivo, la función de distribución será

una función no decreciente que cumple lo siguiente:
Es decir la probabilidad de todo el espacio muestral es 1 tal y

como establece la teoría de la probabilidad y por otra parte:
Es decir la probabilidad del suceso nulo es cero.
Tipos de distribuciones de probabilidad.
Las distribuciones de probabilidad se clasifican como continuas y discretas. En la

distribución de probabilidad discreta está permitido tomar sólo un número limitado de
valores.
En una distribución de probabilidad continua, la variable que se está considerando

puede tomar cualquier valor dentro de un intervalo dado.
7
Las distribuciones continuas son una forma conveniente de presentar distribuciones
discretas que tienen muchos resultados posibles, todos muy cercanos entre sí.
Medidas descriptivas de una variable aleatoria
Valor esperado de una variable aleatoria.
El valor esperado es una idea fundamental en el estudio de las distribuciones de

probabilidad.
Para obtener el valor esperado de una variable aleatoria discreta, se multiplica

cada valor que la variable puede tomar por la probabilidad de presentación de ese valor y
luego se suman esos productos. Es un promedio pesado de los resultados que se
esperan en el futuro. El valor esperado pesa cada resultado posible con respecto a la
frecuencia con que se espera se que presente. En consecuencia, las presentaciones más
comunes tienen asignadas un peso mayor que las menos comunes.
El valor esperado también puede ser obtenido a partir de estimaciones subjetivas.

En ese caso, el valor esperado no es más que la representación de las convicciones
personales acerca del resultado posible.
En muchas situaciones, encontraremos que es más conveniente, en términos de

los cálculos que se deben hacer, representar la distribución de probabilidad de una
variable aleatoria de una manera algebraica. Al hacer esto, podemos llevar a cabo
cálculos de probabilidad mediante la sustitución de valores numéricos directamente en
una fórmula algebraica.
El valor esperado es un operador matemático, cuya fórmula de cálculo depende del

tipo de variable aleatoria:
Dada una distribución de probabilidad de una variable aleatoria discreta:
xi x1 x2 x3 ... xN
f(xi) f(x1) f(x2) f(x3) ... f(xN)
E(X) = x1. f(x1) + x2. f(x2) + x3. f(x3) + . . . + xN. f(xN) =  xi f(xi)
i
Entonces,
Para variable aleatoria discreta:  = E (X) = i xi f(xi)
Para variable aleatoria continua:  =  x f(x) dx
Se simboliza con la letra griega porque es una media poblacional, ya que los
valores que asume la variable aleatoria son todos los posibles, y constituyen una
población.
8
E(X) =  xi f(xi) =  xi (fi /N) = (1/N)  xi.fi = 

i i i
La E(X) tiene las mismas propiedades que la media aritmética.
Varianza de una variable aleatoria
Para caracterizar correctamente a la distribución, además de determinar su

posición es necesario calcular alguna medida que cuantifique su variabilidad. Una
cantidad muy útil para evaluar la dispersión de la variable aleatoria es el operador
varianza, que se calcula:
Variable aleatoria discreta:  Var (X) =  (xi - E(X))2 f(xi)
Variable aleatoria continua: Var (X) =  (x - E(X))2 f(x) dx
Se simboliza con una letra griega porque es una varianza poblacional.


V(X) =  (xi - )2 f(xi) =  (xi - )2 (fi /N) = (1/N)  (xi - )2.fi = 
i i i
Si se extrae raíz cuadrada a la fórmula anterior, se obtiene la desviación estándar

de la variable aleatoria, que, como se sabe, es la medida de dispersión más importante.
La varianza y la desviación estándar tienen las mismas propiedades que se han

estudiado en Estadística Descriptiva.
En síntesis, los conceptos fundamentales son:
 Una variable aleatoria se construye al atribuir un número (positivo, negativo o

cero) a cada uno de los sucesos aleatorios que forman el espacio muestral de un
experimento aleatorio. La probabilidad de cada valor de la variable es la
probabilidad conjunta de los sucesos que dan lugar a ese valor. Es decir, definimos
una variable aleatoria como una aplicación del espacio muestral sobre el
conjunto de los números reales R.
 Función de probabilidad: función que asigna probabilidades a cada uno de los

valores de una variable aleatoria discreta.
 Función de densidad de probabilidad: función que mide concentración de

probabilidad alrededor de los valores de una variable aleatoria continua.
 Función de distribución: función que acumula probabilidades asociadas a una

variable aleatoria.
9
 Valor esperado: operador matemático que caracteriza la posición de la
distribución de probabilidades. Promedio pesado de los resultados de un
experimento.
 Varianza: operador que caracteriza la dispersión de la distribución
10
DISTRIBUCIONES DE PROBABILIDAD DISCRETAS
Se denomina distribución de probabilidad de variable discreta a aquella cuya

función de probabilidad sólo toma valores positivos en un conjunto de valores de X finito o
numerable. A dicha función se le llama función de masa de probabilidad.
Las distribuciones de variable discreta más importantes son las siguientes:
 Distribución uniforme
 Distribución binomial
 Distribución binomial negativa
 Distribución Poisson
 Distribución geométrica
 Distribución hipergeométrica
 Distribución multinomial
DISTRIBUCIÓN BINOMIAL
Supongamos que un experimento aleatorio tiene las siguientes características:
 En cada prueba del experimento sólo son posibles dos resultados: el suceso A
(éxito) y su contrario(fracaso).
 El resultado obtenido en cada prueba es independiente de los resultados obtenidos
anteriormente.
 La probabilidad del suceso A es constante, la representamos por p, y no varía de
una prueba a otra. La probabilidad de  es 1- p y la representamos por q.
 El experimento consta de un número n de pruebas.
Todo experimento que tenga estas características sigue el modelo de la distribución

Binomial. La variable X que expresa el número de éxitos obtenidos en cada prueba
del experimento, se llama variable aleatoria binomial.
La variable binomial es una variable aleatoria discreta, sólo puede tomar (n + 1)

valores: 0, 1, 2, 3, 4, ..., n suponiendo que se han realizado n pruebas. Como hay que
considerar todas las maneras posibles de obtener k-éxitos y (n-k) fracasos se deben
calcular éstas por combinaciones (número combinatorio n sobre k).
La distribución Binomial se suele representar por B(n,p) siendo n y p los

parámetros de dicha distribución.
Función de Probabilidad de la v.a. Binomial
Función de probabilidad de la distribución Binomial o también denominada función de

la distribución de Bernoulli (para n=1). Verificándose: 0  p  1
11
Como el cálculo de estas probabilidades puede resultar algo tedioso se han

construido tablas para algunos valores de n y p que facilitan el trabajo.
Parámetros de la Distribución Binomial: n y p.
Función de Distribución acumulada de la v.a. Binomial
siendo k el mayor número entero menor o igual a x i.
Esta función de distribución proporciona, para cada número real x i, la probabilidad

de que la variable X tome valores menores o iguales que x i.
El cálculo de las F(x) = p(X x) puede resultar laborioso, por ello se han construido
tablas para algunos valores de n y p que facilitan el trabajo.
Uso de la tabla de probabilidades binomiales
Existen tablas de la función de probabilidad binomial y de la función de distribución

acumulada de probabilidades binomiales.
La tabla que se presenta en la página siguiente, es de la función de probabilidad,

es decir, da probabilidades para valores exactos de la variable binomial para diferentes
valores de sus parámetros n y p.
P(X = xi) = f(xi) para distintos valores de n y p.
Por ejemplo, para calcular f(2) con n = 3 y p = 0,10, se procede como se indica en la
tabla, y se obtiene la probabilidad deseada.
f(2) = P(X = 2) = 0,027
y para calcular F(2) = P(X ≤ 2) con n = 10 y p = 0,45 es:
F(2) = P(X ≤ 2) = f(0) + f(1) + f(2) = 0,0025 + 0,0207 + 0,0763 = 0,0995

12
n p = 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
x
2 0
1
2
3 0
1
2 0,027
3
.
.
.
0,0025
10 0
0,0207
1
0,9763
2
3
.
.
.
10
Esta distribución de probabilidad se denomina distribución binomial, porque para

x = 0, 1, 2, . . . , n, los valores de las probabilidades son los términos sucesivos del
desarrollo binomial de (p + q)n.
Ejemplos de aplicación
Ejemplo 1: Una máquina fabrica una determinada pieza y se sabe que produce un 7 por
1000 de piezas defectuosas. Hallar la probabilidad de que al examinar 50 piezas sólo
haya una defectuosa.
Solución: X: Cantidad de piezas defectuosas
X tiene distribución binomial de parámetros B(50; 0,007) y se debe calcular la

probabilidad P(X=1).
Este problema no se puede resolver aplicando la tabla porque n = 50 y p = 0,007 no están

tabulados.
Ejemplo 2: La probabilidad de éxito de una determinada vacuna es 0,72. Calcula la

probabilidad de a que una vez administrada a 15 pacientes:
13
a) Ninguno sufra la enfermedad
b) Todos sufran la enfermedad
c) Dos de ellos contraigan la enfermedad
Solución: X: Cantidad de pacientes que sufren la enfermedad.
Se trata de una distribución binomial de parámetros B(15, 0'72)
Este problema no se puede resolver aplicando la tabla porque, aunque n = 15 está

tabulado, p = 0,72 no está tabulado.
Ejemplo 3: Para decidir si se aceptan los lotes de mercaderías que envía una
determinada fábrica, se seleccionan al azar 10 artículos de cada lote y se determina el
número de defectuosos. Un lote se rechaza si se encuentran 2 o más artículos
defectuosos entre los 10 seleccionados. Suponiendo que la cantidad de artículos en cada
lote es grande y que cada lote contiene 5% de defectuosos, ¿cuál es la probabilidad de
aceptar un lote? ¿Cuál es la probabilidad de rechazarlo?
Solución:
En primer lugar se analizan los datos del problema enunciado a fin de verificar si se
cumplen los requisitos para que la variable pueda ser considerada binomial.
1. Al inspeccionar las muestras de los lotes existen sólo dos resultados posibles,
mutuamente excluyentes: “defectuoso” y “no defectuoso”.
2. Cuando se revisa un artículo, hay una probabilidad constante de que sea defectuoso,
p = 0,05.
3. Se realizan n pruebas independientes, que son los 10 artículos seleccionados e

inspeccionados.
Por lo expuesto, se deduce que la variable aleatoria X: número de artículos

defectuosos por lote (0 ≤ x ≤ 10) , tiene distribución binomial con n = 10 y p = 0,05.
Entonces, usando la tabla,
P(aceptar) = F(1) = P(X ≤ 1) = f(1) + f(2) = 0,5987 + 0,3151 = 0,9138
P(rechazar) = 1 – 0,9138 = 0,0862

14
Cuando la probabilidad de éxito supera a 0,50, se puede utilizar la tabla cambiando
la variable, la probabilidad y el valor de la variable cuya probabilidad se busca.
Por ejemplo, si X es el número de éxitos con p = 0,60, y se toman muestras de

tamaño n = 5 con el propósito de calcular la probabilidad de que X tome el valor x = 2; en
este caso p = 0,60 no está tabulado. Para utilizar la tabla se realizan los siguientes
cambios:
X’: n° de fracasos, con p = 0,40, y se busca P(X’ = 3); entonces,
P(X = 2) = P(X’ = 3) = 0,2304
Asimetría
Si p = 0,5 → distribución simétrica
Asimetría Si p < 0,5 → asimetría positiva
Si p > 0,5 → asimetría negativa
Cuanto más lejano sea p de 0,5, mayor asimetría tendrá la distribución.
A continuación se muestran distribuciones de la variable binomial X para diferentes

valores de n y de p.
n = 4 y p = 0,3 n = 8 y p = 0,3 n = 14 y p = 0,5

,4 ,3
,5
,4
,3
,2
,3
,2
,2
,1
Valor probabilidad
Valor probabilidad
,1
,1
alor probabilidad
0,0 0,0 0,0

V
0 1 2 3 4 0 1 2 3 4 5 6 7 8 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
X X X
n = 4 y p = 0,1 n = 8 y p = 0,1 n = 50 y p = 0,1

,3
,7 ,5
,6
,4 ,2
,5
,3
,4
Valor probabilidad
,3 ,1
,2
,2
Valor probabilidad
Valor probabilidad
,1
,1
0,0
0 2 4 6 8 10 12 14
0,0 0,0
0 1 2 3 4 Omitido 0 1 2 3 4 5
1 3 5 7 9 11 13
X X X
15
A medida que aumenta n disminuye la asimetría de la distribución.
DISTRIBUCIÓN MULTINOMIAL
La distribución multinomial es esencialmente igual a la binomial con la única

diferencia de que cada prueba tiene más de dos posibles resultados mutuamente
excluyentes.
Es una generalización inmediata de la distribución binomial que surge cuando cada

prueba tiene más de dos resultados posibles. Esto ocurre, por ejemplo, cuando un
producto manufacturado se clasifica como de calidad superior, promedio o mala; cuando
el aprendizaje de un estudiante se evalúa asignándole calificaciones de A, B, C o D;
cuando un experimento se considera exitoso, desafortunado o no concluyente.
Si tenemos K resultados posibles (E i , i = 1, ... , K) con probabilidades fijas (p i ,

i = 1, ... , K), la variable que expresa el número de resultados de cada tipo obtenidos en n
pruebas independientes tiene distribución multinomial.
Dadas las condiciones que se indican a continuación:
La probabilidad de obtener x 1 resultados E1, x2 resultados E2, etc. se representa

como:
Los parámetros de la distribución son p1,..., pK y n.
Su nombre se debe al hecho de que para los diversos valores de x, las

probabilidades están dadas por los términos correspondientes del desarrollo multinomial
de
(p1 + p2 + p3 + . . . + pK)n
Ejemplo de aplicación
Las probabilidades de que una declaración de impuestos se llene correctamente,

que contenga un error que favorezca al declarante, que lleve un error que favorezca al
16
estado, o que contenga ambos tipos de errores son, respectivamente, 0,6, 0,2, 0,1 y 0,1.
Calcule la probabilidad de que entre 10 de tales declaraciones de impuestos,
aleatoriamente seleccionadas para una auditoría, cinco estén correctas, tres contengan
un error que favorezca al declarante, una lleve un error que favorezca al estado y una
contenga ambos tipos de errores.
Los datos de este problema son los siguientes:
Resultados Probabilidad xi
E1 : declaración correcta 0,6 x1 = 5
E2 : error favorable al declarante 0,2 x2 = 3
E3 : error favorable al estado 0,1 x3 = 1
E4 : ambos tipos de error 0,1 x4 = 1

∑ pi = 1 ∑ pi = n
Total
i i
Se cumplen las restricciones del modelo de probabilidad, por lo tanto, la

probabilidad buscada puede calcularse así:
10!
f(5, 3, 1, 1) = (0,6)5. (0,2)3. (0,1)1. (0,1)1 = 0,03135
5!.3!.1!.1!
Si solo interesa que de las 10 declaraciones escogidas, 5 estén correctas, entonces

el problema se transforma y se resuelve aplicando la distribución binomial, donde los
parámetros son:
N = 10 y p = 0,6, por lo tanto q = 0,4 y x=5
10!
Entonces, f(5) = (0,6)5. (0,4)5 = 0,20
5!.5!
Así se ve como la distribución binomial puede considerarse como un caso particular

de la distribución multinomial.
DISTRIBUCIÓN HIPERGEOMÉTRICA
Una variable tiene distribución hipergeométrica si procede de un experimento que

cumple las siguientes condiciones:
17
1) Se toma una muestra de tamaño n, sin reemplazamiento, de un conjunto finito de
N objetos.
2) K de los N objetos se pueden clasificar como éxitos y N - K como fracasos.
X cuenta el número de éxitos obtenidos en la muestra. El espacio muestral es el

conjunto de los números enteros de 0 a n, ó de 0 a K si K < n.
En este caso, la probabilidad del éxito en pruebas sucesivas no es constante pues

depende del resultado de las pruebas anteriores. Por tanto, las pruebas no son
independientes entre sí.
Estas condiciones pueden resumirse en el esquema siguiente:
K éxitos
Población N unidades
N – K fracasos
Se extrae una muestra aleatoria

de tamaño n, sin reposición
x éxitos
Muestra n unidades
n – x fracasos
La función de probabilidad de la variable hipergeométrica es:
Los parámetros de la distribución son n, N y K.
Los valores de la media y la varianza se calculan según las ecuaciones:

Ejemplos de aplicación:
1. Para evitar que lo descubran en la aduana, un viajero ha colocado 6 tabletas de
narcótico en un frasco que contiene 9 píldoras de vitamina similares en apariencia. Si el
oficial de la aduana selecciona 3 tabletas aleatoriamente para analizarlas,
a) ¿Cuál es la probabilidad de que el viajero sea arrestado por posesión de narcóticos?,
18
b) ¿Cuál es la probabilidad de que no sea arrestado por posesión de narcóticos?

Solución:
a) N = 9+6 =15 total de tabletas

K = 6 tabletas de narcótico
n = 3 tabletas seleccionadas
x = 0, 1, 2, o 3 tabletas de narcótico = variable que nos indica el número de tabletas de
narcótico que se puede encontrar al seleccionar las 3 tabletas

P(viajero sea arrestado por posesión de narcóticos) = p(de que entre las 3 tabletas
seleccionadas haya 1 o más tabletas de narcótico)
C1* 9 C2 6 C2* 9 C1 6 C3* 9 C0

 p( x  1,2ó3tabletas; n  3 )  6
  
C
15 3 C
15 3 C
15 3

( 6 )( 36 ) ( 15 )( 9 ) ( 20 )( 1 ) 216  135  20 371
      0.81538
455 455 455 455 455

Otra forma de resolver;

P(el viajero sea arrestado por posesión de narcóticos) = 1 – P(de que entre las tabletas
seleccionadas no haya una sola de narcótico)

C0* 9 C3
 1  p( x  0; n  3 )  1  6 
15 C3

( 1 )( 84 )
 1  0.184615  0.815385
455
b) P(no sea arrestado por posesión de narcóticos)

C0* 9 C3
 p( x  0; n  3 )  6

C
15 3

( 1 )( 84 )
  0.184615
455

2. De un lote de 10 proyectiles, 4 se seleccionan al azar y se disparan. Si el lote
contiene 3 proyectiles defectuosos que no explotarán, ¿cuál es la probabilidad de que,
a) los 4 exploten?,
b) al menos 2 no exploten?

Solución:
19
a) N = 10 proyectiles en total
K = 7 proyectiles que explotan
n = 4 proyectiles seleccionados
x = 0, 1, 2, 3 o 4 proyectiles que explotan = variable que nos define el número de
proyectiles que explotan entre la muestra que se dispara

C4* 3 C0 ( 35 )( 1 ) 35
p( x  4; n  4 )  7
   0.16667
C
10 4 210 210

b) N = 10 proyectiles en total
K = 3 proyectiles que no explotan
n = 4 proyectiles seleccionados
x = 0, 1, 2 o 3 proyectiles que no explotan

P(al menos 2 no exploten) = p( 2 o más proyectiles no exploten) = p(x = 2 o 3; n=4) =

C2* 7 C2  3 C3* 7 C1 ( 3 )( 21 )  ( 1 )( 7 ) 63  7 70
 3
    0.333333
C
10 4 210 210 210

Aproximación a la distribución binomial
Si n es pequeño, con relación a N (n < 0,05 N), la probabilidad de un éxito varia

muy poco de una prueba a otra, así la variable, en este caso, es esencialmente binomial;
en esta situación, N suele ser muy grande y los números combinatorios se vuelven
prácticamente inmanejables, entonces, las probabilidades se calculan más cómodamente
aproximando por las ecuaciones de una binomial con p = K / N y q = 1 – K/N.
La media de la variable aproximada (μ = n p = n (K / N)) es la misma que la de la variable

antes de la aproximación; sin embargo, la varianza de la variable binomial es ligeramente
superior a la de la hipergeométrica, porque está corregida por un factor, (N-n)/(N-1), que
tiende a 1 cuando . Este factor se denomina factor de corrección para población
finita.
el factor por el que difieren es siempre mayor que 1 y tan próximo a 1 como sea que
n<0,05N.
Ejemplo de aplicación
En una universidad hay 200 profesores titulares de Cátedra, de los cuales 20 son
doctores en su especialidad. Se seleccionan aleatoriamente 5 profesores para integrar
una comisión de evaluación de proyectos, ¿cuál es la probabilidad de que 2 doctores
integren la comisión?
Solución
X: n° de doctores que integran la comisión.

20
El esquema para resolver este problema es:
K = 20 doctores
N = 200 profesores titulares
N – K = 180 no doctores
x = 2 doctores
n = 5 profesores seleccionados
n – x = 3 doctores
Este es un típico problema donde la variable tiene distribución hipergeométrica, en

el cual la solución es la siguiente:
f(2) = P(X = 2) = h(2; 200, 5, 20) = 20C2 . 180C3 / 200C5
Pero como en este problema la selección aleatoria se realiza sin reposición de una
población finita, y además, n < 0,05N, se presentan las condiciones especiales para
aproximar a la distribución binomial. Entonces:
P(X = 2) = 5C2 . (20/200)2.(180/200)3 = 10. (0,1)2. (0,9)3 = 0,0729
Si se utiliza la tabla de la distribución binomial para n = 5 , p = 0,1 y x = 2 , se

obtiene el mismo resultado.
Problema propuesto
Una compañía manufacturera utiliza un esquema para la aceptación de los

artículos producidos antes de ser embarcados. El plan es de dos etapas. Se preparan
cajas de 25 para embarque y se selecciona una muestra de 3 para verificar si tienen algún
artículo defectuoso. Si se encuentra uno, la caja entera se regresa para verificarla al
100%. Si no se encuentra ningún artículo defectuoso, la caja se embarca.
a) ¿Cuál es la probabilidad de que se embarque una caja que tiene tres artículos
defectuosos?,
b) ¿Cuál es la probabilidad de que una caja que contiene solo un artículo defectuoso se
regrese para verificación?
DISTRIBUCIÓN DE POISSON
Una variable de tipo Poisson cuenta éxitos (es decir, objetos de un tipo
determinado) que ocurren en un intervalo del espacio o del tiempo.
El experimento que la genera debe cumplir las siguientes condiciones:
1. El número de éxitos que ocurren en cada región del tiempo o del espacio es
independiente de lo que ocurra en cualquier otro tiempo o espacio disjunto
del anterior.
2. La probabilidad de un éxito en un tiempo o espacio pequeño es
proporcional al tamaño de este y no depende de lo que ocurra fuera de él.
21
3. La probabilidad de encontrar uno o más éxitos en una región del tiempo o
del espacio tiende a cero a medida que se reducen las dimensiones de la
región en estudio.
Como consecuencia de estas condiciones, las variables Poisson típicas son
variables en las que se cuentan sucesos raros.
La función de probabilidad de una variable Poisson es:
El parámetro de la distribución es λ que es igual a la media y a la varianza de la

variable.
Esta característica puede servirnos para identificar a una variable Poisson en casos
en que se presenten serias dificultades para verificar los postulados de definición.
La varianza de la variable aproximada es ligeramente superior a la de la variable

binomial.
Las variables Poisson cumplen la propiedad de que la suma de variables Poisson

independientes es otra Poisson con media igual a la suma las medias.
El aspecto de la distribución depende muchísimo de la magnitud de la media.

Como ejemplo, mostramos tres casos con λ = 0,5 (izquierda), λ = 1,5 (centro) y λ = 5
(derecha). Obsérvese que la asimetría de la distribución disminuye al crecer λ y que, en
paralelo, la gráfica empieza a tener un aspecto acampanado.
,2
,7 ,4
,6
,3
,5
Va lo r P r o b a b ilid a d
,4 ,1
,2
,3
Valor Probabilidad
Valor Probabilidad
,2
,1
,1
0,0
0,0 0,0 0 2 4 6 8 10 12 14
0 1 2 3 4 5 0 1 2 3 4 5 6 7 8 1 3 5 7 9 11 13 15
X X X
0,5 ,5 5
Uso de la tabla de Poisson

22
Como la distribución binomial, la distribución de Poisson está tabulada para valores
exactos de la variable (función de probabilidad), y para valores menores o iguales que uno
determinado de la variable (función de distribución acumulada).
A continuación se presenta un ejemplo del uso de la tabla de la función de

probabilidad, es decir, da probabilidades como la siguiente:
P(X = x) = p(x; ) P(X = 3) = p(3; 2,6) = 0,2176

23
X 0 1 2 3 . . . . . . . . . . . . . . . . . . . . . . 11 12

0,1
0,2
0,3
.
.
.
2,6 0,2176
1. Si un banco recibe en promedio 6 cheques falsos por día, ¿cuáles son las
probabiliddes de que reciba:
a) cuatro cheques falsos en un día cualquiera?

b) 10 cheques falsos en dos días consecutivos cualesquiera?
Solución:
X: número de cheques falsos que recibe el banco por día.
X tiene distribución binomial con parámetro  = 6.
a)  = 6 por día, por lo tanto, f(4) = P(X = 4) = p(4; 6) = 0,1339
b)  = 12 por cada dos días (segundo postulado de Poisson), entonces:
f(10) = P(X = 10) = p(4; 12) = 0,1048
Si  = 12 no estuviera en la tabla, sería P(X = 10) = e-12 . 1210

10 !
Aproximación binomial-Poisson
La distribución de Poisson se puede considerar como el límite al que tiende la

distribución binomial cuando n tiende a y p tiende a 0, siendo np constante (y menor
que 7); en esta situación sería difícil calcular probabilidades en una variable binomial y,
por tanto, se utiliza una aproximación a través de una variable Poisson con media  = n p.
La regla práctica para lograr mejores aproximaciones es que n > 100 y p < 0,01.
24
2. Se sabe que el 5% de los libros encuadernados en un taller determinado tienen
encuadernación defectuosa. Calcular la probabilidad de que 2 de 100 libros terminados en
ese taller tengan encuadernación defectuosa, utilizando:
a) la fórmula de distribución binomial;
b) la aproximación de Poisson a la distribución binomial.
a) X: cantidad de libros con encuadernación defectuosa.
X ~ binomial con parámetros n = 100 y p = 0,05
P(X = 2) = 100C2 . 0,052 . 0,9598 = 0,081
b) Como n es grande y p es pequeño, puede aproximarse por Poisson.
= np = 100.(0,05) = 5 p(2; 5) = e-5 . 52 = 0,084

2!
Si se utiliza la tabla de probabilidades de Poisson para  = 5 y x = 2, se obtiene:
P(2; 5) = 0,0842
En este ejemplo, los cálculos realizados en la aplicación de la distribución binomial son

relativamente sencillos, y factibles con una calculadora científica corriente, pero existen
algunos problemas en los cuales no es posible obtener la solución aplicando la
distribución binomial, sino que se hace estrictamente imprescindible el uso de la
aproximación a la distribución de Poisson, como en el ejemplo que se enuncia a
continuación:
3. Una compañía de seguros contra incendios tiene 3.840 asegurados. Si la

probabilidad de que alguno de ellos presente una reclamación en un año cualquiera es
1/1200, calcular la probabilidad de que 0, 1, 2, 3, … de los asegurados presente una
reclamación en un año cualquiera.
Solución
X: cantidad de asegurados que presentan una reclamación en un año.
X ~ binomial con n = 3.840 y p = 1/1200
Por razones prácticas no es posible aplicar la distribución binomial, pero se dan las
condiciones para aplicar la aproximación a la de Poisson.
= 3.840 (1/1200) = 3,2
Buscando en la tabla de probabilidades de Poisson para = 3,2 y para todos los valores
de X, se obtiene:
Xi 0 1 2 3 4 5 6 7 8 9 10 11 12
f(x) 0,0408 0,1304 0,2087 0,2226 0,1781 0,1140 0,0608 0,0278 0,0111 0,0040 0,0013 0,0004 0,0001
F(x) 0,0408 0,1712 0,3799 0,6025 0,7806 0,8946 0,9554 0,9832 0,9943 0,9983 0,9996 1
25
La función de probabilidad se representa por un gráfico de bastones, como el siguiente:
,3
,2
,1
Valor Probabilidad
0,0
0 1 2 3 4 5 6 7 8 9 10 11 12
Si se deseara representar gráficamente la función de distribución acumulada, se

debería dibujar un gráfico escalonado, por ser X una variable discreta.
DISTRIBUCIONES DE PROBABILIDAD CONTINUAS
Las distribuciones de probabilidad son idealizaciones de los polígonos de

frecuencias. En el caso de una variable estadística continua consideramos el histograma
de frecuencias relativas, y se comprueba que al aumentar el número de datos y el número
de clases el histograma tiende a estabilizarse llegando a convertirse su perfil en la gráfica
de una función.
Las distribuciones de probabilidad de variable continua se definen mediante una

función y=f(x) llamada función de densidad.
Así como en el histograma la frecuencia viene dada por el área, en la función de

densidad la probabilidad viene dada por el área bajo la curva, por lo que:
 El área encerrada bajo la totalidad de la curva es 1.
 Para obtener la probabilidad p(aXb) obtenemos la proporción de área que
hay bajo la curva desde a hasta b.
 La probabilidad de sucesos puntuales es 0, p(X=a)=0
Las distribuciones de probabilidad continua mas utilizadas son: la Uniforme, la

Normal, la Gamma, la Exponencial, la Chi-cuadrado (2), la t de Student, la F de
Snedecor.
26
DISTRIBUCIÓN NORMAL
La distribución normal fue definida por De Moivre en 1733 y es la distribución de

mayor importancia en el campo de la estadística.
Una variable es normal cuando se ajusta a la ley de los grandes números, es decir,
cuando sus valores son el resultado de medir reiteradamente una magnitud sobre la que
influyen infinitas causas de efecto infinitesimal.
Esta distribución es frecuentemente utilizada en las aplicaciones estadísticas. Su

propio nombre indica su extendida utilización, justificada por la frecuencia o normalidad
con la que ciertos fenómenos tienden a parecerse en su comportamiento a esta
distribución.
Muchas variables aleatorias continuas presentan una función de densidad cuya gráfica tiene
forma de campana.
Histograma de una normal idealizada Histograma de una muestra de una variable

normal
En otras ocasiones, al considerar distribuciones binomiales, tipo B(n,p), para un

mismo valor de p y valores de n cada vez mayores, se ve que sus polígonos de
frecuencias se aproximan a una curva en "forma de campana".
En resumen, la importancia de la distribución normal se debe principalmente a que

hay muchas variables asociadas a fenómenos naturales que siguen el modelo de la
normal
 Caracteres morfológicos de individuos (personas, animales, plantas,...) de una

especie, p.ejm. tallas, pesos, envergaduras, diámetros, perímetros,...
 Caracteres fisiológicos, por ejemplo: efecto de una misma dosis de un fármaco, o
de una misma cantidad de abono.
 Caracteres sociológicos, por ejemplo: consumo de cierto producto por un mismo
grupo de individuos, puntuaciones de examen.
 Caracteres psicológicos, por ejemplo: cociente intelectual, grado de adaptación a
un medio,...
 Errores cometidos al medir ciertas magnitudes.
27
 Valores estadísticos muestrales, por ejemplo : la media.
 Otras distribuciones como la binomial o la de Poisson son aproximaciones
normales, ...
Y en general cualquier característica que se obtenga como suma de muchos factores.
Las variables normales tienen una función de densidad con forma de campana a la
que se llama campana de Gauss.
Su función de densidad es la siguiente:
Otra forma de escribir la función de densidad es la siguiente:
Representación gráfica de esta función de densidad
Los parámetros de la distribución son la media y la desviación típica, μ y σ,

respectivamente. Como consecuencia, en una variable normal, media y desviación típica
no deben estar correlacionadas en ningún caso (como desgraciadamente ocurre en la
inmensa mayoría de las variables aleatorias reales que se asemejan a la normal).
Se utiliza la siguiente simbología:

28
La curva normal cumple las siguientes propiedades:
1) El máximo de la curva coincide con la media.
2) Es perfectamente simétrica respecto a la media.
3) La curva tiene dos puntos de inflexión situados a una desviación típica de la media.
En esos puntos cambia la curvatura.
4) Sus colas son asintóticas al eje X.
5) un cambio en la media desplaza la curva hacia la derecha o izquierda, mientras

que un cambio en la varianza o desviación estándar cambia la forma de la curva.
6) De forma análoga a lo que pasaba con las variables Poisson, la suma de variables
normales independientes es otra normal.
Las propiedades mencionadas pueden resumirse en el siguiente cuadro:

29
Función de distribución acumulada
 Puede tomar cualquier valor 

 Son más probables los valores cercanos a uno central que llamamos media 
 Conforme nos separamos de ese valor , la probabilidad va decreciendo de igual

forma a derecha e izquierda (es simétrica).
 Conforme nos separamos de ese valor  la probabilidad va decreciendo de forma

más o menos rápida dependiendo de un parámetro , que es la desviación típica.
F(x) es el área sombreada de esta gráfica
Para calcular probabilidades en intervalos de valores de la variable, habría que

integrar la función de densidad entre los extremos del intervalo. Por desgracia (o por
suerte), la función de densidad normal no tiene primitiva, es decir, no se puede integrar.
Por ello la única solución es referirse a tablas de la función de distribución de la variable
30
(calculadas por integración numérica). Estas tablas tendrían que ser de triple entrada (μ,
σ, valor) y el asunto tendría una complejidad enorme.
Afortunadamente, cualquier que sea la variable normal, X, se puede establecer una

correspondencia de sus valores con los de otra variable con distribución normal, media 0
y varianza 1, a la que se llama variable normal tipificada o Z. La equivalencia entre ambas
variables se obtiene mediante la ecuación:

La transformación de la variable X en la variable Z produce el efecto de reducir X a

unidades en términos de desviaciones estándares alejadas de la media. Es decir, dado un
valor de X, el correspondiente valor de Z indica cuán alejada está X de su media , y en
qué dirección, en términos de su desviación estándar .
Por ejemplo, Z = 1,8 significa que el valor de X está a una distancia igual a 1,8
veces  a la derecha de . En cambio z = -2,3 indica que X se encuentra a una distancia
de 2,3a la izquierda de .
Esta propiedad de la variable normal estandarizada permite calcular probabilidades

normales para cualquier n() con una única tabla de probabilidades, la de n(0,1).
Porque si X es n(), entonces Z = (X-)/ es n(0,1). Y también es posible calcular un
valor de la variable X dada una probabilidad determinada, mediante la fórmula X =
Z+
Puede demostrarse que E(Z) = 0 y V(Z) = 1 y por lo tanto z = 1.
E(Z) = E[(X-)/]=E(X-)/= E[(X) -/ = 0porque E(X) = 
V(Z) = E(Z2) – [E(Z)]2 = E[(X-)/]2= E(X-)2/2= 2/2 = 1
La función de distribución de la variable normal tipificada está tabulada y,

simplemente, consultando en las tablas se pueden calcular probabilidades en cualquier
intervalo que nos interese.
Resumiendo,
Por tanto su función de densidad es

31
y su función de distribución acumulada es
siendo la representación gráfica de esta función
Característica de la distribución normal tipificada (reducida, estándar)
 No depende de ningún parámetro

 Su media es 0, su varianza es 1 y su desviación típica es 1.
 La curva f(x) es simétrica respecto del eje OY
 Tiene un máximo en este eje
 Tiene dos puntos de inflexión en z =1 y z = -1
Aproximación de la Binomial por la Normal (Teorema de De Moivre) :
Demostró que bajo determinadas condiciones (para n grande y tanto p como q no

estén próximos a cero) la distribución Binomial B(n, p) se puede aproximar mediante una
distribución normal
32
Se debe tener en cuenta que cuanto mayor sea el valor de n, y cuanto más próximo
sea p a 0.5, tanto mejor será la aproximación realizada. Es decir, basta con que se
verifique
gracias a esta aproximación es fácil hallar probabilidades binomiales, que para valores
grandes de n resulten muy laboriosos de calcular.
Hay que considerar que para realizar correctamente esta transformación de una
variable discreta (binomial) en una variable continua (normal) es necesario hacer una
corrección de continuidad.
33
Manejo de tablas. Casos más frecuentes.
La distribución de la variable z se encuentra tabulada

34
Básicamente, se busca un valor de x (por ejemplo, x = 0.37), y la tabla nos da la

probabilidad de que
En el caso de que la distribución no sea estándar, por ejemplo, N(μ,σ) con μ = 2 y σ = 3,

tendremos que tipificar la variable:
Obtenemos una variable Z normal, que además está tipificada. Si ahora consultamos en
la tabla,
35
1. Algunos estudios indican que el rendimiento de combustible de los
autos vendidos en un determinado país, se distribuye normalmente con una media de 8
km por litro (km/l) y una desviación estándar de 2 km/l.
a) ¿Qué porcentaje de autos tiene un rendimiento de 11,5 km/l o más?

b) En épocas de escasez de fuentes de energía, los fabricantes de automóviles que
producen vehículos más económicos, en el consumo de combustible, tienen
ventajas competitivas con respecto a los demás fabricantes. Si uno de ellos desea
fabricar un auto más económico que el 95% de los autos actuales, ¿cuál debe ser
el rendimiento del nuevo auto?
Solución:
La variable es X: rendimiento del combustible, en km/l.
X ~ N(8;2) → X tiene distribución normal con media 8 y desviación estándar 2.
a) P(X > 11,5) = P[Z > (11,5 – 8)/2] = P(Z > 1,75) = 1 – P(Z ≤ 1,75) = 1 – 0,95994 = 0,04
El 4% de los autos tiene un rendimiento de 11,5 km/l o más.
b) P(X < x) = 0,95 → P(Z < z) = 0,95 → z = 1,65 → x = z +  = (1,65)2 + 8 = 11,3 km/l
El rendimiento del nuevo auto debe ser de 11,3 km/l, para que sea más económico.
2. La contabilidad a valor actual no e muy popular entre los ejecutivos de finanzas, pero
es más realista. El enfoque del valor actual registra lo que un activo vale hoy en contraste
con el enfoque del costo histórico, que registra lo que se pagó por el activo en la fecha de
adquisición. Algunos estudios recientes indican que el 30% de los ejecutivos de finanzas
prefieren el enfoque de valor actual. Si se toma una muestra de 25 ejecutivos de finanzas,
encontrar la probabilidad de que el menos 8, pero no más de 11 de ellos, prefieran el
enfoque del valor actual, utilizando:
c) las probabilidades binomiales
d) la aproximación binomial-normal.
Solución:
X: número de ejecutivos que prefieren el enfoque del valor actual
X ~ binomial con n = 25 y p = 0,3
a) Aplicando distribución binomial
P(8 ≤ X ≤ 11) = ∑ 25Cx (0,3)x (0,7)n-x para x = 8, 9, 10 y 11

x
O bien, P(8 ≤ X ≤ 11) = F(11) – F(7) = 0,956 – 0,512 = 0,444
b) Aplicando aproximación normal

36
= np = 25(0,3) = 7,5 y  = √ 25(o,3)(0,7) = 2.2913
z1 = (8 – 7,5)/2,2913 = 0,22 y z2 = (11 – 7,5)/2,2913 = 1,53 entonces:
P(8 ≤ X ≤ 11) = P(0,22 ≤ Z ≤ 1,53) = F(1,53) – F(0,22) = 0,93699 – 0,58706 = 0,35
Aplicando el término de corrección por continuidad:
z1 = (8 – 7,5 – 0,5)/2,2913 = 0 y z2 = (11 – 7,5 – 0,5)/2,2913 = 1,75 entonces:
P(8 ≤ X ≤ 11) = P(0 ≤ Z ≤ 1,75) = F(1,75) – F(0) = 0,95994 – 0,50 = 0,46
Comparando con los dos resultados anteriores, se observa que aplicando la aproximación
normal con la corrección por continuidad, se obtiene un valor más cercano al calculado
mediante la distribución binomial.
37
Bibliografía
Bioéstadística: Métodos y Aplicaciones. U.D. Bioestadística. Facultad de Medicina. Universidad de
Málaga. ISBN: 847496-653-1
Chou Y.L. (1979). Análisis estadístico. Editorial Interamericana. México.
es.wikipedia.org/wiki/Distribución_binomial - 18k. Actualizado en febrero de 2007
Marcoleri de Olguín M.E. (1997). Notas de Clases sobre Probabilidad y distribuciones de

Probabilidad. (97 páginas).
Mendenhall W. (1991). Introducción a la Probabilidad y la Estadística. Grupo Editorial

Iberoamérica. México.
Mendenhall W. (1990). Estadística para Administradores. Grupo Editorial Iberoamérica. México.
personal5.iddeo.es/ztt/Tem/t20_variable_aleatoria_continua.htm - 13k -
personal5.iddeo.es/ztt/Tem/t21_distribucion_normal.htm - 11k -
www.southlink.com.ar/vap/VARIABLE ALEATORIA.htm - 14k –
www.ucm.es/info/genetica/Estadistica/estadistica_basica%201.htm - 59k
www.itchihuahua.edu.mx/academic/industrial/sabaticorita/_private/03Ddistr%
38
TABLA DE CONTENIDOS
Tema Página
Variable aleatoria 1
Introducción a las distribuciones de probabilidad 2
Variables aleatorias contínuas 3
Tipos de distribuciones de probabilidad 5
Medidas descriptivas de una variable aleatoria 6
Distribuciones de probabilidad discretas 8
Distribución binomial 8
Distribución multinomial 13
Distribución hipergeométrica 14
Distribución de Poisson 18
Distribuciones de probabilidad continuas 22
Distribución normal 23

Introduccion A Las Distribuciones de Probabilidad

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Introduccion A Las Distribuciones de Probabilidad

Caricato da

Copyright:

Formati disponibili

1

UNIVERSIDAD NACIONAL DE JUJUY

Facultad de Ciencias Económicas

Variable aleatoria, Valor esperado y

María Elena Marcoleri

Una variable es aleatoria si toma diferentes valores como resultado de un

Para comprender este concepto se plantea el siguiente ejemplo:

Con el objeto de verificar la exactitud de su contabilidad, las compañías realizan

a) realizar un diagrama de árbol de probabilidad

a) 1er. Registro 2do. Registro 3er. Registr. P.muestr. Probabilidad

0,05 E (E, E, E) 0,053 = 0,000125

0.05 E (E’, E, E) 0,002375

Los valores que asume la variable aleatoria X son, x i : 0, 1, 2 y 3.

Los resultados del diagrama de árbol de probabilidades se pueden expresar

Probabilidad 0,857375 0,135375 0,007125 0,000125

Siendo la Probabilidad = f(xi) = P(X = xi) , para i = 1, 2, 2, . . . , N

El conjunto de pares ordenados [x i , f(xi)] constituye la función de probabilidad,

Introducción a las distribuciones de probabilidad.

Las distribuciones de probabilidad están relacionadas con las distribuciones de

Una distribución de frecuencias es un listado de las frecuencias observadas de

Las distribuciones de probabilidad pueden basarse en consideraciones teóricas o

valores entre 0 y 1).

 ∑ f(xi) = 1 para i = 1, 2, 2, . . . , N. (la suma de probabilidades repartidas

La representación gráfica para la variable del ejemplo es un gráfico de bastones,

De la misma manera que calculamos frecuencias acumuladas, podemos acumular

Esta función representa la probabilidad de que la variable aleatoria sea menor o

Gráficamente, la función aumenta de "a saltos", ya que entre dos valores

Calculando la FDA para el ejemplo de los errores en los registros contables, se

f(xi) 0,857375 0,135375 0,007125 0,000125

F(xi) 0,857375 0,99275 0,999875 1

Y la interpretación es similar a la de las frecuencias acumuladas de una variable

Variables aleatorias continuas.

En este caso, en lugar de trabajar con la probabilidad de valores particulares de la

Una función de densidad de probabilidad debe cumplir con las siguientes

 f(x) > 0 (la función es no negativa para cualquier valor de x).

Y así se podrá construir un histograma de frecuencias relativas y un histograma de

A partir de una situación real con densidades de frecuencias se crea un modelo

Una vez realizado este proceso de dividir sucesivamente el intervalo, las

P(x0  X  x0+h) y corresponde al área bajo la curva en el intervalo [x 0 , x0+h].

La función correspondiente a esta curva, y = f(x), se llama Función de densidad.

La función de distribución para una variable aleatoria continua se calcula:

F(a) = P(X < a) =  f(x) dx

P (a< x < b) = F(b) - F(a)

Como la probabilidad es siempre un número positivo, la función de distribución será

Es decir la probabilidad de todo el espacio muestral es 1 tal y

Es decir la probabilidad del suceso nulo es cero.

Tipos de distribuciones de probabilidad.

Las distribuciones de probabilidad se clasifican como continuas y discretas. En la

En una distribución de probabilidad continua, la variable que se está considerando

Medidas descriptivas de una variable aleatoria

Valor esperado de una variable aleatoria.

El valor esperado es una idea fundamental en el estudio de las distribuciones de

Para obtener el valor esperado de una variable aleatoria discreta, se multiplica

El valor esperado también puede ser obtenido a partir de estimaciones subjetivas.

En muchas situaciones, encontraremos que es más conveniente, en términos de

El valor esperado es un operador matemático, cuya fórmula de cálculo depende del

Dada una distribución de probabilidad de una variable aleatoria discreta:

Para variable aleatoria discreta:  = E (X) = i xi f(xi)

Para variable aleatoria continua:  =  x f(x) dx

E(X) =  xi f(xi) =  xi (fi /N) = (1/N)  xi.fi = 

La E(X) tiene las mismas propiedades que la media aritmética.

Varianza de una variable aleatoria

Para caracterizar correctamente a la distribución, además de determinar su