Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Cátedra: ESTADÍSTICA
Abril de 2007
2
VARIABLE ALEATORIA
Variables aleatorias
Se puede pensar en una variable aleatoria como un valor o una magnitud que
cambia de una presentación a otra, sin seguir una secuencia predecible. Los valores de
una variable aleatoria son los valores numéricos correspondientes a cada posible
resultado de un experimento aleatorio.
Suma = 1
xi 0 1 2 3
3
Una función definida para los valores de una variable aleatoria discreta es una
función de probabilidad, si verifica dos condiciones:
0 ≤ f(xi) ≤ 1 para todo xi. (f(xi) es una probabilidad, por lo tanto debe tomar
f(xi)
1
0,8
0,6
0,4
0,2
0 1 2 3 xi
4
Resumiendo, puede decirse que las distribuciones de probabilidad son modelos
teóricos que describen la forma en que varían los resultados de un experimento aleatorio.
Lista de los resultados de un experimento con las probabilidades que se esperarían ver
asociadas con cada resultado.
F(x) = f(xi)
i
xi 0 1 2 3
f(x) dx = 1 (la acumulada para todos los valores de la variable suma 1, el área
bajo la curva de la función vale 1).
5
Si se quieren hallar probabilidades se tendrá que recurrir a métodos empíricos y
usar técnicas estadísticas: tomar una muestra, examinar y anotar las frecuencias
observadas. Entonces se tomará como valor de la probabilidad de un suceso s 1 la
frecuencia observada de éste: p(s1) = fr(s1).
Sea X una variable aleatoria continua que toma valores en un intervalo [a, b]. Si
se procede a dividir el intervalo cada vez en más partes el polígono de frecuencias
relativas (densidades de frecuencias) se va aproximando a una curva con un determinado
aspecto.
La probabilidad de que la variable X tome los valores entre x0 y x0+h es
Una función y = f(x) es una función de densidad de una variable aleatoria continua si
cumple las siguientes condiciones:
Esto explica la idea de que para el caso de una variable aleatoria continua no tiene
sentido trabajar con la probabilidad de un valor particular.
Como hemos visto hay variables aleatorias que pueden tomar cualquier valor de un
intervalo real de la forma (a, b), (a, +), (-, b), o uniones de ellos. A las
variables de este tipo se las denomina variables aleatorias continuas.
Por ejemplo: Supongamos que vamos a realizar un experimento aleatorio que consiste en
seleccionar una persona y apuntar su peso. Podemos crear una variable aleatoria cuyos valores sean el
número de kilogramos que pesa la persona observada. En este caso, el rango de valores posibles se
extiende entre los límites naturales, pero la continuidad de esta variable aleatoria radica en el carácter
continuo de lo que medimos, el peso, es decir, en el hecho de que entre dos valores posibles se podrían
obtener infinitos valores intermedios, también posibles si utilizáramos aparatos con suficiente precisión.
Estos "infinitos" en el interior del rango de la variable es lo que diferencia a las variables continuas de las
discretas.
Para dos números reales cualesquiera a y b tal que (a < b), los sucesos y
serán mutuamente excluyentes y su suma es el suceso por lo
que tenemos entonces que:
y finalmente,
Por lo tanto, una vez conocida la función de distribución F(x) para todos los valores
de la variable aleatoria X conoceremos completamente la distribución de probabilidad de
la variable.
xi x1 x2 x3 ... xN
f(xi) f(x1) f(x2) f(x3) ... f(xN)
E(X) = x1. f(x1) + x2. f(x2) + x3. f(x3) + . . . + xN. f(xN) = xi f(xi)
i
Entonces,
Se simboliza con la letra griega porque es una media poblacional, ya que los
valores que asume la variable aleatoria son todos los posibles, y constituyen una
población.
8
Distribución uniforme
Distribución binomial
Distribución binomial negativa
Distribución Poisson
Distribución geométrica
Distribución hipergeométrica
Distribución multinomial
DISTRIBUCIÓN BINOMIAL
En cada prueba del experimento sólo son posibles dos resultados: el suceso A
(éxito) y su contrario(fracaso).
El resultado obtenido en cada prueba es independiente de los resultados obtenidos
anteriormente.
La probabilidad del suceso A es constante, la representamos por p, y no varía de
una prueba a otra. La probabilidad de es 1- p y la representamos por q.
El experimento consta de un número n de pruebas.
El cálculo de las F(x) = p(X x) puede resultar laborioso, por ello se han construido
tablas para algunos valores de n y p que facilitan el trabajo.
Por ejemplo, para calcular f(2) con n = 3 y p = 0,10, se procede como se indica en la
tabla, y se obtiene la probabilidad deseada.
n p = 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
x
2 0
1
2
3 0
1
2 0,027
3
.
.
.
0,0025
10 0
0,0207
1
0,9763
2
3
.
.
.
10
Ejemplos de aplicación
Ejemplo 1: Una máquina fabrica una determinada pieza y se sabe que produce un 7 por
1000 de piezas defectuosas. Hallar la probabilidad de que al examinar 50 piezas sólo
haya una defectuosa.
Ejemplo 3: Para decidir si se aceptan los lotes de mercaderías que envía una
determinada fábrica, se seleccionan al azar 10 artículos de cada lote y se determina el
número de defectuosos. Un lote se rechaza si se encuentran 2 o más artículos
defectuosos entre los 10 seleccionados. Suponiendo que la cantidad de artículos en cada
lote es grande y que cada lote contiene 5% de defectuosos, ¿cuál es la probabilidad de
aceptar un lote? ¿Cuál es la probabilidad de rechazarlo?
Solución:
En primer lugar se analizan los datos del problema enunciado a fin de verificar si se
cumplen los requisitos para que la variable pueda ser considerada binomial.
1. Al inspeccionar las muestras de los lotes existen sólo dos resultados posibles,
mutuamente excluyentes: “defectuoso” y “no defectuoso”.
2. Cuando se revisa un artículo, hay una probabilidad constante de que sea defectuoso,
p = 0,05.
Asimetría
,4
,3
,2
,3
,2
,2
,1
Valor probabilidad
Valor probabilidad
,1
,1
alor probabilidad
0 1 2 3 4 0 1 2 3 4 5 6 7 8 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
X X X
,7 ,5
,6
,4 ,2
,5
,3
,4
Valor probabilidad
,3 ,1
,2
,2
Valor probabilidad
Valor probabilidad
,1
,1
0,0
0 2 4 6 8 10 12 14
0,0 0,0
0 1 2 3 4 Omitido 0 1 2 3 4 5
1 3 5 7 9 11 13
X X X
15
A medida que aumenta n disminuye la asimetría de la distribución.
DISTRIBUCIÓN MULTINOMIAL
(p1 + p2 + p3 + . . . + pK)n
Ejemplo de aplicación
Resultados Probabilidad xi
10!
f(5, 3, 1, 1) = (0,6)5. (0,2)3. (0,1)1. (0,1)1 = 0,03135
5!.3!.1!.1!
10!
Entonces, f(5) = (0,6)5. (0,4)5 = 0,20
5!.5!
DISTRIBUCIÓN HIPERGEOMÉTRICA
K éxitos
Población N unidades
N – K fracasos
x éxitos
Muestra n unidades
n – x fracasos
Ejemplos de aplicación:
1. Para evitar que lo descubran en la aduana, un viajero ha colocado 6 tabletas de
narcótico en un frasco que contiene 9 píldoras de vitamina similares en apariencia. Si el
oficial de la aduana selecciona 3 tabletas aleatoriamente para analizarlas,
a) ¿Cuál es la probabilidad de que el viajero sea arrestado por posesión de narcóticos?,
18
b) ¿Cuál es la probabilidad de que no sea arrestado por posesión de narcóticos?
Solución:
el factor por el que difieren es siempre mayor que 1 y tan próximo a 1 como sea que
n<0,05N.
Ejemplo de aplicación
En una universidad hay 200 profesores titulares de Cátedra, de los cuales 20 son
doctores en su especialidad. Se seleccionan aleatoriamente 5 profesores para integrar
una comisión de evaluación de proyectos, ¿cuál es la probabilidad de que 2 doctores
integren la comisión?
Solución
x = 2 doctores
n = 5 profesores seleccionados
n – x = 3 doctores
Pero como en este problema la selección aleatoria se realiza sin reposición de una
población finita, y además, n < 0,05N, se presentan las condiciones especiales para
aproximar a la distribución binomial. Entonces:
Problema propuesto
DISTRIBUCIÓN DE POISSON
Una variable de tipo Poisson cuenta éxitos (es decir, objetos de un tipo
determinado) que ocurren en un intervalo del espacio o del tiempo.
1. El número de éxitos que ocurren en cada región del tiempo o del espacio es
independiente de lo que ocurra en cualquier otro tiempo o espacio disjunto
del anterior.
2. La probabilidad de un éxito en un tiempo o espacio pequeño es
proporcional al tamaño de este y no depende de lo que ocurra fuera de él.
21
3. La probabilidad de encontrar uno o más éxitos en una región del tiempo o
del espacio tiende a cero a medida que se reducen las dimensiones de la
región en estudio.
Como consecuencia de estas condiciones, las variables Poisson típicas son
variables en las que se cuentan sucesos raros.
Esta característica puede servirnos para identificar a una variable Poisson en casos
en que se presenten serias dificultades para verificar los postulados de definición.
,6
,3
,5
Va lo r P r o b a b ilid a d
,4 ,1
,2
,3
Valor Probabilidad
Valor Probabilidad
,2
,1
,1
0,0
0,0 0,0 0 2 4 6 8 10 12 14
0 1 2 3 4 5 0 1 2 3 4 5 6 7 8 1 3 5 7 9 11 13 15
X X X
X 0 1 2 3 . . . . . . . . . . . . . . . . . . . . . . 11 12
0,1
0,2
0,3
.
.
.
2,6 0,2176
Ejemplos de aplicación
1. Si un banco recibe en promedio 6 cheques falsos por día, ¿cuáles son las
probabiliddes de que reciba:
Solución:
Aproximación binomial-Poisson
La regla práctica para lograr mejores aproximaciones es que n > 100 y p < 0,01.
24
2. Se sabe que el 5% de los libros encuadernados en un taller determinado tienen
encuadernación defectuosa. Calcular la probabilidad de que 2 de 100 libros terminados en
ese taller tengan encuadernación defectuosa, utilizando:
a) la fórmula de distribución binomial;
b) la aproximación de Poisson a la distribución binomial.
P(2; 5) = 0,0842
Solución
Por razones prácticas no es posible aplicar la distribución binomial, pero se dan las
condiciones para aplicar la aproximación a la de Poisson.
Buscando en la tabla de probabilidades de Poisson para = 3,2 y para todos los valores
de X, se obtiene:
Xi 0 1 2 3 4 5 6 7 8 9 10 11 12
f(x) 0,0408 0,1304 0,2087 0,2226 0,1781 0,1140 0,0608 0,0278 0,0111 0,0040 0,0013 0,0004 0,0001
F(x) 0,0408 0,1712 0,3799 0,6025 0,7806 0,8946 0,9554 0,9832 0,9943 0,9983 0,9996 1
25
La función de probabilidad se representa por un gráfico de bastones, como el siguiente:
,3
,2
,1
Valor Probabilidad
0,0
0 1 2 3 4 5 6 7 8 9 10 11 12
DISTRIBUCIÓN NORMAL
Una variable es normal cuando se ajusta a la ley de los grandes números, es decir,
cuando sus valores son el resultado de medir reiteradamente una magnitud sobre la que
influyen infinitas causas de efecto infinitesimal.
Muchas variables aleatorias continuas presentan una función de densidad cuya gráfica tiene
forma de campana.
Las variables normales tienen una función de densidad con forma de campana a la
que se llama campana de Gauss.
28
3) La curva tiene dos puntos de inflexión situados a una desviación típica de la media.
En esos puntos cambia la curvatura.
6) De forma análoga a lo que pasaba con las variables Poisson, la suma de variables
normales independientes es otra normal.
Por ejemplo, Z = 1,8 significa que el valor de X está a una distancia igual a 1,8
veces a la derecha de . En cambio z = -2,3 indica que X se encuentra a una distancia
de 2,3a la izquierda de .
Resumiendo,
gracias a esta aproximación es fácil hallar probabilidades binomiales, que para valores
grandes de n resulten muy laboriosos de calcular.
Hay que considerar que para realizar correctamente esta transformación de una
variable discreta (binomial) en una variable continua (normal) es necesario hacer una
corrección de continuidad.
33
34
Obtenemos una variable Z normal, que además está tipificada. Si ahora consultamos en
la tabla,
Ejemplos de aplicación
35
1. Algunos estudios indican que el rendimiento de combustible de los
autos vendidos en un determinado país, se distribuye normalmente con una media de 8
km por litro (km/l) y una desviación estándar de 2 km/l.
Solución:
a) P(X > 11,5) = P[Z > (11,5 – 8)/2] = P(Z > 1,75) = 1 – P(Z ≤ 1,75) = 1 – 0,95994 = 0,04
b) P(X < x) = 0,95 → P(Z < z) = 0,95 → z = 1,65 → x = z + = (1,65)2 + 8 = 11,3 km/l
El rendimiento del nuevo auto debe ser de 11,3 km/l, para que sea más económico.
2. La contabilidad a valor actual no e muy popular entre los ejecutivos de finanzas, pero
es más realista. El enfoque del valor actual registra lo que un activo vale hoy en contraste
con el enfoque del costo histórico, que registra lo que se pagó por el activo en la fecha de
adquisición. Algunos estudios recientes indican que el 30% de los ejecutivos de finanzas
prefieren el enfoque de valor actual. Si se toma una muestra de 25 ejecutivos de finanzas,
encontrar la probabilidad de que el menos 8, pero no más de 11 de ellos, prefieran el
enfoque del valor actual, utilizando:
c) las probabilidades binomiales
d) la aproximación binomial-normal.
Solución:
Comparando con los dos resultados anteriores, se observa que aplicando la aproximación
normal con la corrección por continuidad, se obtiene un valor más cercano al calculado
mediante la distribución binomial.
37
Bibliografía
Bioéstadística: Métodos y Aplicaciones. U.D. Bioestadística. Facultad de Medicina. Universidad de
Málaga. ISBN: 847496-653-1
personal5.iddeo.es/ztt/Tem/t20_variable_aleatoria_continua.htm - 13k -
personal5.iddeo.es/ztt/Tem/t21_distribucion_normal.htm - 11k -
www.ucm.es/info/genetica/Estadistica/estadistica_basica%201.htm - 59k
www.itchihuahua.edu.mx/academic/industrial/sabaticorita/_private/03Ddistr%
38
TABLA DE CONTENIDOS
Tema Página
Variable aleatoria 1
Distribución binomial 8
Distribución multinomial 13
Distribución hipergeométrica 14
Distribución de Poisson 18
Distribución normal 23