Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Humberto Barrios
Docente UPC
Introducci
on
DESCRIPCIONES DE UN CONJUNTO DE
MEDICIONES
DISTRIBUCIONES DE FRECUENCIAS
METODO
GRAFICO
MEDIDAS NUMERICAS
DESCRIPTIVAS
MEDIDAS DE TENDENCIA CENTRAL
MEDIDAS DE DISPERSION
OTRAS MEDIDAS DESCRIPTIVAS
EJERCICIOS
1. Estadstica Descriptiva
1.1
Introducci
on
Estamos en una epoca en la que nos agobian acontecimientos y n
umeros, las llamadas, estadsticas, acerca de cualquier tema comprensible. Se escuchan o se leen indagaciones de los medios de comunicaciones del n
umero de personas desplazadas por la
violencia a las que ayuda el gobierno, el n
umero de hectareas sembradas de coca radicadas diariamente por el actual gobierno y cronicas deportivas sobre el n
umero promedios
de goles en los partidos de f
utbol en una semana determinada. En este sentido para
mucha gente, el termino estadstica significa descripcion numerica. En un sentido mas
amplio, se puede establecer que el objetivo de la estadstica es hacer inferencias con
respecto a una poblaci
on a partir de la informacion contenida en una muestra y proporcionar una medida (probabilidad) correspondiente para la bondad de la inferencia. Es
decir, la estadstica trata del dise
no de experimento o encuestas (investigacion) mediante muestras para obtener una cantidad determinada de informacion a un costo mnimo
y del uso
optimo de esta informacion para sacar conclusiones (inferencias inductivas)
con respecto a una poblaci
on.
En estadstica la inferencia es inductiva porque se proyecta de lo especifico (la muestra)
hacia lo general (poblaci
on). En un procedimiento de esta naturaleza siempre existe la
posibilidad de error. Nunca se tendra el cien por ciento de seguridad sobre una proporcion en la que se basa la inferencia estadstica. Sin embargo, lo que hace de la estadstica
una ciencia (separ
andola del arte de adivinar la suerte) es que, unida cualquiera proposicion o afirmaci
on, existe una medida de la confiabilidad de esta. En estadstica se mide
la confiabilidad en terminos de probabilidad (un tema que se estudiara mas adelante).
En otras palabras, para cada inferencia estadstica se identifica la probabilidad de que
la inferencia sea correcta. Los problemas estadsticos se caracterizan por los siguientes
cuatro elementos:
1. La poblaci
on de interes y el procedimiento cientfico que se emplea para seleccionar
la muestra.
2. La muestra y el an
alisis matematico de la informacion.
3. Las inferencias estadsticas que resulten del analisis de la muestra.
4. La probabilidad o confiabilidad de que las inferencias sean correctas.
Poblaci
on: Son todos los estudiantes varones de primer semestre de la UPC.
Objetivo inferencial: Estimar la distribucion de frecuencias, por edades, la resistencia
fsica de estudiantes varones que recientemente ingresaron a la universidad.
Muestra: Seleccionar una muestras de estudiantes varones que ingresaron a la UPC,
en el primer semestre.
Ejemplo 1.2 Un ingeniero desea estimar el consumo semanal promedio de agua por
familias en Valledupar.
Poblaci
on: Todas las familias que viven en Valledupar.
Objetivo inferencial: Estimar el consumo semanal promedio de agua por familias.
Muestra: Tomar un subconjunto de todas las familias de Valledupar, de tal manera
que estas familias sean representativas.
Poblaci
on: En este caso, la poblacion puede estar constituida por todos los transistores
producidos por una f
abrica durante una semana o tambien se puede considerar los que
se pueden fabricar en el futuro. En este caso, la poblacion es virtualmente infinita.
Objetivo inferencial: Estimar si la duracion promedio de cierto tipo de transistores
supera las 500 horas.
Muestra: Seleccionar una muestra aleatoria de la produccion de un lote de varios das.
1.2
1.2.1
178
221
164
205
200
206
199
226
122
218
Cuadro 1.1:
221 157
153 177
234 151
181 155
134 174
139 176
174 165
191 195
224 187
236 176
Tiempo de duracion de
153 107 188 220
173 182 185 111
169 174 229 192
176 146 187 168
200 191 165 187
160 226 188 155
168 124 149 203
182 160 193 140
104 173 194 181
150 158 199 144
100 bateras
157 184
151 178
109 118
188 222
175 169
185 187
159 164
167 218
151 198
202 208
173
167
135
156
162
184
166
183
172
178
menor a mayor
139
153
162
169
176
182
188
199
218
236
Pero para identificar los patrones en un conjunto de datos es necesario agrupar las
observaciones en un n
umero relativamente peque
no de clases que no se intercepten
entre s, de tal manera que no exista ninguna ambig
uedad con respecto a la clase que
pertenece una observaci
on en particular. El n
umero de observaciones que caen en una
clase recibe el nombre de frecuencia de clase (fi ), mientras que el cociente de una
frecuencia de clase con respecto al n
umero de observaciones (n) en la muestra se conoce
como frecuencia relativa (fi /n) de la clase. Los lmites de las clases se denominan
fronteras de clases, y el promedio aritmetico entre los lmites superior (Li ) e inferior
(Ls ) recibe el nombre de marca de clase o punto medio de clase (xi ).
El n
umero de clase que se emplean para clasificar a un conjunto de datos depende del
n
umero total de observaciones. Si el n
umero de observaciones es relativamente peque
no,
el n
umero a emplear sera cinco o mas. Si existe un n
umero sustancial de datos, el
n
umero de clases debe ser de quince clases o menos. Es decir, el n
umero de clases que se
deben tomar no debe ser mayor a quince ni menor de cinco. Un n
umero muy peque
no
de clases puede ocultar la distribucion real del conjunto de datos, mientras que una
muy numerosa puede dejar sin observaciones a algunas clases, limitando de esta forma
su uso.
Para determinar el n
umero aproximado de clases, tambien se puede hacer uso de la
Regla de Sturges:
k = 1 + 3.3 log n
donde
K es el n
umero de clases
n es el n
umero total de observaciones de la muestra
log es el logaritmo com
un base 10.
Se debe dejar en claro que la Regla de Sturges es una aproximacion del n
umero de clases,
siempre es posible tomar una m
as o una menos de lo que la formula nos da.
Una buena pr
actica es la creaci
on de clases que tengan longitudes iguales. Esto puede
lograrse tomando la diferencia entre los valores extremos del conjunto de los datos, lo
que se conoce como rango (R), y dividiendolo sobre el n
umero de clases, el resultado
Humberto Barrios - hbarrios@unicesar.edu.co
sera aproximadamente la longitud para cada clase. Sin embargo, existen casos donde
esta regla no se puede aplicar o no debe aplicarse. Como ilustracion, tomemos los datos
de la tabla 1, para establecer un esquema de agrupamiento para este conjunto de datos
y determinar las frecuencias de clases, frecuencias relativas de clases, marcas de clases
y fronteras de clases. Agrupar los datos en clases de igual longitud.
El rango = valor mayor - valor menor = 236 104 = 132
Por ejemplo, si aplicamos la Regla de Sturges el n
umero de clases que debemos tomar
sera de 8.
Por lo tanto, la Longitud de clase = 132/8 ' 17.
Para establecer las fronteras de cada clase, es necesario considerar la unidad mas cercana
con respecto a la cual se mide las observaciones. As, las ocho clases a considerar son:
(103, 120], (120, 137], (137, 154], (154, 171], (171, 188], (188, 205], (205, 222], (222, 239]
Por lo tanto, una manera de representar a un conjunto de datos es como se muestra
en el siguiente cuadro, distribuci
on de frecuencias correspondiente a la duracion de 100
bateras, seleccionadas de manera aleatoria, de la produccion de una fabrica en una
semana.
Cuadro 1.3: Distribucion de frecuencias
Li
Ls
xi
fi fi % Fi
Fi %
103 120 111.5 5
5%
5
5%
120 137 128.5 4
4%
9
9%
137 154 145.5 11 11 % 20
20 %
154 171 162.5 21 21 % 41
41 %
171 188 179.5 31 31 % 72
72 %
188 205 196.5 14 14 % 89
86 %
205 222 213.5 8
8%
94
94 %
222 239 230.5 6
6 % 100 100 %
Donde
Li limite inferior de la clase i-esima.
Ls limite superior de la clase i-esima.
xi marca de clase de la clase i-esima.
fi frecuencia absoluta de la clase i-esima.
fi % frecuencia porcentual de la clase i-esima.
Fi frecuencia acumulada absoluta de la clase i-esima.
Fi % frecuencia acumulada porcentual de la clase i-esima.
El cuadro 1.3 de frecuencias proporciona mucha mas informacion a simple vista que
los datos originales, cuadro 1.1. En un estudio de la vida de las bateras, hay muchas
preguntas que pueden ahora responderse. Por ejemplo, Que fraccion o porcentaje de
las bateras puede esperarse de la poblacion en estudio tengan una duracion entre 171
a 188 das?
METODO
GRAFICO
Otra manera u
til de representar los datos de una muestra es a traves de graficos.
El principal objetivo de la representacion grafica de las frecuencias de clases como las
frecuencias acumuladas es mostrar el perfil de distribucion de los datos. El conocimiento
de este perfil es u
til en varias formas, para los analisis apropiados para las inferencias
estadsticas o con el fin de comparar los perfiles de dos o mas conjunto de datos.
Histograma de frecuencias. Un histograma es una representacion grafica de los datos que muestra la frecuencias de los casos (valores de los datos) en categoras. Las
frecuencias se representan para examinar la forma de la distribucion de las respuestas.
El histograma de frecuencias se construye levantando rectangulos con centros en las
marca de clases, con base de longitud igual a la longitud real del intervalo de clase
(L = LS LI ) y altura igual a la frecuencia de la respectiva clase, en un eje de coordenadas. Para la distribuci
on de frecuencias del cuadro 1.3, el histograma de frecuencias
figura 2.1:
Figura 1.1: Histograma de frecuencias
f
30
25
20
15
10
5
103
120
137
154
171
188
205
222
239 x
Los histogramas y los polgonos de frecuencias son parecidos. Como se puede observar
en los gr
aficos anteriores. Pero se pueden se
nalar las ventajas de los histogramas, las
que se pueden resumir as: los rectangulos muestran cada clase de la distribucion por
separado y el
area de cada rect
angulo, en relacion con el resto, muestra la proporcion
del n
umero total de observaciones que se encuentra en cada clase.
Los polgonos, sin embargo, tambien poseen ciertas ventajas, de las cuales se pueden
resaltar: el polgono de frecuencias es mas sencillo que el histograma, traza con mas
claridad el perfil de patr
on de los datos y por u
ltimo, el polgono se vuelve mas liso y
parecido a una curva conforme aumenta el n
umero de clases y el n
umero de observaciones. Un polgono como el que acabamos de describir, alisado mediante el aumento de
clases y de puntos de datos, se conoce como curva de frecuencias.
Diagrama de tallo y hojas. Una variante del histograma es el diagrama de tallo y hoja
que tiene la misma similitud y prop
osito pero que tambien proporciona una enumeracion
completa de los valores de los datos reales. Para construirlo basta separar en cada dato
el u
ltimo dgito de la derecha (que constituye la hoja) del bloque de cifras restantes (que
formara el tallo). El siguiente ejemplo ilustra la construccion del diagrama de tallo y
hojas.
Ejemplo 1.5 Utilice los datos de los tiempo de duraci
on del cuadro 1.1 para construir
diagrama de tallo y hojas.
Soluci
on Puesto que todas las mediciones son n
umeros de tres dgitos, se tiene tallos
Humberto Barrios - hbarrios@unicesar.edu.co
10
de dos dgitos y hojas de un solo dgito. Por ejemplo, la medicion 175 tiene un tallo 17
y una hoja de 5. La siguiente tabla 1.4 muestra el diagrama de tallo y hojas para los
datos.
Cuadro 1.4: Diagrama de tallo y hojas para el
tiempo duracion de 100 bateras
10 47918
12 24459
14 04690111335567789
16 00244556778899233344456667888
18 1122344557777888112345899
20 002356888
22 0112466946
1.3
MEDIDAS NUMERICAS
DESCRIPTIVAS
Las descripciones gr
aficas de los datos presentadas en la seccion anterior proporcionan una informaci
on u
til respecto al conjunto de mediciones, pero no es adecuado
Humberto Barrios - hbarrios@unicesar.edu.co
1.3 MEDIDAS NUMERICAS
DESCRIPTIVAS
11
para hacer inferencias, sobre todo porque ninguna de las representaciones (tablas y
graficas) no est
an bien definidas. Por ejemplo, se podran elaborar muchos histogramas
similares a partir del mismo conjunto de mediciones. Para poder hacer inferencias con
respecto a una poblaci
on, basada en la informacion contenida en una muestra y medir
la confiabilidad de la inferencia, en terminos de probabilidades, se requieren cantidades obtenidas de expresiones rigurosamente definidas para analizar la informacion de
la muestra. Es posible obtener, mediante las matematicas, ciertas propiedades de esas
cantidades muestrales y establecer conclusiones probabilsticas con respecto a la validez
de las inferencias.
Las cantidades que se pretenden definir son medidas numericas descriptivas de un conjunto de datos. Se buscan n
umeros que describan la distribucion de frecuencias para
cualquier conjunto de mediciones.
Existen dos medidas de interes para cualquier conjunto de datos: la localizacion de su
centro y su variabilidad.
1.3.1
x
=
1X
xi fi
n
(1.1)
i=1
Donde n = f1 + f2 + f3 + . . . + fk . En el caso, f1 = f2 = f3 = . . . = fk = 1
entonces los datos se dicen no agrupados. As, la formula para la media se convierte
en
n
1X
x
=
xi
n
(1.2)
i=1
La media es una medida apropiada de tendencia central para muchos conjuntos de datos.
Sin embargo, dado que todas las mediciones se emplean para su calculo, el valor de la
media puede afectarse por la existencia de algunos valores extremos.
Definici
on 1.3.2 La mediana en un conjunto de datos no agrupados, ordenados de
12
n
2
Fm1
c
fm
(1.3)
1
1 + 2
c
(1.4)
En muchas ocasiones en una serie de datos, puede ocurrir mas de una observacion con la
misma frecuencia. En este caso, se dice que la distribucion de frecuencias es multimodal.
Como en todos los aspectos de la vida, el azar puede desempe
nar un papel importante
en la organizaci
on en un conjunto de mediciones. En ocasiones, el azar hace que un
solo elemento no representativo se repita lo suficiente para ser el valor mas frecuente
del conjunto de mediciones. Es por esta razon que rara vez se utilice la moda de un
conjunto de datos no agrupados como medida de tendencia central.
Se explicar
an el c
alculo de la media, mediana y moda con los ejemplos siguientes:
Ejemplo 1.6 (Para datos no agrupados). El tiempo de reparaci
on, medido en horas,
de un instrumento electr
onico tiene un comportamiento aleatorio. Los tiempos de reparacion de 16 de tales instrumentos, elegidos a traves de un mecanismo aleatorio, son los
siguientes:
1.3 MEDIDAS NUMERICAS
DESCRIPTIVAS
13
5 6 3 6 11 7 9 10 2 4 10 6 2 8 1 5
Calcular la media, mediana y moda de este conjunto de datos.
1X
1
x
=
xi = (5 + 6 + 3 + 6 + 11 + 7 + 9 + 10 + 2 + 4 + 10 + 6 + 2 + 8 + 1 + 5) = 5.94
n
16
i=1
Para el caso de la mediana se ordenan los datos de menor a mayor, como en este caso
el n
umero de elementos es par, la mediana sera el promedio de los dos valores centrales.
1 2 2 3 4 5 5 6 6 6 7 8 9 10 10 11
Es decir,
x
=
6+6
=6
2
La moda en una serie de datos es el valor con mayor frecuencia, en este caso el valor
con mayor frecuencia es el 6. Entonces
Mo = 6
Ejemplo 1.7 (Para datos agrupados). Con la distribuci
on de frecuencias del cuadro ??.
Calcular la media, mediana y moda.
Soluci
on
De la distribuci
on de frecuencias correspondiente a la duracion de 100 bateras, para
calcular la media multiplicamos las marcas de clases por las respectivas frecuencias de
clase y dividimos por las suma de las frecuencias. Es decir,
x
=
1X
xi fi
n
i=1
1
=
[111.5(5) + 128.5(4) + 145.5(11) + 162.5(21)
100
+ 179.5(31) + 196.5(14) + 213.5(8) + 230.5(6)] = 174.9
Otra manera para calcular la media es utilizando el cuadro 1.3, construyendo otra
columna resultado de multiplicar las marcas de clases por sus respectivas frecuencias, y
dividir la suma de esta por la suma de las frecuencias.
Para calcular la mediana de la distribucion de frecuencias del cuadro 1.3.
Humberto Barrios - hbarrios@unicesar.edu.co
14
1. Se identifica la clase mediana, la cual sera la que contiene el elemento para el cual
la mitad de todas las observaciones es menor y la otra mitad es mayor. Por lo
tanto la clase mediana es: 171-188.
2. Lm = limite real inferior de la clase mediana = 171
3. fm = frecuencia de la clase mediana = 31
4. Fm1 = frecuencia acumulada anterior a la clase mediana=21
5. c = ancho real de la clase mediana =14
6. n = n
umero de observaciones en la muestra o tama
no de muestra = 100.
Por consiguiente, la ecuaci
on para la mediana con datos agrupados sera:
n
50 41
2 Fm1
x
= Lm +
c = 171 +
(17) = 175.9
fm
31
Para determinar el valor para la moda, identificamos la clase modal es: 171-188.
1. LMo = lmite real inferior de la clase modal= 171
2. 1 = frecuencia de la clase modal menos la frecuencia que se encuentra inmediatamente por encima de ella = 31-21 = 10
3. 2 = frecuencia de la clase modal menos la frecuencia que se encuentra inmediatamente por debajo de ella = 31 -14=17
4. c = ancho real de la clase modal = 17
Entonces se utiliza la siguiente ecuacion:
1
10
Mo = LMo +
c = 171 +
(17) = 177.3
1 + 2
10 + 17
Cuando se trabaja un problema en estadstica, se debe decidir cual de las medidas de
tendencia central se va ha utilizar. Por ejemplo, si la distribucion es simetrica, es claro
que en este caso solo tienen una moda. Por lo tanto el mismo valor para la media,
la mediana y la moda. En tales casos, no es necesario escoger la medida de tendencia
central, pues ya esta hecha la seleccion, cualquiera de ellas es una buena opcion.
En una distribuci
on sesgada positiva. Es decir, sesgada hacia la derecha, la moda se
encuentra en el punto m
as alto de la distribucion, la mediana esta a la derecha de la
moda y la media se encuentra todava mas a la derecha de la moda y la mediana. Es
decir, se tiene la siguiente relaci
on:
Mo < x
<x
En una distribuci
on sesgada negativa. Es decir, sesgada hacia la izquierda, la moda se
encuentra en el punto m
as alto de la distribucion, la mediana esta hacia la izquierda de
la moda y la media se encuentra todava mas a la izquierda de la moda y la mediana.
Es decir, se tiene la siguiente relacion:
Mo > x
>x
Cuando la poblaci
on est
a sesgada negativamente o positivamente, con frecuencia la
mediana resulta ser la mejor medida de posicion, debido a que siempre esta entre la
moda y la media. La mediana no se ve influida por la frecuencia de aparicion de un solo
valor como es el caso de la moda, ni se distorsion con la presencia de valores extremos
como la media.
Humberto Barrios - hbarrios@unicesar.edu.co
1.3 MEDIDAS NUMERICAS
DESCRIPTIVAS
15
MEDIDAS DE DISPERSION
Las medidas de tendencia central de un conjunto de mediciones solamente localizan
el centro de la distribuci
on de los datos. Por si mismo, no ofrecen una descripcion
adecuada de los datos. Por ejemplo, dos conjuntos de mediciones podran tener sus
distribuciones de frecuencias muy diferentes pero con la misma media. La diferencias
entre dos distribuciones, puede estar en variacion o dispersion a ambos lados de la
media. Una descripci
on adecuada de los datos requiere de la definicion de una medida de
variabilidad de los datos. La medida mas com
un de variabilidad usada en la estadstica
es la varianza, que es una funci
on de las desviaciones (o distancia) de las mediciones
con respecto a su media.
Definici
on 1.3.4 Sean x1 , x2 , x3 , . . ., xk marcas de clases con frecuencias de clases
s2 =
1 X
(xi x
)2 fi
n1
(1.5)
i=1
1 X
(xi x
)2
s =
n1
2
(1.6)
i=1
La varianza es u
til en la comparacion de la variacion relativa de dos conjuntos de
mediciones, pero s
olo aporta informacion con respecto a la variacion en un solo conjunto
cuando se interpreta en terminos de la desviacion estandar. La desviacion estandar de
un conjunto de medidas es la raz cuadrada positiva de la varianza, es decir,
s=
s2
(1.7)
La varianza y la desviaci
on est
andar no son medidas de variabilidad distintas, debido
a que la u
ltima no puede determinarse a menos que se conozca la primera. A menudo
se prefiere la desviaci
on est
andar en relacion con la varianza, porque se expresa en las
mismas unidades fsicas de las observaciones.
Otra medida u
til de la variabilidad tiene base en el valor absoluto de las diferencias
entres el conjunto de mediciones y la media o la mediana, dependiendo de cual de las
dos se emplee como medida de tendencia central.
16
Definici
on 1.3.5 Sean x1 , x2 , x3 , . . ., xk marcas de clases con frecuencias de clases
DM =
1X
|xi x
|fi
n
(1.8)
i=1
1X
DM =
|xi x
|
n
(1.9)
i=1
tiene un comportamiento aleatorio. Los tiempos de reparacion de 16 de tales instrumentos, elegidos a traves de un mecanismo aleatorio, son los siguientes:
5 6 3 6 11 7 9 10 2 4 10 6 2 8 1 5
Calcular la varianza, desviaci
on estandar, desviacion media y desviacion mediana de
este conjunto de datos.
Soluci
on
Para la varianza se tiene
Humberto Barrios - hbarrios@unicesar.edu.co
1.3 MEDIDAS NUMERICAS
DESCRIPTIVAS
17
s2 =
1 X
(xi x
)2
n1
i=1
1
=
[(5 5.94)2 + (6 5.94)2
16 1
+ (3 5.94)2 + (6 5.94)2 + (2 5.94)2
+ (4 5.94)2 + (11 5.94)2 + (7 5.94)2
+ (9 5.94)2 + (10 5.94)2 + (10 5.94)2
+ (6 5.94)2 + (2 5.94)2 + (8 5.94)2
+ (1 5.94)2 + (5 5.94)2 ]
= 9.53
La desviaci
on est
andar es
s=
9.5333 = 3.0876
Para la desviaci
on media se tiene
n
DM =
1X
|xi x
|
n
i=1
1
= [|5 5.94| + |6 5.94| + |3 5.94| + |6 5.94|
16
+ |2 5.94| + |4 5.94| + |11 5.94| + |7 5.94|
+ |9 5.94| + |10 5.94| + |10 5.94| + |6 5.94|
+ |2 5.94| + |8 5.94| + |1 5.94| + |5 5.94|
= 2.445
Para la desviaci
on mediana se tiene
n
DM d =
1X
|xi x
|
n
i=1
1
= [|5 6| + |6 6| + |3 6| + |6 6|
16
+ |2 6| + |4 6| + |11 6| + |7 6| + |9 6|
+ |10 5.94| + |10 6| + |6 6| + |2 6|
+ |8 6| + |1 6| + |5 6|
= 2.4375
desviaci
on est
andar, desviaci
on media y desviacion mediana.
Soluci
on
18
x
q = Lq +
nq Fq1
c
fq
(1.10)
s
100 %
x
(1.11)
1.3 MEDIDAS NUMERICAS
DESCRIPTIVAS
19
de recorrido interdecil.
Definici
on 1.3.9 La diferencia entre los percentiles 75avo y 25avo recibe el nombre de
recorrido intercuartil.
Soluci
on Las clases percentiles 10ava y 90ava son respectivamente (137, 154] y (205, 222],
entonces para calcular a x0.1 se tiene:
1. Se identifica la clase cuantil, la cual sera la que contiene el elemento para el cual
la q % de todas las observaciones es menor y la otra (100 q) % es mayor.
2. Lq = limite real inferior de la clase 10ava = 137
3. fq = frecuencia de la clase 10ava = 11
4. Fq1 = frecuencia acumulada anterior a la clase cuantil =9
5. c = ancho real de la clase cuantil =17
6. n = n
umero de observaciones en la muestra o tama
no de muestra =100.
20
Se utiliza la siguiente f
ormula:
x
q = Lq +
nq Fq1
0.1(100) 9
c = 137 +
(17) = 138.5
fq
11
nq Fq1
0.9(100) 86
c = 205 +
(17) = 213.5
fq
8
s
28.26
100 =
(100) = 16 %
x
174.91
Observese 1.5 que los valores de las medidas de tendencias central se encuentran muy
cerca entre si, tambien se puede afirmar lo mismo de las desviaciones estandar, media
y mediana. Sin embargo, no es de esperar que todas las distribuciones de frecuencia
tengan este comportamiento.
Estas comparaciones aclaran lo que las medidas numericas y las distribuciones de frecuencia pueden hacer para descubrir la naturaleza inherente de un conjunto de mediciones. En consecuencias, el usuario debe tener cuidado tanto en la eleccion como en la
interpretaci
on de estas medidas. A pesar que la media y la desviacion estandar se han
empleado de manera extensa como medidas de tendencia central y dispersion respectivamente, aunque tiene propiedades matematicas muy interesantes existen problemas
para los cuales no puede ser las medidas mas deseables. Para conjuntos de mediciones
fsicas como lecturas de instrumentos, especificaciones de partes, pesos, etc., la media
y la desviaci
on est
andar o desviacion media, son medidas anheladas. Para conjunto de
mediciones afines con ingresos y otras informaciones de tipo economico y financieros,
la mejor elecci
on para la medida de tendencia central y dispersion son la media y la
desviaci
on de la mediana respectivamente.
En muchas investigaciones de tipo economico y social proporcionan informacion en
tablas de frecuencia que no solo contienen clases de diferentes amplitudes sino tambien
clases abiertas como mayores que o menor que con el proposito de tener mayor cobertura
de los datos. Estas clases se presentan en los extremos de la distribucion de frecuencia
y no se especifica los lmites de las clases. Como resultado, no se encuentra definido
el punto medio de la clase abierta y en consecuencias no se puede calcular la media,
varianza, desviaci
on est
andar y desviacion media, a menos que se conozca un valor
particular de la clase o que sea conocido su promedio aritmetico.
1.4
EJERCICIOS
1. Los siguientes datos son los tiempos, en minutos, correspondiente a una muestra
aleatoria de 50 personas que estuvieron cobrando un cheque, un fin de mes en un
banco de la cuidad
Humberto Barrios - hbarrios@unicesar.edu.co
1.4 EJERCICIOS
21
17 16 39 30 23 38 32 20 43 32
44 41 23 17 29 26 21 34 44 24
21 27 36 21 17 28 29 34 24 28
25 29 45 23 16 34 20 30 23 35
35 27 19 31 45 40 14 29 23 19
a) Construir una distribucion de frecuencias, de clases, relativa, acumulada y
relativa acumulada.
b) Construir histograma, polgono y ojiva con los resultados obtenidos en a.
c) Con los datos agrupados calcula: la media, mediana, moda, desviacion estandar,
desviaci
on media, desviacion mediana, y los recorridos intercuartil e interdecil.
2. Con los siguiente tres conjuntos de datos:
1
2 3 4 5
1 1 6 6
13 2 3 4 5 20
Calcular la media y la varianza para cada conjunto de datos. Que se puede
concluir?
3. Con los datos del ejercicio 1, sea xi el tiempo que gasta el i-esimo cliente en cobrar
un cheque para i = 1, 2, . . . , 50. Transformar los datos por medio de la relacion
zi = (xi 28.2)/8.928
Con los datos transformados
a) Construir una distribucion de frecuencias, de clases, relativa, acumulada y
relativa acumulada.
b) Construir histograma, polgono y ojiva con los resultados obtenidos en a.
c) Con los datos agrupados calcula: la media, mediana, moda, desviacion estandar,
desviaci
on media, desviacion mediana, y los recorridos intercuartil e interdecil.
d ) Ha ocurrido alg
un cambio en la naturaleza de la distribucion de frecuencia
cuando esta se compara con los del ejercicio 1?
4. Los datos que tienen una distribucion acampanada tienen caractersticas bien definidas con respecto a la variacion, que se puede expresar en el siguiente enunciado:
Regla emprica. Para una distribucion de mediciones que es aproximadamente
acampanada (forma normal), el intervalo
( , + ) Contiene aproximadamente el 68 % de las mediciones
( 2, + 2) Contiene aproximadamente el 95 % de las mediciones
( 3, + 3) Contiene casi todas las mediciones
Donde y son la media poblacional y desviacion estandar poblacional respectivamente.
Calcular el intervalo (
x k, x
+ k) para k =1, 2, y 3, del ejercicio 1, cuenta
el n
umero de mediciones que se ubican dentro de cada intervalo y compara estos
resultados con el n
umero que podra esperarse de acuerdo a la regla emprica.
Humberto Barrios - hbarrios@unicesar.edu.co
22
5. Los siguientes datos agrupados representan las ventas ($1000) de 50 tiendas, seleccionadas aleatoriamente del municipio de Valledupar, de un da cualquiera de
la semana.
Clases
110-186
187-263
264-340
341-417
418-494
495-571
572-648
649-727
Frecuencias
4
14
11
9
7
1
2
2
i=1
n
P
c)
i=1
n
P
cxi = c
n
P
i=1
(xi + yi ) =
i=1
xi
n
P
i=1
xi +
n
P
yi
i=1
n
X
(xi y)2
i=1
Tiene un mnimo en x
. Utilice sus conocimientos de Calculo Diferencial.
7. Sea k 1. Demuestre que para cualquier conjunto de n mediciones, la fraccion
que queda incluida en el intervalo (
x ks, x
+ ks) es por lo menos (1 k12 ). Este
resultado se conoce con el nombre de teorema de Tchbysheff.
8. Supongamos que tenemos las siguientes medias: x
1 = 37, x
2 = 41 y x
3 = 28,
basadas en 50, 20 y 10 observaciones respectivamente. Si hay que escoger una
sola media, Cu
al sera su eleccion? Por que? Cuales son los totales de las
muestras originales? C
omo se usara estos totales para hallar la media de las 80
observaciones?
Humberto Barrios - hbarrios@unicesar.edu.co
1.4 EJERCICIOS
23
1in
(n 1)s
78
100
107
108
108
126
129
137
139
142
113
116
117
121
124
131
136
143
144
146
94
102
109
126
128
129
130
132
146
149
87
93
112
120
122
128
141
143
151
151
110
114
120
121
129
129
130
138
142
147
92
95
117
118
119
126
135
140
147
152
INTRODUCCION
PROPIEDADES BASICAS
DIFERENTES MANERAS DE ASIGNAR
PROBABILIDADES
PROBABILIDAD CONDICIONAL
EVENTOS INDEPENDIENTES
EJERCICIOS
2. PROBABILIDAD
2.1
INTRODUCCION
La teora de probabilidad comenzo en siglo XVII con dos grandes matematicos
franceses, Blaise Pascal (1961-1668) y Pierre de Fermat (1623-1662), aunque algunos
matematicos anteriores, como Gerolamo Cardano (1501-1576) en el siglo XVI, haban
hecho importantes contribuciones a su desarrollo. La probabilidad, como una rama de
la matem
atica, comenz
o como un intento de responder a varias preguntas que surgan
en los juegos de azar, convirtiendose en una herramienta poderosa en las mas variadas
ramas del conocimiento. Es as, que encuentra aplicaciones en cada una de las area de
la actividad humana desde la m
usica a la fsica, y en experiencia diarias como es la de
pronosticar el tiempo a la predicci
on de los riesgos de nuevos tratamientos medicos.
El objetivo principal de este captulo es proporcionar al estudiante una formacion
solida y sistem
atica en los principios, metodos, resultados y aplicaciones de la teora de
la probabilidad, as como la habilidad de razonar bajo estos modelos. El primer paso de
esta captulo es describir la estructura generica del concepto de probabilidad a traves
de un conjunto de axiomas, y sus propiedades basicas. Para esto, se empezara con una
revision corta de la teora de conjuntos.
2.2
PROPIEDADES BASICAS
La teora de la probabilidad fue establecida sobre una base axiomatica idonea por
el matem
atico ruso Andrei Nikol
ayevich Kolmogorov (1903-1987) en la decada de los
a
nos treinta. Por supuesto, los axiomas y teoremas de Kolmogorov son mas rigurosos
que la versi
on simplificada que presentaremos a continuacion, para ilustrar el enfoque
axiomatico comenzaremos con la siguiente definicion.
Definici
on 2.2.1 Un experimento aleatorio es el proceso por medio del cual se obtiene
una observaci
on.
Por ejemplo, el lanzamiento de un dado, el n
umero de carros que llegan a la universidad
en una hora determinada, se les puede considerar un experimento. En el contexto de las
ciencias sociales, la mayor parte de los procedimientos de recogida de datos se pueden
26
Captulo 2. PROBABILIDAD
notaremos A .
Para el espacio muestral asociado con el lanzamiento de un dado, se tiene que cualquier
subconjunto de
= {1, 2, 3, 4, 5, 6}
es un evento de .
Al conjunto formado por todos los subconjuntos de , el cual notaremos P(), lo
denominaremos el conjunto de partes . Por ejemplo, si = {a, b, c} conjunto de
partes de es:
P() = {, {a}, {b}, {c}, {a, b}, {a, c}, {b, c}, }.
Definici
on 2.2.4 Sean A y B eventos cualesquiera del espacio muestral . Entonces
1. La intersecci
on de los eventos A y B es otro evento, lo cual escribimos A B,
cuyo elementos son los elementos comunes a A y B.
x A B si y solo si x A y x B
2. La uni
on de los eventos A y B es otro evento, lo cual escribimos A B, cuyos
elementos son todos los elementos de A o B.
x A B si y solo si x A o x B
3. Los eventos A y B se dicen disjuntos o mutuamente excluyentes si su
intersecci
on es el conjunto vaco:
2.2 PROPIEDADES BASICAS
27
AB =
AB
AB
AB
AB =
Ac
A B = {6}
A B = {2, 3, 4, 6}
Ac = {2, 3, 4, 6}
Definici
on 2.2.5 Sea un espacio muestral asociado a un experimento. Una proba-
28
Captulo 2. PROBABILIDAD
An ) =
n=1
P (An ).
n=1
Demostraci
on. Sea A1 = y Ai = para i = 2, 3, . . . , es claro que Ai Aj = para
todo i 6= j.
Por el axioma (P3) de la definici
on (2.2.5) tenemos que
P(
An ) =
n=1
P (An )
(2.1)
n=1
como
=
An
(2.2)
n=1
P (An )
n=2
P (A B) = P (A) + P (B).
Demostraci
on. Considerese A1 = A, A2 = B, Ai = , aplicando el axioma ?? se deduce
P(
An ) =
n=1
n=1
P (An )
n=3
n=1
An ) =
(2.3)
n=1
Humberto Barrios - hbarrios@unicesar.edu.co
2.2 PROPIEDADES BASICAS
29
pero
AB =
An
(2.4)
n=1
P (Ac ) = 1 P (A).
Demostraci
on. Como se puede ver en la figura 2.1, = A Ac y A Ac = .
Figura 2.1: Ac
Ac
A
P (A) P (B).
Demostraci
on. N
otese que el evento B se puede escribir como
B = A (Ac B)
donde los eventos A y (Ac B) son mutuamente excluyentes. En consecuencia, por
teorema 2 se tiene
P (B) = P (A) + P (Ac B)
Humberto Barrios - hbarrios@unicesar.edu.co
30
Captulo 2. PROBABILIDAD
Figura 2.2: A B
B
A
Ac B
como
P (Ac B) 0
se sigue
P (A) P (B).
Teorema 2.2.5 Sean A y B eventos de . Entonces
P (A B) = P (A) + P (B) P (A B)
Demostraci
on. Es f
acil comprobar, mediante la figura 2.3, que
Figura 2.3: A B
AB
A AB B
A B = A (Ac B) y A (Ac B) =
(2.5)
B = (A B) (Ac B) y A B) (Ac B) =
(2.6)
tambien
(2.7)
(2.8)
31
2.3
entre el n
umero de casos favorables y el n
umero total de casos posibles, siempre que
no exista raz
on alguna para creer que un resultado ocurra mas que otro. Es decir, si
A es un evento del espacio muestral entonces la probabilidad del evento A es:
P (A) =
n
umero de casos favorables de A
#(A)
=
n
umero de casos posibles
#()
P (c) = lm
Al igual que en el caso anterior, esta definicion es una forma conceptual de entender lo
que es un experimento aleatorio (por ejemplo, lanzar un dado), y no significa que en la
practica haya que repetirlo un n
umero ilimitado de veces para calcular la probabilidad.
Esto se debe a dos razones: en la practica es imposible repetir un mismo experimento
en identicas condiciones; el dado se deteriorara cuantas mas veces se lance, la velocidad
del aire cambiar
a, etc. Adem
as, si se pudiera repetir el fenomeno en identicas condiciones el resultado sera el mismo en todos los lanzamientos, por lo que el concepto de
probabilidad perder
a su sentido.
32
Captulo 2. PROBABILIDAD
n
umero de casos favorables
3
1
= = .
n
umero de caso posibles
6
2
cos listos para ser enviados a su destino. El no sabe que dos son defectuosos. Recibe
un pedido especial de dos terminales y lo surte seleccionado al azar dos de los cinco
disponibles.
1. Encuentren el espacio muestral para este experimento
2. Sea A el evento en que el pedido se surte con dos terminales no defectuosos. Liste
los puntos muestrales de A
3. Asigne probabilidades a cada resultado posible
4. Calcular la probabilidad del evento A.
Soluci
on. Sean d1 , d2 los dos terminales defectuoso y b1 , b2 , b3 los terminales buenos.
1. Los eventos simples pueden representarse como sigue:
e1 = {d1 , d2 }
e6 = {d2 , b2 }
e2 = {d1 , b1 }
e7 = {d2 , b3 }
e3 = {d1 , b2 }
e8 = {b1 , b2 }
e4 = {d1 , b3 }
e9 = {b2 , b3 }
e5 = {d2 , b1 }
e10 = {b3 , b3 }.
1
;
10
i=1, 2, 3, 4, 5, 6, 7, 8, 9, 10.
Humberto Barrios - hbarrios@unicesar.edu.co
33
4. Puesto que el evento A = {e8 , e9 , e10 } = {e8 } {e9 } {e10 } , aplicando el teorema
2, se obtiene
P (A) = P ({e8 }) + P ({e9 }) + P ({e10 }) =
3
.
10
EVENTOS
e1
e2
e3
e4
RESULTADOS
1 perforacion 2 perforacion Probabilidad
Exito
Exito
0.01
Exito
Fracaso
Fracaso
Exito
0.09
Fracaso
fracaso
0.81
34
Captulo 2. PROBABILIDAD
Ejemplo 2.5 Una agencia comercial compra papelera a uno de los tres vendedores v1 ,
v2 y v3 . Se ordena el pedido en dos das consecutivos, un pedido por da, tal que (v1 , v2 )
significa que el vendedor v1 recibe el pedido el primer da y el vendedor v2 lo recibe el
segundo da.
1. Determine los puntos muestrales de este experimento
2. Supongamos que se seleccionan los vendedores al azar cada da, asigne una probabilidad a cada punto muestral
3. Sean A el evento de que el mismo vendedor recibe los dos pedidos y el evento B
de que el vendedor v2 consigue por lo menos un pedido. Calcular: P (A), P (B),
P (A B) y P (A B).
Soluci
on. El experimento consiste en la solicitud de papelera que hace una agencia
comercial en dos das consecutivos. Como (vi , vj ) representa que el vendedor i recibio el
primer pedido y j el segundo pedido. Entonces
1. el espacio muestral es:
= {(v1 , v1 ), (v1 , v2 ), (v1 , v3 ), (v2 , v1 ), (v2 , v2 ), (v2 , v3 ), (v3 , v1 ), (v3 , v2 ), (v3 , v3 )}
2. Como la selecci
on se hace de manera aleatoria cada da, es natural suponer que
todos los vendedores tienen la misma posibilidad de ser seleccionados por lo tanto
1
P ({(vi , vj )}) = ;
9
i,j=1, 2, 3.
3. Los eventos
A = {(v1 , v1 ), (v2 , v2 ), (v3 , v3 )}
B = {(v1 , v2 ), (v2 , v1 ), (v2 , v2 ), (v2 , v3 ), (v3 , v2 )}
A B = {(v2 , v2 )}
se tiene
1
3
5
9
1
P (A B) = P ({(v2 , v2 )}) = .
9
Por lo tanto
P (A B) = P (A) + P (B) P (A B) =
1 51
7
+
= .
3 99
7
2.4
PROBABILIDAD CONDICIONAL
La probabilidad condicional nos permite ajustar un evento si se sabe que ha ocurrido
un evento relacionado con el primero.
35
Definici
on 2.4.1 . Sea B un evento del espacio muestral tal que P (B) > 0. Entonces
la probabilidad condicional del evento A, dado que el evento B ocurrio, se define como
la razon
P (A|B) =
P (A B
.
P (B)
P (B|A) =
P (A B
.
P (A)
Tambien de la definici
on de probabilidad condicional se obtiene lo que se conoce como
teorema de multiplicaci
on
P (A B) = P (A|B)P (B) = P (B|A)P (A).
Ejemplo 2.6 Supongamos que en una oficina hay 100 m
aquinas calculadoras. Algunas
de esas m
aquinas son electricas (E), mientras otras son manuales (M). Ademas, algunas
son nuevas (N), mientras otras son usadas (U). La siguiente tabla da el n
umero de
maquinas de cada categora.
N
U
Total
E
40
20
60
M
30
10
40
Total
70
30
100
Una persona entra a la oficina, escoge una maquina al azar y descubre que es nueva.
Cual es la probabilidad de que sea electrica?
Soluci
on. Se sabe que la persona escogio una maquina nueva de la 70 y se tienen 40,
por lo tanto
4
P (E|N ) = .
7
Otra forma es calcular la probabilidad que se nueva y electrica,
P (E N ) = 0.40
P (N ) = 0.70.
Entonces
P (E|N ) =
P (E N )
0.40
4
=
= .
P (N )
0.70
7
36
Captulo 2. PROBABILIDAD
P (A B)
1
= .
P (B)
3
Definici
on 2.4.2 Se dice que los eventos B1 , B2 , B3 , B4 , . . . Bn representa una partici
on
n
X
P (A|Bi )P (Bi ).
i=1
Demostraci
on. Es f
acil observar en la figura 2.4 que A es la union disjunta de elementos
de , como se muestra en la siguiente grafica.
Figura 2.4: Particion de
Bn
B1
B3
B2
Esto es:
A = (A B1 ) (A B2 ) (A B3 ) . . . (A Bn )
donde
(A B1 ) (A B2 = ;
para todo i 6= j
entonces
P (A) =
n
X
P (A Bi )
(2.9)
i=1
Humberto Barrios - hbarrios@unicesar.edu.co
37
(2.10)
n
X
P (A|Bi )P (Bi ).
i=1
Ejemplo 2.8 Cierto artculo se hace en una de tres f
abricas, digamos 1,2 y 3. Se sabe
que la primera produce el doble de artculos que la segunda. Tambien se sabe que la
segunda y la tercera producen el mismo n
umero de artculo(durante un periodo de
producci
on especfico). Se conoce tambien que el 2 % de los artculos producidos por
cada una de las dos primeras son defectuosos; mientras que 4 % de los manufacturados
por la tercera son defectuosos. Todos los artculos se colocan en una fila y se escoge uno
al azar.
1. Cu
al es la probabilidad de que este artculo sea defectuoso?
2. Si las tres f
abricas producen 10000 artculos Cual es el n
umero de artculos defectuosos que produce cada f
abrica?
3. Si se sabe que el artculo es defectuoso Cual es la probabilidad de que este articulo
proceda de la f
abrica dos?
Soluci
on. Definamos
1. los siguientes eventos:
Entonces para i = 1, 2, 3
(A B1 ) = {el articulo es defectuoso y proviene de la fabrica i}
Luego
A = (A B1 ) (A B2 ) (A B3 )
por otra parte se tiene que
P (A|B1 ) = 0.02
P (A|B2 ) = 0.02
P (A|B3 ) = 0.04
P (B1 ) = 0.5
P (B2 ) = 0.25
P (B3 ) = 0.25.
38
Captulo 2. PROBABILIDAD
Figura 2.5:
6
18
63
P (B
B
2|
P (O
9
63
16
63
(B
1)
2 |B
1)
3
9
P
4
)=
1
(O
P (O
2|
P (B
2 |O
1)
5
9
20
63
bronce, y una segunda urna contiene tres de oro y cinco de bronce. Las monedas en las
dos urnas son todas identicas. Se selecciona una moneda de la primera urna y se coloca
sin verla en la segunda urna. Cu
al es la probabilidad de que ahora se seleccione una
moneda de bronce de la segunda?
Soluci
on. Sean B1 y B2 , la seleccion de una moneda de bronce de la urna 1 y una
moneda de bronce de la segunda urna respectivamente, y O1 una moneda de oro de la
urna 1. Debemos calcular la probabilidad de la union de los eventos B1 B2 y O1 B2 .
Las diferentes posibilidades que se pueden dar se muestran el diagrama de arbol, figura
2.5. Entonces
Por lo tanto, la probabilidad se seleccionar una moneda de bronce de la segunda
urna es:
P (B2 ) = P ((B1 B2 ) (O1 B2 ))
= P (B1 B2 ) + P (O1 B2 )
= P (B2 |B1 )P (B1 ) + P (B2 |O1 )P (O1 )
38
18 20
+
= .
=
63 63
63
Humberto Barrios - hbarrios@unicesar.edu.co
39
P (A|Bj )P (Bj )
.
n
P
P (A|Bi )P (Bi )
i=1
Demostraci
on. Por la definici
on de probabilidad condicional se tiene
P (Bj |A) =
P (A Bj )
P (A)
(2.11)
(2.12)
n
X
P (A | Bi )P (Bi )
(2.13)
i=1
P (A | Bj )P (Bj )
.
n
P
P (A|Bi )P (Bi )
i=1
Ejemplo 2.10 Supongamos que varias cajas son de dos tipos B1 y B2 . El tipo B1
contiene 70 % de caramelos dulces y 30 % de caramelos acidos, mientras que el tipo B2
dicho porcentaje esta invertido. Supongamos ademas que el 60 % de todas las cajas son
del tipo B1 , mientras que el resto son del tipo B2 . Si se escoge un caramelo dulce al
azar de una caja desconocida. Decidir de que tipo proviene.
Soluci
on. Se tienen dos tipos de cajas B1 y B2 con probabilidades de seleccion
P (B1 ) = 0.60
y
P (B2 ) = 0.40.
Sea los eventos
40
Captulo 2. PROBABILIDAD
P (D|B1 ) = 0.70
P (D|B2 ) = 0.30
P (A|B1 ) = 0.30
P (A|B2 ) = 0.70.
As
P (B1 |D) =
P (D|B1 )P (B1 )
(0.7)(0.6)
7
=
=
P (D|B1 )P (B1 ) + P (D|B2 )P (B2 )
(0.7)(0.6) + (0.3)(0.4)
9
P (B2 |D) =
P (D|B2 )P (B2 )
(0.3)(0.4)
2
=
=
P (D|B1 )P (B1 ) + P (D|B2 )P (B2 )
(0.7)(0.6) + (0.3)(0.4)
9
Por lo tanto se decide a favor de los caramelos que provienen de las cajas B1 .
2.5
EVENTOS INDEPENDIENTES
Definici
on 2.5.1 Los eventos A1 , A2 , A3 , . . . , An de se dicen independientes si para
Ejemplo 2.11 Un lote de diez objetos contiene cuatro defectuosas y seis en buen estado.
41
12 43
2
+
= .
35 95
5
3
9
2
5
y
P (D1 D2 ) = P (D1 )P (D2 ) =
4
.
25
A = {cc, cs}
B = {cc, sc}
C = {cc, ss}
Entonces se tiene
P (A B) = P ({cc}) =
P (A C) = P ({cc}) =
P (B C) = P ({cc}) =
1
4
1
4
1
4
= P (A)P (B) =
= P (A)P (C) =
= P (B)P (C) =
11
22
11
22
11
22
pero
P (A B C) = P ({cc}) =
1
1
111
6= = P (A)P (B)P (C) =
.
4
8
222
42
Captulo 2. PROBABILIDAD
cuando k < n. Por ejemplo, supongamos el lanzamiento de dos dados. Es claro, que el
espacio muestral es conjunto formado por todas las parejas (i, j), i, j = 1, 2, 3, 4, 5, 6
con probabilidad 1/36. Sean los siguientes eventos
En este caso, es f
acil ver que
P (A B) 6= P (A)P (B)
P (A C) 6= P (A)P (C)
P (B C) 6= P (B)P (C)
pero
P (A B C) = P (A)P (B)P C).
Por lo tanto los eventos A, B y C no son independientes.
Ejemplo 2.12 El siguiente circuito (figura 2.6) funciona si y s
olo si hay un camino
en el cual todos los dispositivos funcionan de izquierda a derecha. Suponga que los
dispositivos funcionen de forma independiente y que la probabilidad de que funcione un
dispositivo es como se muestra en la grafica.
1. Cu
al es la probabilidad de que el circuito funcione?
2. Cu
al es la probabilidad de que el no circuito funcione?
Figura 2.6:
A1
A2
A4
0.90
0.90
0.98
A3
A5
0.97
0.98
A6
0.99
Soluci
on. Para solucionar este problema procedemos como sigue:
1. La trayectoria de A1 a A2 funciona si y solo si los dispositivos A1 y A2 funcionan
simult
aneamente. Por lo tanto, la probabilidad de que funciona, dado que los
dispositivos funcionan de manera independiente, es:
P (A1 A2 ) = P (A1 )P (A2 ) = (0.90)(0.90) = 0.81
Humberto Barrios - hbarrios@unicesar.edu.co
2.6 EJERCICIOS
43
Figura 2.7:
A1
A4
0.81
0.98
A3
A5
0.97
0.98
A6
0.99
A2
A3
0.994
0.999
0.990
Para que el circuito de la figura 2.8 funcione es necesario que los tres dispositivos
funciones simult
aneamente, y por ser independientes, la probabilidad que funcione
el circuito es:
P (A1 A2 A3 ) = P (A1 )P (A2 )P (A3 ) = 0.983.
2. La probabilidad que no funcione el circuito de la figura 2.6 es: 0.017.
2.6
EJERCICIOS
1. Supongamos que se lanzan tres monedas perfectas y se observa el resultado de las
caras que quedan hacia arriba.
Humberto Barrios - hbarrios@unicesar.edu.co
44
2.
3.
4.
5.
6.
7.
8.
9.
Captulo 2. PROBABILIDAD
2.6 EJERCICIOS
45
10. Cuantos grupos de 5 alumnos pueden formarse con los treinta alumnos de una
clase. (Un grupo es distinto de otro si se diferencia de otro por lo menos en un
alumno).
11. Una aerolnea tiene seis vuelos diarios Barranquilla a Medelln y siete vuelos de
Medelln a Cali. Si los vuelos se hacen en das separados. Cuantos arreglos diferentes de vuelos puede ofrecer la aerolnea de Barranquilla a Cali?
12. Una operaci
on de montaje en una fabrica manufacturara requiere tres pasos que
pueden realizarse en cualquier orden. De cuantas maneras se puede hacer el
montaje?
13. Cierta marca de autom
ovil tiene cinco modelos diferentes, con cuatro tipo de
motores, con dos tipos de transmision, y en ocho colores.
a) Cu
antos autom
oviles tendra que adquirir un distribuidor si quiere incluir
un carro por combinaci
on modelo-motor-trasmision?
b) Cu
antos autom
oviles tendra que tener en existencia un centro de distribuci
on si almacenara los carros de todos los colores disponibles para cada
combinaci
on en (a.)?
14. Un investigador quiere determinar el efecto de tres variables, presion, temperatura y el tipo de catalizador, en el proceso de refinacion. Si el investigador tiene
la intenci
on de utilizar tres temperaturas, tres presiones y dos tipos de catalizador. Cu
antos experimentos habra que hacer si quiere incluir todas las posibles
combinaciones de temperaturas, de presiones y tipos de catalizador?
15. Cinco empresas F 1, F 2, F 3, F 4 y F 5, hacen propuestas con respecto a tres contratos separados, C1, C2 y C3. Una empresa solo puede obtener a lo mas un contrato.
Los contratos son bastante diferentes, de tal manera que la asignacion de C1 a F 1
se debe diferenciar de la asignacion de C2 a F 2.
a) Cu
antos puntos muestrales tiene este experimento que trata de la asignacion
de los contratos a las empresas?
b) Encuentre la probabilidad de que se conceda un contrato a la empresa F 3,
bajo el supuesto de que los puntos muestrales son equiprobable.
16. Dado los siguientes eventos A y B, tales que P (A) = 0.5, P (B) = 0.3, y P (AB) =
0.1, encontrar lo siguiente:
a) P (A|B)
b) P (B|A)
c) P (A|A B)
d ) P (A|A B)
e) P (A B|A B)
17. Un armador de ventiladores electricos usa motores de dos proveedores. La compa
na A le suministra el 70 % y la compa
na B el otro 30 % de los motores. Supongamos que sabe que el 5 % de los motores que suministra la compa
na A son
defectuosos que el 3 % de los que suministra B tambien lo son. Se selecciona un
ventilador ya armado.
a) Cual es la probabilidad que tenga un motor defectuoso?
b) Si tiene un motor defectuoso cual es la probabilidad que ese motor haya sido
suministrado por la compa
na A?
c) Si tiene un motor defectuoso cual es la probabilidad que ese motor haya sido
suministrado por la compa
na B?
18. Los empleados de un supermercado se encuentra clasificado en tres categoras:
administradores, supervisores y vendedores. La siguiente tabla indica el n
umero
de empleados en cada divisi
on clasificados por sexo:
Humberto Barrios - hbarrios@unicesar.edu.co
46
Captulo 2. PROBABILIDAD
Administradores (A)
Supervisores (S)
Vendedores (V)
Total
19.
20.
21.
22.
23.
24.
25.
Mujeres (M)
20
50
100
170
Hombres (H)
30
20
80
130
Total
50
70
180
300
2.6 EJERCICIOS
26.
27.
28.
29.
30.
31.
47
0.35, 0.40 y 0.25 para los tres tipos de formaciones respectivas. De acuerdo con
la experiencia, se sabe que el petroleo se encuentra en un 40 % de formaciones de
tipo I, en un 20 % de formaciones de tipo II y en un 30 % de formaciones de tipo
III. Si la compa
na no descubre petroleo en ese lugar, determnese la probabilidad
de que exista una formaci
on de tipo II.
Se debe examinar un grupo grande de personas respecto a dos sntomas comunes
de cierta enfermedad. Se considera que el 20 % de las personas presentan solamente
el sntoma A, el 30 % tienen solamente el sntoma B, 10 % tienen ambos sntomas,
y el resto no tiene sntoma alguno. Para una persona escogida aleatoriamente de
este grupo, encuentre las probabilidades de los eventos siguientes:
a) Que la persona presente al menos un sntoma?
b) Que la persona no presente sntoma alguno?
c) Que la persona presente ambos sntoma, dado que presenta el sntoma B?
Una planta ensambladora recibe circuitos proveniente de tres fabricas distintas
B1 , B2 y B3 . El 50 % del total se compran a B1 mientras que a B2 y B3 se les
compra un 25 % a cada una. El porcentaje de circuitos defectuosos para B1 , B2 y
B3 es 5, 10 y 12 % respectivamente. Si los circuitos se almacenan en la planta sin
importar quien fue el proveedor:
a) Determinar la probabilidad de que una unidad armada en la planta contenga
un circuito defectuoso
b) Si un circuito no es defectuoso. Cual es la probabilidad de que haya sido
vendido por el proveedor B2 ?
Supongamos que hay nueve lugares disponibles en un estacionamiento, uno junto
al otro. Un acomodador tiene que estacionar nueve carros. Tres son carros deportivos, tres son carros grandes nacionales, y tres son carros compactos importados.
Cu
al es la probabilidad de que los tres carros deportivos se encuentren juntos,
suponiendo que el acomodador estaciona los carros de manera aleatoria?
Se clasifican ocho marcas de llantas de 1 a 8 (de la mejor a la peor) seg
un el
kilometraje que aguanten. Si un comprador escoge cuatro llantas aleatoriamente,
encuentre la probabilidad de que la mejor llanta entre las seleccionadas por el
comprador se encuentre realmente en el tercer lugar entre las ocho llantas originales.
Una maquinaria para producir un nuevo tubo electronico experimental genera
tubos defectuosos de vez en cuando, de una manera aleatoria. El ingeniero supervisor de una m
aquina en particular, ha notado que los tubos defectuosos parecen
agruparse (y, por tanto, aparecen de manera no aleatoria) y esto sugiere el mal
funcionamiento de alguna de la maquina. Una prueba para detectar la no aleatoriedad de un evento, se basa en el n
umero de corridas de artculos defectuosos
y buenos (una corrida es una sucesion no interrumpida de artculos defectuosos
o buenos). Mientras m
as peque
na sea el n
umero de corridas, mas grande es la
evidencia que indica la no aleatoriedad. De 12 tubos producidos por la maquina,
los 10 primeros eran buenos y los dos u
ltimos defectuosos (BBBBBBBBBBDD).
Suponga la aleatoriedad.
a) Cu
al es la probabilidad de observar la secuencia antes mencionada (resultante de dos corridas) dado que los 10 tubos de 12 son buenos?
b) Cu
al es la probabilidad de observar dos corridas?
c) Cu
al es la probabilidad de que el n
umero de corridas R sea R=3?
Suponga que la probabilidad de exposicion a la gripe durante una epidemia es 0.6.
La experiencia ha mostrado que una vacuna tiene 80 % de efectividad en proteger
Humberto Barrios - hbarrios@unicesar.edu.co
48
Captulo 2. PROBABILIDAD
a una persona sobre la gripe, si esta expuesta a la epidemia. Una persona tiene una
probabilidad de 0.90 de ser afectada por la gripe al ser expuesta. Dos personas, una
vacunada y la otra no, realizan una tarea altamente especializada en un negocio.
Suponga que no se ubican en la misma localizacion, que no entra en contacto con
la misma persona, y no se expone la una a la otra. Cual es la probabilidad de
que al menos una sea afectada por la gripe?
32. Si A y B son eventos tales que A B. Demuestrese que P (A) P (B).
33. Sean A, B y C eventos mutuamente excluyentes. Entonces
P (A B C) = P (A) + P (B) + P (C)
34. Sean A y B eventos cualesquiera. Entonces
P (A B) P (A) + P (B) 1
35. Sean A, B y C eventos cualesquiera. Entonces
P (ABC) = P (A)+P (B)+P (C)P (AB)P (AC)P (BC)+P (ABC)
36. Sea (, P ) un espacio de probabilidad. Dada la funcion PH : () 7 <, definida
por
PH (A) =
P (A H)
P (H)
i=1
n
[
i=1
Ai )
n
X
P (Ai )
i=1
n
[
i=1
Ai ) =
n
X
i=1
n
n
X
X
P (Ai )
P (Ai Aj )+
P (Ai Aj Ak ). . .+(1)n+1 P (A1 A2 . . .An
i<j
i<j<k
2.6 EJERCICIOS
49
42. Sean A y B eventos cualesquiera del espacio muestral , tales que P (A) = 0.2,
P (B) = 0.3 y P (A B) = 0.4. Calcular:
a) P (A B)
b) P (Ac B)
c) P (Ac B c )
d ) P (Ac B c )
43. Sean A y B eventos independientes del espacio muestral tales que P (A) = 0.5
y P (B) = 0.4. Calcular:
a) P (A B)
b) P (Ac B)
c) P (Ac B c )
d ) P (Ac B c )
44. Sean A y B eventos cualesquiera del espacio muestral . Demuestrese:
a) Si A B = = P (A|B) = 0
b) Si A B = P (B|A) = 1
45. Se lanzan dos dados hasta que la suma de los dos puntos sea 7 u 8. si sale 7, gana
el jugador A, y si sale 8 gana el jugador B. Cual es la probabilidad que gane B?
46. En el control preventivo de una poblacion donde la proporcion de enfermos es, se
usa el examen radiol
ogico para detectar posibles enfermos. Se sabe que la probabilidad de que, aplicando el examen a un enfermo, la muestra como tal, es 0.90; y
que la probabilidad de que el examen aplicado a una persona sana la se
nale como
enfermo es 0.01. calcular la probabilidad de que una persona dada este realmente
enferma, si el examen radiol
ogico lo mostro como tal. Considerese el experimento
de elegir una persona de la poblacion de manera aleatoria.
47. Supongamos que tenemos tres escritorios identicos, A, B y C, cada uno con dos
cajones. En A, cada caj
on contiene una moneda de oro; en B, un cajon contiene
una moneda de oro y el otro una de plata, y en C, cada cajon contiene una de
plata. Se elige un escritorio al azar, se abre uno de los cajones y encontramos una
moneda de oro. Cu
al es la probabilidad de que el escritorio elegido sea el B?
48. Sean A y B dos eventos independientes tales que con probabilidad 16 ocurren simult
aneamente, y con probabilidad 13 ninguno ocurre. Halle P (A) y P (B). Estan
determinadas en forma u
nica estas probabilidades?
49. Sean A y B dos eventos independientes tales que con probabilidad 16 ocurren simult
aneamente, y con probabilidad 31 ocurre A y B no ocurre. Halle P (A) y P (B).
Est
an determinadas en forma u
nica estas probabilidades?
50. Cu
al es el menor valor de n para el cual la probabilidad de obtener al menos un
6 en una serie de n lanzamientos de un dado es mayor que 43 ?
51. Los A1 , A2 , . . . son independientes y P (Ai ) = p, i = 1, 2, . . . . Hallar el menor n
n
S
para el cual P ( Ai ) p0 , donde p0 es un n
umero fijo.
i=1
52. Sean A y B dos eventos cualesquiera. Cual de las siguientes afirmaciones es falsa?
a) P (A|B) + P (Ac |B c ) = 1
b) P (A|B) + P (A|B c ) = 1
c) P (A|B) + P (Ac |B) = 1
53. Sean A y B dos eventos cualesquiera tales que P (A|B) = P (B|A), P (A B) = 1
y P (A | B) > 0. Demostrar que P (A) > 1/2.
54. Sean A1 , A2 , . . . , An eventos independientes en el espacio muestral si 0 < P (Aj ) <
1 para todo j. Demostrar que tiene por lo 2n puntos.
55. Demuestre que si P (A|C) P (B|C) y P (A|C c ) P (B|C c ), entonces P (A)
Humberto Barrios - hbarrios@unicesar.edu.co
50
Captulo 2. PROBABILIDAD
P (B).
56.
57.
58.
59.
60.
61.
62.
63.
Introducci
on
Variables Aleatorias Discretas
Valor Esperado y Varianza
Distribuci
on Binomial
Distribuci
on Poisson
Distribuci
on Geom
etrica
Distribuci
on Binomial Negativa
Distribuci
on Hipergeom
etrica
Ejercicios
3.1
Introducci
on
En el captulo anterior se estudio los conceptos basicos de probabilidad con respecto
a los resultados posibles de un experimento aleatorio. Se considero al espacio muestral
, como el conjunto de todos los resultados posibles de un experimento aleatorio. Estos resultados pueden ser cualitativos o cuantitativos. Por ejemplo, en un proceso de
fabricaci
on se puede estar interesado en el hecho si el producto es defectuoso o no defectuoso o una persona puede estar interesada en el consumo de agua diarias de una
familia en Valledupar. Con frecuencia puede ser u
til la cuantificacion de los resultados
de un espacio muestral y, mediante la asignacion de un n
umero real a cada elemento de
, estudiar su comportamiento aleatorio. El concepto de variable aleatoria facilita un
medio para relacionar un resultado de un espacio muestral con un n
umero real. Es decir,
utilizaremos el concepto de variable aleatoria para referirnos a experimentos donde cada
resultado posible queda caracterizado por un valor numerico.
52
3.2
(2,
1)
(2,
2)
(2,
3)
(2,
4)
(2,
5)
(2,
6)
(5,
1)
(5,
2)
(5,
3)
(5,
4)
(5,
5)
(5,
6)
y definamos la variable aleatoria X =suma de las dos caras, entonces los posibles
valores de est
a variable aleatoria son: X = 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12.
Es decir, una funci
on X que asigna a cada uno de los elementos w , un n
umero real
X(w), se llama una variable aleatoria.
Definici
on 3.2.2 Sea X una variable aleatoria definida sobre el espacio muestral .
Si el n
umero de valores posibles de X es a lo mas numerable, diremos que X es
una variable aleatoria discreta. Es decir, si se pueden anotar los valores posibles de
X como x1 , x2 , . . . , xn , . . .. En el caso finito, la lista termina y en el caso infinito
numerable, la lista contin
ua indefinidamente.
Las variables aleatorias definidas en los ejemplos anteriores, son claramente variables
aleatorias discretas.
Definici
on 3.2.3 Sea X una variable aleatoria discreta definida sobre el espacio de
53
(3.1)
2. la funci
on de distribuci
on acumulada de X (abreviada fda), la cual se notara
por F (x), por
F (x) = PX (X x) = P ({w | X(w) x}
(3.2)
La funci
on de probabilidad de densidad PX (x) como la funcion de distribucion acumulada F (x) para una variable aleatoria discreta X se pueden representa por una formula,
una tabla o una gr
afica.
Soluci
on En la tabla siguiente se muestra, en la primera columna todos los resultados
posibles, es decir, el espacio muestral del experimento: lanzamiento de tres moneda
una sola vez, en la segunda columna los valores que toma la variable aleatoria X n
umero
de sellos en el lanzamiento de tres moneda una sola vez y en las columnas tres y cuatro
la funcion de probabilidad de densidad PX (x) y la funcion de distribucion acumulada
F (x) para la variable aleatoria X respectivamente.
ccc
css, scs, ssc
ccs, csc, scc
ccc
x
0
1
2
3
PX (x)
F (x)
1
8
3
8
3
8
1
8
1
8
4
8
7
8
54
1
8
1
2
3
Gr
afica de PX
0, si x < 0
8 , si 0 x < 1
F (x) = 14 , si 1 x < 2
4 , si 2 x < 3
1, si x 3
Por consiguiente, F (x) se puede representar como se muestra en la siguiente grafica
F (x)
1
7
8
4
8
1
8
1
2
3
Gr
afica de F (x)
En la gr
afica se puede establecer que la probabilidad F (2.5) = 48 , haciendo la interpolacion como se puede ver en la gr
afica.
55
variable aleatoria X suma de las dos caras en el lanzamiento de un dado corriente dos
veces y en las columnas tres y cuatro la funcion de probabilidad de densidad PX (x) y la
funcion de distribuci
on acumulada F (x) para la variable aleatoria X respectivamente.
(1,1)
(1,2)
(1,3)
(1,4)
(1,5)
(1,6)
(2,6)
(3,6)
(4,6)
(5,6)
(6,6)
(2,1)
(2,2)
(2,3)
(2,4)
(2,5)
(2,6)
(3,6)
(4,6)
(5,6)
(3,1)
(3,2)
(3,3)
(3,4)
(4,4)
(4,5)
(6,4)
(4,1)
(4,2)
(4,3)
(5,3)
(6,3)
(5,1)
(5,2)
(6,2)
(6,1)
x
2
3
4
5
6
7
8
9
10
11
12
PX (x)
F (x)
1
36
2
36
3
36
4
36
5
36
6
36
5
36
4
36
3
36
2
36
1
36
1
36
3
36
6
36
10
36
15
36
21
36
27
36
30
36
33
36
35
36
Por lo tanto la probabilidad de observar que la suma de las dos caras se exactamente
6
5
7 es PX (7) = 36
, PX (8) = 36
es la probabilidad de obtener exactamente 8 en la suma
6
de las dos cara en el lanzamiento de un dado corriente y F (4) = PX (X 4) = 36
es la
probabilidad de obtener a los m
as 4 como suma de las dos cara.
PX (x)
Gr
afica de PX
6
36
5
36
4
36
3
36
2
36
1
36
10
11
12
Como en el caso anterior del ejemplo 3.1 la grafica de la distribucion acumulada nos
permite responder preguntas referentes a la probabilidades de aquellos valores que no
toma la variable aleatoria X, pero que si estan en el dominio de la funcion de distribucion
acumulada F , puesto que F est
a definida en todo el conjunto de los n
umeros reales.
Humberto Barrios - hbarrios@unicesar.edu.co
56
Gr
afica de F (x)
1
30
36
24
36
18
36
12
36
6
36
10
11
12
x
3.3
xi PX (xi )
i=1
= V (X) =
(xi )2 PX (xi )
i=1
i=1
llegan una bomba de gasolina en Valledupar en un intervalo de tiempo de una hora (por
Humberto Barrios - hbarrios@unicesar.edu.co
3.4 Distribuci
on Binomial
57
ejemplo, entre las 5:00 PM y 6:00 PM). En la siguiente tabla se muestra la funcion de
probabilidad de la variable aleatoria X
X=x
PX (x)
0
0.05
1
0.10
2
0.10
3
0.10
4
0.20
5
0.25
6
0.10
7
0.05
8
0.05
0
0.05
0
0.90
1
0.10
0.10
1.06
2
0.10
0.20
0.51
3
0.10
0.30
0.16
4
0.20
0.80
0.01
5
0.25
1.50
0.14
6
0.10
0.60
0.31
7
0.05
0.35
0.38
8
0.05
0.40
0.70
xi PX (xi ) =
i=1
9
X
xi PX (xi ) = 4.25
i=0
.
la varianza de X
2 = V (X) =
9
X
(xi )2 PX (xi ) = 4.17
i=1
aleatoria Y = aX + c. Entonces
E(Y ) = aE(X) + c
V (Y ) = a2 V (X)
Demostraci
on. La demostraci
on se deja como un ejercicio.
3.4
Distribuci
on Binomial
Definici
on 3.4.1 Sea X una variable aleatoria que representa el n
umero de exitos en
0,
en otro caso
Humberto Barrios - hbarrios@unicesar.edu.co
58
Si una variable aleatoria X que tiene una distribucion binomial con parametros n y p,
notaremos X B[n, p].
La probabilidad que una variable aleatoria X sea menor o igual a un valor determinado
x0 , se especifica por la funci
on de distribucion acumulada,
X n
px q nx
F (x0 ) = PX (X x0 ) =
x
xx0
y la funci
on de distribuci
on acumulada
F (x0 ) = PX (X x0 ) =
10
X
10
x=0
0.2x 0.810x
PX (X = x)
0.1074
0.2684
0.3020
0.2013
0.0881
0.0264
0.0055
0.0008
0.0001
0.0000
F (x0 )
0.1074
0.3758
0.6778
0.8791
0.9672
0.9936
0.9998
0.9999
1
1
3.4 Distribuci
on Binomial
59
3. La probabilidad de que 4 o m
as artculos son defectuosos entre los 10 seleccionados
es:
PX (X 4) = 1 F (3)
= 1 0.8791 = 0.1209.
PX (X 3) = 1 PX (X 2)
= 1 0.6778 = 0.3222.
Teorema 3.4.1 Sea una variable aleatoria X que tiene una distribuci
on binomial con
parametros n y p. Entonces
n
X
n
x=0
px q nx = 1
(3.3)
E(X) = np
(3.4)
V (X) = npq
(3.5)
t
MX (t) = (pe + q)
Demostraci
on.
(3.6)
PX (x) = 1
x=0
Por definici
on y el teorema del Binomio de Netown, entonces
X
x=0
PX (x) =
n
X
n
x=0
px q nx
= (p + q)n = 1
2. Por la definici
on de valor esperado para una variable aleatoria discreta,
Humberto Barrios - hbarrios@unicesar.edu.co
60
E(X) =
=
=
=
X
x=0
n
X
x=0
n
X
x=0
n
X
x=1
n1
X
y=0
n1
X
y=0
= np
xPX (x)
n x nx
x
p q
x
xn!
px q nx
(n x)!x!
xn!
px q nx
(n x)!(x 1)!
n(n 1)!
py+1 q n(y+1)
(n (y + 1))!y!
n(n 1)!
py+1 q (n1)y
(n 1) y)!y!
n1
X
y=0
(n 1)!
py q (n1)y
(n 1) y)!y!
= np(p + q)n1 = np
3. Para calcular la varianza de la variable aleatoria X, hallemos el segundo momento,
es decir:
E(X 2 ) =
x2 PX (x)
x=0
n
X
x=0
n
X
x=0
n
X
x=1
n1
X
y=0
= np
n x nx
x
p q
x
2
x2 n!
px q nx
(n x)!x!
xn!
px q nx
(n x)!(x 1)!
n(n 1)(y + 1)! y+1 n(y+1)
p q
(n (y + 1))!y!
n1
X
y=0
= np
(n 1)!(y + 1) y (n1)y
p q
(n 1) y)!y!
n1
X
y=0
n1
X
y=0
y(n 1)!
py q (n1)y
(n 1) y)!y!
(n 1)!
py q (n1)y
(n 1) y)!y!
3.5 Distribuci
on Poisson
61
Por lo tanto
E(X 2 ) = np[np + q] = n2 p2 + npq
Puesto que V (X) = E(X 2 ) [E(X)]2 ), se tiene que
V (X) = E(X 2 ) [E(X)]2 ) = n2 p2 + npq n2 p2 = npq
4. En el capitulo anterior se encontro la funcion generatriz de una variable aleatoria
binomial.
En el ejemplo anterior, el n
umero de artculos defectuosos que esperamos esten en el
lote de 10 es: E(X) = np = 10(0.20) = 2.
3.5
Distribuci
on Poisson
Definici
on 3.5.1 Sea X una variable aleatoria que representa el n
umero de eventos
x0
X
x e
x=0
x!
Ejemplo 3.7 El n
umero de componentes que fallan antes de cumplir 100 horas de
operacion es un variable aleatoria de Poisson. Si el n
umero promedio de esta es ocho:
1. Hallar la funci
on de probabilidad y distribucion acumulada para los primeros 6
valores de la variable aleatoria X que falle un componentes en 25 horas.
2. Cu
al es la probabilidad de que falle un componentes en 25 horas?
3. Cu
al es la probabilidad de que fallen no mas de dos componentes en 50 horas?
4. Cu
al es la probabilidad de que fallen por lo menos diez componentes en 125 horas?
Soluci
on Sea X la variable aleatoria que representa el n
umero componentes que fallan
antes de cumplir 100 horas en la muestra seleccionada. Si el n
umero promedio en la 100
horas es = 8. Entonces
1. Para 25 horas esperamos = 2, entonces la funcion de probabilidad de X esta dada
por:
PX (X = x) =
2x e2
; donde x = 0, 1, 2,
x!
62
PX (X = x)
0.1353
0.2707
0.2707
0.1804
0.0902
0.0361
F (x)
0.1353
0.4060
0.6767
0.8571
0.9473
0.9834
X=x
0
1
2
3
4
5
6
7
8
9
PX (X = x)
0
0.0005
0.0023
0.0076
0.0189
0.0378
0.0631
0.0901
0.1126
0.1251
F (x)
0.0000
0.0005
0.0028
0.0103
0.0293
0.0671
0.1301
0.2202
0.3328
0.4579
3.5 Distribuci
on Poisson
63
Teorema 3.5.1 Sea una variable aleatoria X que tiene una distribuci
on Poisson con
parametro . Entonces
X
x e
x=0
=1
x!
E(X) =
(3.8)
V (X) =
MX (t) = e
(3.7)
(3.9)
(et 1)
(3.10)
Demostraci
on. Para demostrar el teorema es suficiente considerar el desarrollo en serie
de Taylor de e , es decir,
e =
X
x
x=0
x!
parametros n y p. Entonces
n x nx x e
PX (X = x) = lm
p q
=
n x
x!
Donde = np.
Demostraci
on. Comencemos escribiendo la funcion de densidad de la probabilidad binomial en terminos de :
x
n x nx
n
nx
lm
p q
= lm
1
n x
n x
n
n
n!
1
x
n
x
= lm
1
1
n (n x)!x!
nx
n
n
(3.11)
(3.12)
64
lm
n!
1
1 1/n
(1 2/n)
= lm
lm
lm
(n x)(n )x n (1 /n) n (1 /n) n (1 /n)
(1 (x 1)/n)
lm
=1
n
(1 /n)
(3.13)
100
x
(0.01)x (0.99)100x
0.366032
0.369730
0.184865
0.060999
0.014941
0.002897
0.000463
0.000062
0.000007
0.000000
0.000000
1x e1
x!
0.367879
0.367879
0.183940
0.061313
0.015328
0.003065
0.000510
0.000072
0.000009
0.000001
0.000000
Un buena aproximaci
on de la distribucion binomial a la de Poisson se obtiene cuando
p < 0.1 y n .
3.6
Distribuci
on Geom
etrica
Definici
on 3.6.1 Sea X una variable aleatoria que representa el n
umero de pruebas
necesarias hasta obtener el primer exito, donde cada prueba es independiente y la
probabilidad de un exito es p y de un fracaso es 1 p, cada vez que el experimento
se lleva acabo. Se dice entonces que X tiene distribucion Geometrica con funcion de
probabilidad dada por:
(
pq x1 , donde x = 1, 2, 3, y q = 1 p
PX (X = x) =
0,
en otro caso
Si una variable aleatoria X que tiene una distribucion geometrica con parametro p,
notaremos X G[p].
La probabilidad que una variable aleatoria X sea menor o igual a un valor determinado
x0 , se especifica por la funci
on de distribucion acumulada,
Humberto Barrios - hbarrios@unicesar.edu.co
3.6 Distribuci
on Geometrica
65
F (x0 ) = PX (X x0 ) =
x0
X
pq x1
x=1
Teorema 3.6.1 Sea una variable aleatoria X que tiene una distribuci
on Poisson con
parametro p. Entonces
pq x1 = 1
(3.14)
x=1
1
p
1p
V (X) =
p2
E(X) =
MX (t) =
(3.15)
(3.16)
pet
1 (1 p)et
(3.17)
Demostraci
on. Las pruebas de (a), (b) y (d) las dejaremos como ejercicios.
Demostremos (c) teniendo en cuenta la siguiente igualdad:
E(X 2 ) = E(X(X 1)) + E(X)
Por definici
on,
E(X(X 1)) =
x=1
As que
E(X(X 1)) =
x(x 1)pq x1 = pq
x=1
x(x 1)pq x2
x=2
si y = x 1, entonces
X
E(X(X 1)) =pq
(y + 1)yq y
=pq
y=1
(y + 1)yq
d2 X y+1
q
= pq 2
dq
y=1
y1
y=1
X
d2
2
=pq 2 q
q y1
dq
y=1
pero la serie
Humberto Barrios - hbarrios@unicesar.edu.co
66
X
y=0
qy =
1
1q
d2
dq 2
q2
1q
2q
p2
2q 1
2q + p
+ =
2
p
p
p2
1
1p
2q + p
2 =
p2
p
p2
donde x = 1, 2, 3, y q = 1 p
PX (X = x)
0.1000
0.0900
0.0810
0.0729
0.0656
0.0590
0.0531
0.0478
0.0430
0.0387
F (x)
0.1000
0.1900
0.2710
0.3439
0.4095
0.4686
0.5217
0.5695
0.6126
0.6513
3.7 Distribuci
on Binomial Negativa
67
Por lo tanto
1. La probabilidad que el primer motor no defectuoso se encuentre en el segundo
intento,
PX (X = 2) = (0.1)(0.9)21 = 0.0810
2. La probabilidad que el primer motor no defectuoso se encuentre en el quinto
intento,
PX (X = 5) = (0.1)(0.9)51 = 0.0590
3. La probabilidad que el primer motor no defectuoso se encuentre en o antes del
quinto intento,
F (5) = PX (X 5) =
5
X
(0.1)(0.9)x1 = 0.4686
x=1
1
1
=
= 10
p
0.1
y
V (X) =
0.9
1p
=
= 90
2
p
(0.1)2
respectivamente.
3.7
Distribuci
on Binomial Negativa
Definici
on 3.7.1 Sea X una variable aleatoria Binomial con probabilidad de
exito p
y donde X, es el n
umero de pruebas necesarias hasta obtener exactamente r exitos.
En este caso, se dice que la variable aleatoria X tiene distribucion Binomial Negativa
con funci
on de probabilidad dada por:
x 1 pr q x r,
r1
PX (X = x) =
0,
x = r, r + 1, r + 2,
donde r = 1, 2, 3,
0p1 y q =1p
en otro caso
Si una variable aleatoria X que tiene una distribucion binomial negativa con parametros
r y p, en donde r no se requiere que sea un entero positivo, notaremos X BN [r, p].
La probabilidad que una variable aleatoria X sea menor o igual a un valor determinado x0 , se especifica por la funcion de distribucion acumulada,
X x 1
F (x0 ) = PX (X x0 ) =
pr q x
r1
xx0
68
Teorema 3.7.1 Sea una variable aleatoria X que tiene una distribuci
on binomial ne-
pr q x = 1
r1
x=0
r
E(X) =
p
r(1 p)
V (X) =
p2
h pet ir
MX (t) =
1 qet
(3.18)
(3.19)
(3.20)
(3.21)
Teorema 3.7.2 Sea X una variable aleatoria que tiene una distribuci
on Binomial Ne-
1. Encontrar la funci
on de probabilidad de la variable aleatoria, n
umero de aspirantes
hasta obtener tres que tengan conocimiento avanzado en programacion.
2. Se entrevistan uno a uno los solicitantes, calcular la probabilidad de encontrar un
aspirante en la quinta entrevista.
Soluci
on Sup
ongase que las entrevistas son independientes, y que la probabilidad de
encontrar un candidato con conocimiento avanzado de programacion es 0.3, la cual
permanece constante de prueba en prueba. Sea X, n
umero de aspirantes hasta obtener
tres que tengan conocimiento avanzado en programacion. Entonces se puede inferir
que X, n
umero de aspirantes hasta obtener tres que tengan conocimiento avanzado en
programaci
on.
1. Entonces se puede concluir que X tiene una distribucion binomial negativa, as que
la funci
on de probabilidad es:
PX (X = x) =
x1
(0.3)3 (0.7)x1 ,
2
r = 3, 4, 5, , 12
En la siguiente tabla se muestra la funcion de probabilidad y funcion de distribucion acumulada para los primeros 10 valores de la variable aleatoria X
Humberto Barrios - hbarrios@unicesar.edu.co
3.8 Distribuci
on Hipergeometrica
69
X=x
3
4
5
6
7
8
9
10
11
12
PX (X = x)
0.027
0.057
0.079
0.093
0.097
0.095
0.089
0.080
0.070
0.060
F (x)
0.027
0.084
0.163
0.256
0.353
0.448
0.537
0.617
0.687
0.747
3.8
Distribuci
on Hipergeom
etrica
Definici
on 3.8.1 Sea N el n
umero total de objetos en una poblacion finita, de manera
tal que R de estos son de tipo A y N R - de tipo B. Si se selecciona una muestra
aleatoria simple sin reemplazo n objetos de la poblacion. La probabilidad que exactamente X sean de tipo A, est
a dado por la funcion de probabilidad hipergeometrica.
R N R
( x )( nx ) , si x = 0, 1, 2, , n.
(Nn )
PX (X = x) =
0,
en otro caso
y donde x R yn x N R.
Los parametros de la distribuci
on hipergeometrica son N , n y R.
La probabilidad que una variable aleatoria Hipergeometrica X sea menor o igual a un
valor determinado x0 ,se especifica por la funcion de distribucion acumulada,
x0 R N R
X
x
nx
F (x0 ) = PX (X x0 ) =
N
x=0
Teorema 3.8.1 Sea una variable aleatoria X que tiene una distribuci
on Hipergeometri-
ca con par
ametros N , n y R. Entonces
70
n
X
R
x
x=0
N R
nx
N
n
=1
(3.22)
R
N
R N n
R
)
V (X) = n (1 )(
N
N N 1
MX (t) = (pet + q)n
E(X) = n
(3.23)
(3.24)
(3.25)
PX (X = x) =
10x
N
n
si x = 0, 1, 2, , 10.
PX (X = x)
0.0029
0.0279
0.1083
0.2259
0.2801
0.2151
0.1034
0.0306
0.0053
0.0005
0.0000
F (x)
0.0029
0.0308
0.1390
0.3650
0.6450
0.8601
0.9635
0.9942
0.9995
1.0000
1.0000
3.8 Distribuci
on Hipergeometrica
71
La distribuci
on de binomial tambien es una forma limite de la distribucion hipergeometrica. Este resultado se demuestra en el siguiente teorema.
Teorema 3.8.2 Sea X una variable aleatoria que tiene una distribuci
on hipergeometri-
ca con par
ametros N , n y R . Entonces
R N R
lm
nx
N
n
n x nx
=
p q
x
Donde p = R/N.
Demostraci
on. La prueba se deja como un ejercicio
La funci
on de distribuci
on Binomial aproxima de manera adecuada a la funcion de
probabilidad Hipergeometrica si n < 0.1N.
En la siguiente tabla se comparan los valores de probabilidad de una Binomial como
limite de una funci
on de probabilidad Hipergeometrica, con N = 1000, n = 10 y R = 50.
X=x
0
1
2
3
4
5
6
7
8
9
10
Hipergeometrica
0.0009
0.0095
0.0434
0.1168
0.2057
0.2473
0.2057
0.1168
0.0434
0.0095
0.0009
Binomial
0.0010
0.0098
0.0439
0.1172
0.2051
0.2461
0.2051
0.1172
0.0439
0.0098
0.0010
72
3.9
Ejercicios
1. Demuestre
las siguientes
igualdades:
n+r1
n+r1
a)
=
n
r1
n+r1
r
b)
= (1)n
n
n
2. En la Universidad Popular del Cesar
se ha observado que el 60 % de los estudiantes que se matriculan lo hacen
en una carrera de Ciencias, mientras
que el otro 40 % lo hacen en carreras
de Humanidades. Si un determinado
da se realizan 20 matrculas, calcular
la probabilidad de que:
a) el n
umero de matrculas en
Ciencias y en Humanidades es
igual
b) el n
umero de matrculas en
Ciencias sea menor que en Humanidades
c) al menos 8 estudiantes matrculas en Ciencias
d ) no se matriculen m
as de 12 estudiantes en Ciencias
e) Si las cinco primeras matrculas
son de Humanidades, calcular la
probabilidad de que el n
umero
total de matrculas en Ciencias
y en Humanidades es igual.
3. Un examen consta de 10 preguntas
a las que hay que responder s o no.
Suponiendo que a los estudiantes que
se le aplica no saben responder a ninguna de las preguntas y, en consecuencia, responden de manera aleatoria.
a) Hallar la funci
on de probabilidad y la funci
on de distribucion
acumulada.
b) Cu
al es la probabilidad de pasar el examen si cada punto vale
0.5?
c) Cu
al es la probabilidad de obtener una calificaci
on mayor o
igual a 4?
d ) Cu
al es la probabilidad de obtener una calificaci
on mayor o
igual a 3.5 e inferior a 4.8?
3.9 Ejercicios
73
cohetes est
a construido con n unidades de radar que funcionan independientemente, cada una con probabilidad de 0.9 de detectar un cohete que
ingrese en la zona que cubren todas
las unidades.
a) Si n = 5 y un cohete entra en
la zona. Cu
al es la probabilidad de que exactamente cuatro
unidades detecten el cohete?
b) Si n = 5 y un cohete entra en la
zona. Cu
al es la probabilidad
de que al menos una unidades
detecten el cohete?
c) Cu
al debe ser el valor de n para
que la probabilidad de detectar
el cohete al entrar a la zona, sea
de 0.999?
8. Un fabricante de cera para pisos
desarrolla dos productos nuevos, A y
B, que desea someter a la evolucion
de amas de casa para determinar cual
es la mejor. Las dos ceras, A y B, se
aplica en los pisos de 15 casas. Se supone que en realidad no hay diferencia en calidad entre las dos marcas.
a) Cu
al es la probabilidad de que
10 o m
as amas de casa vayan a
preferir la marca A?
b) Cu
al es la probabilidad de que
10 o m
as amas de casa vayan a
preferir la marca A o B?
9. En un almacen en particular los
clientes llegan al mostrador de caja,
conforme una distribuci
on de Poisson
con un promedio de siete por hora.
En una hora dada.
a) Cu
al es la probabilidad de que
no lleguen m
as de tres clientes?
b) Cu
al es la probabilidad de que
lleguen al menos dos clientes?
c) Cu
al es la probabilidad de que
lleguen exactamente cinco clientes?
10. El n
umero de componentes que fallan
antes de cumplir 100 horas de opera-
74
marca B). Si se seleccionan sin reemplazo un grupo de 3 TV. Hallar la
probabilidad de:
a) Seleccionar 2 TV de la marca B.
b) Seleccionar 2 TV de la marca A
o 2 TV a color.
14. La probabilidad de un lanzamiento
exitoso es igual a 0.8. Supongamos
que se hacen ensayos de lanzamientos
hasta que han ocurrido 3 lanzamientos exitosos.
a) Cu
al es la probabilidad de que
sean necesarios 6 ensayos?
b) Suponga que se hacen los ensayos de lanzamientos hasta que
ocurren 3 lanzamientos exitosos
consecutivos. Responda la pregunta (a) en este caso.
c) Suponga que cada uno de los
ensayos de lanzamiento cuesta
$5000. Adem
as, un lanzamientos que fracase produce un costo adicional de $500. Calcule el
costo esperado para obtener los
3 lanzamientos exitosos.
15. Para un experimento medico se requieren cinco mujeres que hayan tenido seis o m
as partos. La proporcion de mujeres adultas con esa caracterstica es 0.25. Suponga que se
toma una muestra de mujeres adultas
y sea N el n
umero de mujeres adultas que es necesario entrevistar para
encontrar las cinco buscadas.
a) cu
al es el modelo apropiado para la distribuci
on de N ?
b) cu
al es la probabilidad de que
en diez o menos intentos se encuentren las cinco mujeres?
16. El 20 % de los peces de un lago son
de la especie A y el resto de otras especies. Un investigador decide realizar el siguiente experimento: Extraer
peces del lago hasta obtener 3 de la
especie A (asuma que el metodo de
captura utilizado por el investigador
3.9 Ejercicios
75
prete
b) el valor esperado y la desviacion
estandar e interprete.
21. Los procedimientos de muestreo para
aceptar lotes en una empresa manufaturera electronica requiere el muestreo de n artculos de un lote de N
artculos, y aceptar el lote si X c,
donde X es el n
umero de artculos defectuosos en la muestra. Para un lote
de 20 cubiertas de impresoras, se debe mostrar 5. Calcular de aceptar el
lote si c = 1, y si el n
umero real de
cubiertas defectuosas en el lote es:
a) X = 0, 1, 2, 3, 4
b) Responder la anterior pregunta
se c = 2.
22. De cada 2.000 tornillos fabricados
por una determinada maquina hay 2
defectuosos. Para realizar el control
de calidad se observan 150 tornillos
y se rechaza el lote si el n
umero de
defectuosos es mayor que 1. Calcular
la probabilidad de que el lote sea rechazado.
23. En pruebas realizadas a un amortiguador para automovil se encontro que el 20 % presentaban fuga
de aceite. Si se instalan 20 de estos
amortiguadores, hallar la probabilidad de que:
a) 4 salgan defectuosos,
b) mas de 5 tengan fuga de aceite.
c) de 3 a 6 amortiguadores salgan
defectuosos.
d ) Determine el y la desviacion
estandar de amortiguadores con
defectos.