Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
ESTADISTICA Y PROBABILIDAD
Julia Munoz
1. Estadstica Descriptiva 1
1.1. Representacon de datos agrupados y no agrupados . . . . . . . . . . . . . . . . 1
1.1.1. Agrupamiento de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.2. Graficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.1.3. Diagrama de tallo y hoja . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2. Medidas de tendencia central . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2.1. Datos no agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.2. Datos agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.3. Medidas de dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.1. Datos no agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.2. Varianza y desviacion estandar . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.3. Datos agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2. Probabilidad 15
2.1. Espacio muestral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.2. Elementos de calculo combinatorio . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.2.1. Principio de multiplicacion . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.2.2. Permutaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2.3. Combinaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.3. Eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3.1. Operaciones con eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.4. Funcion de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.5. Probabilidad Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.6. Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3. Variables Aleatorias 35
3.1. Definicion y propiedades de las variables aleatorias discretas . . . . . . . . . . . 35
3.2. Distribucion de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.3. Esperanza, varianza y desviacion estandar . . . . . . . . . . . . . . . . . . . . . 40
3.4. Distribuciones discretas especiales . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.4.1. Distribucion Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.4.2. Distribucion Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.4.3. Distribucion Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.4.4. Distribucion Geometrica . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.4.5. Distribucion Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
iii
INDICE GENERAL
5. Estimaciones 71
5.1. Teorema del Lmite Central . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5.2. Intervalos de Confianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.2.1. Intervalos de confianza para con conocida . . . . . . . . . . . . . . . 75
5.2.2. Intervalo de confianza para con desconocida . . . . . . . . . . . . . . 77
5.3. Intervalos de confianza para 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
6. Pruebas de hipotesis 81
6.1. Pruebas de hipotesis para . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
6.1.1. Prueba de hipotesis para de dos colas . . . . . . . . . . . . . . . . . . . 82
6.1.2. Prueba de hipotesis para cola derecha . . . . . . . . . . . . . . . . . . 83
6.1.3. Prueba de hipotesis para de cola izquierda . . . . . . . . . . . . . . . . 83
6.2. Pruebas de hipotesis para y 2 . . . . . . . . . . . . . . . . . . . . . . . . . . 86
Indice de Materias 88
iv
1
Estadstica Descriptiva
Ejemplo 1.1.1
1
1.1. REPRESENTACION DE DATOS AGRUPADOS Y NO AGRUPADOS
Ejemplo 1.1.2
Los datos que siguen corresponden a las observaciones hechas a las 10:00 de la manana del numero
de pasajeros en el RTP durante 50 das.
48 51 57 63 59
52 54 37 47 49
30 40 50 46 56
50 64 39 55 74
45 52 65 59 51
63 64 54 62 77
57 53 58 73 75
58 61 59 70 63
60 64 71 81 66
73 72 82 60 49
30 37 39 40 45
46 47 48 49 49
50 50 51 51 52
52 53 54 54 55
56 57 57 58 58
59 59 59 60 60
61 62 63 63 63
64 64 64 65 66
70 71 72 73 73
74 75 77 81 82
Cuando hacemos este ordenamiento obtenemos como mnimo 30 pasajeros y el maximo fue 82.
Ademas por ejemplo el 49 aparece 2 veces, al 2 le llamamos frecuencia f o frecuencia absoluta, esto
es numero de veces que aparece repetido el elemento. Obtenemos la siguiente lista de frecuencias:
2
1.1. REPRESENTACION DE DATOS AGRUPADOS Y NO AGRUPADOS
xi f xi f xi f xi f xi f xi f xi f
30 1 37 1 39 1 40 1 45 1 46 1 47 1
48 1 49 2 50 2 51 2 52 2 53 1 54 2
55 1 56 1 57 2 58 2 59 3 60 2 61 1
62 1 63 3 64 3 65 1 66 1 70 1 71 1
72 1 73 2 74 1 75 1 77 1 81 1 82 1
Definicion 1.2. La frecuencia acumulada es la suma de frecuencia del elemento y las frecuen-
cias de los elementos anteriores.
2
Por ejemplo la frecuencia relativa del 49 es pues aparece 2 veces y son 50 datos, el porcentaje
50
correspondiente es 4 %.
Y la frecuencia acumulada es 10 si sumamos todas las frecuencias anteriores incluida la del 49
y traduciendolo a porcentaje es 20 %
Como podemos observar tenemos muchos datos, lo cual no es agradable a la vista. Los datos
que mas se repiten son el 59, 63 y el 64, muchos datos solo aparecen una vez, lo cual nos aporta
poca informacion. Para obtener mas informacion hacemos agrupamiento de datos en clases.
El numero de clases es arbitrario. En general se forman entre 5 y 20 clases aunque algunos
autores proponen maximo 12 clases.
Una regla simple para determinar el numero de clases c de n observaciones puede ser:
2c n
Definicion 1.3. El intervalo de clase es el rango de valores encontrado dentro de una clase.
Por ejemplo cuando se hace una encuesta a mujeres jovenes, la edad se divide en clases:
21 a 25, 26 a 30, 31 a 35 etcetera.
Cada clase tiene 5 valores esto es 21,22,23,24,25 lo mismo que las otras y por lo tanto el IC = 5.
Una forma de aproximar un valor conveniente para el IC es:
Aplicamos las formulas anteriores al ejemplo 1.1.2 del RTP. Despejamos de la desigualdad y
obtenemos
3
1.1. REPRESENTACION DE DATOS AGRUPADOS Y NO AGRUPADOS
ln50
ln2c ln50, cln2 ln50 c 5.64
ln2
entonces c = 6. Redondeando obtenemos 6 clases.
82 30 52
Aproximamos IC = = 8.7. Redondeando 9 el cual no es tan comodo, en su lugar
6 6
nos conviene utilizar un IC = 10 para trabajar con decenas esto es digamos la clase de 20 a 29
que tiene 10 valores posibles. El valor mas pequenoo se llama lmite inferior de la clase en
este caso 20 y el 29 es el lmite superior de la clase.
Otra caracterstica de la clase ademas del IC es el punto medio. El punto medio de la clase
y se calcula como la suma de los lmites superior e inferior entre 2.
Regresamos al ejemplo y obtenemos las siguientes 6 clases junto con su frecuencia y punto
medio.
Ejercicio 1.1.1. 1. Un conjunto de datos contiene 100 observaciones la mas grande es 315
y la mas pequena es 56.
2. Los siguientes datos son los ingresos semestrales de 60 ingenieros. Los datos estan expre-
sados en miles de pesos.
4
1.1. REPRESENTACION DE DATOS AGRUPADOS Y NO AGRUPADOS
58 76 89 45 67 34
64 76 34 65 45 39
79 74 56 71 85 87
74 38 69 79 61 71
69 62 56 38 69 79
71 54 31 69 62 39
65 79 47 46 77 66
55 75 62 57 77 36
73 72 64 69 51 50
40 50 74 61 69 73
1.1.2. Graficos
Los graficos tambien son metodos utiles para describir conjuntos de datos.
Un histograma coloca las clases o elementos de una distribucion de frecuencias en el eje
horizontal. Lo que haces es simplemente escribir rectangulos en su base la clase y la altura es
la frecuencia correspondiente.
Podemos decir que este grafico corresponde a la frecuencia absoluta. El grafico correspondiente a
la frecuencia relativa es el conocido como diagrama circular o diagrama pastel. Esto es cada
pedazo representa el porcentaje correspondiente a la frecuencia relativa. Lo mas conveniente es
que sean pocas clases para obtener para poder leer facilmente la informacion.
5
1.2. MEDIDAS DE TENDENCIA CENTRAL
Tallo Hoja
3 079
4 0567899
5 001122344567788999
6 001233344456
7 01233457
8 12
Ejercicio 1.1.2. Haz el histograma, diagrama circular y diagrama de tallo y hoja del problema
2 del ejercicio 1.1.1 .
6
1.2. MEDIDAS DE TENDENCIA CENTRAL
Definicion 1.4. La media, o media aritmetica, es la medida de tendencia central que usual-
mente se le llama promedio. Se calcula haciendo la suma de todas las observaciones y dividir
esta suma entre el numero de operaciones.
N
X
Xi
X1 + X2 + X3 + + XN i=1
= =
N N
Es posible que no tengamos todas las observaciones, esto es, tenemos la llamada muestra.
Para determinar si se trata de una poblacion o de una muestra se debe leer cuidadosamente el
problema.
Definicion 1.7. La mediana conocida como media posicional porque queda exactamente en
la mitad del conjunto de datos despues de ordenarlos.
La mitad de las observaciones estara por encima de la mediana, la otra mitad estara por debajo
de ella. Si el conjunto de datos tiene un numero impar de observaciones, la posicion de la
mediana se calcula con la formula:
n+1
posicion = .
2
En el caso de que el numero de observaciones sea par se toma el promedio de los valores que se
n+1
encuentran en las posiciones justo en medio esto es el entero mayor y menor a .
2
7
1.2. MEDIDAS DE TENDENCIA CENTRAL
Definicion 1.8. La moda es la observacion o dato que ocurre con mayor frecuencia.
En caso de que sean 2 datos los que mas se repiten se dice que el conjunto de datos es bimodal,
si son 3 trimodal etcetera.
La media es la medida de tendencia central mas usada, pues se presta para mayor manipulacion
e interpretacion algebraica. Desafortunadamente, la media se ve afectada por valores extremos,
o valores atpicos, y a diferencia de las otras dos, la media puede ser sesgada por estos valores.
Esto no significa que sean mejores que la media, simplemente cada medida de tendencia central
da distinta informacion.
Ejemplo 1.2.1
Tu empresa esta introduciendo un nuevo chip de computadora que hace calculos estadsticos rapi-
damente. Se hacen 20 calculos diferentes que se muestran a continuacion. Determina la media, la
mediana y la moda. Comenta los beneficios de usar cada estadstico.
SOLUCION: Al leer que se toman 20 calculos diferentes quiere decir que no tomamos todos.
Por lo tanto se trata de una muestra con n = 20. Ordenamos los valores podemos aprovechar y
escribir el diagrama de tallo y hoja obteniendo.
tallo hoja
0 6
1 5789
2 246
3 2236
4 139
5 24
6 123
Calculamos
70.5
X = = 3.525.
20
20 + 1
Como el numero de datos es par obtenemos la posicion= = 10.5.
2
8
1.2. MEDIDAS DE TENDENCIA CENTRAL
Entonces tomamos los datos en las posiciones 10 y 11. Esto es, 3.2 y 3.3 al hacer el promedio
obtenemos que la mediana es 3.25. Del diagrama de tallo y hojas notamos que el valor que mas se
repite es 3.2.
Podemos observar que en este caso la media, la moda y la mediana no estan tan alejadas. Entonces
el dato mas representativo sera la mediana pues el el valor que se encuentra entre la media y la
moda.
Ejercicio 1.2.1. Como gerente de ventas de Acme, deseas calcular las medidas de tendencia
central de los niveles de utlidad del ultimo ano. Se tienen los siguientes datos mensuales en
miles de dolares. Comenta tus resultados
Ejemplo 1.2.2
clase f M fM
30-39 3 34.5 103.5
40-49 7 44.5 311.5
50-59 18 54.5 981
60-69 12 64.5 774
70-79 8 74.5 596
80-89 2 84.5 169
50 2935
9
1.2. MEDIDAS DE TENDENCIA CENTRAL
Para calcular la mediana con datos agrupados utilizamos las frecuencias para determinar
en que clase se encontara la mediana si no estuvieran agrupados. Como no conocemos las
observaciones generales hacemos una aproximacion utilizando la siguiente formula:
n
F
2
Mediana Lmd + (IC)
fmd
Donde Lmd es el lmite inferior de la clase donde se encontrara la mediana, F es la frecuencia
acumulada de la clase anterior, fmd es la frcuencia de la clase de la mediana, IC es el intervalo
de la clase de la mediana.
Usamos nuevamente el ejemplo del RTP. Buscamos la clase donde se encuentran incluidos los
elementos 25 y 26, esto es la clase 50-59. Notamos que su frecuencia acumulada de la clase
anterior es 10.
En el caso de la moda, lo que hacemos es localizar la clase modal, que es la que tiene el mayor
numero de elementos. Y para estimar la moda para datos agrupados usamos la siguiente
formula:
Da
Moda = Lmo + (IC)
Db + Da
Donde Lmo es el lmite inferior de la calse modal, Da es la diferencia entre la frecuencia de la
clase modal y la clase que la antecede, Db es la diferencia entre la frecuencia de la clase modal
y la clase que le sigue y IC es el intervalo de clase. Usando la tabla del RTP. Estimamos la
moda:
18 7
Moda = 50 + (10) = 56.47
(18 12) + (18 7)
revisando la tabla de datos originales tenemos que tena tres modas: 59, 63 y 64, pero en este
caso solo podemos estimar una y esta ya no es tan buena aproximacion.
Ejercicio 1.2.2. El ausentismo diario en una oficina parece ir en aumento. El ano pasado un
promedio de 47.8 empleados estuvo ausente algunos das. Se recolecto una muestra de datos
para el ano en curso y se ubicaron en la tabla de frecuencias que se muestra a continuacion.
Estima la media, la mediana y la moda para estos datos y compara con el promedio del ano
anterior.
10
1.3. MEDIDAS DE DISPERSION
Numero de empleados ausentes Das en los que ese numero estuvo ausente
20-29 5
30-39 9
40-49 8
50-59 10
60-69 12
70-79 11
80-89 8
90-99 3
N
X
(Xi )2
2 2 2
(X1 ) + (X2 ) + + (XN ) i=1
2 = =
N N
Desviacion estandar poblacional: = 2 .
Ejemplo 1.3.1
Marcos Reyes es gerente de una empresa. Recientemente Marcos estaba interesado en las tasas de
endimiento de los ultimos cinco anos 12,10,13,9 y 11 %.
Calcula, media, varianza y desviacion estandar.
SOLUCION: Se trata de una poblacion pues solo interesan los ultimos cinco anos:
11
1.3. MEDIDAS DE DISPERSION
12 + 10 + 13 + 9 + 11
= = 11 para calcular la varianza
5
(12 11)2 + (10 11)2 + (13 11)2 + (9 11)2 + (11 11)2
2 = =2
5
y finalmente la desviacion estandar = 2 1.4142.
Cuando se trata de una muestra la media muestral se denota con x y la desviacon estandar
muestral se denota con s.
La formula para x es la misma que para como ya vimos, pero la varianza muestral cambia a
XN
(Xi X)2
2 2 2
(X1 X) + (X2 X) + + (XN X)
s2 = = i=1
n1 n1
donde n es el numero de elementos de la muestra. Una formula mas sencilla de calcular estas
sumas de cuadrados es: !
n n 2
X X
2
n xi xi
i=1 i=1
s2 =
n(n 1)
Ejemplo 1.3.2
El senor Reyes desea determinar la estabilidad de la desviacion estandar del precio de cierre diario de
dicha accion. Al revisar las paginas financieras Reyes sabe que la accion ha cotizado en la bolsa duran-
te muchos meses. Reyes ocupa una muestra aleatoria de 7 das dada en dolares: 87,120,54,92,73,80
y 63.
SOLUCION: Claramente se trata de una muestra.
87 + 120 + 54 + 92 + 73 + 80 + 63
X = = 81.29
7
la varianza muestral es:
X 7
(Xi X)2
i=1
s2 = = 465.9 y finalmente la desviacion estandar muestral s = 21.58.
71
Ejercicio 1.3.1. Se utilizan dos procesos para producir discos de computadora. Han surgido
problemas con respecto a las varaciones en los tamanos de dichos discos. Con base en los datos
de muestra aqui observados, de ocho tamanos de disco. Determina cual proceso tienen una
menor desviacion estandar.
Proceso 1 Proceso 2
3.41 3.22 3.81 3.26
3.74 3.06 3.26 3.79
3.89 3.65 3.07 3.14
3.65 3.33 3.35 3.51
12
1.3. MEDIDAS DE DISPERSION
f M 2 nX 2
s2 =
n1
y la desviacion estandar s = s2 .
Usamos nuevamente la tabla del RTP y escribimos la informacion que nos falta para calcular
la desviacion estandar.
clase f M fM M2 fM2
30-39 3 34.5 103.5 1190.25 3570.75
40-49 7 44.5 311.5 1980.25 13861.75
50-59 18 54.5 981 2970.25 53464.5
60-69 12 64.5 774 4160.25 49923
70-79 8 74.5 596 5550.25 44402
80-89 2 84.5 169 7140.25 14280.5
50 2935 179502.5
Ya habamos calculado:
f M 2935
Xg = = = 58.7
n 50
Ahora sustituimos las sumas correspondientes en la formula de la varianza:
179502.5 50(58.7)2
s2 = = 147.31
50 1
y la desviacion estandar
s = 12.14.
Ejercicio 1.3.2. Usamos ahora el ejercicio 1.2.2 de ausentismo. Si el ano pasado la desviacion
estandar fue de 14.7. Calcula la varianza y la desviacion estandar del ano en curso y comparala
con la del ano anterior.
Existen otras medidas de dispersion llamadas cuartiles y percentiles. Los cuartiles dividen el
conjunto en 4 partes, esto es el primer cuartil se trata del dato que tiene por debajo el 25 % de
las observaciones, el segundo cuartil corresponde a la mediana que es el 50 %, y el tercer cuartil
corresponde al 75 %.
Cuando hablamos de percentiles se escoge un porcentaje, digamos 85 % y lo que se hace es
encontrar el dato cuya posicion indica que el 85 % de los datos estan por debajo de dicho dato.
13
1.3. MEDIDAS DE DISPERSION
14
2
Probabilidad
Ejemplo 2.1.1
Lanzar un dado
Partido de futbol
Ejemplo 2.1.2
15
2.1. ESPACIO MUESTRAL
Se puede tener un experimento donde se escogen objetos donde se puede tener la caracterstica
de escoger con reemplazo esto es se regresa el objeto elegido para participar en la siguiente
eleccion o sin reemplazo, un objeto ya elegido no participa en la siguiente eleccion.
Ejemplo 2.1.3
16
2.2. ELEMENTOS DE CALCULO COMBINATORIO
2. Se tienen 3 mensajes de correo electronico, tenemos que llegan puntuales (p) o tarde (t).
S = {ppp, ptt, ppt, ttt, tpp, ttp, ptp, tpt}
Ejercicio 2.1.2. Una consecionaria vende vehculos con equipo al gusto del cliente las opciones
son:
Automatico o estandar
Ejemplo 2.2.1
17
2.2. ELEMENTOS DE CALCULO COMBINATORIO
4. Cuantos numeros hay de la lotera nacional que no repiten dgitos? Sabemos que la lotera
nacional imprime boletos de 5 dgitos, entonces para el primer dgito tenemos 10 maneras,
para el segundo ya no tenemos 10 maneras pues no queremos que se repita el primero as que
son 9, para el tercero son 8 finalmente tenemos 10 9 8 7 6 = 30240.
Ejercicio 2.2.1.
3. Cuantos numeros de la loteria nacional tienen solo dgitos pares que no se repiten?
Definicion 2.3. El factorial de n denotado por n!. Es el resultado del producto de n y todos
los enteros menores a n.
n! = n(n 1)(n 2) 5 4 3 2 1
Propiedades
i. n(n 1)! = n!
n!
ii. (n 1)! =
n
iii. 0! = 1
Ejemplo 2.2.2
a) 5! = 120
88! 88 87 86 85!
b) = = 88 87 86 = 658416
85! 85!
1!
c) 0! = =1
1
d) 18! = 6.402D + 15
18
2.2. ELEMENTOS DE CALCULO COMBINATORIO
2.2.2. Permutaciones
Definicion 2.4. Una permutacion es un arreglo de n smbolos en un orden definido.
Ejemplo 2.2.3
a) Cuantas permutaciones de 3 letras se obtienen del conjunto A = {a, b, c}? {abc, acb, bac, bca, cab, cba}
En total son 6.
b) Cuantas permutaciones de 2 letras? {ab, ac, ba, bc, ca, cb} En total son 6.
n!
P (n, r) =
(n r)!
As en el primer caso tenemos que son tres smbolos en palabras de tres letras. Entonces
n=r=3y
3! 3!
P (3, 3) = = = 3! = 6.
(3 3)! 0!
En el segundo problema se trata de tres smbolos en palabras de dos letras. Entonces n = 3 y
r = 2 sustituyendo en la formula tenemos
3! 3!
P (3, 2) = = = 6.
(3 2)! 1!
Si se quiere hacer una permutacion con de n simbolos donde k estan repetidos la formula
correspondiente es:
n!
P =
n1 ! n2 ! nk !
donde ni es el numero de veces que se repite el smbolo i.
Ejemplo 2.2.4
Cuantas palabras distintas se obtienen con aabb? Notamos n = 4 y son dos simbolos los que
4!
se repiten n1 = 2 y n2 = 2 sustituyendon en la formula P = = 6. Podemos verificar esto
2!2!
{aabb, abab, abba, baab, baba, bbaa}.
19
2.2. ELEMENTOS DE CALCULO COMBINATORIO
2.2.3. Combinaciones
Ahora que pasa cuando no nos interesa la posicion, esto es cuantas selecciones de dos letras pue-
do hacer de {a, b, c}, notemos que {a, b} es la misma eleccion que {b, a} porque aqu el orden no
importa, pues notamos que se eligieron las mismas letras. As tenemos que {{a, b}, {a, c}, {b, c}},
esto es son solo tres posibles selecciones de tres letras.
Propiedades
! !
n n
i. =1 iii. =n
n n1
! ! !
n n n
ii. =1 iv. =
0 nr r
Ejemplo 2.2.5
! !
10 10! 10! 75 75!
= = = 45 = = 5.607D + 14
8 8!(10 8)! 8!2! 14 14!61!
Ejemplo 2.2.6
20
2.3. EVENTOS
52!
una combinacion de 5 de 52 objetos. Sustituimos en la formula y obtenemos: C(52, 5) = =
5!47!
2598960.
Cuando resolvemos problemas debemos determinar si se trata de una permutacion (importa
el orden y se trata de un arreglo), una combinacion (no importa el orden se trata de una
seleccion) o simplemente se debe utilizar el principio de la multiplicacion (importa el orden
pero hay elementos repetidos).
Ejercicio 2.2.2.
2. Cuantas combinaciones hay del melate si se trata de escoger 6 numeros del 1 al 56?
2.3. Eventos
Definicion 2.6. Un evento o suceso es un subconjunto del espacio muestral.
Ejemplo 2.3.1
a) El espacio muestral de lanzar una moneda es S = {A, S} digamos aguila o sol. Los eventos
pueden ser: E1 = {A} esto es cae aguila y otro puede ser E2 = {S} que es cae sol.
b) En el ejemplo de tirar un dado un evento puede ser caiga un numero par Ep = {2, 4, 6}.
21
2.3. EVENTOS
#(E1 ) = 1 #(Ep ) = 3
Definicion 2.8. La union de dos eventos es un evento que consiste de todos los reultados que
estan en E1 o en E2 .
E1 E2 = {x : x E1 o x E2 }
E1 E2 =
S
E1 E2
Definicion 2.9. La interseccion de dos eventos es un evento que consiste de todos los resultados
que estan en los dos eventos E1 y E2 .
E1 E2 = {x : x E1 y x E2 }
E1 E2 =
S
E1 E2
22
2.3. EVENTOS
E1 E2 = .
E1 E2
Definicion 2.11. El complemento de E1 es un evento que consiste de todos los resultados del
espacio muestral S que no estan en el evento E1 .
E1c = {x S : x 6 E1 }
23
2.3. EVENTOS
Ejemplo 2.3.2
Consideremos el espacio muestral donde se aceptan o se rechazan 2 artculos. S = {ss, sn, ns, nn}
son eventos de este espacio muestral
El evento se acepta al menos uno. E1 = {ss, sn, ns}
E1 E2 = {ss, sn, ns, nn} = S La union de estos dos eventos da el espacio muestral completo.
E1 E2 =
E1c = {nn} = E2
Ejercicio 2.3.1.
1. Haz el diagrama de Venn correspondiente a espacio muestral de la concesionaria consi-
derando los siguientes eventos:
2. Se mide el tiempo necesario para que se realice una reaccion qumica. Este experimento
puede ser modelado con el espacio muestral S = + . Sean los eventos E1 = {x : 1 x <
10} y E2 = x : 3 < x < 118. Calcula
24
2.4. FUNCION DE PROBABILIDAD
a) E1 E2 b) E1 E2 c) E1c d) E1c E2
Propiedades de cardinalidad
Propiedades de conjuntos
Como hemos observado los eventos son conjuntos por lo cual nos conviene repasar algunas
propiedades las cuales puedes verificar utilizando diagramas de Venn.
i. (Ac )c = A iv. (A B) C = (A C) (B C)
v. (A B) C = (A C) (B C)
Propiedades conmutativas
i. P (E) 0
ii. P (S) = 1
25
2.4. FUNCION DE PROBABILIDAD
#(E)
P (E) = .
#(S)
Claramente cumple los axiomas utilizando las propiedades de cardinalidad.
Ejemplo 2.4.1
Resistencia a golpes
Resistencia
a rayo-
alta baja
nes
alta 40 4
baja 1 5
Sea A el evento que denota a los elementos con alta resistencia a golpes y sea B el evento que
denota alta resistencia a rayones.
c) Que es A B? son los elementos que tienen alta resistencia a golpes y rayaduras
d) Que es A B? son los elementos que tienen una alta resistencia en cualquiera de los dos
golpes o rayaduras
41
f) P (A). En este caso sabemos que #(S) = 50 y que #(A) = 41 entonces P (A) = = 0.82
50
26
2.4. FUNCION DE PROBABILIDAD
#(B) 44
g) P (B) P (B) = = = 0.88
#(S) 50
h) P (A B c ) Nos preguntan por los que tienen alta resistencia a golpes y baja resistencia a
1
rayaduras leyendo de la tabla tenemos que es solo uno P (A B c ) = = 0.02
50
i) P (A B) Son los que tienen alta en cualquiera de los dos golpes o rayaduras P (A B) =
45
= 0.9
50
9
j) P (Ac ) P (Ac ) = = 0.18
50
Propiedades de la probabilidad
a) 0 P (E) 1
b) P () = 0
d) P (E c ) = 1 P (E)
e) P ((E c )c ) = P (E)
Teorema 2.2. Sea S un espacio muestral que contiene a dos eventos cualquiera A y B, enton-
ces:
P (A B) = P (A) + P (B) P (A B).
Verificamos esto usando el ejemplo anterior donde ya tenemos calculados todos los valores
40
excepto P (A B), #(A B) = 40 entonces P (A B) = = 0.8, ahora que tenemos todos los
50
valores sustituimos en P (A B) = P (A) + P (B) P (A B) P (A B) = 0.82 + 0.88 .8 = 0.9
valor que habiamos obtenido directamente.
Ejercicio 2.4.1.
Localizacion
Contaminacion
centro orilla
baja 514 68
alta 112 246
27
2.5. PROBABILIDAD CONDICIONAL
a) P (A)
b) P (C)
c) P (A C)
d) P (A C)
P (A B)
P (B|A) = con P (A) 6= 0
P (A)
Tambien tenemos que si trabajamos con complementos
Ejemplo 2.5.1
Consideremos nuevamente el ejemplo de las piezas de plastico. Recordamos que los eventos son A
alta resistencia a golpes y B alta resistencia a rayones.
28
2.5. PROBABILIDAD CONDICIONAL
Resistencia a golpes
Resistencia
a raya-
duras
alta baja
alta 40 4
baja 1 5
P (B|A) se traduce a cual es la probabilidad de dado que es una pieza de plastico tiene alta resistencia
a golpes se escoja con alta resistencia a rayones. Como A ya ocurrio vemos la tabla y estamos
trabajando con 41 piezas, de las cuales 40 tienen alta resiencia a rayones. Entonces P (B|A) =
40
= 0.97. Gracias a la definicion no es necesario que hagamos este razonamiento, simplemente
41
utilizamos la formula.
P (A B) 0.8
P (B|A) = = = 0.98
P (A) 0.82
Por lo regular P (A|B) 6= P (B|A) podemos verificarlo con el ejemplo:
P (A B) 0.8
P (A|B) = = = 0.91
P (B) 0.88
Regla de multiplicacion
Ejercicio 2.5.1. A los habitantes de la Ciudad de Mexico se les hizo una encuesta con el
proposito de determinar el numero de lectores de La Jornada y el Universal. Los resultdos
fueron: 20 % leen el Universal, 16 % leen la Jornada, mientras que el 1 % lee ambos periodicos.
Si selecciona al azar a un lector del Universal cual es la probabilidad de que tambien lea la
Jornada?
Definicion 2.14. Sean A y B dos eventos cualesquiera de un espacio muestral S. Se dice que
el evento A es independiente del evento B si P (A|B) = P (A).
Teorema 2.3. Si el evento A es independiente del evento B entonces se verifica una de las 3
relaciones siguientes:
1. P (A|B) = P (A)
2. P (B|A) = P (B)
3. P (A B) = P (A) P (B)
29
2.5. PROBABILIDAD CONDICIONAL
Ejemplo 2.5.2
El circuito ilustrado a continuacion solo opera si hay una trayectoria de dispositivos funcionales de
izquierda a derecha. La probabilidad de que cada dispositivo funcione se indica en la ilustracion.
Supon que los dispositivos fallan independientemente. Cual es la probabilidad de que el circuito
opere?
Cuando trabajamos con circuitos en serie se trata de de una interseccion pues para que funcione
deben funcionar todos, y cuando estan conectados en paralelo se trata de uniones pues para que
funcionen puede funcionar cualquiera.
Nombramos dispositivo A al de arriba y B al de abajo.
Para que funcione nos preguntamos P (A B) pues estan conectados en paralelo. P (A B) =
P (A)+P (B)P (AB) como son independientes podemos cambiar la interseccion por el producto.
P (A B) = P (A) + P (B) P (A)P (B) = 0.95 + 0.95 (0.95)(0.95) = 0.998
30
2.5. PROBABILIDAD CONDICIONAL
A = (A B) A B c
Ejemplo 2.5.3
31
2.6. TEOREMA DE BAYES
F : el producto falla.
Despues obtenemos los datos correspondientes: P (F |A) = 0.10, P (F |M) = 0.01, P (F |B) = 0.001,
P (A) = 0.2, P (M) = 0.3 y P (B) = 0.5.
P (E1 |B) =
P (E1 B) P (B|E1 )P (E1 )
=
P (B) P (B|E1 )P (E1 ) + P (B|E2 )P (E2) + + P (B|En )P (En )
32
2.6. TEOREMA DE BAYES
Ejemplo 2.6.1
Dado que un nuevo procedimiento medico ha demostrado ser efectivo para la deteccion temprana
de una enfermedad, se propone un estudio medico exhaustivo de la poblacion. La probabilidad de
que la prueba identifique correctamente a alguien que no padece la enfermedad como negativo es
0.95 y la probabilidad de que la prueba identifique correctamente a alguien con la enfermedad como
positivo es 0.99. La incidencia de la enfermedad en la poblacion general es 0.0001. Si te sometes a
la prueba y el resultado es positivo. Cual es la probabilidad de que padezcas la enfermedad?
SOLUCION: Nuevamente empezando por la pregunta debemos tener cuidado pues se trata de
probabilidad condicional pues ya sucedio que el resultado es positivo y se pide la probabilidad de
padecer la enfermedad.
Eventos:
E: esta enfermo as E c : no esta enfermo
N: resultado negativo y N c : resultado positivo
Lo que nos piden calcular es P (E|N c ).
La informacion que nos dan es: P (N|E c ) = 0.95, P (N c |E) = 0.99 y P (E) = 0.0001. Utilizamos
el Teorema de Bayes
P (N c |E)P (E)
P (E|N c ) =
P (N c |E)P (E) + P (N c |E c )P (E c )
Como podemos ver nos faltan los datos P (E c ) y P (N c |E c ) podemos calcularlos pues son comple-
mentos de P (E) y P (N|E c ) podemos modificar la formula a
c P (N c |E)P (E)
P (E|N ) = .
P (N c |E)P (E) + (1 P (N|E c ))(1 P (E))
(0.99)(0.0001)
P (E|N c ) = = 0.002
(0.99)(0.0001) + (1 0.95)(1 0.0001)
La probablidad de que estes enfermo es del 0.2 %.
Ejercicio 2.6.1.
a) Supon que la probabilidad de que una oblea contenga una partcula de contaminacion grande
es 0.01 y que las obleas son independientes; es decir, la probabilidad de que una oblea contenga
una partcula grande no depende de las caractersticas de las obleas restantes. Si se analizan
15 obleas, cual es la probabilidad ninguna tenga particulas grandes?
33
2.6. TEOREMA DE BAYES
c) Durante los ultimos anos se ha escrito mucho sobre la posible relacion entre fumar y el
cancer pulmonar. Supon que en un centro medico, de todos los fumadores de quienes se
sospechaba tenan cancer pulmonar, el 90 % lo tena, mientras que unicamente el 5 % de los
no fumadores lo padeca. Si la proporcion de fumadores es de 0.45, cual es la probabilidad
de que un paciente con cancer pulmonar seleccionado al azar sea fumador?
34
3
Variables Aleatorias
Ejemplo 3.1.1
35
3.2. DISTRIBUCION DE PROBABILIDAD
a) Espacio muestral
b) Rango de X
SOLUCION:
X = {2, 1, 0}
P (Ac Ac ) esto es las dos fallan es interseccion y son independientes podemos calcularlo con
P (Ac ) P (Ac ) = (0.2)(0.2) = 0.04
Ademas de preguntarnos por la probabilidad de cada uno de los elementos del rango de X
tenemos que es posible P (X 1) esto es cual es la probabilidad de que la variable aleatoria
sea mayor o igual que uno. Para esto tenemos dos opciones o es 1 o es 2. Entonces P (X 1) =
P (X = 1) + P (X = 2) = 0.32 + 0.64 = 0.96.
36
3.2. DISTRIBUCION DE PROBABILIDAD
Ejemplo 3.2.1
a) Determina el Rango de X
SOLUCION: Sabemos que la suma de los dados va de 2 a 12 por lo cual X = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}.
Notemos que P (X = 1) = 0 pues no es posible que al lanzar 2 dados la suma de 1.
Para calcular P (X = 2) notamos que esto solo es posible cuando cae 1 en los dos dados, sabemos
que el espacio muestral tiene 36 posibles resultados pues para cada dado son 6 maneras, y de estas
1
la pareja (1, 1) aparece solo una vez, por lo tanto P (X = 2) = = 0.028.
36
Hacemos una tabla para ver como se obtienen cada una de las posibles sumas y la probabilidad
correspondiente:
37
3.2. DISTRIBUCION DE PROBABILIDAD
i parejas Probabilidad
1
2 (1,1) 36
2
3 (1,2),(2,1) 36
3
4 (1,3),(2,2),(3,1) 36
4
5 (1,4),(2,3),(3,2),(4,1) 36
5
6 (1,5),(2,4),(3,3),(4,2),(5,1) 36
6
7 (1,6),(2,5),(3,4),(4,3),(5,2),(6,1) 36
5
8 (2,6),(3,5),(4,4),(5,3),(6,2) 36
4
9 (3,6),(4,5),(5,4) 36
3
10 (4,6),(5,5) 36
2
11 (5,6),(6,5) 36
1
12 (6,6) 36
La grafica correspondiente a esta distribucion de probabilidad es la siguiente
Definicion 3.3. Para una variable aleatoria X con valores posibles o rango x1 , x2 , x3 , . . . , xn
la funcion masa de probabilidad se define como
f (xi ) = P (X = xi ).
38
3.2. DISTRIBUCION DE PROBABILIDAD
Por ejemplo, usando las parejas de los resultados de tirar dos dados.
1 2
f (1) = 0 f (2) = f (3) =
36 36
3 4 5
f (4) = f (5) = f (6) =
36 36 36
6 5 4
f (7) = f (8) = f (9) =
36 36 36
3 2 1
f (10) = f (11) = f (12) =
36 36 36
1 35
F (11) = P (X 11) = 1 P (X > 11) = 1 f (12) = 1 = .
36 36
Para una variable aleatoria discreta X, F (x) satisface las siguientes propiedades:
X
i. F (x) = P (X x) = f (xi )
xi <x
ii. 0 F (x) 1
39
3.3. ESPERANZA, VARIANZA Y DESVIACION ESTANDAR
Ejemplo 3.3.1
Seguimos con el ejemplo de los dados, si jugamos turista el valor esperado sera el resultado de:
12
X 1 2 3 4 5 6 5
= xf (x) = 2 +3 +4 +5 +6 +7 +8 +
36 36 36 36 36 36 36
x=2
4 3 2 1
9 + 10 + 11 + 12 =7
36 36 36 36
Definicion 3.6. La varianza de una variable aleatoria discreta X denotada por 2 o V (X) se
define como
X X
2 = V (X) = (x )2 f (x) = x2 f (x) 2 .
xX xX
Por ultimo
calculamos
la varianza y la desviacion estandar del ejemplo de los dados.
1
V (X) = (4(1) + 9(2) + 16(3) + 25(4)
36
+36(5) + 49(6) + 64(5) + 81(4) + 100(3) + 121(2) + 144(1)) 72 = 5.83
p
= V (X) = 5.83 = 2.42.
Ejemplo 3.3.2
Sea que la variable aleatoria X denote el numero de obleas de semiconductores que es necesario
analizar a fin de detectar una partcula grande de contaminacion. Supongase que la probabilidad de
que una oblea contenga una partcula grande es 0.01 y que las obleas son independientes. Determina:
40
3.3. ESPERANZA, VARIANZA Y DESVIACION ESTANDAR
d) Valor esperado
SOLUCION: En este caso tenemos que se trata de una variable aleatoria discreta pero infinita,
pues la oblea con la partcula grande de contaminacion puede aparecer en la primera muestra o en
la segunda etcetera. Por lo tanto la variable aleatoria X = {1, 2, 3, 4, 5, 6, 7, . . . }.
En este caso no podemos hacer una tabla para determinar que pasa con la probabilidad.
Empezamos con f (1) esto es cuando la partcula grande se detecta en la primera oblea. Como se
trata solo de una podemos decirlo directamente del enunciado. Esto es: f (1) = 0.01. En el caso
de f (2) no se detecta en la primera pero si en la segunda, como son independientes es el producto
f (2) = (0.99)(0.01), para f (3) = (0.99)2 (0.01). Con esto podemos decir que la funcion de masa
es f (x) = (0.99)x1(0.01).
La grafica que se obtiene:
0.014
0.012
0.010
0.008
0.006
0.004
0.002
0.000
0 5 10 15 20 25
Para calcular la funcion acumulada F , seguimos el mismo procedimiento F (1) = 0.01, F (2) =
f (1) + f (2) = 0.01 + 0.99(0.01) y F (3) = f (1) + f (2) + f (3) = 0.01 + 0.01(0.99) + 0.01(0.99)2.
Notemos que 0.01 es comun a todos y por lo tanto lo podemos factorizar, y ademas podemos
41
3.3. ESPERANZA, VARIANZA Y DESVIACION ESTANDAR
reescribirlo como 0.01 = (1 0.99). As F (1) = 1 0.99, F (2) = (1 0.99)(1 + 0.99) = 1 0.992
y F (3) = (1 0.99)(1 + 0.99 + 0.992 ) = 1 + 0.99 + 0.992 0.99 0.992 0.993 = 1 0.993 .
Entonces F (x) = 1 0.99x .
X
Ahora para calcular el valor esperado utilizamos la formula = xf (x) y tambien recordaremos
xX
X1
la serie geometrica pi =
si p < 1.
i=1
1p
X X
x1
E(X) = x(0.99) (0.01) = (0.01) x(0.99)x1.
x=1 1
X
En este momento nos preocuparemos solo por la suma notamos que tenemos que x(0.99)x1 =
x=1
1 + 2 0.99 + 3 0.992 +
La cual a si vez podemos reescribir como:
X
x(0.99)x1 =
x=1
1 +0.99 +0.992 +0.993 +
+0.99 +0.992 +0.993 +
+0.992 +0.993 +
+0.993 +
Notamos que la primera lnea se trata de la serie geometrica con p = 0.99 y la segunda tambien si
factorizamos 0.99, la tercera tambien si factorizamos 0.992 .
As obtenemos:
X
x(0.99)x1 = 1
10.99
1
+ 0.99 10.99 1
+ 0.992 10.99 +
x=1
1
= 10.99
(1 + 0.99 + 0.992 + 0.993 + )
1 1 1
= 10.99 10.99
= (0.01)2
Entonces:
X 1 1
(0.01) x(0.99)x1 = (0.1) 2
= = 100.
1
(0.01) 0.01
Ejercicio 3.3.1. Estudios de mercado estiman que un nuevo instrumento para el analisis de
muestras de suelo sera de gran exito, con un exito moderado, o sin exito, con probabilidades
0.3, 0.6 y 0.1, respectivamente. Los ingresos anuales asociados con un producto de gran exito,
42
3.4. DISTRIBUCIONES DISCRETAS ESPECIALES
con un exito moderado o sin exito son de 10 millones, 5 millones y 1 millon, respectivamente.
Sea que la variable aleatoria X denote los ingresos anuales del producto.
4. Valor esperado
5. Varianza.
Ahora la idea es identificar distribuciones y obtener para cada una: funcion de masa, grafica,
valor esperado, varianza y desviacion estandar.
Cuando tenemos que todos los elementos de una variable aleatoria discreta X tienen la misma
probabilidad, se trata de la distribucion uniforme. Sea X = {x1 , x2 , . . . , xn } la cual tiene n
elementos.
1
f (x) = p =
n
Xn
xi
i=1
E(X) = Esto es el promedio.
n
n n
!2
X X
2
n xi xi
V (X) = i=1 i=1
p n2
= V (X)
La grafica de esta distribucion con X = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} es:
43
3.4. DISTRIBUCIONES DISCRETAS ESPECIALES
1.0
0.8
0.6
0.4
0.2
0.0
0 2 4 6 8 10
Ejemplo 3.4.1
Sea la variable aleatoria discreta X = {0.1, 0.5, 0.7, 0.8, 0.9, 1.1}. Si todos sus elementos tienen la
misma probabilidad. Determina funcion de masa, la media y la desviacion estandar.
1
SOLUCION: Como tiene 6 elementos la funcion de masa es f (x) = .
6
Hacemos la tabla y obtenemos
xi x2i
0.1 0.01
0.5 0.25
0.7 0.49
0.8 0.64
0.9 0.81
1.1 1.21
suma 4.1 3.41
44
3.4. DISTRIBUCIONES DISCRETAS ESPECIALES
n
X
xi
i=1 4.1
= == 0.683
vn 6
!2
u n n
u X X
un x2i xi r
6(3.41) (4.1)2
u
t i=1 i=1
= = = 0.3184
n 36
Ejercicio 3.4.1. Sea que la variable aleatoria discreta X tiene una distribucion uniforme y se
compone de los enteros 0 x 15. Determina funcion de masa, media y varianza.
Considera la inspeccion de un artculo unico salido de la lnea de esamble, tirar una moneda,
acreditar estadstica y probabilidad, tirar un penal, etcetera. En cada uno de estos casos tenemos
2 resultados posibles, en el artculo pasa o no pasa, sol o aguila, acreditar o reprobar, anotar o
fallar el penal.
A estos experimentos se les llama ensayo tipo Bernoulli, cuyo resultado es exito o fracaso. La
variable aleatoria discreta se compone de dos numeros digamos X = {0, 1} con f (1) = p y
f (0) = q pero como p + q = 1 podemos reescribir a q como q = 1 p.
As f (1) = p y f (0) = 1 p as obtnemos una formula mas general como f (x) = px (1 p)x1 .
Para calcular = 0(1 p) + 1(p) = p y la varianza se obtiene V (X) = 02 (1 p) + 12 (p) p2 =
p(1 p).
La distribucion de Bernoulli es un caso particular de la distribucion binomial que es el tema a
continuacion.
Ahora en lugar de ser solo un intento son varios digamos n, entonces cuantos artculos pasaran
la inspeccion?, cuantas veces caera sol si tiro la moneda 3 veces?
En este caso tenemos que la variable aleatoria es X = {0, 1, 2, 3, 4, 5, . . . n} para el primer caso
que no nos dicen cuantos artculos son.
En el caso de las monedas pueden caer cero soles hasta 3: X = {0, 1, 2, 3}.
Para obtener la funcion de masa de esta distribucion hagamos el ejemplo de los volados, pero
en lugar de usar una moneda honesta, usamos una cargada, la probabilidad de sacar Sol es
p = 0.6. En la siguiente tabla dejamos expresada la probabilidad para
45
3.4. DISTRIBUCIONES DISCRETAS ESPECIALES
xi Elementos probabilidad
x=0 AAA (1 0.6)3
x=1 SAA, ASA, AAS 3(0.6)(1 0.6)2
x=2 SSA, SAS, ASS 3(0.6)2 (1 0.6)
x=3 SSS (0.6)3
!
n n!
donde = son los llamados coeficientes binomiales.
x x!(n x)!
Definicion 3.8. Un experimento aleatorio que consta de n ensayos repetidos tales que los
ensayos son independientes, la probabilidad p del resultado de interes en cada ensayo permanece
constante. Se llama experimento binomial. Con:
46
3.4. DISTRIBUCIONES DISCRETAS ESPECIALES
0.5
0.4
0.3
0.2
0.1
0.0
0 2 4 6 8 10
-0.1
Ejemplo 3.4.2
La probabilidad de que un bit transmitido a traves de un canal de transmision digital se reciba con
error es 0.1. Supon ademas que los ensayos de transmision son independientes. Sea X el numero de
bits con error de cuatro bits transmitidos. Determina:
a) Variable aleatoria
b) funcion de masa
SOLUCION: a) La variable aleatoria es X = {0, 1, 2, 3, 4}. Y como nos interesa con error
p = 0.1 y n = 4.
47
3.4. DISTRIBUCIONES DISCRETAS ESPECIALES
! !
4 4
b) f (x) = (0.1)x (1 0.1)4x = (0.1)x (0.9)4x
x x
!
4 4!
c) f (2) = P (X = 2) = (0.1)2 (0.9)42 = (0.1)2 (0.9)2 = 0.0486
2 2!2!
! !
4 4 4!
d) P (X 3) = f (3) + f (4) = (0.1)3 (0.9)43 + (0.1)4 (0.9)44 = (0.1)3 (0.9)1 +
3 4 3!1!
4!
(0.1)4 (0.9)0 = 4(0.1)3(0.9) + (0.1)4 = 0.0037
4!0!
Ejercicio 3.4.2. Cada muestra de aire tiene 10 % de probabilidad de contener una molecula
rara particular. Supon que las muestras son independientes con respecto a la presencia de la
molecula rara. Determina:
Definicion 3.9. Sea que la variable aleatoria X denote el numero de ensayos independien-
tes tipo Bernoulli necesarios hasta obtener el resultado deseado con probabilidad constante p.
Entonces X tiene una distribucion geometrica.
48
3.4. DISTRIBUCIONES DISCRETAS ESPECIALES
0.6
0.5
0.4
0.3
0.2
0.1
0.0
0 2 4 6 8 10
-0.1
Ejemplo 3.4.3
La probabilidad de que un bit transmitido a traves de un canal de transmision digital se reciba con
error es 0.1. Suponga ademas que los ensayos de transmision son independientes. Sea X el numero
de bits necesarios hasta que ocurra el primer error. Determina:
b) La probabilidad de que se requieran transmitir 5 bits para obtener un bit con error.
c) Numero de bits que se espera que se deben transmitir para encontrar el primer error.
d) Varianza.
SOLUCION: a) X = {1, 2, 3, 4, . . . }
49
3.4. DISTRIBUCIONES DISCRETAS ESPECIALES
1
c) Sustituimos en la formula = = 10
0.1
1p 1 0.1
d) V (X) = = = 90
p2 (0.1)2
Ejercicio 3.4.3. Cada muestra de aire tiene 10 % de probabilidad de contener una molecula
rara particular. Supon que las muestras son independientes con respecto a la presencia de la
molecula rara. Determina:
e) Valor esperado
f ) Varianza
Definicion 3.10. Un experimento aleatorio que consta de conteos del resultado deseado en un
intervalo, donde los conteos en subintervalos son independientes. Con promedio en un intervalo
dado tiene una distribucion llamada de Poisson:
Variable aleatoria X = {0, 1, 2, 3, 4, 5, . . . }
e x
Funcon de masa f (x) =
x!
Valor esperado E(X) =
Varianza V (X) =
50
3.4. DISTRIBUCIONES DISCRETAS ESPECIALES
Ejemplo 3.4.4
e) Valor esperado
f) Varianza
51
3.5. OTRAS DISTRIBUCIONES DISCRETAS
SOLUCION: a) Como vamos a trabajar solo sobre un milmetro entonces = 2.3 y utilizamos
e2.3 2.32
la funcion de masa f (2) = = 0.265
2!
e4.6 4.63
b) Ahora trabajamos con 2 milmetros entonces duplicamos y obtenemos = 4.6 f (3) = =
3!
0.163
c) En este caso el calculo no es exacto usamos la desigualdad P (X 1). Como X tiene un numero
infinito de elementos utilizamos la propiedad de complemento:
P (X 1) = 1 P (X < 1) = 1 f (0)
e4.6 4.60
=1
0!
= 0.999
e) = 2.3
f) 2 = 2.3
52
3.5. OTRAS DISTRIBUCIONES DISCRETAS
Definicion 3.11. En una serie de ensayos tipo Bernoulli independientes, la probabilidad p del
resultado deseado, sea la variable aleatoria X denote el numero de ensayos hasta que ocurran
r de estos resultados deseados. Entonces X tiene una distribucion binomial negativa.
Variable aleatoria X = {r, r + 1, r + 2, r + 3, r + 4, r + 5, . . . }
!
x1
Funcon de masa f (x) = pr (1 p)xr
r1
r
Valor esperado =
p
r(1 p)
Varianza 2 =
p2
Ejemplo 3.5.1
Una empresa de reclutamiento encuentra que el 30 % de los aspirantes para determinado puesto
en la industria tienen conocimientos avanzados de programacion de computadoras. Supongase que
se tienen tres puestos en los que se necesitan conocimientos avanzados de programacion. Si se
seleccionan los solicitantes uno a uno en forma independiente y al azar, calcular:
a) La variable aleatoria X
c)
P (X 6) = f (3) +
! f (4) + f (5) + f (6)
!
2 3
= 0.33 (0.7)0 + 0.33 (0.7)1 +
2
! 2
!
4 5
0.33 (0.7)2 + 0.33 (0.7)3
2 2
= 0.256
53
3.5. OTRAS DISTRIBUCIONES DISCRETAS
r 3
d) = = = 10.
p 0.3
Esto es se espera hacer 10 entrevistas.
Ejercicio 3.5.1. Supon que la probabilidad de que Shaquille ONeal anote una canasta es 0.6.
Supon que los tiros son eventos independientes, y sea que la variable aleatoria X denote el
numero de tiros hasta que anota 4 canastas. Calcula:
Cada uno de los ensayos, cuestan tiempo o dinero. Podemos calcular ademas tiempos y costos
las funciones correspondientes. Las cuales podemos incorporar a las distribuciones pues estan
en funcion del numero de ensayos, para hacer estos calculos usamos el siguiente teorema.
Ejemplo 3.5.2
Un gran lote de bombas usadas contiene un 20 % de ellas que no sirven y necesitan reparacion. Se
manda a un mecanico con tres juegos de refacciones. Selecciona bombas al azar y las prueba una
tras otra. Si trabaja una bomba, prosigue con la siguiente. Si no trabaja, le instala uno de sus juegos
de refacciones. Supongase que tarda 10 minutos en probar si una bomba trabaja o no, y 30 minutos
en probar y reparar una bomba que no trabaja. Calcular el valor esperado y la varianza del tiempo
total que le llevara terminar con sus tres juegos.
SOLUCION: Como va a seguir intentando hasta que se acaben sus 3 juegos de refacciones, se
trata de una distribucion binomial negativa con p = 0.2, r = 3 y X = {3, 4, 5, 6, . . . }. Pero si
encuentra una que no sirve le tomara otro rato repararla.
Si le toma x intentos en encontrar las tres bombas descompuestas. x 3 ocuparan solo su tiempo
de revision y 3 el tiempo de reparacion.
Esto es la funcion tiempo es: t(x) = 10(x 3) + 30(3) = 10x 30 + 90 = 10x + 60. Usamos el
teorema y metemos esta funcion en el valor esperado esto es:
3
E(t(x)) = E(10x + 60) = 10(E(x)) + 60 = 10 + 60 = 210
0.2
54
3.5. OTRAS DISTRIBUCIONES DISCRETAS
(3)(0.8)
V (10x + 60) = 102 V (x) = 102 = 6000
0.22
Se espera que le tome 210 minutos y la varianza es de 6000 minutos cuadrados.
Ejercicio 3.5.2. Se examina a los empleados de un negocio de fabricacion de aislantes para ver
si hay asbesto en sus pulmones. Se pide a la empresa que mande a tres empleados cuyos resul-
tados fueron positivos a un centro medico para mayores examenes. Si el 40 % de los empleados
tuvieron resultados positivos en la detencion asbesto en sus pulmones:
a) Calcular la probabilidad de que se deba analizar a diez empleados para encontrar a tres con
asbesto en sus pulmones.
b) Si cada analisis cuesta $200, calcular el valor esperado y la varianza del costo total de llevar
a cabo las pruebas para encontrar tres empleados con resultados positivos.
Otra distribucion discreta es la llamada hipergeometrica la cual ya no usa ensayos tipo Bernoulli
independientes. Si te interesa puedes consultar en la bibliografa.
55
3.5. OTRAS DISTRIBUCIONES DISCRETAS
56
4
Variable aleatoria continua
Definicion 4.1. Se dice que una variable aleatoria X es continua si puede tomar un numero
infinito de valores posibles asociados con intervalos de numeros reales.
Z
ii. f (x)dx = 1
Z b
iii. P (a X b) = f (x)dx1
a
Consideremos la funcion f (x) = 0.3x2 + 0.1 cumple con las especificacines para ser una funcion
de masa en el intervalo [0, 2] y el area bajo la curva, es decir, la integral es igual con 1. Como
podemos apreciar en la siguiente figura:
1
Notemos que P (a < X b) = P (a X < b) = P (a < X < b)
57
4.1. VARIABLES ALEATORIAS CONTINUAS Y SUS PROPIEDADES
Definicion 4.4. Suponga que X es una variable alatoria continua con funcion de densidad de
probabilidad f (x) entonces:
La media o el valor esperado de X es:
Z
= E(X) = xf (x)dx
La varianza:
Z
2
= V (X) = x2 f (x)dx 2
Ejemplo 4.1.1
La funcion de densidad de la variable aleatoria X de la vida util de una batera dado en cientos de
horas: (
1 x2
2
e Si x > 0
f (x) =
0 Si x 0
58
4.1. VARIABLES ALEATORIAS CONTINUAS Y SUS PROPIEDADES
e) Determina la probabilidad de que la batera dure mas de 250 horas pero menos de 500.
f) Determina media.
g) Determina varianza.
SOLUCION: a) Primero tenemos que calcular la integral y verificar que da 1. En este caso
tenemos una integral impropia:
Z Z b
1 x 1 x x
b
b
e 2 dx = lm e 2 dx = lm e 2 |b0 = lm e 2 + e0 = 1 lm e 2 = 1
0 2 b 0 2 b b b
Z x
1 x x x x
e 2 dx = e 2 |x0 = e 2 + e0 = 1 e 2
b) F (x) = P (X x) =
0 2
2
c) 200 horas corresponde a 2 cientos de horas por lo tanto P (X < 2) = F (2) = 1 e 2 = 0.63
4
d) 400 horas corresponde a 4 cientos de horas P (X > 4) = 1 P (X 4) = 1 (1 e 2 ) = 0.14
Z b
1 x
Z
x2 x2 x2 x b b b
f) = x e 2 dx = lm xe + e = lm xe 2e |0 = lm be 2 2e 2 (0
2
0 2 b 0 b b
2
Z
x
g) Al igual que el ejercicio anterior se usa integracion por partes y se obtiene V (X) = x2 e 2 dx
0
2 = 4
Ejercicio 4.1.1. Sea que la variable aleatoria continua X denote el diametro de un agujero
taladrado en un componente metalico. El diametro especificado es 12.5 mm la mayora de las
perturbaciones aleatorias del proceso resultan en diametros mayores. Datos historicos indican
que la distribucion de X puede modelarse con la funcion de densidad de probabilidad f (x) =
20e20(x12.5) para x 12.5.
59
4.1. VARIABLES ALEATORIAS CONTINUAS Y SUS PROPIEDADES
2. Determina F (x)
5. Determina
6. Determina V (X)
Como F (x) resulta de integrar la funcion de densidad f (x). f (x) se pude obtener derivando
F (x).
d
As f (x) = dx
(F (x))
Ejemplo 4.1.2
El tiempo para que una reaccion qumica se complete (en milisegundos), se aproxima con la funcion
de distribucion
( acumulada siguiente:
0 si x < 0
F (x) =
1e 0.01x
si x 0
60
4.2. DISTRIBUCIONES CONTINUAS ESPECIALES
b
1 1 1
Z
dx = x |ba = (b a) = 1
a ba ba ba
b+a
E(X) =
2
(b a)2
V (X) =
12
Ejemplo 4.2.1
Sea que la variable aleatoria continua X denote la corriente medida en un alambre delgado de cobre
en miliamperes. Supon que el rango de X es [0, 10 mA] y que tiene distribucion uniforme.
a) Determina: funcion de densidad, funcion acumulada, valor esperado, varianza y desviacion estandar.
SOLUCION: a = 0 y b = 10
1 1
f (x) = =
Z x 0
10 10
1 x x x
F (x) = dx = | =
0 10 10 0 10
10 + 0
E(X) = =5
2
(10 0)2
V (X) = = 8.33
12
= 2.887
10 5
Para el inciso b P (5 < X < 10) = F (10) F (5) = = 0.5
10 10
Ejercicio 4.2.1. Supon que X tiene una distribucion continua uniforme en el intervalo [1.5, 5.5].
b) P (X < 2.5)
61
4.2. DISTRIBUCIONES CONTINUAS ESPECIALES
c) P (2 < X < 4)
d) P (X 3)
Definicion 4.6. La variable aleatoria X que es igual a la distancia entre conteos sucesivos de
un proceso de Poisson tiene una distribucion exponencial con parametro > 0.
La funcion
Z de densidad de probabilidad de X es f (x) = ex para x 0
1
E(X) = x ex dx =
0
1
V (X) = 2
Por otro lado si se trata de la exponencial con media E(X) = entonces estoy partiendo de la
1
media la cual por la definicion tenemos que E(X) = = haciendo el despeje tenemos que
1
= y sustituyo adecuadamente en la integral.
Ejemplo 4.2.2
En una red de computadoras de una gran corporacion, el acceso de usuarios al sistema puede
modelarse como un proceso de Poisson con una media de 25 accesos por hora. Sea X denote el
tiempo en horas desde el principio del intervalo hasta el primer acceso.
c) Determina el intervalo de tiempo tal que la probabilidad que no haya accesos en el intervalo sea
0.9.
e) La desviacion estandar
SOLUCION: Notamos que = 25 por hora y pero notamos que las preguntas estan en minutos
25 5
entonces hacemos el cambio = =
60 12
62
4.2. DISTRIBUCIONES CONTINUAS ESPECIALES
6
5 5x
Z
5
12 x 6 30 30
a) P (X > 6) = 1 P (X 6) = 1 e 12 dx = 1 e |0 = 1 e 12 + 1 = e 12 =
0 12
0.082
3
5 5x
Z
5 15 10
b) P (2 < X < 3) = e 12 dx = e 12 x |32 = e 12 + e 12 = 0.148
2 12
Z t
5 5x 5 5
c) P (X > t) = 0.9 esto es P (X t) = 0.1 0.1 = e 12 dx = e 12 x |t0 = 1 e 12 t y ahora
0 12
despejamos t
5
1 e 12 t = 0.1
5
e 12 t = 0.9
5
t = ln 0.9
12
12
t= ln 0.9
5
t = 0.253 minutos
1 12
d) E(x) = = = = 2.5
5 5
12
1
e) = = 2.5
Ejercicio 4.2.2. Sea que X denote el tiempo entre la deteccion de una partcula rara en un
contador Geiger y suponga que sigue un proceso de Poisson con media de 75 por minuto.
b) Determina la probabilidad de que detecte una partcula entre los 15 y los 45 segundos.
Ejemplo 4.2.3
Una refinadora de azucar recibe azucar morena a granel. La cantidad de azucar que puede procesar
la refinadora en un da se puede representar mediante una funcion exponencial con una media de 4
(mediciones en toneladas) por da.
63
4.2. DISTRIBUCIONES CONTINUAS ESPECIALES
3
1 x
Z
x 3 3 1
b) P (1 < X < 3) = e 4 dx = e 4 1 = e 4 + e 4 = 0.306
1 4
3
1 x
Z
x 3 3
c) P (X < 3) = e 4 dx = e 4 0 = e 4 + 1 = 0.528
0 4
Ejercicio 4.2.3. En una zona de Estados Unidos se pueden modelar las magnitudes de los
terremotos mediante una distribucion exponencial cuyo promedio es 2.4 en la escala de Richter.
Calcular la probabilidad de que el siguiente temblor que se presente en esa zona sea:
Ejemplo 4.2.4
Si la corriente en una tira de alambre sigue una distribucion normal, con una media de 10 mA y
una varianza de 4 mA2 esto es = 2.
1 (x10)2
La funcion de masa es f (x) = e 222 la grafica correspondiente es:
22
64
4.2. DISTRIBUCIONES CONTINUAS ESPECIALES
0.20
0.18
0.16
0.14
0.12
0.10
0.08
0.06
0.04
0.02
0.00
-5 0 5 10 15 20
0.40
0.35
0.30
0.25
0.20
0.15
0.10
0.05
0.00
-4 -3 -2 -1 0 1 2 3 4
Como veremos no es necesario que calculemos la integral para esta funcion, pues toda la infor-
macion se da en la tabla que se anexa. Para usarla entendemos que se tratan de los valores de
65
4.2. DISTRIBUCIONES CONTINUAS ESPECIALES
la funcion de distribucion acumulada de una variable aleatoria estandar que se denota como
z
1
Z
1 2
(z) = P (Z z) = e 2 u du
2
Observamos que la tabla tiene como columnas z y valores que van desde 0.09 hasta 0.00 del
lado negativo, del lado positivo tiene z y los valores desde 0.00 hasta 0.9.
Como renglones en la primer columna tenemos desde 3.9 hasta 0.0 del lado negativo y desde
0.0 hasta 3.9 del lado positivo. Lo demas son los valores que buscamos.
Ejemplo 4.2
P (Z < 1.32) Para encontrar el valor correspondiente buscamos 1.3 del lado positivo en el renglon,
despues nos movemos hasta la columna 0.02 esto es 1.32 = 1.3 + 0.02 y justo en la interseccion
del renglon 1.3 y la columna 0.02 encontramos el valor de la distribucion acumulada de la normal:
P (Z < 1.32) = 0.906582)
La grafica correspondiente es:
b) P (Z 1.53) = 0.936992
d) P (1.25 < Z < 0.37) = P (Z < 0.37) P (Z < 1.25) = 0.644309 0.105650 = 0.538659
66
4.2. DISTRIBUCIONES CONTINUAS ESPECIALES
I. P (Z > a) = 1 P (Z a) = P (Z < a)
b) P (Z < 3)
c) P (Z < 4.5)
d) P (Z 1.45)
e) P (Z < 6.1)
f ) P (Z > 2.15)
g) P (Z > 5)
i) P (Z 1.53)
j) P (Z 1.26)
k) P (Z < z) = 0.9
m) P (Z z) = 0.2
n) P (1.24 Z z) = 0.8
n) P (z Z z) = 0.68
67
4.2. DISTRIBUCIONES CONTINUAS ESPECIALES
Proceso de estandarizacion
Ejemplo 4.2.7
Suponga que las mediciones de corriente de una tira de alambre siguen una distribucion normal con
una media de 10mA y una varianza de 4(mA)2
Ejercicio 4.2.5. El diametro de un eje propulsor de almacenamiento optico tiene una distri-
bucion normal con una media de 0.2508 pulgadas y una desviacion estandar de 0.005 pulgadas.
Las especificaciones de los ejers son 0.2500 0.0015
68
4.2. DISTRIBUCIONES CONTINUAS ESPECIALES
La distribucion Beta esta definida en el intervalo 0 < x < 1, esta distribucion se usa para
trabajar con 2 probabilidades llamadas y .
La distribucion de Weibull, esta se usa par tiempos de vida util de componentes o sistemas.
69
4.2. DISTRIBUCIONES CONTINUAS ESPECIALES
70
5
Estimaciones
La media muestral x es el promedio de los datos de la muestra. Pero es igual a ? Es mas
grande o mas pequena que ? Que tanto estan alejadas? Esto es lo que vamos a trabajar en
este captulo.
Nuestro objetivo es estimar y 2 , media y varianza poblacionales, conociendo los valores
muestrales x y s2 . Hay diversos trabajos con otras distribuciones pero en esta unidad nos
enfocaremos unicamente a la distribucion normal.
Ejemplo 5.1.1
Las resistencias a la fractura de determinado tipo de vidrio son en promedio 14 (miles de libras por
pulgada cuadrada) y tienen una desviacion estandar igual a dos.
a) Cual es la probabilidad de que la resitencia promedio de fractura de 100 piezas de este vidio sea
mayor que 14.5?
71
5.1. TEOREMA DEL LIMITE CENTRAL
SOLUCION: a) Notamos que nos estan preguntando P X > 14.5 y que nos dan como datos
que = 14 y que = 2. Entonces podemos estandarizar, pues de acuerdo con el Teorema de
Lmite Central X tiene una distribucion aproximadamente normal.
!
X 14.5 14
P X > 14.5 = P > 2 = P (Z > 2.5) = 1P (Z 2.5) = 10.993790 =
n 100
0.00621
0.95 + 1
b) P (z < Z < z) = 0.95 esto es 2P (Z z) 1 = 0.95 P (Z z) = = 0.975
2
|z| = 1.96
x
Ahora resolvemos para x z =
. Despejando x = z n
+ .
n
Ejemplo 5.1.2
Se ha observado durante mucho tiempo que una maquina determinada para llenar botellas, tiene una
varianza en las cantidades de llenado aproximadamente de 2 = 1 onzas cuadradas. Sin embargo,
el promedio de las onzas de llenado depende de un ajuste que puede cambiar de da a da, o de
operador a operador. Si en un da se llevan a cabo n = 25 observaciones de la cantidad (onzas) de
lquido servido, todas con el mismo ajuste de maquina.
a) Calcular la probabilidad de que el promedio muestral quede dentro de 0.3 onzas de diferencia
con respecto al promedio verdadero de la poblacion , para ese ajuste.
b) Cuantas observaciones se deben efectuar en la muestra para que x quede a menos de 0.3 onzas
de con una probabilidad de 0.95?
SOLUCION: a) Tenemos que = 1, n = 25 y lo que nos estan preguntando es:
!
0.3 x + 0.3
0.3
0.3
P ( 0.3 < x < + 0.3) = P < < =P 1 <Z< 1 =
n n n 5 5
P (1.5 < Z < 1.5) =0.933193 0.066807 = 0.866386
b) En este caso me estan preguntando un valor simetrico que da dicha probabilidad esto es:
P (z < Z < z) = 0.95 Ahora le hacemos al reves y buscamos en la tabla que valores correspon-
0.3
den obteniendo z = 1.96 utilizando el inciso anterior tenemos que z = 1.96 = 1 despejamos
n
2
1.96
de la ecuacion anterior tenemos n = = 42.42.684444.
0.3
Redondeado necesitamos hacer 43 observaciones para que x quede a menos de 0.3 onzas de .
72
5.1. TEOREMA DEL LIMITE CENTRAL
Con el inciso b del ejemplo anterior podemos obtener una formula para encontrar el numero de
observaciones necesario haciendo el despeje conveniente:
2
z
n=
x
Ejercicio 5.1.1. 1. Se ha encontrado que las mediciones de resistencia al cortante de las
soldaduras de punto tienen una desviacion estandar aproximada de 10 lb/pulg 2 . Si se
miden 100 soldaduras de prueba:
2. Los resistores de cierto tipo tienen resistencias que en promedio son de 200 Ohms, con
desviacion estandar de 10 ohms. Se utilizan 25 de ellos en un circuito. Calcular la pro-
babilidad de que la resistencia promedio de los 25 resistores este entre 199 y 202 ohms.
Definicion 5.1. Un estimador es una medida estadstica que especfica como utilizar los datos
de la muestra para estimar un parametro desconocido de la poblacion.
Un estimador es una variable aleatoria a la cual le podemos calcular valor esperado y varianza.
Definicion 5.4. Si se consideran todos los estimadores de al que tiene la menor varianza se
le llama estimador insesgado de varianza mnima.
Definicion 5.5. El error estandar del estimador x es la desviacion estandar por el teorema del
lmite central tenemos = .
n
73
5.1. TEOREMA DEL LIMITE CENTRAL
s
En caso de que no conozcamos usamos s podemos obtener un error estimado estandar = .
n
Ejemplo 5.1.3
Un artculo del Journal of Heat Transfer (Trans. ASME, Secc. C, 96, p. 59) describa un nue-
vo metodo para medir la conductividad termica del hierro Armco. Utilizando una temperatura de
100 F y una alimentacion de energa de 550 W , se obtuvieron las siguientes 10 mediciones de la
conductividad termica (en Btu/hr pie F ):
41.60, 41.48, 42.34, 41.95, 41.86, 42.18, 41.72, 42.26, 41.81, 42.04
a) Calcular x y su error.
b) Comparar el error con x calculando que porcentaje representa el error con respecto a la media
obtenida. Es un buen estimador?
x x2
41.60 1730.56
41.48 1720.5904
42.34 1792.6756
41.95 1759.8025
41.86 1752.2596
SOLUCION: a)
42.18 1779.1524
41.72 1740.5584
42.26 1785.9076
41.81 1748.0761
42.04 1767.3616
2
x = 419.24 x = 17576.9442
x nx2 ()2
n = 10; x = = 41.924; s2 = = 0.0807 y por lo tanto s = 0.284.
n n(n 1)
s 0.284
Como no tenemos entonces podemos calcular el error estimado estandar = = =
n 10
0.0898
(0.0898)(100)
b) Tenemos que 100 = = 0.214 %
x 41.924
Como el error es el 0.214 % del valor estimado podemos concluir que es un buen estimador.
Ejercicio 5.1.2. Cinco temperaturas maximas de la ciudad de Florida en grados celsius fueron:
22, 20, 24,21 y 26.
74
5.2. INTERVALOS DE CONFIANZA
a) Calcular x y su error.
b) Comparar el error con x calculando que porcentaje representa el error con respecto a la
media obtenida. Es un buen estimador?
Definicion 5.6. Suponga que X es una variable aleatoria cuya probabilidad depende de un
parametro desconocido . Dada una muestra aleatoria x1 , x2 , x3 , ...xn dos estadsticas L1 y L2
forman un intervalo de confianza del 100(1 ) % para si P (L1 L2 ) 1 . Sin
importar el valor desconocido de .
Como se obtiene esto, recordemos que lo que queremos es encontrar B tal que P ( B X)
+ B) = 1 . La grafica correspondiente es la siguiente:
2 1 2
B +B
75
5.2. INTERVALOS DE CONFIANZA
2 1 2
z z
2 2
!
X
As estandarizado 1 = P z 2 z 2 = P z 2 X z 2 =
n n
n
P X z 2 X + z 2
n n
Ejemplo 5.2.1
Ahora supongamos que queremos estimar el numero de observaciones para que x quede a B
de con un nivel de confianza 1 .
z
Esto es el intervalo que queremos es que el intervalo de confianza x 2 = x B. Esto es
n
z 2 z 2
B = x entonces n = 2
n B
76
5.2. INTERVALOS DE CONFIANZA
Ejemplo 5.2.2
Se desea estimar la distancia promedio que recorren los empleados de una empresa muy grande
camino a su trabajo. Los estudios anteriores de este tipo indican que la desviacion estandar de esas
distancias debe estar cercana a las 2 millas. Cuantos empleados deben muestrearse si la estimacion
debe quedar a menos de 0.1 millas del promedio verdadero, con un coeficiente de confianza de 0.95?
SOLUCION: = 2, B = 0.1, 1 = 0.95, = 0.05 y 2
= 0.025 entonces z/2 = 1.96.
z 2 1.96(2) 2
2
n= = = 1536.64.
B 0.1
Se deben muestrear 1537 empleados.
Ejercicio 5.2.2. La resistencia a la ruptura de los hilos tiene una desviacion estandar de 18
gramos. Cuantas mediciones de resistencia a la ruptura deben hacerse en el siguiente experi-
mento, si la estimacion de la resistencia promedio de ruptura debe estar a menos de 4 gramos
de la resistencia verdadera a la ruptura, con un coeficiente de confianza igual a 0.90?
Ejemplo 5.2.3
El alambre pretensado para reforzar tubos de concreto se fabrica en rollos grandes. En una inspeccion
de control de calidad se prueban 5 muestras de un rollo y se mide su resistencia maxima a la tension,
RMT . Los resultados de las mediciones, en un rollo de lb/pulg 2 , fueron 253, 261, 258, 255 y 256.
Con estos datos, determinar una estimacion de intervalo de confianza del 95 % del RMT promedio
verdadero para el rollo que se muestreo.
77
5.3. INTERVALOS DE CONFIANZA PARA 2
x x2
253 64009
261 68121
SOLUCION: 258 66564
255 65025
256 65536
x = 1283 x2 = 329255
5(329255) (1283)2
n = 5, x = 256.6, s2 = = 9.3 y s = 3.049.
5(4)
= 0.05 entonces /2 = 0.025.
t/2 con 4 grados de libertad es: t0.025 = 2.776
s 9.3
x t 2 = 256.6 2.776 = 256.6 3.7859 = (252.814, 260.3859)
n 5
Ejercicio 5.2.3. La resistencia a la ruptura en el sentido de la urdimbre de 5 especmenes de
determinada tela, fue en promedio 180lb/pulg 2 con desviacion estandar muestral de 5lb/pulg 2.
Estimar resistencia de ruptura verdadera en el sentido de la urdimbre para telas de este tipo
con un intervalo de confianza de 95 %.
Teorema 5.3. Suponga que x1 , x2 , ..., xn es una muestra aleatoria X con media y varianza
n
2
X (xi )2
Entonces Y = 2
tiene una distribucion 2 con n 1 grados de libertad.
i=1
Teorema 5.4. Suponga que X1 , X2 , X3 , ..., Xn es una variable aleatoria de una variable alea-
toria normal. Entonces:
(xi x)2 s2 (n 1)
=
2 2
es una variable aleatoria 2 con n 1 grados de libertad y s2 y x son variables aleatorias
independientes.
Con el teorema anterior podemos definir el intervalo de confianza para 2 con una confianza
del100(1 ) %.
(n 1)s2
2 2
P 1/2 /2 = 1
2
Trabajando la desigualdad para!dejar sola a 2 obtenemos:
(n 1)s2 2 (n 1)s2
P =1
2/2 21/2
Por lo tanto el intervalo de confianza para 2 con (1 )100 % de confianza es:
78
5.3. INTERVALOS DE CONFIANZA PARA 2
!
(n 1)s2 2 (n 1)s2
2/2 21/2
Ejemplo 5.3.1
= 0.1 entonces /2 = 0.05 con 5 grados de libertad 0.05 = 11.07 0.95 = 1.15.
(6 1)0.02855 (6 1)(0.02855)
, = (0.1241, 0.128)
11.07 1.15
Ejercicio 5.3.1. Estimar la varianza verdadera de las mediciones de resistencia, en un in-
tervalo de confianza de 90 %, si una muestra de 15 resistores presento resistencias con una
desviacion estandar muestral igual a 0.5 ohms.
79
5.3. INTERVALOS DE CONFIANZA PARA 2
80
6
Pruebas de hipotesis
Definicion 6.1. A un proceso que lleva a una decision acerca de una hipotesis particular se
llama prueba de hipotesis.
Las posibles decisiones son Rechazar, No rechazar. Como trabajaremos con una muestra en-
tonces asegurar algo sobre la poblacion sera muy descuidado.
Los procedimientos de prueba se basan en el uso de la informacion contenida en una muestra
aleatoria de la poblacion de interes.
En este caso la hipotsis nula es la hipotesis que quiere probarse. El rechazo de la hipotesis nula
lleva a No rechazarla hipotesis alterna.
Los errores en los que podemos caer al trabajar pruebas de hipotesis son 2.
Definicion 6.2. El error de tipo I se define como el rechazo de la hipotesis nula H0 cuando
esta es verdadera.
Rechazar H0 No rechazar H0
H0 es cierta Error de tipo I Decision correcta
H0 es falsa Desicion correcta Error de tipo II
Debido a que la decision que se toma esta basada en variables aleatorias puede asociarse pro-
babilidades a los errores de tipo I y tipo II.
La probabilidad de incurrir en un error de tipo I se denota por la letra griega . Tambien se le
llama nivel de significacion o amplitud de la prueba.
81
6.1. PRUEBAS DE HIPOTESIS PARA
Intervalo
de
confianza
2 1 2
Region
Region de Region
de aceptacion de
rechazo rechazo
punto crtico punto crtico
x 0
z0 =
n
x 0
t0 =
s
n
82
6.1. PRUEBAS DE HIPOTESIS PARA
H0 : 0 esto quiere decir que la hipotesis afirma que la 0 dada es mayor que la de la
poblacion.
La hipotesis alterna es el complemento de la hipotesis nula H1 : < 0 .
1
Region
Region de
de aceptacion
rechazo
punto crtico
x 0
z0 =
n
H0 no se rechaza si z0 > z
H0 se rechaza si z0 < z
El estadstico en caso de que no conozcamos es:
x 0
t0 =
s
n
H0 no se rechaza si t0 > t
H0 se rechaza si t0 < t
H0 : 0 esto quiere decir que la hipotesis afirma que la 0 dada es menor que la de la
poblacion.
La hipotesis alterna es el complemento de la hipotesis nula H1 : > 0 .
83
6.1. PRUEBAS DE HIPOTESIS PARA
1
Region
de Region
aceptacion de
rechazo
punto crtico punto crtico
x 0
z0 =
n
H0 no se rechaza si z0 < z
H0 se rechaza si z0 > z
El estadstico en caso de que no conozcamos es:
x 0
t0 =
s
n
H0 no se rechaza si t0 < t
H0 se rechaza si t0 > t
Ejemplo 6.1.1
Los sistemas de expulsion de la tripulacion de un avion son impulsados por una carga propulsora
solida. La rapidez de combustion de esta carga propulsora es una caracterstica importante del
producto. Las especificaciones requieren que la rapidez de combustion media debe ser 50cm/s. Se
sabe que la desviacion estandar de la rapidez de combustion es = 2cm/s. El analista decide
especificar una probabilidad del error tipo I o nivel de significacion de = 0.05. Selecciona una
muestra aleatoria de n = 25 y obtiene un promedio muestral de la rapidez de combustion de
x = 51.3cm/s. Considera como H0 : = 50. Cual es tu conclusion?
84
6.1. PRUEBAS DE HIPOTESIS PARA
=2
H0 : = 50 /2 = 0.025 x 0 51.3 50
z0 = = = 3.25
H1 : 6= 50 n = 25 2
n 25
x = 51.3
Por otro lado z0.025 = 1.96. Ahora como tenemos que z/2 < z0 entonces la hipotesis se rechaza.
Conclusion: Rechazamos la hipotesis de que = 50 con un nivel de significacion de 0.05.
Ejemplo 6.1.2
Ejercicio 6.1.1. Un vicepresidente de una gran empresa afirma que el numero de llamadas
solicitando servicio al equipo que vende su empresa no es mas de 15 por semana, en promedio.
Para comprobar su afirmacion, se revisaron los registros de servicio para 36 semanas seleccio-
nadas al azar, y el resultado fue que x = 17 y la varianza muestral de 19 para los datos de las
muestras. Contradice la evidencia de la muestra la afirmacion del vicepresidente al nivel de
significacion de 5
Ejercicio 6.1.2. La tension de salida de determinado circuito electrico debe ser 130, de acuerdo
con las especificaciones. Una muestra de 40 mediciones independientes de la tension de este
circuito dio un promedio de x = 128.6 y una desviacion estandar muestral de 2.1. Se quieren
hacer las dos pruebas siguientes con un nivel de significacion
85
6.2. PRUEBAS DE HIPOTESIS PARA Y 2
Ejemplo 6.1.3
Un artculo de la revista Materials Engineering (Vol. II, No. 4, pp. 275-281) describe los resultados
de las pruebas por traccion para la adhesion en 22 muestras de la aleacion U-700. Las cargas en
que fallaron las muestras (en MPa) son las siguientes: 19.8 18.5 17.6 16.7 15.8 15.4 14.1 13.6 11.9
11.4 11.4 8.8 7.5 15.4 15.4 19.5 14.9 12.7 11.9 11.4 10.1 7.9
La media muestral 13.71 es y la desviacion estandar resulta 3.55 Los datos sugieren que la carga
para la falla media excede 10? Supon que la carga para la falla tiene una distribucion normal, y usa
= 0.05.
n = 22
H0 : > 10 x = 13.71 x 13.71 10
SOLUCION: t0 = = = 4.901
H1 : 10 s = 3.55 s 3.55
n 12
= 0.05
Tenemos que t0.05 = 1.721 con 21 grados de libertad.
Como t0 > t no se rechaza.
Conclusion: No se rechaza la hipotesis de que la media exceda 10.
Ejercicio 6.1.3. Los anchos de las ventanas de contacto de determinados chips para circuito
integrado tienen especificacion de diseno de 3.5m. (Vease los detalles en M. S. Phadke et.
al., The Bell System Technical Journal, 62, No. 5. 1983, paginas 1273 a 1309.) Los anchos de
ventana despues del ataque qumico en los especmenes de prueba fueron como sigue: 3.21, 2.49,
2.94, 4.38, 4.02, 3.82, 3.30, 2.85, 3.34, 3.91. Se podra rechazar la hipotesis de que se cumple
con la especificacion en el nivel de significacion del 5 %?
86
6.2. PRUEBAS DE HIPOTESIS PARA Y 2
H0 : 2 02
2 > 20 Si 2/2 < 20 1
H1 : 2 > 02
H0 : 2 02
21 < 20 Si 21 > 20 1
H1 : 2 < 02
Ejemplo 6.2.1
Una determinada compana que produce una parte maquinada para un motor, afirma que tiene una
varianza de diametro no mayor que 0.0002 pulgadas. Una muestra aleatoria de 10 de dichas partes
dio una varianza muestral s2 = 0.0003. Hay evidencia para refutar lo que afirma el proveedor
usando = 0.05 ?
n = 10
H0 : 2 0.0002 (n 1)s2 9(0.0003)
SOLUCION: s2 = 0.0003 20 = 2
= = 13.5
H1 : 2 > 0.0002 0.0002
= 0.05
Como 20.05 = 16.92 y 2 > 20 . No se rechaza la hipotesis de que 2 0.0002
Ejercicio 6.2.1. La variacion en la anchura de la ventana de los chips para circuito integrado
se deben controlar estrechamente si se desea que los circuitos funcionen en forma correcta.
Suponer que las especificaciones establecen que 2 = 0.30 para los anchos de ventana. Se
podra rechazar la afirmacion de que se cumple con dicha especificacion si se usan los datos del
ejercicio anterior n = 10 y s2 = 0.3166? Utilizar
Ejemplo 6.2.2
Para una muestra aleatoria simple de adultos, las puntuaciones de CI se distribuyen normalmente, con
una media de 100 y una desviacion estandar de 15. Una muestra aleatoria simple de 13 profesores de
estadstica produce una desviacion estandar s = 7.5. Un psicologo afirma que la desviacion estandar
de los profesores es menor o igual a la de los adultos. Tienes elementos para rechazar esta hipotesis
usando un nivel de significacion de = 0.05. ?
87
6.2. PRUEBAS DE HIPOTESIS PARA Y 2
n = 13
H0 : 2 225 2 2 (n 1)s2 12(51.84)
SOLUCION: 2
s = 51.84 0 = 2
= = 2.7648.
H1 : > 225 225
= 0.05
2 2 2
Como 0.05 = 21.03 y > 0 . No se rechaza la hipotesis de que < 15.
Ejercicio 6.2.2. Utilice un nivel de significancia de 0.05 para probar la aseveracion de que las
estaturas de mujeres supermodelos varan menos que las estaturas de las mujeres en general.
La desviacion estandar de las estaturas de la poblacion de mujeres es de 2.5 pulgadas. A con-
tinuacion se listan las estaturas (en pulgadas) de supermodelos seleccionadas al azar (Taylor,
Evangelista, Auermann, Schiffer, MacPherson, Turlington, Hall, Crawford, Herzigova, Banks,
Moss, Hume). 71 69.5 70.5 71 72 70 70 69 69.5 69 70 66.5
88
Indice alfabetico
Bayes Distribucion continua
Teorema de, 33 uniforme, 60
Bernoulli Distribucion de probabilidad, 36
Distribucion, 45
Error de tipo I, 78
Binomial
Error de tipo II, 78
distribucion, 45
Espacio muestral, 14
experimento, 46
Esperanza, 40
Cardinalidad Estadstica
propiedades, 25 descriptiva, 1
cardinalidad, 21 inferencial, 1
clases, 3 Estandarizacion, 67
Combinacion, 19 Estimaciones, 69
conjuntos Estimador, 71
propiedades, 25 error, 72
insesgado, 71
Datos
Evento
agrupados, 1
interseccion de, 22
agrupamiento de, 1
Eventos
no agrupados, 1
ajenos, 22
Datos agrupados, 9
complemento, 23
Desviacion estandar
definicion, 20
datos agrupados, 13
independientes, 30
poblacional, 11
union, 21
variable aleatoria discreta, 40
experimento, 14
Diagrama de tallo y hoja, 6
Exponencial
Distribucion
distribucion, 61
Bernoulli, 45
Binomial, 45 Factorial, 17
exponencial, 61 Frecuencia, 3
Geometrica, 48 acumulada, 3
normal, 63 relativa, 3
Poisson, 50 Funcion de distribucion, 57
uniforme, 43 Funcion de distribucion acumulada
89
INDICE ALFABETICO
propiedades, 39 Poblacion, 7
funcion de distribucion acumulada, 39 Poisson
funcion de masa de probabilidad, 39 distribucion, 50
Principio de multiplicacion, 16
Geometrica
Probabilidad
distribucion, 48
condicional, 28
Grafica
funcion, 25
pastel, 5
propiedades, 27
Graficos, 5
total, 31
histograma, 5 Pruebas de hipotesis, 78
para cola derecha, 80
Intervalo de clase, 3 para de cola izquierda, 80
Intervalos de confianza, 73 para de dos colas, 79
con desconocida, 75 Punto medio, 4
2
para , 76
Regla de multiplicacion, 29
Lmite Central
Teorema
teorema de, 69
del Lmite Central, 69
Media aritmetica Teorema de Bayes, 33
datos no agrupados, 7
Uniforme
Media muestral
distribucion, 43
datos no agrupados, 7
distribucion continua, 60
Mediana
datos agrupados, 10 Variable aleatoria
Datos no agrupados, 7 continua, 35
Medidas de dispersion, 11 definicion, 35
Medidas de tendencia central, 6 discreta, 35
Medua Variable aleatoria continua
datos agrupados, 9 definicion, 56
Moda propiedades, 56
datos agrupados, 10 Varianza, 11
datos no agrupados, 8 datos agrupados, 13
Muestra, 7 poblacional, 11
variable aleatoria discreta, 40
Normal
distribucion, 63
Permutacion, 18
90