Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
5
Elementos de
Estadistica para Preparación y
Evaluación de Proyectos
9,10 E 1/2,
O •••-•
V eIt YR: A
171 F raeha
„ mt.:1 •
Tqflí fe rri-!) ; • C;
od7
REGISTRO No.
r
7
Primera Edición, 1974
Segunda Edición Revisada, 1977
Tercera Edición Corregida, 1990
Prohibida la Reproducción
. Total o Parcial
PROLOGO
La Paz - Bolivia
1974
PROLOGO
A LA TERCERA EDICION
La Paz - Bolivia
Agosto, 1990
CONTENIDO
CAPITULO 1
1.1 Introducción
1
_1.2 Significación y Naturaleza de la Estadistica 2
1.3 Etapas de la Investigación Estadística-- 3
1.4 Población, Medidas Elementales y Observaciones - 5
1.5- Medidas de las Unidades Elementales-- 7
1.6 Distribución de Observaciones y Distribución''
de Frecuencias c-
8
1.7 Especificación de Parámetros de Decisión'. 9
El Agregado, la Proporción, la Media Aritméti-'
ca,-la Varianze y la Desviación Estándar 10
CAPITULO 2
DISTRIEUCION DE FRECUENCIAS
li
CAPITULO 3
CAPITULO 4
MEDIDAS DE DISPERSION
53
4.1 Recorrido 54
4.2 Desviación Media
4.3 Desviación Estándar y Varianza 56
62
4.4 Dispersión Relativa(
65
4.5 Ejercicios
CAPITULO 5
TEORIA DE PROBABILIDADES
CAPITULO 6
CAPITULO 7
'MODELOS DE DISTRIBUCIONES
DE PROBABILIDADES
CAPITULO 8
MUESTREO Y DISTRIBUCIONES
EN EL MUESTREO
CAPITULO , 9\:
ESTIMACION DE PARAMETROS
CAPITULO 10
CAPITULO 11
MODELOS DE REGRESION
CAPITULO 12
NÚMEROS INDICES
APENDICES
1.1
Introducción
Así como los tres casos mencionados anteriormente, podemos citar miles
de ejemplos en los que está implícita la idea intuitiva de observaciones, me
didas y predicciones estadísticas. Como puede apreciarse, no se tratan de
hechos recientes, toda una vida seguramente se ha estado frente a razonamien
tos iguales, los mismos que forman parte de lo que nosotros actualmente lla-
mamos astadateca. No se trata de algo nuevo ni reciente, como la teoría de
la relatividad, la teoría de conjuntos o la gramática estructural. Quíén
nos dice si no se trata de una de las disciplinas más antíguas, puesto que
se tienen indicios de que en sociedades como la Egipcia, mucho antes de co-
nocer los jeroglíficos, tenían ya alguna forma de registro de datos estadís-
ticos; lo propio ocurre en nuestro continente con la civilización "Quechua",
que antes de conocer la escritura ya utilizaban los "Quipus" para coleccio-
nar informaciones relacionadas con la producción agrícola y otros.
a medida que vayamos estudiando cada uno de los capítulos del presente traba
jo.
1.2
Significación y Naturaleza
de la Estadística
1.3
Etapas de la Investigación
Estadística
Cuando los valores de una variable son arreglados en algún orden ascen-
dente o descendente, se forma una 4exa. Wad/Ataca. Una serie puede ser
contínua o discreta. Una atCe contfrua es una variable que puede tomar
cualquier valor numérico comprendido en un determinado recorrido. Es el ca-
so en que los valores sucesivos de la serie pueden diferir en cantidades in-
finitesimales. En otras palabras una serle continua es tal que la unidades
elementales pueden tomar valores divididos entre dos valores contiguos. Ejem
plos & series continuas, son las medidas de peso, estatura, tiempo, longitud.-
o temperaturas.
1.6
Distribución de Observaciones y
Distribución de Frecuencias
Así por ejemplo, cuando se miden las estaturas de 350 estudiantes y los
resultados son ordenados en una serie en orden ascendente, primero que todo
advertimos el AwonAído de la serie, que es la diferencia entre el mayor y.me
nor valor de la serie. Entonces podemos proceder a dividir el recorrido en un
número de partes o aloma, sobre la cual se distribuyen las informaciones.
Cada clase evidentemente tienen su propia frecuencia, ya que el numero de me
didas que caen en cada clase posiblemente diferirán de una clase a otra.
Una distribución de frecuencias puede presentarse en forma tabular, en una
tabla de diotnAlueídn de 19teeueneía4. Sin embargo también es importante co-
nocer la distribución de Ptecu.encias Aaatíva4, que no son otra cosa que la
proporción del total de unidades de una clase en relación al total de unida-
des observadas. En la tabla 1.1 se representan estos conceptos. En estudios
1.7
Especificación de parámetros
de Decisión
1.8
N
T xl + x2 + ...+ 35,1 = x. (1.1)
i=1
donde cada x. (i=1, 2,.., N) representa el valor individual de la iésima ob-
servación. 1Tomemos un ejemplo sencillo: Se trata de saber el ingreso to -
tal por mes de una familia en la que trabaja los padres y los tres hijos
mayores, sabiendo que:
el ingreso mensual del padre es = x2 1.200 $b.
el ingreso mensual de la madre es = x2 = 850 $b.
el ingreso mensual del ler. hijo es x3 = 1.250 $b.
el ingreso mensual del 2do. hijo es = x4 = 1.300 $b.
el ingreso mensual del 3er. hijo es = x5 = 750 $b.
Entonces el ingreso total de la familia es
5
T e: x. =x+x+x+x+ x
1 2 3 4 5
i=1
T= x + x + + x = 5--- x. (1.2)
1 2 n
i=1
A
= — (1.3)
N
entonces A = 90 y N = 150, y P = A = 90
150 = 0,60, 6 60%
- 12-
-' xl 4- x2 4- "' xN Ex
N (1.4)
N
La media aritmética a menudo es el parámetro clave para muchos proble-
mas estadísticos. Prácticamente se usará este concepto en todo el presente
trabajo, por su gran utilidad en la estadística inductiva. Este parámetro
de decisión se usa en muchísimos casos de problemas estadísticos; por ejem-
plo, cuando se desea saber el ingreso promedio de las personas no asalaria-
das, el tiempo promedio de duración de un cierto artículo, la producción pro
medio de artículos manufacturados, el consumo promedio de carne de pescados,
el promedio de personas que enferman de cáncer a los pulmones de una pobla-
ción con hábito de fumar, etc. Seguramente no hay una persona adulta, con o
sin preparación estadística, que no hable del concepto de promedio en alguna
actividad de su vida cotidiana.
Como esta medida cambia el valor original de las unidades elementales (al
ser elevados al cuadrado), una medida que se deduce directamente de la va-
rianza, es la desviación utandan, que es la raíz cuadrada de la varíanza,
o sea :
j E (xs. -A) 2
N
La desviación estándar 0-, es una de las medidas más importantes que sirve
como indicador de la variabilidad de una población; además, se verá que es
un parámetro de múltiples aplicaciones.
CAPITUL02
DISTRIBUCION DE FRECUENCIAS
Recordemos sin embargo, que a los datos se los necesita sólo cuando los
estados de la naturaleza son desconocidos. Por otro lado, los tipos de datos
que se requieren dependen sobre todo del problema de decisión a resolver. Así,
muchas veces inclusive es necesario recoger varias características simultánea.;
mente de cada elemento de la población, Cuando obtengamos un sólo valor de
las unidades elementales, llamaremos datos unívarcíantee, si obtenemos dos va-
lores, diremos datos bívartíantes; y en general, sí obtenemos dos o más valores,
diremos datos muitivaradmteá. En el presente cap£tulo, ilustraremos las dis
tribuciones de frecuencias y sus características, utilizando una sola varizlit
2.1
Construcción de Distribuciones
de Frecuencias
1 Fecha._ ...........
- 15-
47
Empezaremos por ver el caso más simple de las di trikucionek frecue:
cias. Partiremos de la siguiente información correspon e ,s califica.
ciones (redondeadas) obtenidas en una prueba por 50 alumnos, el la escala
del 10 al 70.
40 40 60 30 so 50 60 50 60 30
30 10 50 20 30 40 40 40 50 40
60 20 40 70 30 30 30 30 40 10
20 50 30 40 10 60 20 60 40 60
50 70 20 40 40 20 10 30 30 50
Registro o cómputo de
Calificación las repeticiones de Frecuencias
X los valores distintos Absolutas
que toma la variable n. = f
1
xl = 10 //// n = 4
x la 20 ///// / n
1
x
2
= 30 ///// ///// / 2 = 6
n = 11
x3 = 40 ///// ///// // n3 12
4 4
x = 50 ///// /// n = 8
x5 5
= 60 ///// // n = 7
x6 = 70 - // n6 = 2
7 7
En la Tabla 2.1 vemos que hay varios x. iguales. Sin embargo, en la Ta-
bla 2.2, en la primera columna aparecen tah sólo siete valores para los x.;
esto se debe a que se han clasificado a las x., sólo en los distintos vilóres
que ella toma, ya que en la columna de las frécuencias absolutas aparecen el
número de veces que se repite un valor x. particular. Algunos autores, usan
otra letra para designar a los diatinto41valores que toma la variable X, por
ejemplo, la letra Y; de manera que en este caso tendríamos y l, y2, ..., y7
- 16-
Para la notación de las frtecuencia.4 abeclutta, usaremos n., que nos indi
cara: el número de veces que aparece repetido un valor x.; detesta manera, en
nuestro ejemplo, n4 s. 12 significa que se han encontrado112 alumnos con una
calificación de 40. En la columna central de la Tabla 2.2 se lleva la cuenta
mediante rayas, las que son marcadas a medida que aparece un valor x.(De la
misma manera que se hace un recuento de votos, en una elección cualcitiera).
Esto es lo que se llama también computacíón de la información original, que
de acuerdo al 'volumen de los datos puede realizarse en forma manual o mecáni-
ca.
Por otro lado, podemos representar graficamente una distribución de fre-
cuencias absolutas, como se ve en la Figura 2.1
n.
1
Número de
alumnos
10
, x. calificacio-
10 20 30 40 50 60 70 nes.
50
r---.
20
;
10
;
mi calificaciones
10 20 30 40 50 60 70
Figura 2.2 Gráfico acumulativo de las calificaciones obte-
nidas por 50 alumnos en una prueba de evaluación
TABLA 2.3
Acumulación
Calificaciones Frecuencia de las Fre- Frecuen- Acumulación de
Absoluta cuencias cia las Frecuencias
," Absolutas 1
/1.
10 4 4 0,08
20 0,08
6 10 0,12 0,20
30 11 21 0,22
40 0,42
12 33 0,24 0,66
50 8 41 0,16
60 0,82
7 48 0,14 0,96
710 2 50 0,04 1
1
'5'dc
xl ni hl nlin = ni H1 = hi
x2 n2 h2 = n2/n 272 = nl+n2 E2 hl+h2
x3 n3 h3 = n3/n 273 = ni+n2+n3 H3 = hi+h2+h3
2.2
Propiedades y Relaciones
de las Frecuencias
Ni =-Y:: ni ,=
11 hi
i=1 i=1
- 19 -
También
Nm = n Hm = 1
Finalmente,
n1 N1 1 N2 Nm = n
hi = Hl 1 H2 1 ... 1 Hm = 1
2.3
•
°(:1 . 405 '300 / 330 7 -295 /
3.290 / 420 9305 320 • 365
360 370 405 330 --- 375
355 355 400 335 ,' 380
375 .305/ 380 355 390 „
410 420 375 370 1.300'7
400 390 385 385 315
390,/ 385 .395 380 340
q5310 380 360 370 365
.0290/ 320 375
360 j:10 3
:(-------455-1— 330 385 /
370 350 '110 315' 330 /
420 400 325 -/ 380 315 .7".
e 285 380 335 -' 345 320
370 370 410 360 • 340
390 350 390 345 350
415 345 360 340 345
345 430 .310 395 365
350 415 325 . 375 355 ,
410 380 320 395 335
k= 1 + 3,3 log n
donde
k = nGtero aproxitado de clases
n = número total de observaciones en la muestra
log = logaritmo de base 10
Vs - VI 430 - 280
e - - 18,5 ( 181i5
k 8
donde VS es el valor superior y V/ el valor inferior, que toman las observa
ciones. Luego, el primer intervalo de clase será de '280 a 298,5; el segun-
do de 298,5 a 317; y así sucesivamente.
LI + Ls 280 + 298,5
2 2 - 289,25
c = 430 - 280
-15
10
De modo que el primer intervalo ;será de 280 a 295, y el punto medio 287,5.
De manera que la talla de distribuci6n de frecuencias de datos agrupados
para nuestro ejemplo será:
Para calcular algunas medidas de los datos observados, los puntos medios
de clase equivalen a los x.. Este concepto se usará bastante en el proximo
capitulo.
De Tabla 2.6 pueden obtenerse muchas informaciones respecto de los va-
lores observados de la población; como por ejemplo, el número y porcentaje de
los obreros que ganan entre 340 y 355 $, el porcentaje de obreros con ingreso
inferior a 370 $, etc.
Hay una observación importante que debe hacerse cuando se confecciona
una distribución de frecuencias por intervalos de clase para una serie conti
nua. En nuestro ejemplo el limite superior de un intervalo, coincide con el
límite inferior del intervalo inmediato que sigue, lo cual da lugar a la si-
guiente pregunta: Si un obrero gana, digamos 295 $, será incluido en el pri
mer intervalo o en el segundo?. Nosotros convencionalmente lo incluiremos en
el intervalo inmediato superior. Algunos autores para salvar este tipo de di
ficultad trivial, clasifican los intervalos, de la siguiente manera:
Intervalo de Clase
280 a 294,99
295 a 309,99
310 a
Como puede apreciarse, con la salvedad del caso, podemos evitar el uso
de números como 294,99, etc.
2.4
-w 1c, salarios en $
280 295 310 325 340 355 370 385 400 415 430 -
n.
Número
de
obreros
x. salarios en
280 295 310 325 340 355 370 385 400 415 430
2.5
Ejercicios
1 1 4 .3 0,08
2 4 9 MI
3 g 16 0,16
14 7 23 0,14
5 5 28 040. 1
6 /e 38 1. 2 O',"
7 7 45 0,14
8 5 U. ' 0' -
511
al. Tome 15 monedas y después de mezclarlas, eche sobre una superficie pla
na y anote el número de caras resultantes. Repita este experimento
100 veces y construya con los resultados una distribución de frecuen -
cies.
12. Cuarenta familias escogidas al azar, que viven en un campamento minero,
incluían los siguientes números de miembros por familia:
6,4, 5, 4, 4, 3, 5, 3, 6, 5, 4, 5, 5, 6, 3, 4, 3, 2, 6, 3,
4, 3, 9, 3, 5, 3, 2, 4, 5, 3, 5,3, 5, 3, 11, 3, 4, 4, 3, 5.
12.1 Hacer un histograma de frecuencias, que muestre las frecuencias de
las familias según el número de miembros.
CAPITUL03
3.1
Tipos de Promedio
-29-
3.2
Media Aritmética
3+4+5+4+6+5+4+6+7+3 47 4 7
10 10 . 1'
m
1:: xi ni
(x) 7 . 1=1
M n
Número de
Calificación alumnos Frecuencia
X ni hi
x1 = 3 nl ' 2 hl = 0,20
n2 = 3 h2 = 0,30
x2 = 4 n3 = 2 h3 = 0,20
x3 = 5
=6 = 2 = 0,20
x5 2 7 n5 = 1 h5 = 0,10
10 1
E
Entonces, la media aritmética es
ni x/ n1 + x2n2+...+ x5 n5
M (X) = i= 1=110 10
3 x 2+4 x 3+5 x 2+6 x 2+7 x 1
10
= 6+12+10+12+7 = 47 _ 4 7
10 10
- 31 -
= 3(0,2)+4(0,3)+5(0,2)+6(0,2)+7(0,1)
0,6+1,2+1,0+1,2+0,7 = 4,7
3.3
Como x = x = nx (3.5)
Por ejemplo, si se sabe que en promedio un vendedor de loterías gana u-
na comisión de 35 $ diarios, entonces, el distribuidor de billetes de lote
rías,' pagará a sus 120 vendedores, 35 x 120 = 4.200 $
d = X) = o (3.7)
i=1 i=1
-33-
y para datos agrupados
m m
2:: di ni = (xi - 17) ni = O
i=1 i=1
Se demuestran fácilmente aplicando las propiedades de snmatorias, por ejem-
plo para (3.7), se tiene
Observaciones Desvíos
ni
xi (xi -
3 4:# 2 - 1,7
14 3 - 0,7
5 2 0,3
6 2 1,3
7. 1 2,3
Ejemplo 3.5 La media de los salarios en una fábrica A que cuenta con
125 obreros es 875 $; y la media de los salarios de otra
fábrica similar 3, que tiene 53 obreros es 1.050 $. Cuál es el salario pro
medio de los trabajadores de ambas fábricas?. La solución es sencilla. Te
mando la relación (3.12) se tiene
3.4
Media Geométrica
DEFINICION 3.2 La medía geométnica se define como la raíz enésima del pro-
ducto de los n valores ob'servados, o sea,
G (X) = '
12
,7x1 .1(2 xn = TT xi (3.13)
n
i=1
- 35 -
cuando los datos no están agrupados.
G (X) = n.
xi 1 (3.14)
i=1
m
log C (X) =
n >
i.1 n. log
lo xi (3.16)
que sirven para calcular la media geométrica para datos sin agrupar y para
datos agrupados, respectivamente.
xi n. logxi ni log x.
3 2 0,47712 0,95424
4 3 0,60206 1,80618
5 2 0,69897 1,39794
6 2 0,77815 1,55630
7 1 0,84510 0,84510
10 6,55976
1920 100.000
1930 115.000 1,150 0,06070
1940 140.000 1,217 0,08529
1950 175.000 1.250 0,09691
1960 215.000 1.229 0,08955
1970 250.000 1,163 0,06558
Total • 0,39803
I:log x 0,39803 = 0,0796
Luego log G lX2 = n 5
de donde
G (X) = 1,201, o sea alrededor de 20,1% por década,
La razón promedio de crecimiento de la población para la última década
es
lag G (x) Max. 0,06558 . 0,
006558
10
Po = Po (1 + r)n
donde r es la razón de cambio.
-37-
3.5
Media Armónica
DEflNICION 3.3 La medía arunióníca de una serie de valores xl, x,..., xn,
se define como el recíproco de la media aritmética de los
recíprocos de los valores observados. Así, para datos sin agrupar, se tie
ne
( x) = 1 _ 1 _ n
1/xl + 1/x2 +...+ 1/xn n (3.17)
2::1/xi
i=1
:i (X) 1
I: 1 n E n2. ix (3.18)
1=1 xi 1 1=1
H (X) = 10
2 +3— 2 10 - 4 36
— + +2— 1
+ —2 293
1
3 4 5 6 7
TABLA 3.5
Trabajador Tiempo de
Producción
3.6
Media Cuadrática
x?
M (E .1=1 1
c (3.20)
y para datos agrupados
Me 00
( 3.2 1)
M = 9 x 2 + 16 x 3 + 25 x 2 + 36 x 2 +49 x 1
c 10 = 4,87
La aplicación de la medía cuadrática se verá en el proximo capítulo,
cuando estemos tratando los cálculos de las medidas de variación.
3.7
Mediana
mente que no serán las poblaciones extremas, como PI o P7. Recordando que
la SUMA de los desvíos absolutos respecto de la mediana es un mínimo, es fá
cil decidir que el frigorífico será localizado en la poblción P4 (o en su
vecindad). La mediana es 94 kilómetros, ya que el camino total a recorrer-
se hasta este punto de las otras poblaciones es de 292 Km. Si se localiza,
el frigorífico en cualquier otro punto, la suma de las distancias será mayor.
Por ejemplo, para la población P3, la suma es 314 Km. La siguiente Tabla
nos muestra dichos cómputos:
P1 10 62 84
P2 42 30 52
P3 72 0 22
P4 94 22 0
P5 130 58 36
P6 136 64 42
P7 150 78 56
Ni
Nj
n/2
1j-1
X
xj_1
Figura 3.1 Localización de la mediana para una distri-
bución de frecuencias como el de las Tablas
2.3 y 2.4
Entonces, para calcular la mediana se debe determinar previamente n, y
2
luego ver si éste valor es menor o igual que una j-ésima frecuencia acumula
da, y luego seguir la regla (3.22)
Ejemplo 3.12 Utilicemos la información de la Tabla 2.3, que es:
TABLA. 3.7
Frecuencias Frecuencias
Calificación Absolutas Absolutas
X ni Acumuladas
10 4 4
20 6 10
30 11 21, - -- ?S
.40 12 33
50 8 41
60 7 48
70 2 50
en consecuencia, Me = 40
-43-
b) Si -11
2 = Ni_1==>Me = x.
Ni
n/2
X
x Me x.
j-1
C.
3
Figura 3.2 Localización de la mediana cuando se tiene una varia-
ble continua o una distribución con intervalos de cla
se.
Vemos que la mediana será
Me = x. +d
j-1
El cálculo de d, es como sigue:
N1 N. n
1 j-1 _ 2 i-1
c.
3
de donde n
d =
- -1
cj N. - N. ,
J J-1
TABLA 3.8
260 - 295 4 4
295 - 310 5 9
310 - 325 10 19
325 - 340 9 28
340 - 355 Y. 13 41
15 56 Clase mediana
1755
...., - 370 ,,
3.8
3.9
Moda
Cuando hay dos modas, se dice bímodal, y en el caso de existir más de dos
se conoce con el nombre de mita:SU.
Si se tienen datos agrupados, tal que los valores de la clase son únicos,en-
tonces la moda, es obvio que sea la que tiene mayor frecuencia, así en el
ejemplo 3.2, la moda es 4.
Cuando se Cene una distribución de frecuencias con intervalos de clase,
la moda se determina por interpolación, es decir
di
mo = xj -1 (d, d2 c (3.24)
Clase
Modal
/ 32
xj_i u o xj xd
xj = 370
= 18 - 15 = 3
= 18 - 12 = 6
e = 15
Mo = 370 +
3+6 . 15 = 375 $
3.10
Es
importante notar que la moda obtenida por este método aproximado,
no necesariamente coincide con la moda calculada mediante la interpolación.
-48-
Media
Mediana
Moda
Moda t r Media
Mediana
Ejercicios
3.1 La media aritmética debe coincidir con algunos valores que toma
la variable, si ésta es discreta.
3.2 El promedio de las notas de un curso fué de 58. Las mujeres ob-
tuvieron un promedio de 38y los hombres un promedio de 64. Lue
go, el curso tiene más de 90 alumnos.
= 25 ; t = 30
2- 2
b)m = 5 ; 2 Xi ni = 400 ; X = 5 ; h5 = 0,1
i=1
H3 = 0,5 ; n4 = 8
4.En una oficina de empleados públicos hay 35 hombres con una edad me-
dia de 27,5 años y 15 mujeres las que, en promedio, son un 22% más
jóvenes. Cuál es la edad media de los empleados?
5.Un auto sube a La Cumbre a 30 Kms por hora y baja a 60 Kms por hora.
Cuál es la velocidad media?
CAPITULO 4
MEDIDAS DE DISPERSION
4.1
Recorrido
luego el recorrido es
Esta medida no está afectada por los valores comprendidos entre el valor
más alto y más bajo, por tanto, el recorrido no es un estimador muy relevan-
te.
4.2
Desviación Media
3 - 1,7 1,7
4 - 0,7 0,7
5 0,3 0,3
4 - 0,7 ' 0,7
6 1,3 1,3
5 0,3 0,3
4 - 0,7 0,7
6 1,3 1,3
7 2,3 2,3
3 - 1,7 1,7
E 0 11
DM =
E Id I 11
- 1,1
10
Desde el punto de vista práctico, puede obviarse la segunda columna.
Ejemplo 4.3 Sea ahora la información del Ejemplo 3.2 y la Tabla 3.2
Xi ni Vil ni
3 2 1,7 3,4
4 3 0,7 2,1
5 2 0,3 0,6
6 2 1,3 2,6
7 1 2,3 2,3
E 10 11
Luego, Dm = Diluí - 11 = 1
- 4,1
10
Como se ha visto, la DM considera a todos los valores observados para su
cálculo, por lo tanto, da una mejor descripción de La dispersión. De manera
que nos mide la dispersión alrededor del valor promedio. Sin embargo, esta
medida es un poco débil puesto que se ignora el signo positivo o negativo de
las desviaciones.
-56-
Una medida más fina o más adecuada de la dispersión, es la que recibe el
nombre de daviacían U-tanda/t.
4.3
-2
21:(xi - x) ni
s
-2
xi d.=x.-x¿=(x.-x)
2.
3 - 1,7 2,89
4-- - 0,7 0,49
5 0,3 0,09
4 - 0,7 0,49
6 1,3 1,69
5' 0,3 0,09
4 - 0,7 0,49
6- 1,3 1,69
7 2,3 5,29
3 - 1,7 2,89
n 0 16,10
De manera que 16 1
V(x) - M (d2) --I— 1,61
10
y la desviación estándar será
.1767 = 1,2689
xi ni d d2=( xi-x) 2 ni
kxrx).
5:: 10 16,1
8 =.5703
,171 = 1,2689
Y
- 59 -
Derostracióc: V (X + K) • M {[(X + K) - M (X + K)] 2}
▪ - 271::x1 n (1)2
2 _ — 2 r 2 .7,42
- 2x x + (x) -
▪ M (x2) - (M (X)) 2
Ejemplo 4.6 La siguiente Tabla nos muestra ejemplos prácticos para ac-
tas últimas tres propiedades.
TABLA 4.5 Cálculos para la propiedad (4.11) aplicados a los teoremas
4.3 y 4.4
Valor
X X2 X + 5 (X + 5)2 3X (3X)2
1 1 6 36 3 9
2 4 7 49 6 36
4 16 9 81 12 144
5 25• 10 100 15 225
E 12 46 32 266 36 414
M(X2) = X
46 = 11,5 M (x4.92 = 266 = 66'5 m (3X)2 w111. .103,5
'
Nota: Eh el caso de tener datos agrupados, los cálculos son idefiticos, te-
niendo únicamente cuidado no olvidar de multiplicar los valores por
sus frecuencias '(n-
1)•
' Ejemplo 4.7 Calculemos las varianzas para los Ejemplos 4.4 y 4.5, apli-
cando la propiedad 4.11.
3 9 3 2 9 18
4 16 4 3 16 48
5 25 5 2 25 50
4 16 6 2 36 72
6 36 7 1 49 49
5 25
4 i6 E 10 237
6 36
7 49
3 9
E 147 237
- 61 -
Entonces pare la primera Tabla (datos sin agrupar), tenemos
V(X) = 237
- - (4,7)2 = 1,61
10
y para la segunda
V(X) = glI - ( 4,7)2 = 1,61
10
E emmlo 4.8 Los salarios percibidos por un grupo de 25 empleados en
dos empresas privadas se da en la siguiente Tabla.
E 25 12156,25 25 12906,25
-2 = 12.9c.6,25
S2
25 _ 445,21 = 516,25 - 445,21 = 7144
4.4
Dispersión Relativa
(4 .14)
Vale la pena mencionar algunos otros tipos de medidas, pero que no son
de dispersión propiamente dicha. Así por ejemplo, tenemos el esegteZente
de asiMetta (cAs)
CAs - M (X)
3 - Eb (4.16)
que nos mide el grado de asimetría. Pb general se presentan los tres casos
de la Figura 4.1.
Mo
CAse O
M No
o
CAs <o C Ao > O
Figura 4.1 Ejemplos de asimetría: El primer caso muestra sim
tría perfecta. El segundo caso se dice que tiene
asimetría negativa; y el tercer caso indica asimet
positiva.
nC
Si C < 3 indica apuntamiento hacia abajo
Ap
>3
Ap
Ap = 3
Ejercicios
x2_,• 50 ; nl = 4 ; N2 = 20 ; n3 = 25 y SZ - 62
1 1 i /1 1-1
2 6 ,..1 é
3 7 21 ri
4 Lly O
5 I -1
'59
8.2 DM= 47 ; S = 38 ; n = 17
8.3 M (x2) = 300 g = 74
8.4 Elxi - 41 - 3.000; n • 15 ; DM • 220 ; S = 210
9.Determine si las siguientes afirmaciones son correctas:
9.1 Si todos los valores de la variable de una distribución, cuya
desviación estándar es 30, se aumentan en 30%, la nueva varien-
za es 1521.
9.2 Si los ingresos de la población activa en Bolivia se expresan
en dólares, la varianza entes de la devaluación ea mayor que
después de ella.
9.3 Si cierta distribución tiene una varianza igual a 144 y otra
una desviación estándar igual a 11,5 puede afirmarse que la pri
mera tiene mayor dispersión.
Y =
x-
Sx
Demostrar que la media y la varianza de Y son iguales a cero y a
uno, respectivamente.
11. Determinar el coeficiente de asimetría y el coeficiente de apunta -
miento para los ejercicios 8 y 12 propuestos en el Capítulo 2.
- 67 -
CAPITULO 5
TEORIA DE PROBABILIDADES
5.1
Noción de Conjunto
La noción de conjunto es, tal vez, una de las más difíciles de explicar
y comprender de todas las matemáticas. Sin embargo, se puede decir también
que es lo más sencillo del mundo, ya que todos sabemos intuitivamente, que
se entiende per la palabra conjunto. Así, cuando decimos que un conjunto de
palabras forma una oración, que un conjunto dé cabellos de un hombre consti-
tuye su cabellera o que una máquina está formada por un conjunto de piezas ,
etc., son expresiones que no ofrecen dificultad alguna de comprensión para
nadie. Es precisamente esta noción intuitiva que aprovechó la matemática mo
derna para establecer una de las teorías más generales y fecundas de gran a-
plicación en las probabilidades y en la estadística, que es la teokta de los
conjuntos.
Una definición simple de conjunto será entonces:
DEFINIC/ON 5.1 Conjunto es la reunión (o colección) de objetos bien de-
terminados y capaces de diferenciarse unos de otros.
A= {a, b, c, d}
= {1, 2, 3, 4, 5}
C = : x = 1, 2, .., 100}
No todo conjunto puede ser descrito en forma extensiva, así por ejemplo,
un conjunto D cuyos elementos son todos los números reales comprendidos entre
0 y 1, sólo es posible expresarlo en forma comprensiva, o sea
D= {x : 0< x< 1)
a e A, 5e B, 57 c c, 1/4eD,
E = 10, 2, 4, 6, 8, ...
A 1 B.
Notamos cue el orden del listado de elementos de un conjunto no tiene
importancia, así
A = {1, 2, a, 3} y B = la, 3, 1, 2)
E = {1, 2, 2, 1, 3, 1} y F = (1, 2, 3}
A = 11, 2, 3, 4.
; , B = (1, 2, 4) y C = (1) ,
(
AC B
Figura 5.1
A-A VA
A CA VA
- 72-
El símbolo (Y), indica "para todo" 6 "cualquiera que sea"
Un conjunto que contiene todos los elementos de un cierzo tipo, que sir
ven de base para una discusión particular, recibe el nombre de conjunto ung
~Zeit (llamado también conjunto 4undamental). A este conjunto lo designare
mos con la letra omega mayúscula n , y a sus elementos con omega minúscula
, de manera que &men. Así por ejemplo, si se está discutiendo la pro -
ducciót de zapatos, el conjunto universal estará compuesto de todos los zapa
tos producidos por las distintas zapaterías de cierta localidad.
Por otro lado, un conjunto que no tiene elemento alguno, se llama COn -
junto vagto ( o también conjunto nato), y se lo representa con la notación é,
o sea O í
A continuación estudiaremos un poco del étgebna de conjuntoá (llamadas
también operaciónesbooleanas). Al igual que en el álgebra de los números re
alee que está relacionada con operaciones realizadas con números y sus cunee
cuenciae, el álgebra de conjuntos está relacionada con conjuntos y sus impli
°aciones-a
AU B
Figura 5.2
En relación a la unión, se tienen las siguientes propiedades lógicas:
AU9inA
AUAnA
A V E- E, si ACE
Veamos el siguiente ejemplo que nos aclarará la operación de unión:
- 73 -
(A U 13) UCLUCE U C)
Ana- {x : x€A,xEB}
tr
Af113
A
Figura 5.3
En este caso, se tienen las siguientes propiedades lógicas:
Arld d
A (1A • A
A ()E = A, si ACE
A U (B E) A fl 1.1C)
Figura 5.4
Figura 5.5
Por ejemplo; sin = (a, b, c, d, e, f, g) , y A = (b, d, g), entonces
Ac = (a, c, e, f) . -Si el conjunto universal') comprende todos los números
naturales y A el conjunto de los números pares, entonces Ac es el conjunto
de todoi los números impares.
Un subconjunto y su complementario tienen las siguientes propiedades
lógicas:
Si A = ti entonces Ac = d
Si B = Ac, entonces A = EP .(Ac)c
-75-
c
A l/A e n
A (lAc
AU0 = A
An# fi
De la definición de subconjunto, podemos admitir que licA para todo A,
ya que cada elemento perteneciente a % (ninguno) también pertenece a A. De
safortunadamente, el conjunto vacío # no se puede ilustrar en un diagrama.
Simbólicamente se tiene:
= {x : x€A, x4 B)
y graficamente
A \ B
Figura 5.6
También
A \B = AilBe
A\ B # BNA (excepto si A B)
En efecto,
A•.B ANAnB
B's,A = BN.Ar111
de donde se desprende:
Si A si B ./L\B = E\ A =
Si AN.B=ly ENAlé~ACB
Si A C. B~A B = eS
(A \ V (B \ A)
Figura 5.7
DEFINICION 5.8
1) Cuando los conjuntos Al, A2,.., A son tales que su unión AlUA2 U
= fl, se dice que forman unatcubítímíentede
A
4
ReCubrimien:o de fl Partición de 11
Figura 5.8
- 77 -
•
Por ejemplo si (-1= (1, 2, 3, 4, 5, 6, 7, 8, 9), entonces, los conjuntos
A = {1, 2, 3, 4) , B =(3, 4, 5, 6, 7) , C ={4, 5, 6, 7, 8) y D = 19), for-
man un recubrimiento, mientras que los conjuntos A ={1, 2, 7} B = {3, 4, 5)
C ={8, 9) y D - {6} forman una partición. Las divisiones del territorio
boliviano en departamentos es una partición del suelo de Bolivia.
5.2
Operaciones Booleanas'
A cla of B,nA lt
conmutativa
A La B •JA
(Ans)(1C = Arl(anc)
asociativa
UB) C = A U (E UC) j
A rl A a A 1.
idempotencia
A UA = A f
•
• O
- 78 -
arl(BLAC) = (A/13)1./(At1C) Distributiva (de la intersección
con relación a la unión y de la
A u(8 nc) - (ata) n(Auc) ) unión con relación a la intersen
alón).
Ano a /
AUAc ca
Ano
AU$ * A
-1
Afin = A
AVfl
(Ac )c = A involución
(Amo° • act/Be I
teoremas de Margen
(A UB)c =AC ABO
Las leyes de Morgan en forma general se expresan
( Ai)c = !1 4
i=1 i=1
( (1 A C = („) Al
1=1 1=1
las demostraciones de todas las identidades anteriores., ae dejdlcomo
ejercicio.
, (2)}
{ s, (i) , (2) , (1,2)}
a. tal , ti)) , {a ;la )
son clases. Un conjunto que tiene como elenmntos todos los subcon-
juntos de B = (1,2,3), o sea
n(di) - 2n(A)
Por otro lado, se dice que un conjunto es enuntertabte cuando se puede "e-
numerar" sus elementos. Todo conjunto finito es enumerable, mientras que no
todo conjunto infinito se puede numerar, ast por ejemplo, el conjunto de los
números reales no es enumerable.
5.3.7
(1,2) O (1,2,3)
(4,5) O (5,4)
(1, 1, 3) 1 (3, 1, 1)
A x B ={(a, b) : a s A, be S1
A x B = {(1, 4), (1, 5), (2, 4), (2, 5), (3, 4), (3, 5))
C x C 1(0, 0)/
+
Si IR es el conjunto de número positivo, entonces IR+ x7R+ es el con
junto de puntos en el primer cuadrante del plano cartesiano.
c1={(xl, x2) : xl = 1, 2, 3; x2 = 2, 3, 4}
Dos conjuntos que son de íntergs para cualquier función, son: su domi-
nio de definición y su recorrido.
f(A) = O si le A
= 1 si 1 A
-83-
es una regla que puede ser usada para asociar un número con cada conjunto
A a . Entonces f se llama una función conjunto definida sobre a. En for-
ma similar,
g(A) ■
número de lementos de A, A E a
h(A) ■
cuadrado del número de elementos pertenecientes
a A, A 6a
son funciones conjunto definidas sobre a. En este caso, el dominio de defi
:Ación en cada caso es entonces:tia. El recorrido de f es el conjunto(0,1),-
... el recorrido de g es el conjunto{0, 1, 2, 3j, y el recorrido de h ea el con
junto (0, 1, 4, 9j.
Ejercicios 5.1
Calcular:
8.1 AU B 8.7 B tiC 8.13 AUBUC
8.2 A/1 B 8.8 B nC 8.14 Anca U C)
8.3 AU C 8.9 B U D 8.15 AU(B n
8.4 A nC 8.10 Bn D 8.16 Ananc
8.5 A U D 8.11 C U D 8.17 CUCA n D)
8.6 A AD 8.12 C D 8.18 (A U B) n (C U B)
5.4
Probabilidad
5.5
A = {2,4, 6)
D = {3,4, 5, 6)
C = 13}
D = {1, 2, 3, 4, 5)
En el ejemplo 5.4 cuyo espacio muestral era
C1=-1(i,j) : i = 1,2,..., 6; j =
los sucesos:
Al = {(5,6) , (6,5))
A2 = «1,6),(2,5),(3,4),(4,3),(5,2),(6,1))
A = {(1,6),(2,3),(3,2),(6,1))
A = {(1,1),(1,2),(2,1)}
4
Una pregunta casi inmediata, es: ¿cuántos sucesos hay en relación a un
experimento dado? La respuesta es inmediata: hay tantos sucesos como subcon
juntos sean posibles de formar a partir del espacio muestral. Así, en el ex
perimento del Ejemplo 5.1, hay 64 eventos o sucesos, incluyendo el caso en
que no ocurra uno de todos ellos. A este Último suceso se lo llama 4UCC40
iMp0441/e d. De la teoría de conjuntos, sabemos que el conjunto vacío í no
contiene elementos, entonces un conjunto que contenga al menos un elemento
del espacio muestral es un auceao pouIte, mientras que el conjunto que no
contiene ningún elemento de(1, se dice que es un suceso imposible, razón
por la que se lo simboliza por
- 91 -
5.6
Axiomas de Probabilidad
3) I E a.
Veamos ahora la definición de probabilidad.
DEFINICION 5.17 La probabilidad P es una Sanción que asigna a cada su
ceso A en aun número P(A), llamado p4obabítidad del
huce40 A, tal que cumple los siguientes axiomas:
2) Si A.Ea i=1,2,..
1 =* P(I)Ai) = c :P(Ai), y
i : (5.1) -
y A n A. = é Vi. 1 5 i=1
i
3) P ( II ) = 1
La probabilidad es entonces una medida aplicada a los sucesos que pue-
den ocurrir cuando se realiza un experimento. En otras palabras, la función
probabilidad es una función de conjunto real-valorada definida sobre la cla-
se de todos los subconjuntos del espacio muestral c).
Para cualquier experimento, el espacio muestrall)5 uega el papel del
conjunto universal; entonces cualquier suceso complemento (o suceso contra -
río), debe tomarse con respecto a O.
La función probabilidad que cumple los tres axiomas anteriores, se supo
ne válido para cualquier juego o experimento, tanto si los sucesos elemen-
tales son igualmente posibles o n6. Partiendo de esos axiomas, deduciremos
las siguientes propiedades importantes.
TEOREMA 5.6.1 P(é) = O para cualquier Q. (5.2)
rl
Ac
1n A2
Figura 5.6.1
Por el Axioma 2
P(A1 U A2) = P [A1 U (Al (1 A2 )) = P(A1) + P(A? n A2) (a)
(ya que los sucesos Al y Ac n A2, son incompatibles).
1
Por otro lado, (ver Figura 5.6.1),.
A2 = (A l fl A2 ) U (Ac (1 A2)
1 2
y por el Axioma 2,
P(Al n A2) ?
2nAc
1
Figura 5.6.2
pero P(A2((.111) 1 O
En consecuencia P(A2) P(Al) O
COROLARIO Para cualquier suceso A se tiene
P(A) 1 1 ( 5 .7)
Demostración: Como A<IS1 , entonces por el Teorema 5.6.4
P(A) 1 E(n )
Por el Axioma 3
p( n ) = 1, luego P(A) á 1
De este corolario y por el Axioma 1, concluimos que para cualquier su
ceso A, se tiene
O P(A) 1
De manera que la medida de un suceso está acotada entre O y 1.
TEOREMA 5.6.5 Para cualquier suceso peca , se tiene
P(Ac) = 1-P(A) y P(A) = 1-P(Ac) (5>13)
Vemos que
Luego,
A \ A = A (1 A
l 2 1 2 P(A \A ) = P(A1) - P(A
1 2 1
n A2) og
Figura 5.6.3
5.7
•En muchos experimentos es razonable suponer que cada suceso simple pue
de ocurrir igualmente que cualquier otro. Por ejemplo, si nuestro experimen
to consiste en jugar a cara o sello con pna moneda bien equilibrada, eviden-
temente los sucesos simples de £1= (C, S) tienen la misma posibilidad de ocu
rrir. Si nuestro experimento consiste en elegir un estudiante de un curso
de Proyectos, es razonable pensar que cada uno de ellos puede ser elegido cors
la misma posibilidad. Si tomamos el supuesto de que todos los sucesos sím -
ples den son igualmente posibles hay una manera muy simple de asignar medi-
das de probabilidad a todos los subconjuntos de £1, que serán consistentes
con los tres axiomas de probabilidad (Definición 5.17).
Supongamos que se tiene un experimento con 1.posibles resultados, y
que cada uno de estos resultados de cuerdo a la descripción del experimento,
tienen la misma posibilidad de ocurrir. Entonces, ya que la probabilidad to
tal de todo el espacio muestral es 1, el valor común de la probabilidad para
cada suceso simple será 1/k. Además, ya que cualquier suceso es la unión de
sucesos simples (tal como lo muestra el Teorema 5.7.1), entonces la probabi- e,"
lidad de cualquier suceso ACfl estará dada por la razón del número de ele -
mentos de A (el número de sucesos simples, cuya unión es A) y el nómero.de e
lamentos de £1 . Esto es,
P(A) = para todo ACC1
nua.f '
Ejemplo 5,8 Sea el experimento que consiste en lanzar dos dados una
vez. Cuál es la probabilidad de que la suma de los puntos
que aparecen sea 12? Cuál es la probabilidad de que sea 17 y cuál la probabi
lidad de que la suma no sea mayor que 3?
Por el ejemplo 5.4, sabemos que hay 36 sucesos simples, ya quefl tiene
36 resultados posibles, o sea = 36. Por otro lado, sean los sucesos
Entonces
n(A) = 5 P(A) =
20
= 1
4
n(B) = 9 =# P(B) =
20
n(C) = 8 p(c) = = 2
20 5
Son muchos los problemas que tienen sucesos simples igualmente posi -
bles. Como se ha visto en este caso, el procedimiento de cálculo se reduce
a contar el número de elementos de n y el número de elementos del suceso de
interés; y la probabilidad está dada por la razón de esas cantidades.
5.8
Probabilidad Condicionada
Gráficamente se tiene
P(AIB) 1103)
Figura 5 8.1
Luego:
] O 1
1/4.. 1- 1 ! V 2
P(BIA) = 5 = 5 ; P(CIA) = 6 = O ; P(DiA) = = —
5 15
W W
P(A(B) P(AAB)
rí p (ACIB) P(B) P(AIB) (5.11)
Y P AAB) P(AAB) = P(A) P(BIA)
P(BIA)
PA
n
P(/1 Ai) ?(A') P(AglAi) P(A31A1(1A2)...P(An IA1AA2(1...(1An_i)
i=1
Ejemplo 5.12
Se seleccionan 2 bolillas aleatoriamente sin restitución
de una urna que contiene 5 bolillas blancas y 3 negras.
Calcular la probabilidad de que ambas sean blancas. Definamos loe sucesos
Entonces
entonces
P(B) = p(An e) p(Ac nB)
• 1 1 4, 2 1
3• E 3 2 12
5.9
TeoremA de Be:y.1s
Sean los sucesos A1, A2,...An que forman una partición de un espacio
zuestral ; esto es, los sucesos Ai son mutuamente e:..cluyentes y su uni6n
es n. Sea además otro suceso cualquiera B. Todo ésto en términos de un
diagrama, equivale a (ver página siguiente).
- 102-
A
l
A
n
Figura 5.9.1
Vemos que
3) Probabilidades finales
)3) . (0,12)/19 = 6
P(A115) = P(Al(1
171r (0,74)/19 37
P(A3(1B) (3,L8)/19 = 24
P(A3IE) = 77 7W.51 37
En consecuencia, es más probable que la ampolleta seleccionada perte -
nezca a la tercera planta, sabiendo que es defectuosa. Una manera fácil de
verificar que los cálculos fueron bien hechos, es que debe cumplir
= 1
El anterior ejemplo, nos ilustra una de las principales aplicaciones
del Teorema de Bayes, en toma de decisiones.
5.10
Sucesos Independientes
Tabla 5
Adquiere No adquiere
Cáncer Cáncer
Fumador 0,50 0,20
No fumador 0,10 0,20
Ejemtio 5.16 Si se lanzan 2 dados una vez, veremos que los dos sucesos
Como vimos antes, P(A) = P(B) = 1/6; por otro lado At1B = P(A(111)=0,
de manera que P(AEIB) = 0 # (1/6)(1/6) = P(A) P(B). Entonces los dos suce
scs no son independientes.
Prácticamente todos los espacios muestrales que hemos visto en los ejem
plos del presente capítulo, corresponden a espacios muestrales discretos.
Ejercicios 5.2
4.?ara el espacio muestral dado en el Ejercicio 1., defina los sucesos (co
mo Subconjuntos):
A: una bola blanca es extraída
3: una bola roja es extraída
hallar:
7.1 P(C) 7.3 P(Ac) 7.5 P(Ac U Bc)
7.2 P(AUB) 7.4 P(Ac ("1 Be) 7.6 P(BUC)
8. Dado un experimento tal que P(A) = 1/2, P(B) = 1/2 y P(A U 15) = 2/3,
calcular:
8.1 P(Ac) 8.4 P(Ac (1 9c) 8.7 P(Ac(111)
8.2 P(Bc) 8.5 P(Ac U Bc) 8.8 P(AcUB)
8.3 P(A(18) 8.6 P(A Bc) 8.9 P(A U Bc)
13. Una urna A contiene 2 bolas blancas y 4 azules, otra urna B contien3 10
bolas blancas y 2 azules. Si una urna es elegida aleatoriamente y se ex
trae una bola de ésta, cuál es la probabilidad de que la bola selecciona
da sea azul? Cuál que sea blanca?
CAPITU10 6
VARIABLES ALEATORIAS Y
FUNCIONES DE DISTRIBUCION
TABLA 6.1
Puntos
Muestrales (ccc) (ces) (CSC) (SCC) (css) (SCS) (SSC) (SSS)
Número de
caras X 3. 2 2 2' 1 1 1 0
n= (x: 4x115}
.Ahora, si X es el momento de llegada, entonces el recorrido de X es el con -
junto {x: O 4x413}; de esta mañera X es una variable aleatoria continua.
Ejemplo 6.4 Si se trata de conocer los ingresos individuales de 50
trabajadores, el espacio muestral puede ser el conjunto
,,, cuyos elementos son el listado de los 50 trabajadores; y si Y indica el
ingreso, entonces el recorrido de r serán los ingresos de los 50 trabajado -
res, de manera que Y es una variable aleatoria discreta.
6.2
Funciones de Probabilidades y
Distribuciones para Variables
Aleatorias Discretas
..onde i indica el número de puntos del primer dado y, j los puntos del segun
do. La figura 6.1 nos muestra este espacio muestral donde cada punto rere-
p
senta un (i,j)cn. .
n
6
I in
5
a 11—
4
aun
3
a En
2
1 anua
a nn
o
1 2 3 U 5 6
Figura 6.1 Espacio muestral correspondiente
al lanzamiento de dos dados una
vez.
cono n(11) = 36, entonces n(5) = 236, 0 sea que el número ae sucesos se
aproxima a los 69 mil millones.
- 112 -
(6,6)
\:11
• • • ,L •
• •
X(i,j ) i+j
• • •
• • \*.\\
O ;•\
\ON
l 2
Figura 6.2 Representación gráfica de la
función X(i,j) =
De la figura 6.2, se desprende que bajo la aplicación de la función X,
hay valores de X que corresponden a varios puntos del espacio muestral; así
por ejemplo, el 3 ea originado por los sucesos elementales ((1,2)1 y 1(2,1))
para el 7 hay seis sucesos simples, etc. Es decir, que hay valores del re-
corrido que se repiten más veces que otros. (En el Capítulo 2, a este hecho
se denominó: Frecuencias Absolutas). De manera que podemos hablar de la
existencia de una distribución de valores absolutos de la variable aleato -
ria X asociada a un experimento, y por tanto se puede hallar fácilmente la
distribución de sus probabilidades. Así por ejemplo, P(x = 2) = 1/36,
P(x = 3) = 2/36 = 1/18, F(X = 7) = 6/36 = 1/6, etc.
La Tabla 6.2 nos muestra el detalle completo de la distribución de la
función de probabilidades tara la variable aleatoria X(i,j) «7: (Se 8,10n
seja al estudiante, comparar la analogía que existe entre la Tabla 6.2 y
la que se estudió en el Capítulo 2.).
- 113 -
2 1 1/36 1/36
3 2 2/36 3/36
3 3/36 6/36
5 4 4/36 10/36
6 5 5/36 15/36
6 6/36 21/36
8 5 5/36 26/36
9 4 4/36 30/36
10 3 3/36 33/36
11 2 2/36 35/36
12 1 1/36 1
E 36 1
Jr-
Si comparamos la Tabla 6.2 con la Tabla 2.3 del Capítulo 2, vemos que
son completamente análogas; de manera que es aplicable todo cuanto estudia-
mos en estadística descriptiva respecto de las distribúciones de frecuen -
CiaB y las medidas que se podrían obtener,- tanto de tendencia central como
de variación. A diferencia de entonces, en nuestro caso, se trata de estu-
diar el comportamiento de una vaithabte á/cato/tia; o mejor dicho, las distri
buciones de las probabilidades de una variable aleatoria. También es inpor
tante representar gráficanente, las distribuciones de probabilidades, a fin
de tener una idea de la forma en que éstas están distribuidas. Naturalmen-
te que la forte de la distribución dependerá de cuál sea el experimento y
cuál la variable aleatoria definida sobre su espacio- muestral. La forma
que toma la distribución de una variable aleatoria, es de gran importancia
I- para el análisis estadístico, por lo que debemos prestarle la mayor aten -
ci6n posible.
Como mencionamos anteriormente, podemos hallar cualquier tipo -de medi-
da relacionada con la distribución de probabilidades de una variable aleato .
ría asociada a algún experimento. Así por ejemplo, para la informaci6n de
la Tabla 6.2, podemos calcular la media aritmética de los valores de X, uti
Usando la fórmula (3.3) o la (3.4). Para ésta última tendríamos
12
xPx(x) = 2 . 1/36 + 3 . 2/36 +....+ 12 . 1/36 4 7
Esta medida, tal como veremos más adelante, recibe el nombre denvelor cene-
E142"0"~eranza. matemática."
-114-
En lo que sigue, veremos todo lo relacionado con estas ideas incluyendo
algunas propiedades importantes para nuestro estudio de la inferencia estadía
tica. Nuestro deseo es muy grande por presentar los aspectos teóricos en de-
talle, sin embargo, creemos que se pasaría del nivel y objetivo del presente
trabajo; por ello, nos limitaremos estrictamente a lo necesario para compren-
der los temas de los capítulos posteriores.
Con toda variable aleatoria, tal como vimos, está asociada otra función
que se llama su función de distribución. En estadística las probabilidades
de las funciones (variables aleatorias) se tratan por medio de sus correspon
dientes funciones de distribución.
Fx(x) P(Xlx) I
Ejemplo 6.6 Tomemos la información del Ejemplo 6.1. Si los ocho suce-
sos simples son igualmente posibles de ocurrir, entonces
la Tabla 6.3 nos muestra la distribución de probabilidades para la variable
aleatoria X: número de caras.
-115-
TABLA 6.3
Número de
Cara Px(X) Fx(X) ?(X<X)
X
o 1/8 1/8
1 3/8 4/8
2 3/8 7/8
3 1/8 1
E 1
P (X 1 x) = PR(CSS),(SCS) ,(SSC),ISSS Ir t
3/8
2/8 0,5
1/8
X
x
0 1 2 3 -1 0 1 2 3 4
Figura 6.3 Representación gráfica de las
funciones px(x) y Fx(x).
Las propiedades más importantes de una función de distribución, son las
siguientes: -
6.3
Funciones de Densidad y
Distribuciones para
Variables Aleatorias Continuas
2) 1 fx(x) dx = 1
(6.10)
fx(x) O -o* < x oco
---F
dx X (x) = O si x<0
= 2e-2x si x> 0
Luego 'X(x) = 2e-2x si x>0
=O en otro caso
La función fX(x) = 2e-2x (Figura 6.4) nos permite hallar probabilida-
des como las siguientes:
0,4 0,4
F(x10,4) 2e-2x dx _e-2x] . l - e- 0,8 . 0,5507 „.„.,
O O
x
8,4
Figura 6.4 Representación gráfica de fx(x) = 2e-2x
Ejemplo 6.8 Consideremos la función de densidad
f X (x) = 1 x si O<x< 2
= O en otro caso.
2 ix
Entonces Fx(x) =
rx
24. t dt _ x2 si 01, x ‘2
2 4 4
o o
Luego Fx(x) = O si x<0
x2
— 4.0 Lx .41 2
4
=1 si :0, 2
0,5
0 1 2 0 1 2
Figure 6.5 Representación sitiea de les funciones de densi-
dad y distribución de la variable X dada en el
Ejemplo 6.8
-119-
J o2
P(X1 1,5) = 4 --9— - 0,5625
o 2
P(X >1,6) 1: 1 - P(X4 1,6 = 1 -lita
- - 0,19
6.4
Operaciones con
Variables Aleatorias
6.5
Valores Esperados
E(X) r
jp
xf (x) dx
X
(6.13)
^"X
si X es discreta, y
E EH(X)1 =1 11(x) fx(x) dx (6.15)
Rx
si X es contínua.
El valor esperado recibe también otros nombres, tales como cápártanza ma
teridtíca, mem pxomedio, o simplemente media, de una variable aleatoria.
Usualmente a E(X) se la denota también por Ax, o seaE(X)=Atx.
xi Px(xi ) xiPx(xi)
0 1/8 0
1 3/8 3/8
2 3/8 6/8
3 1/8 3/8
E 12/8
Ejemplo 6.10 Sucongamos que se tiene un dado cargado, tal que la proba
bilidad de que aparezca un número es proporcional a cada
número. Si se realiza el experimento de rodar el dado, qué número se espera
que aparezca?
- 122-
La Tabla 6.5 nos muestra el recorrido y sus probabilidades de la varia-
ble aleatoria X asociada a este experimento.
TABLA 6.5
x. 1 2 3 4 5 6
91/21 = 4,33
Entonces
oo
30_8 x) e-2x dx
E [11(X2= E [3(1-e x)] = o
oo
-3x 1 1
= 3(e 2x -e ) dx = 3( - 3) = 0,5 cien miles de $.
So
De manera que se espera tener una utilidad de 50.000 $.
O- = V(X) = O-
X 1-7X
Una propiedad para la varianza de una variable aleatoria,
que se usa frecuentemente para cálculos, es la siguiente
Demostración:
V(X) = E ( x -AA )2 j = E[X2 -
[ 2.1? +px]
2
= E (X ) — 2,4x E(X) +,52c
2
= E (X ) - a
Ejemplo 6.13 Calculemos la varianza de X dada la información del ejem-
plo 6.9.
- 124-
En primer lugar,
1)V(X) )0
2)V(K) = O (donde K es una constante)
3)V(KX) = K2 V(X) (6.19)
4)V(-X) V(X) 2
'5) V(aX + b) = a V(X) (donde a y b son constantes)
Las demostraciones de estas proposicibnes se deja como ejercicio para los es-
,
tudiantes.
6.6
'''''''''''
y\
-S \
Oh
• •
15 2_
\\
(6.2o)
En capítulos posteriores veremos la utilidad de una variable aleatoria
en su forma estándar. La propiedad relevante de una variable estandarizada
es que tiene como media cero y su varianza es la unidad, es decir
E(Z) , g1:2L1.21r. ) , E(X) - E(X) O
cx CX
Y 2
V(Z) = E(Z2) - [E(Z)] 2 = E CE2
ok 11) 2 E(
oi
X)2,
le -1
02
que también nos indica que Tz • 1.
6.7
Distribución Conjunta
de Variables Aleatorias
TABLA 6.6
0 1. 2
- PY(YY
>k,
0 0,09 0,30 0,25 0,61+
1 0,12 J,20 0 0,32
2 0,04 o o 0,04
px(x) 0,25 0,50 0,25 1
En los márgenes de la Tabla 6.7, se tienen las sumas de las filas y co-
lumnas de las py y(x,y). Los totales de las columnas indican las probabili-
dades px(x) de qle x de los doe compradores son clientes de la compañía A;
y los totales de las filas, las probabilidades px(y) de que y.de los dos
-127-
0,2
0,1
Y
Figura 6.6 Representación gráfica de la dis-
tribución conjunta para el ejem-
plo 6.15
Es decir, X e Y son dos funciones que asignan un número real a cada re-
sultado del experimento E, o sea a cada ven (a cada elemento del espacio
muestral).
Ejemplo 6.18 De una urna que contiene 3 bolillas numeradas con 1.2 y 3
extraemos 2 con reemplazo. Si X es el número de le p.:ime
ra bolilla extrp1)
ída e Y es el numero de la acerada, entonces el espacio alia3
tral será 11 t (1 ' 3(132)3(133) (2 5 1) (Z72)
5 (2,3),(3,1),(3,2),(3.3)}
- 128-
TABLA 6.8
N
YcN
1 2 3
TABLA 6.9
1 2 3
1 0 1/6 1/6
2 1/6 0 1/6
3 1/6 1/6 0
f (x y) dx dy =.1
2) I I/ i X,Y '
DEFINICION 1.12 La SuncZón de dC4ttilueZón conjunta de una variable
aleatoria bivariante (X,Y), asta definida por
Fx,y(x,y) = P(Xlx, Y1 y) para todo par real (x,y) (6.23)
Esta función tiene propiedades similares a las de una función de die -
tribuel& univariante.
e
- 130 -
TA3LA 6.10
1 2 3 pf (y)
;\\\
1 0 1/6 1/6 1/3
2 1/6 o 1/6 1/3
3 1/6 1/6 0 1/3
O sea .
si x = 1,2,3
PX(x) = 1/3
= O en otro caso
= 0 en otro caso.
o en otro caso.
Ahora si queremos saber el valor esperado de la suma de sos dos números
tendremos:
6 6 6
E(X+Y) • I:: 1:: (x+y) 1 = 1 n (6~1) • 7
xel yvl 36 36 x•1
(compare este resultado con el que obtuvimos al principio de este Capítulo).
Ejemplo 6.22 Juan y Pedro son hermanos cuya actividad consiste en colo
car pólizas de seguros en. general. Sea X el ingreso por
comisiones de Juan e Y el ingreso de Pedro, durante un mes. Por la experien
cia pasada, ellos saben que la función de densidad conjunta (en cientos de
$b.), está dada por
Cxy (6.30)
eXY - co—y
Esta medida nos indica el grado de dependencia que existe entre las va-
riables X e Y.
O-XY = f0NY =
PXY(x'Y)
Pxix(Ylx) si px( x) > o (6.31)
p x
x
=0 si px(x) • O
- 133-
E(YIX = x) = y . EXY(xd)
f(x) dY (6.33)
RY
6.8
Ejercicios
= O en otro caso
4. Verificar que
17 (t) = 0 t < -2
X = 1/2 -2 t < O
=1 t)0
- 134 -
0 en otro caso.
Determinar F (t).
X
6. Lá variable aleatoria continua Y tiene función de densidad
10.Si se venden 20.000 billetes de una rifa, a 5 $ cada uno, pata el sorteo
de un automóvil de 85.000 8, cuál es la ganancia esperada de una persona
que compre un billete?
CAPITULO 7
MODELOS DE DISTRIBUCIONES
DE PROBABILIDADES
7.1
Modelo de Bernoulli
DEFINICION 7.1 Una phueba Belmouttí es un experimento que tiene dos re-
sultados posibles, generalmente llamados éxito (E) y
fracaso (P).
Si a los dos valores únicos que toma una variable aleatoria, dada una
prueba Bernoulli, los deslnamos por 1 y O, tal que p y 1-p q sean sus res
pectivas probabilidades, entonces la función de probabilidad de una variable
Bernoulli estará dada por
=p si x = 1
-oX(x) = q si x= O
p(x) pxql-I si x = 0 6. 1 (7.1)
- O en otro caso - O en otro caso
p%(x) O
(x) ■
p+,4.1
Y *--X
E(%) = 2::xlyx(xi) = 1 • p + P
P 4 0,7
y la varianza.
GX PC (0,70)(0,30) = 0,21
Como acabamos de ver, el modelo Bernoulli implica realizar una sola vez el
experimento; si se realizara una y otra vez el mismo experimento bajo las
mismas condiciones y cuyos resultados son independientes, entonces se dirá
que estamos en presencia de una 4UCC4i64 de pruebas Bernoulli. Esto Ultimo
da origen a la formulación de un nuevo modelo, que es el binomial.
7.2
Modelo Binomial
Ip•••••••■■
•••••■
•
Ejemplo ?'.2
Veamos cuál es la probabilidad de obtener trica de "ases"
si rodamos cine veces un dado, Vemos que en este experi-
mento el resultado de cada prueba puede ser "as" o cualquier otro número de
los cinco restantes. Entonces el experimento satisface las premisas de un
modelo binomial. En cada prueba, p = 1/6 y q = 5/6, y como son cinco prue-
bas, n = 5. •El orden en que vayan apareciendo los "ases", no tiene importan
cía en este caso. Así, si llamamos E toda vez que aparece "as" y F si no a-
parece, un resultado del.experimento puede ser EEFEF, cuya probabilidad es
3}
(1/6)3(5/6)2 1 0,032
n x n-x
PX(x) m (,x)P q para x 0,1,2,...,n
(7.4)
= en otro caso
Es fácil comprobar que esta función cumple con todas las propiedades de una
función de probabilidades. Aplicando el teorema del binomio de Newton, que
establece la fámula
(a + b)n r bn-r
r=0 ri a
Por analog£a, tenemos
Lx=o(X) p. (p.„) n
de manera que n PX(s) - 1
RX
y es obvio que p (x) O
X
Algunas veces se suele utilizar la expresión b(x;n,p) para indicar la fun
.1ign de probabilidad binomial, con parámetros n y p.
P(X1 = 0,073
Luego
Y
P(X 11) = px(0) + Px(I) • 0,73728
2
02 E(X ) - (M )2 = npq (7.7)
X • V(X) /X
- 141 -
0,4
2 4 6 8 0 2 4 6 8
n = 8, p a 0,2 n = 8, p = 0,5 n = 8, p e 0,9
,2
0,1
0 1 2 3 0 2 4 6 0 2 4 6 8 10 12
n = 3, p = 0,2 n = 6, p = 0,2 n 15, p 0,2
Figura 7.1 Distribuciones de probabilidades bino-
mieles para n constante y p constante,
respectivamente.
Cr =j 200.(0,95)(0,05) = 3,08
- 142-
7.3
Modelo Hipergeométrico
(I) ' c)
(ti
P X(N) (
N
) si x = 0,1 2 n (7.8)
t
F (t) = P(X‘, t) h(X;N,n,r) (7.9)
X x = mía [0,n-(N-r)]
También para este modelo existen tablas que facilitan el cálculo de las
probabilidades de una variable aleatoria hipergeométrica X.
Ejemplo 7.6 Una caja contiene 12 latas de leche, 9 de las cuales son
frescas (recién envasadas). Seleccionamos aleatoriamente
2 latas de la caja sin devolución. Sea X el número de latas de leche no
frescas que se seleccionan, entonces X es una variable aleatoria hipergeo-
métrica, con
( ) (!)(29 -x)
Prx- • /12\ si x 0,1,2
121
en otro caso
5
P(X)1) = 1-P(X < 1) = 1 - 11
(12\ "1 - 6II
2
La probabilidad de obtener a lo mgs una lata no fresca
'10 Y I-(41)10
P(X12) = 1 - P(X I I) = 1 í(01(64) (1 1 19
42
( )
w 1 - 0,412381 • 0,5476 19
Estos valores se hallan también directamente de las tablas de probabi-
lidades acumuladas para una variable aleatoria hipergeométrica.
7.4
Modelo Poisson
= O en otro caso
líes 1
( n px (1-p) -x
o sea
líes
n) (A) (1 - )
n-x
e-)1/4
n
x n x.
(1000) (0,0015)5(0,9985)995
p (5) ■ para la binomial.
x 5
-146-
5
y (1,5)5 e-1' por la Poisson
PX(5) 5!
resultados que serán prácticamente iguales, de manera que puede utilizarse
Poissson para aproximar a la binomial. Algo más puede observarse, y es que
el cálculo de la probabilidad, para este tipo de casos, es más facíl la de
Poisson que la binomial.
Otro aspecto interesante que vale la pena observar, es que la distri-
bución de Poisson nos permite calcular probabilidades cuando se conoce la
media A del proceso que se esté estudiando (o es posible aproximar la me-
dia), sin necesidad de saber n ni 11, con tal que la población sea grande.
(rX) = 3 si x <O
FX ' (7.13)
si x
= PX(t)
x=0
además
F (x • X) = P (X S, x)
X
en una
Ejemplo 7.9 Supongamos que el número de muertes por accidente
,= 3 por mes.
ciudad es un proceso Poisson con parámetro 2
Sea X el número de muertes por accidente que ocurren entre el lro. de ene-
ro y el 31 de marzo inclusive, de 1984. Entonces X es una variable aleato
ría Poisson con parámetro -1
nm 3x3 = 9
luego x -9
9 e para x = 0,1,2 ......
PX(x) x!
=0 en otro caso.
A. 5
4 6 8 10 12 14 16 18 20 22
Figura 7.2 Distribuciones de probabilidades de
Poisson para distintos valores de A.
PX(0) = e 3 1 0,05
AX E(X) - (7.13)
Y 6-2 V(X) - X (7.14)
X
Ejemplo 7.11 La media y la varianza para el experimento palnteado en
el ejemplo 7.10, son
/Ok = 3 y G1 = 3
7.5
Modelo Exponencial
TEOREMA 7.4 Supuesto que X es una variable aleatoria exponencial con paré -
metro A, entonces la función de densidad de X, está dada por
F (x) = O si x <O
X (7.16 )
= 1 - e-ikx si x“)
- 149 -
donde X>0 y e= 2,71828... es la base de los logaritmos naturales.
ñx
f (X) = (x) cL (1 - e- Ax)= Xe-
x dx FX dx
2
2 x
f (x) = —
3 e 5 si x > O
X
=0 si x < 0
-150-
La probabilidad de que pase al menos una hora antes de que talle la máquina
es
" - g- x _P
p(x >1) zi i e 3 dx e 3 0,5134
I 3
La probabilidad de que la primera falla ocurra entre la cuarta y quinta ho -
ras, es:
5
P(4 < X 4 5) 25 g e -
t
xdx a
3
r #e
10
'1) 0,0225
4 3
La representación gráfica para esta función de densidad, puedo apreoiaL
se en la figura '.3.
-(2/3)x
fx(x) 2 (2/3) e
),•2/3
0,5
área • 0,8647
ea 2 0,0225
0 1 2 3 4 5 6
Figura 7.3 Distribución exponencial con X. 2/3
1:4 (7.17)
A E(X) si XXe... s
X
0
y la varianza
(7.18)
1 • V(X) E(X2 )
2) " 242
x . 1
7.6
Muchas variables aleatorias continuas, tales como los pesos de loe es-
tudiantes de economía, coeficientes de inteligencia de nitos que estudian,
diámetros de tubos de acero producidos mediante un cierto proceso, etc.,
tienen distribución normal.
fX
(x)> 0 y que -X(x)dx = 1
Para indicar que X tiene distribución normal con parámetros Ay é, al-
gunas veces utilizaremos la notación
N(/, cr2)
La razón para utilizar los símbolos/Uy o-2 (en 7.19), se debe al hecho
de que precisamente/ces la media de la distribución normal, y 0- su desvia-
ción estándar; es decir que
=
(7.20)
2 2
Y °-7( =
En la figura 7.4, puede apreciarse la distribución normal para distin-
tos valores de los parámetros/4y Q. Es interesante observar además que
la simetría de la curva normal se mantiene en cualquier caso. Algo más, su
media, mediana y moda, coinciden.
(a) (b)
rt
F (t) j 1 e - (x-9)2/2 al dx (7.211
Z
-oo A 71 Cr 2
Como puede verse, para el cálculo del área de probabilidad deuda fun -
ojón de densidad normal, la anterior expresión resulta bastante molesta. Pe
ro esta dificultad se salva fácilmente estandarizando la variable aleatoria
normal X, y luego recurriendo a las tablas de la normal estándar.
2
1
f (z) = e-z /2 (7. 2 2)
Z ITY
y su función de distribución
F (t) = P(21 t) = 1 e
2
-z /2
dz (7.23)
z
Stoo 127
La representación gráfica de estas dos funciones puede apreciarse en
la figura 7.5
F (z)
f (z)
-3 -2 -1 1 2 -3 -2 -1 0 1 2 3
Finalmente, 900-750)
p(x,900) - 1 - POI< 900) = 1 -P
cr z loo
- 1 - P(Z< 1,5) - 1 - 0,9332 = 0,0668 /
Luego
1.200 (0,0668) = 80,16 obreros.
-3 -2 -1 0 1 2 3
450 550 650 750 853 950 1.050
/M-3T /m-2T /u-17 ./4 /Ut1T ith12ria+30-
99,73%
95.45%
e-
68,27%;
-3 -2 -1 0 1 2 3
4-347 .44-2c 11-1C ,44 fin"
" ta+30-
1. 7
Ejercicios
1.Se lanzan cinco dados una vez. Si X es el número de unos que ocurren, cal
tullir 114x. Cric, 2(3.1.X< 4) y P(X) 2)
2. Be ¡Babe que el 2% de cierto tipo de artículos heohos por una máquina, son
defectivo.. Si seleccionamos 10 de estos artículos, cuál es la probabili-
dad que ninguno sea defectivo? Cuántos se espera que sean defectivos?.
6. Supuesto que una variable binomial tiene por media 12 y per varianza 8,
hallar p y n.
7./ Supongamos que la estatura de los varones adultos tiene una distribución
normal, con 169 y Cr= 7, centímetros. Cuál es la probabilidad de que
un individuo elegido elatoriamente, tenga más de 170 cros.? Cuál de que
mida a lo más 168 cros?.
•
8.' Cuál es la mediana de E, si fx(x) = 2(1-x), 0 Cx 1?
10./ El peso promedio de una piña es de 50 onzas, con una desviación estándar
de 5 onzas , según informes de un comerciante local. Supuesto que los pe
sos se distribuyen normalmente, que porcentaje de piñas pesa más de 54 on
zas? Que porcentaje pesa menos de 40 onzas? Por encima de qué peso cae
como máximo un 10% de las piñas?
12. Un proceso con distribución normal está centrado en 20,6 cc. y mantiene
una desviación estándar constante de 0,5 cc. Qué tanto por ciento de los
artículos de esta línea de producción vendrán conformes con los siguientes
límites de especificaciones:
12.1)20,6 + 1,0 cc
12.2)21,0 :a: 1,0 cc
12.3)20,5 -T 0,5 cc
- 158-
CAPITULOO
MUESTREO Y DISTRIBUCONES
EN EL MUESTREO
8.1
Introducción
8.2
Funciones de Varias
Variables Aleatorias
rt .1. t X. = -1
1 X.
=1 i
Se aconseja al alumno tomar muy en cuenta este hecho, puesto que juega
le papel importante en la teoría estadística, y en forma particular en la in
ferencia estadística.
8.3
Desigualdad de Chebychev
P( I ) k Cr )<Ir
k
Lo notable de esta desigualdad es que sin importar cuál sea la distribu
ción de probabilidades de X, indica que la probabilidad de tener valores fue
ra del intervalo (AZ- k G ) ,‹44- kcr) está limitada, ya que es un valor menor
o igual a 1/kc.
Esta desigualdad es también útil desde el punto de vista teórico; por ejem
plo, en la discusión de la ley de los grandes números.
8. 4
TEOREMA 8.5 (Ley de los Grandes Números) Sean XI, X2,..., Xn una sucesión
de variables aleatorias independientes idénticamente distribui-
das, cada cual con media.fry variante 6'2, comunes. En tal caso la sucesión
de medias aritméticas
Xn - n x. n = 1, 2, 3, ....
i=1
XI + X2 +
XI X2 , R3
3 3
(° °es: 11 4'X1 ' 2 2
converge en probabilidad hacia , a medida que n crece. Es decir,
lím P(
'TI"71
-/a 1>t) = o para todo (>0
n-. w
O sea que la probabilidad de tienda afr, es prIcticamente 1, si n
que'11
crece indefinidamente.
8.4
TEOREMA 8.6 Sea XI, X2 ..... Xn una sucesión de variables aleatorias indepen
dientes idénticamente distribuidas, cada cual con mediaiu. y va-
riante 62 (es decir, du y 6-2 comunes y finitas). Si se define la sucesión de
variables aleatorias
-
II
Z n - 1, 2, 3,
n
donde 1n 7-- X.
n 3i=1
- 164-
Entonces
2
1 -z /2
lim F, (t) dt
II --I x
an 7inf e
00
es decir que 2,
4v N(0,1) si n-->oo
8.5
Distribución Muestral
de una Proporción
A aP
crp . Bp
= 21:1) (8.)
n N-1
- 266 -
8.6
Distribución Múestral
de la Media
La distribución en el muestreo de la me
dia, o sea la distribución de las medias obtenidas de todas las muestras po-
sibles del mismo tamaño extraídas de la poblada, proporciona el aspecto más
relevante dela inferencia estadística.
Si le toma una muestra aleatoria X1, X2,..., Xn de X con media" y va -
rianza474, eptoncee las xs. (i=1,2,...,n) son variables aleatorias idénticamen
te distribuidas con los mismos parámetros. Además, la media muestral
37 = 1n- i.1 Xi
n Cr2
Y 01- = V(r) = Va EX±) = '
22 VOli) = = (8.6 ;
0r- 47 (8.8)
X' Is-2
-167-
En el caso de que la población sea normal, no hay ninguna dificultad de
trabajar, ya que la distribución muestra). de 1 es también normal. Sin embar
go, si la población tiene cualquier otra distribución, entonces la variable-
= (E9M)/Cry se aproxima a la normal con media 0 y variante 1, cuando n
se hace suficientemente grande.
Ejemplo 8.3 Supongamos que tenemos una población que consiste de cua -
tro fiches numeradas, 1,2,3, y 4, respectivamente. Si to-
ma:son muestras aleatorias de tatuado 2, tendremos • 4
)
( <
Posibles valores Probabilidades`
f2 0(5 )
de X Pi
1,5 1/6
2 1/6
2,5 2/6
3 1/6
3,5 1/6
/2,5 1
Luego
14157= z(i) = (1,5)(1/6) 2(1/6) + (2,5)(2/6) + 3(1/6) + (3,5)(1/6) = 12=2,5/
6
Que coincide con At= 1+2 ---. 2,5 a'
+4341
Por otro lado, 52 m N(X2) - ("4)2 = 7,5 - 6,25 = 1,25 /
Luego, (r
417E1 1/113711r---6
:717 0 6455 /
A n N-1 2 4-1 '
8.7
Distribución Muestral de la
diferencia de dos Proporciones
i/P1(1-P1) P2(2-P2)
(8.10)
O n1 n2
Por otro lado, si ni y n2 son suficientemente grandes, entonces
8.8
nrbr 1
0.2
-2
n2
(8.12)
nl
Igualmente si nI y n2 son suficientemente grandes, entoncesirse puede a-
proximar a la distribución normal mediante la estandarización
Z (8.13)
aR
donde Z r1/4/N(0.1)
-169-
8.9
Distribución Nuestra'
de la Varianza-'
2 1 r oc. _ 1)2
s —
n
i=1
Pero ocurre que al determinar la esperanza matemática, da
2 n 1 2
E(s ) 0-
n
En cambio si se toma la varianza tal como se definió (Definición 8.3), goza
de la propiedad de que
E(s2) = E -)2) =
(La
\, n-1 i.1
Y S2 2 T-
- 1cf
No hemos puesto ejemplos para las distribuciones muestrales por dos ra-
zones: Primero porque se reduce a hacer cálculos como en los Capítulos 3 y4
y para determinar probabilidades, se hace igual que en el Capítulo 7, e. la
sección correspondiente a la distribución normal; y segundo, porque en los
dos capítulos siguientes tendremos oportunidad de practicar con estas distr
buciones muestrales, y además ver sus aplicaciones. Ahora enunciaremos las
tres distribuciones que se cuentan entre las más importantes para las aplica
ciones prácticas de la Estadística.
-170-.
8.10
Distribuciones: Chi-Cuadrado,
F y t-Student
0,3
0,2
0,1
0 2 4 6 8 10 12 14 16 18 20
2
Figura 8.1 Distribución de 1 para distintos valo-
res de n.
e
P(X tx) = p
r
ri(n+1 /2) 1 + t2 ) - (n +1) /2 om
fT(t) (n12) n Para - cc.< tc
ATI
En la figura 8.3 se muestra esta función para distintos t'Amabas de n.
Densidad N(0,1)
Densidad de t; n o 3
Densidad t; n o 10
TEOREMA 8.12 Supuesto que X es una variable aleatoria normal con zediajAy
varianza Q2, y que X1, X2 XII es una muestra aleatoria de n
observaciones de X, entonces
t -I -
S
MOTT
tiene distribución t-Student con (n-1)grados de libertad.
Ejercicios
1.Supongamos que Ire ison las medias de dos muestras, cada una de tamaño n,
tomadas de una población normal con varianza G 2. Determinar n de modo
que la probabilidad de.que las dos medias muestrales se diferencien en menos
de ósea aproximadamente 0,99.
5.Para muestras de tamaño dos de una población con varianza G2, demuéstrese
que el valor esperado de la varianza muestral es 02/2.
8.Una compañía de trigo híbrido para cultivo, afirma que su producto dará,
por término medio, 14 quintales por hectárea sembrada de trigo. 25 ectá-
reas dan un promedio de 13,5 quintales por hectárea. Si suponemos que la
desviación estándar ores 2 quintales por hectárea, cuál es la probatili -
- 176 -
dad de obtener una media =teatral de 12,5 o menos? Qué conclusión Po-
dría deducirse?.
probabilidad de que ric este
9. Si se lanza 130 veces un dado, aproximase la
comprendido entre 3 y 4.
10. Supuesto que se sabe que en una población, los coeficientes de inteli-
gencia (CI) se distribuyen normalmente con/V= 100 y cr= 10. Cuál es
la probabilidad de que un individuo seleccionado aleatoriamente tenga
un CI comprendido entre 95 y 115?
CAPITULO 9
ESTIMACICN DE PP.RAMETROS
Son innumerables los casos en que estamos interesados por conocer una
medida de un conjunto de elementos pertenecientes a la población en estudio;
por ejemplo: la media, la mediana, la desviación estándar, alguna proporción
etc. Como estudiamos en capítulos anteriores, existen una serie de factores
que impiden conocer estas medidas si se quiere tomar en cuenta a todos los
elementos de una población; sea porque el numero de commonentes es muy gran-
de, lo que incide en los costos de obtención y elaboración de datos; sea por
que'se requiere de mayor tiempo para conseguir los resultados; sea porque mu
chas veces no es realmente posible conseguir toda la información; etc. Sin
embargo, todo ésto no constituye un obstáculo para poder obtener de una mues
tra tomada aleatoriamente de la población, una medida que sea un buen estima
dor del valor de la medida poblacional correspondiente. Sabemos que no siem
pre es necesario tomar en cuenta a todos los elementos de la población, ya
que admitiendo un pequeño margen de error se pueden obtener estimaciones ca-
si exactas. Obviamente, es muy difícil cue la medida calculada de una mues-
tra coincida con su correspondiente poblacional, pero, desde el punto de vis
ta de la aplicación práctica, sea en el campo económico o en otros campos,no
tiene mayor importancia el que exista una diferencia pequeña. Por ejemplo,
si la media de los ingresos de 100.000 artesanos es 1.200 $b. mensuales, y
si el ingreso medio mensual de 800. artesanos (tomados aleatoriamente de los
-^ 100.000) da 1.235 $b. la diferencia es muy pequeña, para ser significativa
desde el punto de vista de un análisis general sobre el ingreso promedio men
sual de los artesanos. Es más, decir que el íMBAC40 la/comed:Lo &timado es
1.985 $ 6 1.235 $, 6 1.220 $, no tiene mayor importancia, puesto que todos
ellos son igualmente buenos estimadores del ingreso promedio de toda la ro -
blación de obreros, que es 12= 1.209 $. Si se conociera la medida cue aos
interesa de una población, el problema terminaría en ese momento. Pero, en
general no se conocen los valores de los parámetros de la distribución dl la
población. Eh la práctica se obtiene una muestra aleatoria, y en base a és-
ta, se pretende estimar los valores exactos de los parámetros desconocidos.
9.1
Estimación Puntual
Este método puede describirse cono sigue: Sea X una variable aleato -
ria definida sobre una población II. Supongamos que la densidad de.la dis-
tribución puede indicarse en la forma f(x; 19), ésto es, que la densidad sea
una cierta función de x, pero que depende de un parámetro desconocido 8. El
problema consiste en estimar el valor de 9. El principio de máxima verosi-
militud (o, como también se dice, de máxima probabilidad), establece que el
valor de 9 debe ser tal, que la 'probabilidad de observar lo que realmente
se está observando sea máxima". Es decir que se trata de hallar una estima
cf.& de 9 con la máxima probabilidad de que se obtenga el valor de O como u.
na función de los elementos de una muestra aleatoria.
d L(9) o ( 9.3)
de
Además, de la matemática pura, sabemos que una función o el logaritmo
de dicha función, tienen máximo o mínimo relativos, para un mismo valor. A-
sí, en nuestro caso, alcunas veces resultará más fácil hallar el máximo de
la función logarítmica de la función de verosimilitud, o sea
in (L(9)) = K(G)
o Ejemplo 9.1 Supongamos que X es una v.a. Normal con variante unitaria
y mediaie desconocida. Se trata de estimar el parámetro
a partir de una muestra por el método de máxima verosimilitud. Si X1,X2,..
Xn es una muestra aleatoria de X, entonces la función de verosimilitud
de la muestra es:
(xi -/a)2
2
L(µ) = fx(xs) = II 1 e
i=1
_ 2 i.=1 e)2
-µ )2
)2
ln LcO) = K (fi) = n la 21(xi
= - =5:xi - nµ = 3 (a)
dµ 2
2= Exi = x (media muestral)
de donde 2
- 181 -
Hasta aqui,hemos considerado la condición necesaria para la existencia
de un punto máximo, en este caso parajc= 3E. Sin embargo, falta la condi -
ojón suficiente, que consiste en que la segunda derivada debe ser negativa,
o sea
d2K(9) <O
de2
d2K
An2 = - n<C
e Ejemplo 9.2 Sea X una v.a. con distribución exponencial cuya función
de densidad es fx(x) =Xe-AX para todo x>0. Se trata de
estimar el parámetro X que suponemos desconocido. Si tomamos una muestra
aleatoria XI, X2,...,Xn de X, entonces.la función de verosimilitud será
n - xi e Exi
,n—
L OO = TT fx(xi, A ) e = A
i.1 i=1
Aplicando logaritmos, se tiene
lnL(4) = n lnX-X E)
ci
derivando respecto de A e igualando a cero, tenemos
dInL(A) n n--x = o
dA A z-
_ 1 . 1
de donde xi r
n
de manera que el estimador máximo verosímil de )1/4 es el inverso de la media
muestral.
Estimador máximo ve
Distribución Parámetro rósímil (o de máxi-
ma probabilidad)
n
p = r
Bernoulli p
5■
= 32,910
1--,.= 0,
'911
30
Es decir,que el estimador del tiempo medio de duración sin falla de los tu -
boa eléctricos, es aproximadamente de 0,911 de hora.
9.3
Algunas veces suelen tomarse dos o más estimadores insesgados para cual
quier muestra dada. Si el y 92 son dos estimadores insesgados distintos de
9, ¿cuál de ellos se debe tomar, como mejor estimador que el otro? Una for-
ma de salir del apuro, es comparar les varianzas de los estimadores y elegir
el de varianza mínima, en tal caso, el que tiene varianza más pequeña se di-
ce que es más eficiente.
a Ejemplo 9.6 Supongamos que X es v.a. con distribución Poisson con partí
metro X y que X1, X2,...Xn es una muestra aleatoria de X.
n 4
Si 2:: X. 2:: xi
L 1=1 1 i=1 , entonces ambos son estimadores insesga -
ñ1 n Y A 2 =4---- dos de X.
\
Por Otro lado,
V ()9) = -1 Y (12)
7
1 i
Luego, si n 4, t es un estimador más eficiente que ilk2 puesto que -1-.<
X X—
n 4
Parece que un buen estimador seria aquél para el cual el error disminuye
cuando crece el tamaño de la muestra. Es decir, el estimador es mejor cuando
_se basa por ejemplo en una muestra de 20 observaciones, que si el estimador
se basa en sólo 4 observaciones.
TEOREMA 9.1 Si
lim E (9) =
Y n-Ivo
(9.5)
lim V (41) = O
n--• 00
entonces G es un estimador consistente de 9 (donde n es el tamaño ae la mues
tra)
Ejemplo 9.7 Supongamos que X es una v.a. con media/ y varianza or 2, y
que X1, X2, es una muestra aleatoria de X.
Sabemos que
E (Y) =71-4 y V (3) cr2
2
Luego, lim E (Y) =yez y lim - = o
n-sam. 211:1:.(5) = n-,00 n
9 .4
Estimación de Intervalos
de Jonfianza
Pr (-1,964241,96) = 0,95
-h
0,51,11
es una v.a. normal estándar. De este modo
-ti, 1,96) = 0,95
Pr (-1.961 0,5/Th-
- 188 -
o también Pr I7 - (1,96) 51< p. + (1,96) 22A] = 0,95
forman un intervalo confidencial del 95% para /u. Si se observan los pesos
de 75 frascos y se halla 17= 12,1 los valores de L1 y Is serán
LI = 12,1 - (1,96) III.= 11,99
Y75
18=12,11-(1,96) 124=12.21
TEOREMA 9.2 Si X
1, X2'..'Xn es una muestra aleatoria de una v.a. normal
cuya media ase desconoce y si tiene variante conocida ,
r2, en
tonces los estadísticos
L - - z o'
LI 1-01V2siF
(9.7)
L ■
X or
+ z 1-dna
donde
P(Z
1-MV2) 1 - --
2 constituyen los limites para un i•ter
velo confidencial (1-4Q 100% para im.
Nota: Negamos una acotación para el cálculo de 2, ,u, Para ésto, debe to
marse en cuenta la definición 9.5, donde eralficiente de confianza
es 1-d. Entonces, cuando por ejemplo, decimos una seguridad del 90%, es-
to implica que 1-0(= 0.90 de donde dr.= 0,10; luego Z1_0 10 //2 = n .
como Z tiene distribución normal estándar, basta ver lal Unas dé Probabis
lidades para esta distribución.
L - L1 = 2z (9.8)
S 1-W2 lir .A=
que es una constante (independiente del valor de la media muestral). Enton
ces el recorrido del intervalo confidencial que contenga a/A con un 95% de
confianza será
2 (1,96) .(2/11-) = 7,84/11E
para un n cualquiera. Si n = 22, la longitud del intervalo confidencial
que contendrá a/A, con una probabilidad 0,95 de seguridad, es 7,84 -
1,6/
22
minutos.
Como z -
L1 = - ti_ 04 •
2 Y n
La = X + tl_o c
2
S (9.8)
= x.n:1Z g
11J
/- 1(x2) - 002 (9.10)
de manera que
S, 62,2 cms2A s - (62,2)2 = 5,04
5N 5
Luego,
LI DX. - 1)2
2
x1-
-.112
(9.11) -y
Y
3E4_ 46,69 11
LJg - 1,711
Ejemplo 9.13 Sea una máquina que se usa para cortar barras de metal en
pedazos pequeños, que sirven para fabricar pernos, y su -
puesto que las longitudes de losapedazos cortados es una variable aleatoria
normal con mediai4ty varianza 0-', ambos parámetros descónocidos. Se trata
de estimar la variación de los tamaños, a fin de chequear si la máquina nace
sita algún ajuste. Para esto, se toman 25 piezas cortadas por dicha máquina
y se halla que
wi
= 101,1 cros , Exf = 412,75 , 210q - SiD2 = 3,9
Si consideramos un intervalo confidencial del 90% para estimar 0r2, entonces
/1_ 0,2 /8,95 = 36,4 Y /8,05 = 13,8 para 24 grados de libertad. Enton-
ces, por el teorema 94, se tiene
L1 = 36,4 = 0,11 Y=
-0 13,8
-0,28
TEOREMA 9.5 Si X1, X2, ...Xn es una muestra aleatoria de una v.a. X con dis
tribución exponencial con parámetro entonces
11-.1
Lis _ 2u r
10
xi = 211,5 horas
i=1
Por otro lado, para un intervalo confidencial del 90%, /8.90 = 28,4 para 20
grados de libertad; de manera que
2111 - 0,067
Ls = 2(211,5)
E (p) = P
y
r
(9.13)
V (p) P (1-1")
/777-17-
p - n
9.5
•• Ejercicios
r
• 1.Si deseamos estimar la media de una población normal cuya variante es 10.
Cuál deberá ser el tamaño de la muestra a tomar, de forma que sea 0,80 la
probabilidad de que la estimación no tenga un error mayor de 0,4 unidades?
4.DI las razones y las condiciones, si existen, para sostener los siguientes
enunciados:
50 a menos de 70 50
70 a menos de 90 70
90 a menos de 110 125
110 a menos de 130 75
130 a menos de 150 30
9.Pruebe aue la longitud del intervalo confidencial para C (de una pobla -
ci6n normal) tiende a cero al aumentar el tamaño de la muestra.
10.Supuesto que usted compra una docena de naranjas de una propiedad A, las
pesa y halla que
12 12 ,
EX. a 66 onzas, EX: a 385
ial 1 1=1 1
Calcular el estimador mlimo verosímil de/Ayo-2, asumiendo que las 12
naranjas que compró son una muestra aleatoria de todas las de la pro-
piedad A (considere que los pesos se distribuyen normalmente).
CAPITULO 10
10.1
Análisis General
: i/.4= 60
o
ti 1: <60
Por lo anterior, pueden presentarse pruebas de una hipótesis simple
contra una hipótesis alternativa simple, una simple contra una compuesta ó
una compuesta contra otra compuesta. En la práctica la mayor parte de los
problemas implican hipótesis compuestas, Pos ésto, le dedicaremos más aten-
ción al caso particular de tener una hipótesis simple contra una hipótesis
compuesta.
2. 3.
RC RC RA RC
RC RA RA
. k1 k
2
Figura 10.1
a que por ahora dejaremos de lado el análisis de.este tipo de error, lo mls-
mo que el concepto de "función de potencia" que está relacionado con /3.
3. SELECCION DEL ESTADISTICO DE PRUEBA
t =
00
Crt < Z4L
33
26t= 0,01 11 -2'
Gráficamente se tiene
-2,33
Figura 10.2
significación es 0,01.
- 00
Zi_
Gráficamente, tenemos
2
1,65
Figura 10.3
0 - 0
Mí que se rechaza Ro si y sólamente si 07, e ) 1,65 cono(= 0,05
0
- 0 -e
< 2.
4/2 6 . 21_,v2
9
En este caso, si tomamos 01= 0,05, entonces 20,025 - -1,96 y 7.6975
, n 1,96
Gráficamente
-1,96 1,96
Figura 10.4
Z ) 2,33 Z 1,65
5. REALIZACION DE CONFUTOS
6. TOMA DE DECISIONES
10.2
Prueba de Hipótesis •
Para j4.
2 /10
(10.1)
donde Cc - 47
--
r
a
Ahora bien, tal cono prometimos, veremos paso a peso algunos problemas
clásicos de prueba de hipótesis.
- 211 -
3. Selección del estadístico de prueba: Para este caso hemos visto que el ea
tadístico de prueba más adecuado es
x -AAo
E
x
donde Z tiene distribución Normal estándar.
5. Cómputos: Supongamos que las 35 máquinas del nuevo tipo, .constituyen una
muestra aleatoria, y que se ha obtenido una producción redia de
x = 160 unidades por hora. Por otro lado, asumamos que la desviación es -
tándar de producción para las nuevas máquinas, es idéntica al de las má -
quinas antiguas (ésto es, Or- 8 unidades por hora), entonces con n = 35,
-212-
tenemos
o- = 8 - 1,35
x 471.
•
z - Ao 160 - 155.1 3,7.
Luego, 1,35
x
3.Estadístico de prueba:
- Ato
3x = =
121 =
64 -
121
8
= 0.1875
19 - 20 5,33
luego =
0.1875
- 213 -
6.Decisión: Puesto que Z = - 5,33 < - 1,65 se rechaza Ho. Por tanto, el ge
rente deberá considerar seriamente la adopción del nuevo siste-
ma de frenos, por ser más efectivo que el que se está utilizando actual -
mente.
Veamos ahora un ejemplo para la tercera forma habitual de formular hip6te
sis.
Ejemplo 10.3 (Prueba de doble extremo) El vendedor de una fábrica de
cera para lustrar pisos gana
una comisión media de 980 $b. por mes, con una desviación estándar de 235 $b.
Aparecen en el mercado nuevas marcas de cera para pisos producidas por otras
fábricas. Este hecho hará reducir el volumen de ventas por vendedor, y ob-
viamente a disminuir sus entradas. Mientras tanto, los costos de producción
de la firma han aumentado paralelamente, con la inflaci6n general, lo que im
plica un precio de venta mayor; este factor tiende entonces a incrementar la
comisión del vendedor por cada venta. El gerente de la firma está ansioso
por descubrir el efecto neto de estos dos factores sobre las comisiones de
su vendedor. Para lograr ésto, se adopta el siguiente procedimiento de deci
sión:
1.Hipótesis: Ro ya= 980 $b.
3. Estadístico de prueba: Z - o
4.Regla de decisión: Con 01-= 0,05 para un test de doble extremo (6 bilate-
ral), la regla de decisión llega a ser: Rechazar Ho
si y s6lamente si 12 1)1.96, o lo que es lo mismo, se rechaza Ho siempre
y cuando Z (-1,96 6 Z 1,96.
5.Cómputos) Supongamos que de entre todas las cuentas actuales del vendedor
se toma una muestra aleatoria de 100, y se encuentra un prome -
dio de comisiones de 940 $b.
Entonces
crr --.11.5.= 23,5
ral
Y
Z = 940-980 _ 1,7
23,5
6. Decisión: Como Z = - 1,7 cae dentro de la región de aceptación, Ho no se
rechaza. Este resultado indica que la diferencia de ho $b. pue
de atribuirse al carácter aleatorio de la selección de los elementos que
intervinieron en la muestra y que no es significativa con un riesgo del
5%. El gerente debe dejar de lado esta preocupación, puesto que el resul
- 214 -
Tal vez sería más apropiado para este problema tomar como hipótesis al-
ternativa iu <980 $b., ya que para la gerencia no será problema si la comi
sión media del vendedor fuera igual y mayor que 980 $b. Veamos entonces qué
ocurre si formulamos la prueba de hipótesis H : da= 980 y Hi ytt<980 para el
mismo nivel significación 0:
1 a 0,05. La regid de rechazo sérá para cual -
quier valor de 2 < -1.65. Como el estadístico de prueba da un valor 2 =-1,7
la cual es menor que -1,65, habrá que rechazar H . Así, puede observarse
que la misma diferencia que no es significativa para una prueba bilatera:,
puede llegar a ser significativa para una prueba de extremo simple, como ocu-
rre en este caso. Todo ésto nos indica que si nosotros hubiéramos optado
por realizar una prueba del extremo izquierdo, la decisión de la gerencia ha
bría sido completamente diferente para los mismos resultados de la muestra.
Entonces, en lugar de no hacer nada(cono cuando se aceptó H ) el gerente po
dría, debido a la aceptación de Hl, actuar tomando una política distinta a
fin de obtener una solución al problema. Así por ejemplo: dar lugar a una
campaña de anuncios a fin de aumentar sus ventas, aumentar el porcentaje de
las comisiones que se pagan, mejorar la calidad de su producción a fin de e-
vitar competencia, o hacer mucho más que todas estas acciones con el propósi
to de mantener o incrementar el volumen de sus ventas, con el objeto de man-
tener al menos el monto de las comisiones de su vendedor.
10.3
Prueba de Hipótesis
Para P = P
o
pueden haber unos que consumen carne de res, otros carne de pescado, otros
carne de pollo y los que consumen otro tipo de carne; sin embargo, todos es-
tos pueden ser clasificados en aquellos que prefieren o no prefieren un tipo
de carne particular.
6. Decisión: Puesto que Z = -2.358 < -1,96, se debe rechazar Ho. Entonces
la comisión informará a la Asociación de Constructores que el
nuevo tipo de ladrillo no tiene la resistencia anunciada.
Es interesante notar, que si la comisión de especialistas hubiera tomado
un oí.= 0,01, la decisión cambiaría. Por qué?
Ejemplo 10.5 (Prueba de extremo izquierdo) Supongamos que una de las
embotelladoras de bebidas
gaseosas de una ciudad ha anunciado en un períodico lo que sigue: "Hay más
de 15 embotelladoras de bebidas gaseosas en la ciudad, pero el 30% de las
familias que toman refrescos, son nuestros clientes. BEBIDAS ILLIMANI". El
efecto de esta propaganda como puede esperarse en la realidad perjudicaría
a las otras compañías embotelladoras, quienes como reacción lógica elevan
una queja, la OCC piensa que debe hacer una investigación previa para tomar
decisiones. Seleccionan una muestra aleatoria de 250 familias quienes nor-
malmente se sirven debidas gaseosas, y hallan 65 familias consumidoras de
"Bebidas Illimani" . Se preguntan si es significativo estadísticamente, cc
te resultado, y para responderse, la OCC dísela el siguiente procedimiento
de decisión:
4. Regla de decisión: Con ot= 0,05, deberá rechazarse lahdpótesis nula cuan
do y solamente cuando
Z C - 1,65
-217-
n
5.Cómputos: 65= 0
V ,26
LV
P = 250 '
44/ (0,3)(0,7)
250 0.029
Luego Z = 0 26 - 0 30 -0 04
—2--- 1,38
0.029 0.029
10.4
Prueba de Hipótesis
Para 0 = 0
1 2
10.5
0-12 012 •.
donde Gdx w sil nn son los tamaños de las muestras
n n 2
1 2
1 y 2, respectivamente.
R1: C /2
donHeithi es el promedio de producclon diaria del grupo de trabajadores
que no utilizaron el nuevo método de trabajo, y donde/42 es el número me
dio de artículos producidos por aquellos que utilizaron la nueva técnica.
1. Hipótesis:
Hol µ1 = 1142
11 1: /U1 # 1/,t2
2. Nivel de significación: Usemos un riesgo.L= 0,01
3.Estadístico de prueba: -
Z
6---
dx
4. Regla de decisión: Rechazar Ho si y sólo si Z < -1,96, 6
Z > 1,96
5. Cómputos:
15 8 - 16,2
Z = 3.215
(0,5)2s (0,5)2
j 30 - 35 .
10.6
Ejercicios
4.Una compañia sostiene que la duración media de todos los acumuladores para
automóviles, producidos por la compañia, es 40 meses, Sin embargo, se ha
- 221 -
CAPITULO li
MODELOS DE RSGRESIOR
Y Y Y
2 2 3
Y =I a + bx Y = a + bx + cx Y = a + bx + cx + dx
Ir • t
1X
- 224 -
1
Y = a + b x
0 1
a+ óx
X' X
• N.
d e
Figura 11.1
Las líneas entre los puntos (x1, yi) nos describen la Ionma de id ubican
pumedío entre las variables X e Y. estas líneas y sus funciones se denomina -
rán líneas de regresión y funciones de regresión, respectivamente.
11.2
Una interpretación más simple es que, para un valor dado de X hay muchos
valores asociados z los que supondremos están distribuidos normalmente*. La
distribución de los valores de Y para cada x, se considera una subpoblación;
por tanto, la población consistirá de tantas subpoblaciones como valores x ha-
yan. Así, en cualquier evento, la distribución de cada subpoblación está con
dicionada a cada valor de X.
•
: 1
*
A \E(YIX) a /44
= a + bx
Yx
Figura 11.2
6= Y -t
yx
* Se interpreta igual si decimos que para cada x hay un Y con distribución nor-
mal.
- 226 -
y = E (Y1x) +e
donde e 6 e
Gráficamente tendremos:
E(Ylx)
= a + bx
Figura 11.3
o también2 2
G-
Yx = IDY -/aYx) /e
- 227 -
Densidad
Y (Variable
dependiente)
x
2
./lx a + nx
n (línea de regre-
sión poblacional)
X
(Variable in-
dependiente)
Figura 11.4
Nótese que los supuestos del modelo poblacional anterior puede que no se
ajusten perfectamente a la mayoría de los datos bivariantes económicos. Sin
embargo, el modelo dará un resultado satisfactorio si la relación entre los
valores de X e Y es aproximadamente lineal.
11.3
11.4
(11.5)
1)
Qa i=1
donde las y. son lcs valores de Y observados de la muestra y las x. son los va
lores asociados de la variable independi$nte 1. A los estimadoressde a y b
por este método los simbolizaremos por a y b , respectivamente. *
Figura 11.5
+
* Así por ejemplo, se dirá que el estadístico a obteniendo de la muestra, serát•
el estimador mínimo cuadrático del parámetro poblacional a.
- 229 -
puntos observados yi y la recta que nosotros delineamos. La linea que minimi
za ésto, se llama Z2nea de 2egke4i6n mZnAno wad/ab:w. Y se denota por
Ye = a+ + b+x. Esta linea se llama también regresión de Y sobre X. Si noso-
tros elegimos otra línea distinta de Ye - a* + b+x, por ejemplo:
- a' b'x,
la suma de los cuadrados de los desvíos de las y! sobre esta segunda línea se
rá necesariamente mayor; es decir,Ele!2 r-- 21
Teorema 11.4.1 Sean (xl, y1), (x2, y2) ..... (xn, yn),,los valores observados
de una variable aleatoria Y, asociados a sus valores x, donde
E (YIx) = a + bx. Entonces la línea de regresión mínimo cuadrática está dada
por Y = a+ + b+x, donde
c
+ +
a =y-bx
51(xi - (Yi -
b (11.6)
E(x. - TO 2
Demostración: Se trata de hallar los valores de a y b que hagan mínima la ex-
presión (11.5)
esto es,
Minimizar, Q = min. (yi - a - b xi)2
(para a y b) a,b isl
El método que seguiremos para este fin, es el comunmente usado en el cál-
culo infinitesimal, es decir: se hallan las derivadas parciales de Q con res -
pecto a a y b, las que deben ser nulas como condición necesaria. La condición
suficiente es que
2Q
tal ) O y que el determinante de las derivadas parciales
segundas debe ser también mayor que cero, o sea,
Q
' 2Q
DP.2 DECD11
> o
1)2 Q .212
"0-sibb 'VbZQ
Entonces, a* y b* harán mínima la expresión Q.
Otra expresión equivalente para b+, que suele ser útil para cálculos, es
Exi yi - y2__ x. (11.7)
2::x2 2::x.
-230-
YI a - b sí)
i=1
(1.a)
-2 21(Y1
. -a- b x,) x.
i=1
Para la condición necesaria, tendremos
-2
z
,
t.
]. 1
Sistema que comunnente se escribe
na + bEx. = y.
. =2::x.y.z
aEx. + bEx2 (11.8)
Luego
a+ = - b.1
Por ultimo, veamos si estos valores hacen mínima la función Q.Tomando deriva-
das parciales segundas en (la) tenemos:
-1)25
- 2n, .t)21 2 ni, 1.22 2 Exf
1Pa "Dapb 1>b
Esto es,
2Q -
-aa2
2r. > 0 ',ya que n )0, por ser el tazafic de la muestra)
2n 2 Exi
z - 4 ( Exi)2 = 4n E(xi - ic-)2
2 Exi 2E4
la cual es positiva si tenemos al menos dos valores xi distintos.
En consecuencia, los valores a+ y b+ hacen mínima la expresión Q, luego
la línea de regresión mínima cuadrática es Ye = b+ x
Ejemplo 11.1 Supongamos que los gastos de consumo, desde el punto de
vista económico en promedio, es una función lineal de los
ingresos de las familias con un estándar de vida bajo. Pensemos que pa-
ra los ingresos X hay una distribución de gastos Y, de tal manera que pa
ra cualquier x la media de la distribución de gastos está dada por
E (YJx) = a bx, donde a y b son constantes (parámetros) desconocidos.
Se tomó la información correspondiente al ingreso anual disponible y de-
sembolsos por consumo de diez familias seleccionadas aleatoriamente de
una zona fabril de cierta ciudad, tal información fue:
Tabla 11.1
y
Ingreso Gastos
Consuma.:
$b. $b.
20.000 18.000
15.000 12.000
8,000 7.000
13.000 11.000
7.000 8.000
6.000 6.000
12.000 10.000
20.000 12.000
10.000 8.000
17.000 14.000
- 232-
Tabla 11.2
Ingreso Consumo
en miles en miles
2 2
xi Yi x. yi
xi Yi
+ - + -
y a ey-b x e 10,8 - (0,7) (12,8) 4 1.84
Y (Consumo en
20 miles de $)
•
10
• • = 1,84 + 0,7x
X (Ingreso en
10 20 miles de $)
Figura 11.6
Teorema 11.4.2 Sea Y una variable aleatoria con media a + bx, para un valor
dado x. Se toma una muestra aleaoria de tamaño n de Y (con
sus valores asociados x).
B = 51:(xi - X)(Yi - +
- Si y +
A ='Y - x, (11.9)
21(x. - 1)2
CYX
v(B') \-m..4)2
,
- cYx2
cov (A,)
E(xi-X)2
. + +
donoe A y B son los estimadores mínimos cuadráticos.
2 entonces
Teorema 11.4.4 Suponiendo que E(Y1x) = a + bx y que V Cylx) czpx,
(5.1)2 1 y- (Y t + 2
- A - xi)
n - 2
i=1
Teorema 11.4.5 Supuesto que E (Y!x) ■ a + bx, para valores dados de x, y que
la varianza de Y es c‘ para todo x. Entonces, si (x., Y1) ,
(x2, Y2),...,
) (xn Yn ) es una muestra aleatoria de Y con sus valores ¿socia -
dos x, los estimadores minino cuadráticos A+ y B+ son los mejores estimadores
lineales insesgados de a y b.
Teorema 11.4.6 Sí Y es una variable aleatoria normal con media a + bx, para
un valor especificado x, y con varianza cr2 para cualquier x;
entonces, dada una muestra aleatoria, los estimadores máximo verosímiles de
a, b y cr2, son
A-
A = Y - Bx
^E(x-i) a (Y - b
B -
5--(xi-x )2 2
y
E = nI (Yi - I - 2
Bmi)
Esto nos indica que en promedio existe una desviación estándar estimada
de 1.170 $b., en relación al gasto promedio por concepto de consumo.
11.5
11. 6
E (b4.) a b
2
+ 2 cryx
V(b )= cm .= 2 (11.15)
b 2_(xi-Sp
Le dedicaremos más atención al estimador b+, dado que para tomar decisio-
nes relativas al comportamiento de una población bivariante, es más importante
que a+. Así, si b+ es positivo o negativo, nos indica una relación positiva o
negativa. Como estamos suponiendo que Y es normal, entonces la distribución
de es normal si el tamaño de la muestra es mayor que 30. Cuando n C 30, lo+
tiene distribución más o menos como una t de Student con (n-2) grados de libes
tad. Además, en ambos casos, el estimador insesgado de V (be) es
"2 " 2
"2 cr Cryx
=
(11.16)
b r.(x-s)2 Exl - (5:xi)2
n
El estimador insesgado del error estándar de b+ es simplemente la raíz
cuadrada de
b*
Para nuestro caso, los límites confidenciales estarán dados por los ea -
tadísticos.
1
L + t
s i-01/2 S/ 2
211(x - x)
Y
L •8 - t 1
1-0/2
Ejemplo 11.3 En el ejemplo 11.1 vimos que la estimación puntual del coe-
ficiente de regresión b, era 0,7. Se trata ahora de esta -
blecer su intervalo de confianza, tal que b se encuentre comprendido
dentro de dicho intervalo, con una probabilidad de seguridad del 95%.
Para calcular los límites, podemos usar los resultados obtenidos en los
ejemplos 11.1 y 11.2 faltándonos únicamente el cálculo de tII
,.- 2) con n-2
L • 0 7 - (2,306)(1,17)
I ' 1 0,5252
o sea 0,5252<b<0,8748
11.8
Ejemplo 11.4 Supongamos que existe una relación nula, con un nivel de
significacióno(= 0.05, entre los ingresos y gastos de
consumo, dados en el ejemplo 11.1 ; entonces el proceso de prueba será:
Hipótesis H : b = O
o
H : b O O
l
Nivel de significación: oCa 0,05
- 240-
donde + = Si
6. 1
E:(x- - 1)
2
luego t 9,21
0,076
Decisión: Como 9,21 > 2,306 rechazamos Ho. Era de esperarse, puesto
que b cae dentro del intervalo (0,5252; 0,8748) con una seguridad
probable del 95%.
1.1.9
Distribución Muestral de Yc
/1
2 2 í 1 (x ;)2
CrY (5-yx n JI
E(x.-Z2
de donde r es el estimador insesgado del error estándar de Y c.
Ye
11.10
...■ 1 + (x - x)2
L (x) =Y + t S —
S 1-042 n c-- 2 (11.20)
2...._(x.-x)
2
LI ()
(x) = - t1-a12 S
n _;,2
L-A
Y Y (x) = a+ +
Figura 11.7 c x
o X
X
(x - 12,8)2
Ls (x) = 1,84 + 0,7x + (2,306)0.17) 7 vi 237,6
2
1 (x - 12 8)
L (x) = 1,64 + 0,7x - (2,306)(1,17) TU 237,6
(21-12,6)2 L 18,21
L (21) = 1,84 + (0,7)(21) + (2,306)(1,17)j
21 10 + 37,6
S
Por tanto, se espera que con un ingreso de 21.000 $b., los gastes por
consumo promedio estén comprendidos entre 14.870 y 18.210 $b. con una pro-
babilidad de certeza del 95%.
- 243 -
Correlación
Coe6Leíente de Con/tetar-14n
- 1)(Yi - ;) (11.22)
02 E(y -
Eoci - ;
Inferencia Acerca de O
11.13
Prueba de Hipótesis
para fi =/
s. la que está distribuida como una t-Student con (n-2) grados de libertad, si
Ho es verdadera.
Hipótesis:
Hl : /0 * O
t = r 1_12
Cálculos: 8
t 0,959 j 1-0,919 9,53
-247-
si Z < -1,96 6 Z ) 1,96
1
Zr = 0,959 - 7 + 0,959
0,959
(2,3026) log 1,93332
210 = 0,90 1
—
2 (2,3026) log
,
1 + 0
1 - 90 - 1,47216
11.14
Ejercicios
5.1 Trace un gráfico de puntos con estos datos. Qué variable trazaría en
el eje de las X? Por qué?
5.2 Estime la ecuación de regresión lineal usando el método de los mínimo/.
cuadrados.
- 249 -
5.3 Qué relación describe la ecuación de regresión?
5.4 En promedio, cuales serian las ventas de la compañia cuando el ingre-
so neto personal fuera 2.500 $? Use un intervalo estimado con un coe-
ficiente de confianza de 95%.
5.5 En la pregunta 5.4 trabaje con un ingreso neto de 3.000$.
5.6 Por qué los intervalos en 5.4 y 5.5 no son de la misma amplitud, a pe
sar de que se ha usado en ambos casos el mismo coeficiente
za? Explique. de confian
5.7 El ingreso personal neto en 1974 se espera que sea 3250 $ Cuál es la
predicción para las ventas de la compañia para 1974? Es el intervalo
de predicción lo suficientemente preciso para ser útil? La adminis -
tración desea tener un intervalo de predicción con una amplitud de
4- 2% y un coeficiente de confianza de 95%.
5.8 Estime b con un intervalo de confianza de 98%.
5.9 Proporciona su intervalo de confianza alguna indicación sobre si exis
te o no una relación entre el ingreso neto personal y las ventas de
la compañia?
5.10 Calcule loe coeficientes estimados de determinación y correlación.
Cuál es el significado del coeficiente de determinación?
- 250 -
11.15
11.16
y = E (Ylx,,x2,...,xk) + e (11.28)
que nos indica la relación de una observación de Y en el plano de regresión
multidimensional, donde la variable aleatoria e es la diferencia (error o
desviación) entre un valor observado y su hiperplano medio poblacional (va-
lor medio de Y asociado con un conjunto de valores x. fijos de los Y.
(i=1 ..... k).)
Como en el caso de la regresión lineal simple, se tratará de estimar
los coeficientes de regresión poblacional, mediante una función que haga mí
nima la suma de los errores. Siguiendo el método de los mínimos cuadrados,
tendremos que hallar los valores de a y b. (i=1,...,k), que minimicen la ex
presión
Q = e2 =E EY - E (Ylxi,x2,...,mk)] 2
(11.29)
= 2:: (y - a - bixi - b2x2...- bkxk)2
.lo desarrollarers detalladamente la forma de hallar los estimadores mí-
nimos cuadráticos a y los b.+, puesto que se trata prácticamente de una ge-
neralización del teorema 11.k.1 particularmente en lo concerniente a la de -
mostración. De manera que es cuestión de hallar derivadas parciales en
(11.29) respecto de los coeficientes, igualarlos a cero, y luego obtener las
ecuaciones normales, o sea
1)(1
"Db 2E(y-a-b 1 x1-b x--b
... x.) (-C=0
k 22 kThe
de donde
5::y = na + b
l 2::x l
b2 11:x2 +'" bk
Ex1Y • a EX + b1 23(2 + b21 x + bicExixk
1 2+
Ex2y = a Ex2 + b 2::x x' + b
1 1 2 2 x2
2 + + b
k x2>tk
= /Myx x + e
yi 23 l
Los valores de a, b2 y b3 que hagan mínima la función
)2
9 = 2:lei =;::(Yi 1-1( x2x3
pan estimadores mínimo cuadráticos, que podemos designarlos por a+,
b y b Las ecuaciones normales para hallar estos valores, se obtienen fa
2 3.
ci lmente siguiendo el proceso de las derivadas parciales, etc.; y se tendj
t Y
E I
' x2' x
+ +
Y ■a + b2 x + b x
c 2 3 3
e.
x31
X2 Figura 11.8
X
1(23)c = a1.23 b12.32:2 b13.2X3
en lugar de la que estamos utilizando. Donde X1(23)c nos indica que es la
primera variable (dependiente) y que existen dos variables independientes X2 y
X,; al 23 ea el coeficiente de regresión independiente, cuyo subíndice irsdi
ci que a variable dependiente es X1 y que hay dos variables independientes
X2 y X ; b12 , representa el coeficiente de la variable independiente X2 cuan
12
.-do la variaoló dependiente es X. y la otra variable independiente es X,. Ge
neralizando, b 4235 representaría el coeficiente de regresión de la able
vari
independiente Aí siendo X la variable dependiente y que además existen las
variables independientes A2, X3 y X5, etc., etc.
TABLA 11.3
Préstamos hechos
sobre pólizas
Año por la Cia. de Ingreso Nacio - ?oblación esti-
nal (en millo - mada
Seguros (en mi-
nes de $) (en miles)
les de $) Y
X2 x3
1964 3,6 5 127
1965 3,5 128
1966 3,.4 6 129
1967 3,3 6 130
1968 3,3 7 131
1969 3,2 8 133
1970 3,0 10 134
1971 13 136
1972 2,6 16 138
ti
1973 2,3 18 140
11.17
Regresión no Lineal
Los pasos que se siguen son idénticos al que vimos en el Teorema 11.11.1
De ésta manera se obtendrá el siguiente sistema de ecuaciones normales.
Ey = na + bEx + crx2
Y=axb
Si la función
b c
Y = a x x
2 3
se ajusta mejor a una distribución de datos, podemos seguir el artificio de
aplicar logaritmos a la identidad, es decir
Z k + br + cs
no es otra cosa que una función lineal múltiple, con variables independientes
r y s.
Y = a bx
- 256 -
tendremos
Y' = a' + b'x
que no es otra cosa que una función lineal bivariante. De manera que podemos
aplicar todo cuanto estudiamos en relación a este tipo de función. Del mismo
modo, es posible linealizar otras funciones. Por ejemplo, si en
1
Y =
a+bx 1
tomamos el reciproco de Y, z w 7 , entonces
= a + bx
que también es una función lineal simple.
1= a + bcx (Logística)
Y
ln Y = ln a + (log b) . cx (Gompert)
Y = aebx
Y = a + 15-
x
11.18
Ejercicios
1967 39 48
1968 9
40 54 10
1969 45 55
1970 12
43 58 11
1971 50 62
1972 14
53 64 18
1973 62 69 20
C = a + b Y + cM
CAPITULO /2
MIMOS INDICES
12.1
Introducción
12.2
Números Indices
Año Variable Simples
t X
o x., (xclima).100e 100
1 xl
-1-
x .100
ro
2 x2 11 ..
no 100
k xk xk
.100
xt
donde las xl representan los valotes de <a .ariable, la que puede ser precio,
canTidad, etc. El período base pude ser cualquier ano t. Por simple inspec
ción, se ve que el índice para el período base es siempre igual a 100,
1966 75 60 79
1967 115 92 120
1968 84 67 88
1569 107 86 112
1970 125 100 131
1971 128 102 134
1972 147 118 154
1973 180 144 188
El número índice para cada año se interpreta en términos del período base.
Por ejemplo, el número índice A para 1973 quiere decir que las ventas aumenta
ron en un 44 % respecto al año 1970. El índice B se calculó usando como base
el promedio de las ventas de los años 1968 y 1969 (que es, 95.500 9. Este
caso es usual cuando un sólo año no es representativo como para ser considera
do año base.
I = 100 (12.1)
x
o '
donde x es el valor de la variable del n-ésimo período, y x el valor de la
o
variabl2 en el período base.
TABLA 12.3 Precios unitarios y Cantidades de tres años, para los artícu-
los A,B,C y U.
IQ qn (100) (12.3)
--o
dondeLq ea la suma de las cantidades del n-ésimo período, y:ECIo el agre-
gado de as cantidades del año base.
Otro tipo de índices simple, son aquellos que se obtienen como Pnomedío
Slmsole de Indíce4 Reiatívoa. El promedio simple de relativos es, en efecto,
una media aritmética de relativos. Así, el índice de precios por este mé-
todo viene dado por
19n
—) loa
/P `P o (12.4)
n
De manera que, para cacular índices por este método, es suficiente ha-
llar los indices de cantidades simple (12.1) para cada artículo, y luego pro
mediarlos de acuerdo al número de artículos.
Artículo P1
=1.100 .100 P2
—.100
Po po Po
12.3
Indices de Relativos
Ponderados
O )* Poqo
Po . 100 = FPncill • 100 (12.6)
Poqo
57.:P000
que es el Ud:Cu de Pítecio4 de LaSpeystea (In).
En forma análoga para las cantidades, se tiene
E:(29 Poqo
O0 100 = 100 (12.7)
2::P0qo 2::Pcgo
que es el Indice de CanUdade4 de LASPEYRES
Ejemplo 12.4 Calculemos el índice de precios ponderados con los valo-
res del ato base, para la información de la Tabla 12.3.
Fi(?) Pngo
o 100 27:Pncin 100 (12.9)
EPnqo Pn o
que es el adíee de cantidade4 de PAASCHE (IQP).
Ejemplo 12.5 Veamos el cálculo del índice de precios de Paasche, para
la información de la Tabla 12.3.
Valor actual en
el año dado Valor teórico
IQF 5::PoQn
IQL x IQP
JJJ EPoqo flag°
12.4
Indices de Valor y
Pruebas de Consistencia
IPL x IQL f IV
ya que
EPnc-o x
EPocin EPncln
t
7710 ZIWO EPoqc
- 267 -
también
IPP x IQP ¢ IV
En cambio los índices de Fische?, sí satisfacen la relación 12.12, es
decir
IPF x IQF = IV
ya que
2
E:Pncin E:Pbeln Ar:Pncill) 5:1Pnqn
tr
Scr
á rwit ri
ptR r1/2<70 nocro E 0V0
Por otro lado, una combinación entre índices de Laspmyres y de Paashe,
también cumplen la relación indicada, así,
IPL x IQP - IV
y IPP x IQL m IV
12.5
TABLA 12.9
TABLA 12.11
12.6
Ejercicios
Qué año base se debe tomar para que se cumpla la prueba IPx IQ s IV?
1968 8 1971 25
' 1969 11 1972 27
1970 20 1973 31
4.Supongamos que los datos que se presentan a continuación indican „los in-
gresos totales de una compañía metalúrgica y el índice de precios al por
mayor de metales para el período 1968-1973
Se pide:
4.1 Restablecer los ingresos totales para cada año en términos de pre-
cios promedio en 1966-1967.
4.2 Qué tipo de información se obtiene de la serie de los ingresos' a
precios constantes?. Explique.
4.3 En qué porcentaje disminuyeron los ingresos a los precios de 1966-
1967, entre 1972 y 1973?
4.4 Restablezca los ingresos para 1972 y 1973, a los precios de 1973.
1.00/rv11.
Erratas de importancia advertidas:
á-
- 275 -
›x -A
F (t) = -=r
x x. e-
x=0
A
[t] .50 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0 9.0 10.0
0 .607 .368 .135 .050 .018 .007 .002 .001 .000 .000 -
1 .910 .736 .406 .199 .092 .040 .017 .007 .003 .001 -
2 .986 . .920 .677 .423 .238 .125 .062 .030 .014 .006 .003 .
3 .998 .981 .857. .647 .433 .265 .151 .082 :042 .021 .010
4 1.000' .996 .947 ..815 .629 .440 .285 .173 .100 .055 .029
5 1.000 .999 .983 .961 .785 ' .616 .446 .301 .191 .116 .067
6 1.000 1.000 .995 .966 .889 .762 .606 .450 .313 .207 .130
7 1.000 1.000 ..999 .988 .949 .867 .744 :599 .453 .324 .220
8 1.000 1.000 1.000 .996 .979 .932 .847 .729 .593 .456 .333
9. 1.0.00 1.000 1.000 .999 .992 .968 .916 .830 .717 .587 .458
10 1.000 1.000 1.000
1.000 .917 .985 .957 .901 .816 .706 .583
11 1.000 1.000 1.000
1.000 .999 .995 .980 .947 .888 .803 .697
12 1.000 1.000 1.000
1.000 1.000 .998 .991 .973 .936 .876 .792
13 1.000 1.060 1.000
1.000 1.000 1999 .996 .987 .966 .926 .864
14 1.000 1.000 1.000
1.000 1.000 1.000 .999 .994 .983 .959 .917
15 1.000' 1.000 1.000
1.000 1.000 1.000 .999 .998 .992 .978 .951
16 1.000 1.000 1.000
1.000 1.000 1.000 1.000 .999 .996 ,989 .973
17 1.000 1.000 1.000
1.000 1.000 1.000 1.000 1.000 .998 .995 .986
18 1.000 1.000 1.000
1.000 1.000 1.000 1.000 1.000 .999 .998 .993
19 1.000 1.000 1.000
1.000 1.000 1.000 1.000 1.000• 1.000 .999 .997
'20 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 .998
21 1.000 1.000 1.000 1.000 1.000 1.000 1.000 -1.000 1.000 1.000 .999
22 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000
- 276 -
1 2 3 4 5. 6 7 8 9
z 0
.5080 .5120 .5160 .5199 .5239 .5279 .5319 .5359
.0 .5000 .5040 .5714 .5753
.1 .5398 .5438 .5478 .5517 .5557 .5596 .5636 .5675
.5871 .5910 .5948 .5987 .6026 .6064 .6103 .6141
.5793 .5832 .6480 .6517
.3 .6179 .6217 .6255 .6293 .6331 .6368 .6406 .6443
.6628 .6664 .6700 .6736 .6772 .6808 .6844 .6879
.4 .6554 .6591
.6985 .7019 .7054 .7088 .7123 .7157 .7190 .7224
.5 .6915 .6950 .7517 .7549
.6 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486
.7642 .7673 .7704 .7734 .7764 .7794 .7823 .7852
.7 .7580 .7611 18106 .8133
.8 .7181 .7910 .7939 .7967 .7995 .8023 .8051 .8079
.8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389
.9 .8159 .3186
.8461 .8485 .8508 .8531 .8554 .8577 .8599 .8621
1.0 .8413 3438 .8790 .8810 .8830
1.1 .8643 .8665 .8686 .8708 .8729 .8749 .8770
.8888 .8907 .8925 .8944 .8962 .8980 .8997 .9015
1.2 .8849 .8869 .9162 .9177
1.3 ‘9032 .9049 .9066 .9082 .9099 .9115 .9131 .9147
.9222 .9236 .9251 .9265 .9279 .9292 .9306 .9319
1.4 .9192 .9207
.9357 .9370 .9382 .9394 .9406 .9418 .9429 .9441
1.5 .9332 .9345 .9535 .9545
1.6 .9452 .9463 .9474 .9484 .9495 .9505 .9515 .9525
.9573 .9582 .9591 .9599 .9608 .9616 .9625 .9633
1.7 .9554 .9564 .9700 .9706
1.8 .9641 .9649 .9656 .9664 .9671 .9678 .9686 .9693
.9726 .9732 .9738 .9744 .9750 .9756 .9761 .9767
1.9 .9713 .9719
.9783 .9788 .9793• .9798 .9803 .9808 .9812 .9817
2.0 .9773 .9778 .9854 .9857
2.1 .9821 .9826 .9830 .9834 .9838 .9842 .9846 .9850
.9868 .9871 .9875 .9878 .9881 .9884 .9887 .9890
2.2 .9861 .9864 .9913 .9916
2.3 .9893 .9896 .9898 .9901 .9904 .9906 .9909 .9911
.9922 .9925 .9927 .9929 .9931 .9932 .9934 .9936
2.4 .9918 .9920
.9941 .9943 ..9945 .9946 .9948 .9949 .9951 .9952
2.5 .9938 .9940 .9963 .9964
2.6 .9953 .9955 .9956 .9957 .9959 .9960 .9961 .9962
.9967 .9968 .9969 .9970 .9971 .9972 .9973 .9974
2.7 .9965 .9966 .9981
2.8 .9974 .9975 .9976 .9977 .9977 .9978 .9979 .9979 .9980
.9982 .9983 .9984 .9984 .9985 .9985 .9986 .9986
2.9 .9981 .9982
3.0 .9987
- 277 -
g.1. 1 -a
. 50 .75 .90 .95 .975 .99 .995 .9995 -®
1 •325 1.000 3.078 6.314 12.706 31.821 63.657 636.619
2 .289 .816 1.886 2.920 4.303 6.965 9.925 31.598
3 .277 .765 1.638 2.353 3.182 4.541 5.841 12.941
4 .271 .741 1.533 2.132 2.776 3.747 4.604 8.610
5 .267 .727 1.476 2.015 2.571 3.365 4.032 6.859
6 .265 .718 1.440 1.943 2.447 3.143 3.707 5.959
7 .263 .711 1.415 1.895 2.365 2.998 3.499 5.405
8 .262 .706 1.397 1.860 2.306 2.896 3.355 5.041
9 .261 .703 1.383 1.833 2.2B2 2.821 3.250 4.781
10 .260 .700 1.372 1.812 2.228 2.764 3.169 4.587
11 .260 .697 1.363 1.796 2.201 2.718 3.106 4.417
12 .259 .695 1.356 1.782 2.179 2.681 3.055 4.318
13 .259 .694 1.350 1.771 2.160 2.650 3.012 4.221
14 .258 .692 1.345 1.761 2.145 2.624 2.977 4.140
15 .258 .691 1.341 1.753 2.131 2.602 2.947 4.073
16 .258 .690 1.337 1.746 2.120 2.583 2.921 4.015
17 .257 .689 1.333 1.740 2.110 2.567 2.898 3.965
18 .257 .688 1.330 1.734 2.101 2.552 2.878 3.922
19 .257 .688 1.328 1.729 2.093 2.539 2.861 3.883
20 .257 .687 1.325 1.725 2.086 2.528 2.845 3.850
21 .257 .686 1.323 1.721 2.080 2.518 2.831 3.819
22 .256 .686 1.321 1.717 2.074 2.508 2.819 3.792
23 .256 .685 1.319 1.7]4 2.069 2.500 2.807 3.767
24 .256 .685 1.318 1.711 2.064 2.492 2.797 3.745
25 .256 .684 1.316 1.701 2.060 2.485 2.787 3.725
a 26 .256 .684 1.315 1:706 2.056 2.479 2.779 3.707
27 .256 .684 1.314 1.703 2.052 2.473 2.771 3.690
28 .256 .683 1.313 1.701 2.048 2.467 2.763 3.674
29 .256 .683 1.311 1.699 2.045 2.462 2.756 3.659
30 .256 .683 1.310 1.697 2.042 2.457 2.750 3.646
LO .255 .681 1.303 1.684 2.021 2.423 2.704 3.551
60 .254 .679 1.296 1.671 2.000 2.390 2.660 3.460
120 .254 .677 1.289 1.658 2.980 2.358 2.617 3.373
.253 .674 1.282 1.645 2.960 2.326 2.576 3.291
- 278 -
CAPITULO 2
Ejercicios 2.5
CAPITULO 3
Ejercicios 3.11
/
2.1) M(X) = 67,86 Me = 67,27 Mo 66,43 2.2) M(X) = 111,7 Me = 70
Mo = 60 3.1) No necesariamente 3.2) No necesariamente, se puede dar pa
ra muchos casos. Por ejemplo, pruebe para el caso en que hayan 3 mujeres y
10 hombres 3.4) El caso más simple, para que se cumpla la aseveración ,
es que haya el mismo número de obreros en cada sector. Sin embargo, exis -
ten muchos casos en que para diferentes números de obreros en los sectores
se cumple la aseveración. Analice e intente hallar el número de obreros de
cada sector (que no sean iguales) 3.5) No necesariamente 3.6) No nece -
seriamente 3.8)No, es la misma constante 3.9) Poco factible si no hay
más información 4) 25,7 5) 40 Igh. 9) 291
CAPITULO 4
Ejercicios 4.5
CAPITULO 5
Ejercicios 5.1
Ejercicios 5.2
CAPITULO 6
Ejercicios 6.8
E ercicios 7.7
/ (10)x.
2,4,5
1) 5/6, 5/6, 0,5948, 0,1962 2) 0,8170, 0,2 3)()( 2
x 5-x / 5
4) 6,a, 0,6065 5) 0,2865, 0,3621, 4 0 6) 1/3, 36 7) 0,44, 0,44
8)0,2928 9) 0,1587 , 0,3085 10) 0,2119 , 0,0227 , 56,4 onzas 11) En-
tre 2,496 y 2,504 , 0,0668 , 0,516 12) 95%, 88%, 67%
• CAPITULO 8
Ejercicios 8.11
CAPITULO 94,
Ejercicios 9.5
1) 1.027 2.1) 74,2 a_125,8 2.3) 99 % 3.1) 105 3.2) 79,2 a 130,8
3.3) Sí 4.1) Si p = Rin 5) 52,92 a 143,08 6) 256 7.1) 0,588 a 0,612
7.2) 2401 10) 5,5 , 1,8333 11) 1,5
CAPITULO 10
Ejercicios 10.6
3) Recomendar se incremente el contenido de la carne envasada 4) Está so-
breestimada 5) Con un nivel de significación de 0,01 no se rechaza H en
cambio con 0,05 sí se rechaza. Analizar. 6) No ce válida 8) Existe° di-
ferencia.
CAPITULO 11
Ejercicios 11.14
1.2) Ye=-75,1 + 0,86x 1.3) (0,68 , 1,05) 1.4) (62,54 , 67,46)
1.5) Con un nivel de significación de 0,05 , no se acepta que b=0 1.6) Se
rechaza la hipótesis He: b=6 1.7) 70,3 Kg. 1 .8) 176,3 cros. 2.1) b+=0,8
2.2) Por cada unidad de cambio en X, Y cambia en O ,8 2.3) Ye = 6 + 0,8X
2.4)No se rechazaría la hipótesis E0: 6=1 3) No se rechaza la hipótesis
propuesta 4.1) 0,7 5.2) Ye = 297,16 + 0,055 X 5.3) 0,055
Ejercicios 11.18
2) Ye = 10,99 - 0,036 X2 - 0,57 X2 5) Ye = 0,39 X2+ 0,25 X2
6.1) C • 12,178 + 0,252Y+ 1,527N
CAPITULO 12
Ejercicios 12.6
2) Cualquier año 4.1) 1968 - 1.166,2 4.3) Incrementa 14%
69 - 1.177,4
70 - 1.198,0
71 - 1.010,9
72 - 1.190,7
73 - 1.357,7
4.4) 1972 - 1.775,4
1973 - 2.024,4
-283-
BIBLIOGRAFIA CONSULTADA
A4,0 39 93
uf