Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
ndice
Presentacin
05
Red de contenidos
06
Sesiones de aprendizaje
SEMANA 1
SEMANA 2
SEMANA 3
SEMANA 4
SEMANA 5
SEMANA 6
CIBERTEC
CARRERAS PROFESIONALES
07
19
35
45
55
73
SEMANA 7
: EXAMEN PARCIAL
SEMANA 8
SEMANA 9
SEMANA 10 :
SEMANA 11
SEMANA 12
SEMANA 13
SEMANA 14
SEMANA 15 :
SEMANA 16
CARRERAS PROFESIONALES
87
103
123
135
149
163
173
185
199
CIBERTEC
ESTADISTICA II
Presentacin
La globalizacin ha creado un campo muy extenso de desarrollo para los
nuevos profesionales, ya sea en servicios o en produccin. Es por esto que
tienen
CIBERTEC
CARRERAS PROFESIONALES
Red de contenidos
conocida
Intervalos de
confianza
desconocida
Proporciones
conocida
Prueba de
hiptesis
Muestreo
desconocida
Proporciones
Lineales
Simple
No Lineales
Regresiones
Mltiple
Correlaciones
Serie de
tiempo
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
SEMANA
1
TEORA DE MUESTREO
TEMAS
OBJETIVOS ESPECFICOS
CONTENIDOS
ACTIVIDADES
o
o
CIBERTEC
CARRERAS PROFESIONALES
TEORA DE MUESTREO
La teora de muestreo es un estudio de las relaciones existentes entre una
poblacin y muestras extradas de la misma. Tiene gran inters en muchos
aspectos de la estadstica. Por ejemplo, permite estimar cantidades
desconocidas de la poblacin (tales como la media poblacional, la varianza,
etc.), frecuentemente llamadas parmetros poblacionales o brevemente
parmetros, a partir del conocimiento de las correspondientes cantidades
muestrales (tales como la media muestral, la varianza, etc.), a menudo
llamadas estadsticos muestrales o brevemente estadsticos.
La teora de muestreo es tambin til para determinar si las diferencias que se
puedan observar entre dos muestras son debidas a la aleatoriedad de las
mismas o si por el contrario son realmente significativas. Tales preguntas
surgen, por ejemplo, al ensayar un nuevo suero para el tratamiento de una
enfermedad, o al decidir si un proceso de produccin es mejor que otro. Estas
decisiones envuelven a los llamados ensayos e hiptesis de significacin, que
tienen gran importancia en teora de la decisin.
En general, un estudio de inferencias, realizado sobre una poblacin mediante
muestras extradas de la misma, junto con las indicaciones sobre la exactitud
de tales inferencias aplicadas a la teora de la probabilidad, se conoce como
inferencia estadstica.
MUESTRAS AL AZAR. NMEROS ALEATORIOS
Para que las conclusiones de la teora del muestreo e inferencia estadstica
sean vlidas, las muestras deben elegirse de forma que sean representativas
de la poblacin. Un estudio sobre mtodos de muestreo y los problemas que
tales mtodos implican se conoce como diseo de experimentos.
El proceso mediante el cual se extrae de una poblacin una muestra
representativa de la misma se conoce como muestreo al azar. De acuerdo con
ello cada miembro de la poblacin tiene la misma posibilidad de ser incluido en
la muestra. Una tcnica para obtener una muestra al azar es asignar nmeros
a cada miembro de la poblacin: escritos estos nmeros en pequeos papeles,
se introducen en una urna y despus se extraen nmeros de la urna, teniendo
cuidado de mezclarlos bien antes de cada extraccin.
MUESTREO CON Y SIN REEMPLAZO
Si se extrae un nmero de una urna, se puede volver o no el nmero a la urna
antes de realizar una segunda extraccin. En el primer caso, un mismo nmero
puede salir varias veces, mientras que en el segundo un nmero determinado
solamente puede salir una vez. El muestreo, en el que cada miembro de la
poblacin puede elegirse ms de una vez, se llama muestreo con reemplazo,
mientras que si cada miembro no puede ser elegido ms de una vez se tiene el
muestreo sin reemplazo.
Las poblaciones pueden ser finitas o infinitas. Si, por ejemplo, se extraen
sucesivamente 10 bolas sin reemplazo de una urna que contiene 100, se est
tomando una muestra de una poblacin finita, mientras que si se lanza al aire
una moneda 50 veces, anotndose el nmero de caras, se est muestreando
en una poblacin infinita.
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
x =
N n
N 1
x =
CIBERTEC
CARRERAS PROFESIONALES
10
p = p
p (1 p)
n
p =
= p(1 p )
Para grandes valores de n( n 30 ) la distribucin muestral se aproxima mucho
a una distribucin normal. Ntese que la poblacin se distribuye binomialmente.
DISTRIBUCIN MUESTRAL DE DIFERENCIAS Y SUMAS
Supngase que se tienen dos poblaciones. Para cada muestra de tamao n1
extrada de la primera poblacin se calcula un estadstico s1. Esto proporciona
una distribucin muestral del estadstico s1 con media x1 y desviacin
estndar x1 . Anlogamente, para cada muestra de tamao n2, extrada de la
segunda poblacin, se calcula un estadstico s2. Esto Igualmente proporciona
una distribucin muestral del estadstico s2, con media x 2 y desviacin
estndar x 2 . De todas las posibles combinaciones de estas muestras de las
dos poblaciones, se puede obtener una distribucin de las diferencias (s1-s2)
que se conoce como distribucin muestral de diferencias de los estadsticos.
Si s1 y s2 son las medias muestrales de las dos poblaciones, las cuales vienen
dadas por x1 y x 2 , entonces la distribucin muestral de las diferencias de
medias para poblaciones infinitas con medias y desviaciones estndar 1 , 1 y
2 , 2 , respectivamente, tiene por media y desviacin estndar:
x1 x 2 = x1 x 2 = 1 2
1 x2
= x21 + x22 =
12
n1
22
n2
p p = p p = p1 p2
1
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
11
p1 (1 p1 ) p2 (1 p2 )
+
n1
n2
p p = p2 + p2 =
1
s s = s s
1
s s = + s2
1
2
s1
Proporciones
CIBERTEC
Error estndar
x =
p =
p (1 p)
n
Observaciones
Se cumple para muestras grandes o
pequeas. La distribucin muestral de
medias se ajusta mucho a la normal
para n 30 incluso para poblaciones
no normales.
Se cumple para muestras grandes o
pequeas. La distribucin muestral de
medias se ajusta mucho a la normal
para n 30 incluso para poblaciones
no normales.
CARRERAS PROFESIONALES
12
ACTIVIDADES
1. Una poblacin se compone de los cinco nmeros 2, 3, 6, 8, 11. Considere
todas las muestras posibles de tamaos que puedan extraerse con
remplazamiento de esta poblacin. Halle lo siguiente:
1.1 La media de la poblacin
1.2 La desviacin estndar de la poblacin
1.3 La media de la distribucin muestral de medias
1.4 El error estndar de medias
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
13
5. Los cojinetes de bolas de una determinada casa pesan 0,50 onzas con una
CIBERTEC
CARRERAS PROFESIONALES
14
7. Se pesan tres cantidades dando 20,48; 35,97 y 62,34 libras con desviaciones
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
15
Autoevaluacin
1. Quinientos cojinetes de bolas tienen un peso medio de 5,02 onzas y una
desviacin estndar de 0,30 onzas. Halle la probabilidad de que una
muestra al azar de 100 cojinetes elegidos entre este grupo tenga un peso
total (a) comprendido entre 496 y 500 onzas, (b) de ms de 510 onzas.
2. Un fabricante despacha 1000 lotes de 100 bombillas cada uno. Si
normalmente el 5% de las bombillas es defectuoso, en cuntos lotes cabe
esperar menos de 90 bombillas buenas?
3. Ciertos tubos fabricados por una compaa tienen una duracin media de
800 horas y una desviacin estndar de 60 horas. Halle la probabilidad de
que una muestra al azar de 16 tubos, tomada entre ellos tenga una duracin
media entre 790 y 810 horas.
4. Se ha encontrado que el 2 % de las piezas producidas por cierta mquina
son defectuosas. Cul es la probabilidad de que en una partida de 400
piezas sean defectuosas 3 % o ms?
5. Los resultados de una eleccin demostraron que un cierto candidato obtuvo
el 46% de los votos. Determine la probabilidad de que de 1000 individuos
elegidos al azar de la poblacin votante se hubiese obtenido una mayora
de votos para dicho candidato.
6. A y B juegan a cara y cruz, lanzando cada uno 50 monedas. A ganar el
juego si consigue 5 o ms caras que B, de otro modo gana B. Determine la
proporcin contra A de que gane un juego determinado.
CIBERTEC
CARRERAS PROFESIONALES
16
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
17
15. Una urna contiene 80 bolas de las que 60 % son rojas y 40 % blancas. De
un total de 50 muestras de 20 bolas cada una, sacadas de la urna con
reemplazo, en cuntas cabe esperar 12 bolas rojas y 8 blancas?
16. A y B fabrican dos tipos de cables, que tienen unas resistencias medias a la
rotura de 4000 y 4500 libras con desviaciones estndar de 300 y 200 libras,
respectivamente. Si se comprueban 100 cables de A y 50 cables de B,
cul es la probabilidad de que la media de resistencia a la rotura de B sea
(a) al menos 600 libras ms que A, (b) al menos 450 libras ms que A?
17. En una prueba de aptitud la puntuacin media de los estudiantes es de 72
puntos y la desviacin tpica de 8 puntos. Cul es la probabilidad de que
dos grupos de estudiantes, formados de 28 y 36 estudiantes, respectivamente, difieran en su puntuacin media en (a) 3 o ms puntos, (b) entre 2
y 5 puntos?
18. Los resultados de una eleccin mostraron que un cierto candidato recibi el
65 % de los votos. Halle la probabilidad de que en dos muestras al azar
compuesto cada una de 200 votantes, haya una diferencia superior al 10 %
en las proporciones que votaron a dicho candidato.
Para recordar
En el uso de Distribuciones muestrales se debe tener en cuenta que las
n variables aleatorias independientes a estudiar deben ser continuas.
Para un proceso Normal se debe tener en cuenta la media promedio y
la desviacin estndar comn y finitas.
CIBERTEC
CARRERAS PROFESIONALES
18
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
19
SEMANA
2
INTERVALOS DE CONFIANZA
TEMAS
OBJETIVOS ESPECFICOS
CONTENIDOS
ACTIVIDADES
CIBERTEC
CARRERAS PROFESIONALES
20
INTERVALO DE CONFIANZA
ESTIMACIN DE PARMETROS
Una vez que se obtiene algn estadstico (media, desviacin estndar o
proporcin muestral, entre otros) es importante determinar si dichos
resultados pueden ser asociados a la poblacin de donde se extrajo la
muestra. La estimacin de parmetros se encarga de aproximar los valores
de estos a partir de los resultados obtenidos de un conjunto de
observaciones muestrales y sobre la base de ciertos procedimientos y
criterios previamente establecidos. Por esto nos permitir estimar con
precisin la porcin de la poblacin (la fraccin de la poblacin que posee
ciertas caractersticas) y la media de la poblacin.
TIPOS DE ESTIMACIN
a) Estimacin Puntual
Una estimacin puntual es un solo nmero que se utiliza para estimar un
parmetro de poblacin desconocido. Se puede decir que es la estimacin
del valor de un parmetro por medio de un valor concreto (nico valor) y que
se obtiene a partir del clculo del estimador correspondiente proveniente de
una muestra determinada. La desventaja de utilizar este tipo de estimacin
radica en que no es posible determinar el grado de certeza que se tiene al
hacer la estimacin.
Por ejemplo, si de una muestra de 36 cajeros automticos se obtuvo que el
tiempo promedio de atencin al cliente es de 1.5 minutos con una desviacin
estndar de 0.5 minutos, estos valores son los estimadores puntuales del
verdadero tiempo promedio de atencin y de la verdadera desviacin
estndar del tiempo de atencin a los clientes.
b) Estimacin por Intervalos
Una estimacin de intervalo es un intervalo de valores que se utiliza para
estimar un parmetro de poblacin. Esta estimacin indica el error de dos
maneras: por extensin del intervalo y por la probabilidad de obtener un
verdadero parmetro de la poblacin que se encuentra dentro del intervalo
bajo un cierto nivel de confianza o certidumbre previamente establecida. Es
mejor la estimacin cuando este intervalo tiene longitud pequea y que la
probabilidad (nivel de confianza) de que el parmetro se encuentre entre los
lmites de dicho intervalo (lmites de confianza) sea cercano a uno.
Estimador: Cualquier estadstica de muestra que se utilice para estimar un
parmetro de poblacin se conoce como estimador, es decir, un estimador es
una estadstica de muestra utilizada para estimar un parmetro de la
poblacin. La media de la muestra x puede ser un estimador de la media de
la poblacin , y la porcin de la muestra se puede utilizar como estimador
de la porcin de la poblacin.
En general, se puede establecer lo siguiente:
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
21
LIC
LCS
p [L E L + E ] = 1
Donde:
L:
E:
1 - :
:
Estadstico correspondiente
Error estndar de estimacin
Nivel de confianza
Parmetro por estimar
CIBERTEC
CARRERAS PROFESIONALES
22
dos estadsticos p [ 1 2 ] = 1
Para una muestra aleatoria de tamao n suficientemente grande (n 30), por el
teorema de lmite central x N ( ,
)
n
Si x es una poblacin normal, entonces x es normal para toda muestra n.
Z=
Adems se tiene
n
Por
la
simetra
tiene p [ Z tab Z + Z tab
de
]= 1
la
curva
normal
se
p x Z tab
x + Z tab
=1
n
n
x Z tab
n
x + Z tab
E = Z tab * x
x =
Donde:
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
23
E = Z tab * x
S
x =
n
Donde:
S: desviacin estndar de la muestra
Z tab 2
n=
E2
2
E2 =
Z tab
n
N n
N 1
Z tab 2
n
=
N n
E2
(
)
N 1
2
Luego:
p [LIC 1 2 LSC
CIBERTEC
]= 1
CARRERAS PROFESIONALES
24
( X Y ) ( x y )
x2
n
y2
m
Luego:
2
2
x2 y
x2 y
=1
+
1 2 ( X Y ) + Z o
+
p ( X Y ) Z o
n
m
n
m
x2 y
( X Y ) Z o
+
n
m
(X Y ) + Zo
x2
n
y2
ACTIVIDADES
1. Se toma una muestra de 60 individuos de una poblacin que se sabe tiene
una desviacin estndar de 1,4. Se encuentra que la media de esta muestra
es de 6,2.
Construya una estimacin de intervalo alrededor de la media de la muestra,
utilizando un error estndar de la media.
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
25
3. Para una poblacin con una varianza conocida de 185, una muestra de 64
individuos conduce al valor de 217 como estimacin de la media. Construya
una estimacin de intervalo que incluya a la media de la poblacin 68,3% de
las veces.
CIBERTEC
CARRERAS PROFESIONALES
26
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
27
9. Una muestra de 150 bombillas del fabricante A dieron una vida media de
1400 horas y una desviacin estndar de 120 horas. Una muestra de 100
bombillas del fabricante B dieron una vida media de 1200 horas y una
desviacin estndar de 80 horas. Halle el intervalo de confianza al 99% para
la diferencia de las vidas medias de las poblaciones A y B.
Autoevaluacin
1. La panificadora Gabino est interesada en adquirir una camioneta usada.
Selecciona al azar 125 ofertas de venta y encuentra que el precio promedio
de una camioneta en esta muestra es de $3250. La empresa sabe que la
desviacin estndar de los precios de las camionetas usadas en la ciudad
es de $615. Construya una estimacin de intervalo para el precio promedio
CIBERTEC
CARRERAS PROFESIONALES
28
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
29
CIBERTEC
CARRERAS PROFESIONALES
30
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
31
2000. Suponga que desea una estimacin por intervalo de 95% de nivel de
confianza para la media del sueldo anual inicial. De qu tamao debe
tomarse la muestra, si el error de estimacin deseado es de $ 200.
19. La empresa de bienes y races Fortaleza proporciona costos promedios
mensuales de renta de departamentos en el departamento de Arequipa.
Suponga que la desviacin estndar poblacional es de s/. 220 soles y que
el error de estimacin es de s/. 50. Cul es el tamao de la muestra
recomendada para una estimacin del intervalo de confianza de 90% del
costo de renta promedio poblacional?
20. El tiempo de traslado al trabajo, para residentes en los conos de la ciudad
de Lima, tiene una distribucin normal con desviacin estndar de 6,25
minutos. Si el error de estimacin es de 2 minutos. Qu tamao debe
tener la muestra, a una confiabilidad del 90%?
21. Determine el tamao mnimo de muestra que se debe tomar para estimar
al 85% de confianza el porcentaje de limeos que actualmente utiliza
Internet diariamente. El ao pasado se realiz una investigacin que indic
que el 18% de los limeos utilizaba Internet diariamente. Se desea que el
error al hacer la estimacin no sea mayor que 5%.
22. Un ingeniero industrial est interesado en estimar el tiempo medio
requerido para ensamblar una tarjeta de circuito impreso. Qu tan grande
debe ser la muestra si el ingeniero desea tener una confianza del 95% de
que el error de estimacin de la media es menor que 0.25 minutos? La
desviacin estndar del tiempo de ensamble es 0.45 minutos.
23. Una tienda de departamentos desea estimar, con un nivel de confianza de
0.98 y un error mximo de 0,5, el verdadero valor medio de dlares de las
compras a crdito por mes realizadas por sus clientes. Dado que la
desviacin tpica es $ 15, determine el tamao de la muestra.
24. De dos anlogos grupos de enfermos A y B formados de 50 y 100
individuos respectivamente, al primero le fue dado un nuevo tipo de
somnfero y al segundo el tipo convencional. Para los pacientes del primer
grupo el nmero medio de horas de sueo fue de 7,82 horas con una
desviacin estndar de 0,24 horas. Para el segundo grupo el nmero
medio de horas de sueo fue de 6,75 horas con una desviacin estndar
de 0,30 horas. Halle el intervalo de confianza al 99% para la diferencia del
nmero de horas de sueo inducidas por los dos tipos de somnfero.
25. Una muestra al azar de 200 pilas de la marca A para calculadoras tiene
una vida media de 140 horas y una desviacin estndar de 10 horas. Una
muestra al azar de 120 pilas de la marca B para calculadoras tiene una
vida media de 125 horas y una desviacin estndar de 9 horas. Determine
el intervalo de confianza al 99% para la diferencia de medias de las dos
marcas de pilas para calculadoras
CIBERTEC
CARRERAS PROFESIONALES
32
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
33
Para recordar
CIBERTEC
CARRERAS PROFESIONALES
34
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
35
SEMANA
3
INTERVALO DE CONFIANZA
PARA MUESTRAS PEQUEAS
TEMAS
OBJETIVOS ESPECFICOS
CONTENIDOS
ACTIVIDADES
CIBERTEC
CARRERAS PROFESIONALES
36
x
S
n
Para hallar un intervalo de confianza para se necesita encontrar dos
estadsticos.
p [ 1 2 ] = 1
]= 1
S
S
p x t tab
x + t tab
=1
n
n
x t tab
n
x + t tab
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
37
L:
E:
1 - :
:
Estadstico correspondiente
Error estndar de estimacin
Nivel de confianza
Parmetro por estimar
E = Ttab * x
x =
S
n
Donde:
S : desviacin estndar de la muestra
fc =
Nn
N 1
( X Y ) ( x y )
2
2
1 1 (n 1) S x + (m 1) S y
n m
n+m2
Donde:
S c : es la desviacin estndar combinada de las dos muestras
Sc =
(n 1) S x2 + (m 1) S y2
n+m2
p [LIC 1 2 LSC
]= 1
Luego:
CIBERTEC
CARRERAS PROFESIONALES
38
p ( X Y ) t o S c
1
1
+
1 2 ( X Y ) + to S c
n m
1
1
+ =1
n m
( X Y ) t o S c
1
1
+
n m
( X Y ) + to S c
1
1
+
n m
ACTIVIDADES
1. De una muestra de 18 gasolineras REPSOL tomadas en la ciudad de Lima,
se encontr que el precio promedio de un galn de gasolina sin plomo es de
$ 3,17; con una desviacin estndar de $ 0,08 por galn. Halle el intervalo
de confianza al 95% para el valor real del precio medio de la gasolina sin
plomo por galn.
3.
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
39
295
305
289
398
294
397
308
300
320
365
350
380
300
395
310
399
285
360
7,0
6,7
1,2
6,0
6,6
7,3
6,9
6,6
6,7
6,4
7,2
7,3
7,0
7,2
7,0
6,0
6,3
6,8
CIBERTEC
CARRERAS PROFESIONALES
40
Analista
164,4 165,2 169,2 168,2 167,3 168,2 169,5 167,2 168,1 169,3
01
Analista
163,2 165,3 167,2 168,9 169,9 165,4 167,3 162,3 163,2 165,2
02
Determine el intervalo de confianza al 90% para la diferencia de medias entre
analistas. Suponga que las varianzas son iguales pero desconocidas.
481
506
494
506
661
572
602
487
524
661
TIPO 2
526
511
556
542
491
498
537
582
605
605
8. Dos analistas tomaron lecturas repetidas en la dureza del agua de las napas
freticas a lo largo del valle del Rimac. Determine un intervalo de confianza
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
41
0,46 0,62 0,37 0,45 0,38 0,37 0,44 0,48 0,53 0,47
Analista B
0,82 0,64 0,54 0,55 0,58 0,42 0,48 0,33 0,32 0,25
Autoevaluacin
1. Se pidi al personal de ventas de la Distribuidora Continental que
presentara informes semanales con los clientes llamados durante la
semana. En una muestra de 18 informes semanales se determin un
promedio de 22,4 llamadas a clientes por semana y una desviacin estndar
de 5 llamadas. Determine el intervalo de confianza al 95% para el nmero
promedio de llamadas semanales a clientes.
2. El dimetro final de un cable elctrico blindado se distribuye normalmente.
Si se toma una muestra de 20 de estos cables, se encuentra que su media
es de 0,790 y una desviacin estndar es de 0,01. Encuentre el intervalo de
confianza al 95%.
3. En un estudio realizado por TEXACO acerca de los precios de la gasolina
de 97 octanos en los diferentes grifos de la capital, se encontraron los
siguientes precios por galn automviles.
4,03 4,05 4,15 4,00 3,99 4,00 3,98 3,97 4,10 4,12
4,08 4,05 4,00 4,04 4,05 4,00 3,99 3,97 4,00 3,98
Si el precio de venta de gasolina de 97 octanos sigue una distribucin
normal, determine el intervalo de confianza al 95% del precio promedio
poblacional.
4. La cantidad de horas que duerme una persona que sobresale en su trabajo
tiene una distribucin normal. En la siguiente tabla se observa la cantidad de
horas de sueo por noche de 24 individuos que sobresalen en su trabajo.
6,2
CIBERTEC
6,3
6,4
6,0
7,0
5,9
5,9
6,0
CARRERAS PROFESIONALES
42
7,0
7,0
6,3
6,1
6,5
6,2
5,8
6,8
5,5
5,8
5,2
5,8
6,4
5,7
6,2
6,0
8,23
8,26
8,20
8,25
8,29
8,29
8,31
8,27
8,25
8,32
8,24
8,31
8,31
8,21
8,29
8,20
8,20
8,30
4,2
4,8
5,2
5,5
5,9
6,1
6,8
5,2
4,2
5,8
4,5
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
43
18
22
14
19
21
23
17
26
28
12
14
26
15,8
15,8
15,4
15,7
16,2
15,4
16,8
15,2
15,4
16,2
15,9
16,3
16,1
15,7
103
97
94
94
95
100
85
105
102
150
98
120
100
92
90
85
94
78
86
85
92
95
95
82
Hdrico II
84
89
87
92
90
91
87
87
81
80
Determine el intervalo de confianza del 95% para la diferencia entre las dos
producciones medias de maz hbrido.
Para recordar
CIBERTEC
CARRERAS PROFESIONALES
44
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
45
SEMANA
4
INTERVALO DE CONFIANZA
PARA UNA PROPORCIN
TEMAS
OBJETIVOS ESPECFICOS
CONTENIDOS
ACTIVIDADES
CIBERTEC
CARRERAS PROFESIONALES
46
x
por p = , que es usado como un estimado puntual del parmetro p.
n
Si p es desconocido, se puede establecer un intervalo de confianza para p (p1
p p2), considerando la distribucin muestral de p, como la misma de la
variable aleatoria x.
Para una muestra aleatoria de tamao n suficientemente grande (n 30),
(1 )
Media p = E ( p) =
Varianza p2 =
n
La variable aleatoria Z =
p p Z tab
(1 )
p [ Z tab Z + Z tab
p (1 p )
p + Z tab
n
]= 1
p (1 p )
=1
p Z
tab
p (1 p )
n
p + Z tab
p (1 p )
E = Z tab
Donde:
p(1 p)
n
p: proporcin muestral
n: tamao de la muestra
z 2 p (1 p )
n=
E2
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
47
z2
n=
4E 2
Observacin: Si se conoce el tamao de la poblacin (N) y el muestreo es sin
reemplazo se usa el factor de correccin para poblacin finita (fc) que afecta y
multiplica al error estndar de estimacin (E).
fc =
Nn
N 1
2
E 2 = Ztab
(
p (1 p ) N n
)(
)
n
N 1
2
tab
Z p(1 p )
n
)
=
2
N n
E
(
)
N 1
INTERVALO DE
PROPORCIONES
CONFIANZA
PARA
LA
DIFERENCIA
DE
LAS
y n2 que son
Z =
( p 1 p 2 ) ( 1 2 )
1 (1 1 )
n1
2 (1 2 )
n2
Luego:
CIBERTEC
CARRERAS PROFESIONALES
48
p
(
1
p
)
p
(
1
p
)
p
(
1
p
)
p
(
1
1
1
2
2
1
1
2
2)
p ( p1 p2 ) Zo
+
(1 2 ) ( p1 p2 ) + Zo
+
=1
n1
n2
n1
n2
p
(
1
p
)
p
(
1
p
( p p ) Z
1
1
2)
+ 2
1
2
tab
n1
n2
( p1 p2 ) + Ztab
p1 (1 p1 ) p 2 (1 p 2 )
+
n1
n2
ACTIVIDADES
1. Una tienda de computacin, que compra al mayoreo chips sin probar para
computadoras, est considerando cambiar de proveedor por otro que se los
suministre probados y con una garanta a un precio ms alto. Con el fin de
saber si este es un plan costeable, determine la porcin de chips
defectuosos que le suministra su actual proveedor. Se prob una muestra
de 200 chips y de stos, 5% tena defectos.
a) Estime el error estndar de la porcin de chips defectuosos.
b) Construya un intervalo de confianza de 98% para la porcin de chips
defectuosos adquiridos.
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
49
CIBERTEC
CARRERAS PROFESIONALES
50
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
51
8 En una muestra al azar de 400 adultos y 600 adolescentes que vean cierto
programa de televisin, 100 adultos y 300 adolescentes dijeron que les
gustaba. Halle los lmites de confianza al 95% para la diferencia de
proporciones de todos los adultos y adolescentes que ven el programa y les
gusta.
CIBERTEC
CARRERAS PROFESIONALES
52
Autoevaluacin
1. Durante un ao y medio las ventas han estado disminuyendo de manera
coherente en las 1500 sucursales de una cadena de comida rpida. Una
empresa de asesores ha determinado que 30% de una muestra de 95
sucursales tienen claros signos de una mala administracin. Construya un
intervalo de confianza de 98% para esta porcin.
2. La directiva estudiantil de una universidad tom una muestra de 45 libros de
texto de la librera universitaria y determin que de ellos, 60% se venda en
ms de 50% por arriba de su costo al mayoreo. D un intervalo para la
porcin de libros, cuyo precio establecido es ms de 50% por encima de su
costo, que tenga 96% de certeza de contener la porcin verdadera.
3. Se desea conocer la porcin de propietarios de acciones individuales que
planean vender al menos un cuarto del total de sus valores el prximo mes.
Se ha efectuado una inspeccin aleatoria de 800 individuos que poseen
acciones y se ha establecido que el 25% de la muestra planea vender al
menos un cuarto de sus acciones al mes siguiente. Construya un intervalo
de confianza de 90% para la porcin verdadera de accionistas individuales
que planean vender al menos un cuarto de sus acciones durante el mes
siguiente.
4. Durante cierta semana, una tienda de departamentos observ y registr que
5750 de las 12500 personas que entraron en la tienda hicieron por lo menos
una compra. Tratando esto como una muestra al azar de todos los clientes
potenciales, halle el intervalo de confianza del 99% para la proporcin real
de las personas que entran a la tienda y que harn por lo menos una
compra.
5. Estudios realizados en 1998 concluyeron que el 55% de profesionales
graduados antes de 1980 no conocan el manejo bsico de Internet. Durante
1999 se realiz una encuesta a 1200 personas de las cuales 590 no conocan el
manejo bsico de Internet.
Determine un intervalo de confianza del 98% para la proporcin de
profesionales graduados antes de 1980 que conocen el manejo de Internet.
Si hoy se quiere averiguar el porcentaje de personas que trabajan con Microsoft
Office, qu tamao de muestra se deber tomar para estimar el porcentaje de
personas que trabajan con Microsoft Office si el error mximo de estimacin
deber ser del 3%?
6. Se realiz un muestreo para determinar las preferencias de las personas
acerca de tres marcas de pantalones. De un total de 460 encuestados, 240
prefieren la marca A, 128 prefieren la marca B, 78 prefieren la marca C y el
resto otras marcas. Construya un intervalo de confianza del 95% para el
porcentaje de personas que prefiere los pantalones marca A.
7. En el Colegio Profesional de Psicoanalistas, de 1200 miembros, se realiz
una encuesta para estimar el candidato que iba a ganar las elecciones al
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
53
CIBERTEC
CARRERAS PROFESIONALES
54
Para recordar
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
55
SEMANA
5
HIPTESIS ESTADSTICA
TEMAS
Hiptesis estadstica. Tipos de errores I y II. Nivel de significacin. Regin
crtica o regin de rechazo. Regin de aceptacin
Prueba de Hiptesis para medias, muestras grandes. Prueba bilateral de
una hiptesis sobre la media
Prueba unilateral de una hiptesis sobre la media, caso I, caso II
Prueba de Hiptesis para diferencia de media. Desviacin estndar
conocidas, Muestras grandes
OBJETIVOS ESPECFICOS
.
CONTENIDOS
Hiptesis estadstica. Tipos de errores I y II. Nivel de significacin. Regin
crtica o regin de rechazo. Regin de aceptacin.
Prueba de Hiptesis para medias, muestras grandes. Prueba bilateral de
una hiptesis sobre la media
Prueba unilateral de una hiptesis sobre la media, caso I, caso II
Prueba de Hiptesis para diferencia de media. Desviacin estndar
conocidas. Muestras grandes.
ACTIVIDADES
CIBERTEC
CARRERAS PROFESIONALES
56
HIPTESIS ESTADSTICA
DECISIONES ESTADSTICAS
Generalmente, en la prctica se tienen que tomar decisiones sobre
poblaciones, partiendo de la informacin muestral de las mismas. Tales
decisiones se llaman decisiones estadsticas. Por ejemplo, se puede querer
decidir a partir de los datos del muestreo, si un sistema educacional es mejor
que otro, si un suero nuevo es realmente efectivo para la cura de una
enfermedad, si una moneda determinada est o no cargada, etc.
HIPTESIS ESTADSTICA. HIPTESIS NULA
Para llegar a tomar decisiones, conviene hacer determinados supuestos o
conjeturas acerca de las poblaciones que se estudian. Tales supuestos que
pueden ser o no ciertos se llaman hiptesis estadsticas y, en general, lo son
sobre las distribuciones de probabilidad de las poblaciones. En muchos casos
se formulan las hiptesis estadsticas con el solo propsito de rechazarlas o invalidarlas.
Si se quiere decidir sobre si un procedimiento es mejor que otro, se formula la
hiptesis de que no hay diferencia entre los procedimientos (es decir, cualquier
diferencia observada se debe meramente a fluctuaciones en el muestreo de la
misma poblacin). Tal hiptesis se llama tambin hiptesis nula y se denotan
por Ho.
Cualquier hiptesis que difiera de una hiptesis dada se llama hiptesis
alternativa. Una hiptesis alternativa de la hiptesis nula se denota por H1.
ENSAYOS DE HIPTESIS y SIGNIFICACIN
Si en el supuesto de que una hiptesis determinada es cierta, se encuentra que
los resultados observados en una muestra al azar difieren marcadamente de
aquellos que caba esperar con la hiptesis y con la variacin propia del
muestreo, se dira que las diferencias observadas son significativas y se estara en condiciones de rechazar la hiptesis (o al menos no aceptarla de
acuerdo con la evidencia obtenida).
Los procedimientos que facilitan el decidir si una hiptesis se acepta o se
rechaza o el determinar si las muestras observadas difieren significativamente
de los resultados esperados se llaman ensayos de hiptesis, ensayos de
significacin o reglas de decisin.
ERRORES DE TIPO I Y TIPO II
Si se rechaza una hiptesis cuando debera ser aceptada, se dice que se
comete un error del Tipo I. Si, por el contrario, se acepta una hiptesis que
debera ser rechazada, se dice que se comete un error del Tipo II. En
cualquiera de los dos casos se comete un error al tomar una decisin
equivocada.
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
Decisin
Aceptar Ho
Aceptar H1
57
Ho Verdadero
Decisin Correcta
Error tipo I
H1 Verdadero
Error tipo II
Decisin Correcta
Para que cualquier ensayo de hiptesis o reglas de decisin sea bueno, debe
disearse de forma que minimice los errores de decisin. Esto no es tan
sencillo como pueda parecer, puesto que para un tamao de muestra dado, un
intento de disminuir un tipo de error, va generalmente acompaado por un
incremento en el otro tipo de error. En la prctica, un tipo de error puede tener
ms importancia que el otro, y as se tiende a conseguir poner una limitacin al
error de mayor importancia. La nica forma de reducir al tiempo ambos tipos de
error es incrementar el tamao de la muestra, lo cual puede ser o no ser
posible.
NIVEL DE SIGNIFICACIN
La probabilidad mxima con la que en el ensayo de una hiptesis se puede
cometer un error del Tipo 1 se llama nivel de significacin del ensayo. Esta
probabilidad se denota frecuentemente por ; generalmente, se fija antes de la
extraccin de las muestras, de modo que los resultados obtenidos no influyen
en la eleccin.
En la prctica, se acostumbra utilizar niveles de significacin del 0,05 0,01;
aunque igualmente pueden emplearse otros valores. Si, por ejemplo, se elige
un nivel de significacin del 0,05 5% al disear un ensayo de hiptesis,
entonces hay aproximadamente 5 ocasiones en 100 en que se rechazara la
hiptesis cuando debera ser aceptada, es decir, se est con un 95 % de
confianza de que se toma la decisin adecuada. En tal caso, se dice que la
hiptesis ha sido rechazada al nivel de significacin del 0,05, lo que significa
que se puede cometer error con una probabilidad de 0,05.
REGIN DE ACEPTACIN Y DE RECHAZO
Estadstico de prueba: valor obtenido a partir de la informacin muestral. Se
utiliza para determinar si se rechaza o no la hiptesis.
En una regin donde la estadstica de prueba prescrita conduce al rechazo de
la hiptesis bajo consideracin es llamada regin crtica. En otras palabras,
Regin.
Crtica o de Rechazo es la regin que contiene los valores para los cuales se
rechaza la hiptesis bajo consideracin.
Regin de aceptacin es la regin que contiene a los valores para los cuales
no se rechaza la hiptesis bajo consideracin.
Valor crtico: el punto que divide la regin de aceptacin y la regin de
rechazo de la hiptesis nula.
CIBERTEC
CARRERAS PROFESIONALES
58
2
n
x o
).
n
(0,1)
4. La regin critica (R.C.) es , Z , donde Z o es tal que P[Z < Z ] =
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
59
6. Se compara Z con Z.
Si Z < Z Z , Z , se rechaza la hiptesis nula Ho
Si Z > Z Z Z , + , se acepta la hiptesis nula Ho
Regin de Rechazo
Regin de Aceptacin
0
Caso II
1. Se formula la hiptesis nula y la hiptesis alternativa
H o : = o
H 1 : > o
Donde o es el valor de la media poblacional.
2. Se escoge el nivel de significancia .
3. Una estadstica para la media de la poblacin es la media muestral x . Si la
poblacin es normal (o si la muestra es grande n 30 , aun cuando la
poblacin no es normal).
La distribucin de x es N ( ,
La variable aleatoria Z =
).
n
x o
N(0,1)
4. La regin critica (R.C.) es Z + , donde Z o es tal que P[Z > Z 1 ] =
5. Se calcula x de los datos, luego se obtiene Z
x o
Z=
CIBERTEC
CARRERAS PROFESIONALES
60
Regin de Aceptacin
0
Regin de Rechazo
Z 1
).
n
x o
N(0,1)
4. La regin Aceptacin (R.A.) es a, b , donde a y b son tal que
P a < x < b = 1 .
Por la simetra de la curva normal, los valores crticos de a y b son
simtricos con respecto a o
a
b o
x
o
p
n
n
n
=1
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
61
o Z / 2
n
o + Z /2
Regin de Rechazo
Regin de Aceptacin
0
Z / 2
Regin de Rechazo
Z / 2
H1 : x y
H 1 : x y 0
c)
H1 : x y
H1 : x y 0
Si H1 toma la forma (a) se utiliza una prueba bilateral, en otros casos se emplea
una prueba unilateral.
Desviaciones Estndar Conocidas, Muestras Grandes
Prueba Unilateral
Caso I:
1. Considrese la siguiente hiptesis:
Ho : x = y
H1 : x y
CIBERTEC
Ho : x y = 0
H1 : x y 0
CARRERAS PROFESIONALES
62
x2
n
y2
m
).
Z=
( x y) ( x y )
x2
n
y2
m
xc
( x y)
=
P
2
2
2
x2 y
x +y
+
n
m
n
m
xc
=
P Z
2
x2 y
n
m
x c = Z 1
x2
y2
+
n
m
5. Se calcula la diferencia de las medias muestrales ( x y ) y S x y si no se
Luego:
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
63
Regin de Aceptacin
Regin de Rechazo
Z 1
Caso II:
1. Considrese la siguiente hiptesis:
Ho : x = y
H1 : x y
Ho : x y = 0
H 1 : x y 0
x2
n
y2
m
).
Z=
( x y) ( x y )
x2
n
y2
m
xc
( x y)
P
2
2
2
x2 y
x +y
+
n
m
n
m
CIBERTEC
CARRERAS PROFESIONALES
64
xc
=
P Z
2
x2 y
n
m
x c = Z
x2
y2
+
n
m
5. Se calcula la diferencia de las medias muestrales ( x y ) y S x y si no se
Luego
Regin de Rechazo
Regin de Aceptacin
0
Prueba Bilateral
1. Considrese la siguiente hiptesis:
Ho : x = y
H1 : x y
Ho : x y = 0
H1 : x y 0
x2
n
y2
m
).
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
65
Z=
( x y) ( x y )
x2
y2
n
m
Tiene una distribucin normal estndar.
4. En el supuesto de que Ho es verdadero, es decir que ( x y ) = 0 . La
a
b
( x y)
P
2
2
2
2
x2 y
x2 y
x +y
+
+
m
n
m
n
m
n
a
b
P
Z
2
2
2
x2 y
x +y
+
m
n
m
n
a = Z / 2
Luego,
b = +Z / 2
x2
n
x2
= 1
= 1
y2
m
y2
+
n
m
5. Calclese la diferencia de las medias muestrales ( x y ) . Tambin S x2 , S y2 si
no se conoce x , y y las muestras son grandes.
2
Regin de Rechazo
Z / 2
CIBERTEC
Regin de Aceptacin
0
Regin de Rechazo
Z / 2
CARRERAS PROFESIONALES
66
ACTIVIDADES
1. El fabricante de cierta marca de cigarrillos sostiene que sus cigarrillos
contienen en promedio 18 miligramos de nicotina por cigarrillo. Un
organismo de control examina una muestra de 100 cigarrillos. Utilizando un
nivel de significacin 0,01; puede el organismo concluir que el fabricante
subestima el contenido medio de nicotina de sus cigarrillos, si el contenido
medio de la muestra es de 19,2 miligramos con una desviacin estndar de
2 miligramos?
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
67
CIBERTEC
CARRERAS PROFESIONALES
68
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
69
Autoevaluacin
1. La comisin promedio que cargan las compaas de corretaje de tiempo
completo en una venta de valores comunes es de $144 con una desviacin
estndar de $52. Se tom una muestra aleatoria de 121 compras y se
determin que haban pagado una comisin promedio de $151. A un nivel
de significancia de 0,10, puede concluirse que las comisiones son mayores
que el promedio de la industria?
2. Alfano ha puesto en marcha una promocin comercial especial para su
estufa de propano y siente que la promocin debe provocar un cambio en el
precio al consumidor. Alfano sabe que antes de que comenzara la
promocin, el precio promedio al menudeo de la estufa era de $44,95 con
una desviacin estndar de $5,75. Alfano muestrea a 30 de sus minoristas
despus de iniciada la promocin y encuentra que el precio medio de las
estufas es ahora de $42,95. A un nivel de significancia de 0,02, tiene
Alfano razones para creer que el precio promedio al menudeo para el
consumidor ha disminuido?
3. Del 2000 al 2006, la tasa promedio de precios/utilidades (p/u) de los
aproximadamente 1899 valores inscritos en la Bolsa de Valores de Lima fue
de 14,35 con una desviacin estndar de 9,73. En una muestra de 30
valores de la Bolsa, aleatoriamente escogidos, la tasa p/u promedio en el
2006 fue de 11,77. Esta muestra presenta evidencia suficiente para concluir
(al nivel de significancia de 0,05) que en el 2007 la tasa promedio para los
valores de la Bolsa se habra modificado de su anterior valor.
4. Editorial Navarrete supone que la vida de su prensa ms grande es de
14500 horas, con una desviacin estndar conocida de 2 00 horas. De una
muestra de 30 prensas, la compaa encuentra una media de muestra de 13
000 horas. A un nivel de significancia de 0,01 debera concluir la compaa
que la vida promedio de las prensas es menor que las hipotticas 14500
horas?
5. UBK sabe que una cierta pelcula de xito se exhibi un promedio de 84
das en cada ciudad, y la desviacin estndar correspondiente fue de 10
das. El administrador del distrito de Los Olivos estaba interesado en
comparar la popularidad de la pelcula. Eligi aleatoriamente 75 cines del
distrito y encontr que proyectaron la pelcula un promedio de 81,5 das.
Establezca hiptesis apropiadas para probar si hubo una diferencia
significativa en la duracin de la exhibicin de la pelcula entre los cines del
distrito de Los Olivos y los dems de la UBK. Use un nivel de significancia
del 1% y pruebe estas hiptesis.
6. Un fabricante de automviles afirma que un modelo en particular rinde 28
millas por galn. La Agencia de Proteccin al consumidor, usando una
muestra de 49 automviles de este modelo, encuentra que la media de
muestra es 26,8 millas por galn. De estudios previos, la desviacin
estndar de la poblacin se sabe que es de 5 millas por galn. Sera
CIBERTEC
CARRERAS PROFESIONALES
70
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
71
de Trabajo ocasionar una mayor reduccin en las GPA para las empresas
de alta tecnologa o para los productores de bienes de consumo?
12. Dos laboratorios de investigacin han producido, independientemente,
medicamentos que alivian las molestias de la artritis. El primer medicamento
fue probado en un grupo de 90 personas que sufren de artritis y produjo un
promedio de 8,5 horas de alivio, con una desviacin estndar de 1,8 horas.
El segundo medicamento fue probado en 80 artrticos y produjo una media
de 7,9 horas de alivio, con una desviacin estndar de 2,1 horas. A un nivel
0,05 de significancia, el segundo medicamento proporciona un periodo de
alivio significativamente ms corto?
Para recordar
CIBERTEC
CARRERAS PROFESIONALES
72
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
73
SEMANA
6
HIPTESIS ESTADSTICA
MUESTRAS PEQUEAS
TEMAS
OBJETIVOS ESPECFICOS
.
CONTENIDOS
ACTIVIDADES
CIBERTEC
CARRERAS PROFESIONALES
74
x
xc
o
p
s
s
n
n
xc
p T
s
p [T t c ] =
5. Se calcula x de los datos, luego se obtiene t
t =
x o
s
n
6. Se compara t con t
Si t < t t , t , se rechaza la hiptesis nula Ho
Si t > t t t , + , se acepta la hiptesis nula Ho
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
75
Regin de Rechazo
Regin de Aceptacin
0
Caso II
1. Se formula la hiptesis nula y la hiptesis alternativa
H o : = o
H1 : > o
Donde o es el valor de la media poblacional.
2. Se escoge el nivel de significancia .
3. Una estadstica de prueba es x , para muestras pequeas se usa la variable
aleatoria.
x o
t=
S
n
Tiene una distribucin t con (n-1) grados de libertad.
4. La regin crtica (R.C.) es x c ,+ , donde x c es tal que P x x c =
x
xc
o
p
s
s
n
n
xc
p t
s
p [t t c
]=
CIBERTEC
CARRERAS PROFESIONALES
76
t1 =
x o
s
n
6. Se compara t con t1
Si t > t1 t t1 , + , se rechaza la hiptesis nula Ho
Si t < t1 t ,t1 , se acepta la hiptesis nula Ho
Regin de Aceptacin
0
Regin de Rechazo
Z 1
P a < x < b = 1 .
Por la simetra de la curva normal, los valores crticos de a y b son
simtricos con respecto a o
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
77
a
x
b o
o
p
s
s
s
n
n
n
= 1
o t / 2
n
o + t / 2
Regin de Rechazo
Regin de Aceptacin
t / 2
Regin de Rechazo
+ t / 2
CIBERTEC
CARRERAS PROFESIONALES
78
Ho : x = y
H1 : x y
Ho : x y = 0
H1 : x y 0
Regin de Aceptacin
0
Regin de Rechazo
t1
Caso II:
1. Considrese la siguiente hiptesis:
Ho : x = y
H1 : x y
Ho : x y = 0
H 1 : x y 0
, t ,
3. Conclusin: si t se encuentra en la regin crtica , t , se rechaza Ho, en
caso contrario se acepta.
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
79
Regin de Rechazo
Regin de Aceptacin
0
t
Prueba Bilateral
1. Considrese la siguiente hiptesis:
Ho : x = y
H1 : x y
Ho : x y = 0
H1 : x y 0
Regin de Rechazo
t / 2
CIBERTEC
Regin de Aceptacin
0
Regin de Rechazo
+ t / 2
CARRERAS PROFESIONALES
80
ACTIVIDADES
.
1. Una mquina produce ejes que. segn las especificaciones, deben tener
100 mm de dimetro. Para mantener la calidad requerida, todos los das se
examina una muestra de 16 ejes para determinar si es necesario detener la
produccin y reajustar la mquina. Un da determinado, la muestra da los
siguientes resultados:
101
98
100
100
102
105
98
100
99
99
100
106
101
102
102
104
13,1
11,0
14,0
12,4
11,5
12,2
10,5
11,0
10,4
10,0
11,0
11,4
10,5
9,0
12,2
1,01
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
81
4. En el taller mecnico de Jerry utilizan una sierra a motor para cortar el tubo
de metal que se utiliza en la manufactura de dispositivos de medicin de
presin. La longitud de los segmentos de tubo est distribuida normalmente.
Se cortaron 25 piezas de tubo con la sierra calibrada para cortar secciones
de 5,00 pulgadas de longitud. Cuando se midieron estas piezas, se encontr
que su longitud media era de 4,7 pulgadas y con una desviacin estndar
de 0,06 pulgadas. Utilice valores probables para determinar si la mquina
debe ser recalibrada, debido a que la longitud media es significativamente
diferente a 5,00 pulgadas.
CIBERTEC
CARRERAS PROFESIONALES
82
6.
15
14
18
13
18
29
30
33
10
11
8
12
26
25
13
21
29
26
24
24
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
83
CIBERTEC
CARRERAS PROFESIONALES
84
Autoevaluacin
1. Un documental de televisin acerca de la alimentacin excesiva afirmaba
que los estadounidenses tienen un sobrepeso aproximado de 10 lb en
promedio. Para probar esta afirmacin, se examin a 18 individuos elegidos
aleatoriamente, y se encontr que su sobrepeso promedio era de 12,4 lb,
con una desviacin estndar de muestra de 2,7 lb. A un nivel de
significancia de 0,01; hay alguna razn para dudar de la validez del valor
afirmado de 10 lb?
2. Microsoft, proveedor de software de sistemas operativos para computadoras
personales, estaba planeando la oferta pblica inicial de sus existencias
para sacar el suficiente capital de trabajo para financiar el desarrollo de un
sistema integrado de sptima generacin, radicalmente nuevo. Con
utilidades actuales de $ 1,61 por accin, Microsoft y sus suscriptores
estaban considerando un precio oferta de $21 aproximadamente 13 veces
las utilidades. Para verificar lo adecuado de este precio, eligieron
aleatoriamente siete compaas de software comercial pblico y encontraron
que su tasa promedio precio/utilidades era de 11,6 con una desviacin
estndar de muestra de 1,3 a un nivel =0,02. Puede Microsoft concluir
que las existencias en compaas de software comercial pblico tienen una
tasa promedio precio/utilidades significativamente diferente de 13?
3. Un bibliotecario universitario sospecha que el nmero promedio de libros
sacados a prstamo por cada estudiante por visita ha cambiado
ltimamente. Anteriormente, se sacaba un promedio de 3,4 libros. Sin
embargo, una muestra reciente de 23 estudiantes promedi 4,3 libros por
visita, con una desviacin estndar de 1,5 libros. Al nivel de significancia de
0,01; ha cambiado el promedio de prstamos?
4. Una compaa, recientemente criticada por no pagar lo mismo a hombres
que a mujeres que trabajan en los mismos puestos, declara que el sueldo
promedio pagado a todos los empleados es de $23500. De una muestra
aleatoria de 29 mujeres que laboran en la compaa, se calcul que el
salario promedio era de $23000. Si se sabe que la desviacin estndar de la
poblacin es de $1250 por estos empleos, determine si puede ser razonable
esperar (con dos errores estndar) que la media de la muestra sea $23000
si, en efecto, es cierto lo declarado por la compaa.
5. Se us gasolina de marca A en 9 automviles semejantes bajo idnticas
condiciones. La muestra correspondiente de 9 valores (kilmetros por litro)
tienen una media 8,565 y una desviacin estndar 0,212. Bajo las mismas
condiciones, la gasolina de alta potencia de marca B da una muestra de 10
valores con media 9,245 y desviacin estndar 0,254. Pruebe la hiptesis,
que A y B son de igual calidad con respecto al kilometraje, contra de que B
es mejor. Use = 0,05.
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
85
12 11 14 13 13 14 13 12 14 12
Ejecutivos de cuenta
13 10 11 12 13 12 10 12
CIBERTEC
CARRERAS PROFESIONALES
86
10.
A nueve comercializadores de componentes para computadoras que
operan en las principales reas metropolitanas se les pidi los precios de
dos impresoras lser parecidas, con anchos estndar. Los resultados de la
investigacin estn dados en la siguiente tabla. A un nivel de = 0,05, es
razonable afirmar que, en promedio, la impresora Apple es ms barata que
la impresora Akita?
Comerciante
1
2
Precio Apple $350 419
Precio Akita
$370 425
3
385
369
4
360
375
5
405
389
6
395
385
7
389
395
8
409
425
9
375
400
Para recordar
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
87
SEMANA
8
PRUEBA DE HIPTESIS
PARA LAS PROPORCIONES
TEMAS
OBJETIVOS ESPECFICOS
.
CONTENIDOS
Prueba de Hiptesis para las proporciones, muestras grandes
Prueba bilateral de una hiptesis sobre las proporciones
Prueba unilateral de una hiptesis sobre la media, caso I, caso II
Prueba de Hiptesis para la diferencia entre dos proporciones
.
ACTIVIDADES
CIBERTEC
CARRERAS PROFESIONALES
88
x
usarse el estadstico p = . Los valores de X que estn distantes de la
n
media = np o lleva al rechazo de hiptesis nula.
4. Establecer la regin critica, es decir determinar el valor (o valores) critico
5. Calcular el valor de la prueba estadstica de una muestra aleatoria de
tamao n.
6. Conclusin; rechazar Ho si la estadstica tiene un valor en la regin
critica, caso contrario aceptar Ho.
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
89
Z=
p o
o (1 o )
n
6. Se compara Z con Z
Si Z < Z. Z , Z , se rechaza la hiptesis nula Ho
Si Z > Z. Z Z , + , se acepta la hiptesis nula Ho
Regin de Rechazo
Regin de Aceptacin
0
Caso II
1. Se formula la hiptesis nula y la hiptesis alternativa
Ho : = o
2.
3.
4.
5.
H 1 : o
Se escoge el nivel de significancia
Una estadstica de prueba es una variable aleatoria binomial X que tiene
una distribucin binomial, cuando n es pequeo se utiliza esta distribucin.
La regin critica (R.C.) es Z + , donde Z o es tal que P[Z > Z 1 ] =
Se calcula x de la muestra de tamao n, luego se obtiene Z
x np o
Z=
np o (1 p o )
Z=
p o
o (1 o )
n
6. Se compara Z con Zo
Si Z > Z 1- Z Z 1 + , se rechaza la hiptesis nula Ho
Si Z < Z 1- Z , Z 1 , se acepta la hiptesis nula Ho
CIBERTEC
CARRERAS PROFESIONALES
90
Regin de Aceptacin
Regin de Rechazo
Z 1
a o
o (1 o )
n
p o
o (1 0 )
n
bo
= 1
o (1 o )
o Z / 2
o (1 o )
o + Z /2
o (1 o )
n
Z=
p o
o (1 o )
n
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
91
5. Se compara Z con Z /2
Si Z , Z / 2 0 Z + Z / 2 ,+ , se rechaza la hiptesis nula Ho
Si Z Z / 2 ,+ Z / 2 , se acepta la hiptesis nula Ho
Regin de Rechazo
Regin de Aceptacin
0
Z / 2
Regin de Rechazo
Z / 2
Z=
( p 1 p 2 ) ( 1 2 )
1 (1 1 )
2 (1 2 )
n1
n2
Se seleccionan muestras aleatorias independientes de tamao n1 y n2 de cada
poblacin binomial respectivamente.
x
x
Siendo p 1 = 1 y p 2 = 2 , donde x1 y x2 es el nmero de xitos de la
n1
n2
muestra n1 y n2 respectivamente, entonces:
CIBERTEC
CARRERAS PROFESIONALES
92
Z=
( p1 p 2 )
1 (1 1 )
n1
2 (1 2 )
n2
( p1 p 2 )
Z=
1
1
+ )
n1 n 2
Es el valor de la normal estndar cuando Ho es verdadera, siendo n1 y n2
grandes.
1 (1 1 )(
x + x2
p = 1
n1 + n 2
Luego, el valor de verdad de la estadstica Z es:
Z=
( p1 p 2 )
1
1
+ )
n1 n2
Desviaciones Estndar Conocidas, Muestras Grandes
Prueba Unilateral
p (1 p )(
Caso I:
1. Considrese la siguiente hiptesis:
H o : 1 = 2
o H o : 1 2 = 0
H 1 : 1 2
H 1 : 1 2 0
2. Se escoge el nivel de significancia
Z=
( p1 p 2 )
1 (1 1 )
2 (1 2 )
n1
n2
Suponiendo que Ho sea verdadera.
x
x
x + x2
5. Se calcula p 1 = 1 y p 2 = 2 , luego p = 1
n1
n2
n1 + n 2
Luego, se halla: z =
( p1 p 2 )
p (1 p )(
CARRERAS PROFESIONALES
1
1
+ )
n1 n 2
CIBERTEC
ESTADISTICA II
93
Regin de Aceptacin
0
Regin de Rechazo
Z 1
Caso II:
1. Considrese la siguiente hiptesis:
H o : 1 = 2
o H o : 1 2 = 0
H 1 : 1 2
H 1 : 1 2 0
2. Se escoge el nivel de significancia .
Z=
( p1 p 2 )
1 (1 1 )
2 (1 2 )
n1
n2
Suponiendo que Ho sea verdadera.
3. La regin crtica (R.C.) es Z Z , para la hiptesis alternativa H 1 : 1 2
x
x
x + x2
4. Se calcula p 1 = 1 y p 2 = 2 , luego p = 1
n1
n2
n1 + n 2
Luego, se halla: z =
( p1 p 2 )
p (1 p )(
1
1
+ )
n1 n 2
CIBERTEC
CARRERAS PROFESIONALES
94
Regin de Rechazo
Regin de Aceptacin
0
Z
Prueba Bilateral
1. Considrese la siguiente hiptesis:
H o : 1 = 2
H o : 1 2 = 0
H1 : 1 2
H1 : 1 2 0
2. Se escoge el nivel de significancia
Z=
( p1 p 2 )
1 (1 1 )
2 (1 2 )
n1
Suponiendo que Ho sea verdadera.
n2
x
x
x + x2
5. Se calcula p 1 = 1 y p 2 = 2 , luego p = 1
n1
n2
n1 + n 2
Luego, se halla:
z=
( p1 p 2 )
p (1 p )(
1
1
+ )
n1 n 2
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
95
Regin de Rechazo
Z / 2
Regin de Aceptacin
0
Regin de Rechazo
Z / 2
ACTIVIDADES
1. Un fabricante de lavadoras automticas produce un modelo en tres colores
diferentes A, B y C. De las primeras 1000 lavadoras vendidas se observa
que 400 fueron de color A. concluir usted que ms de 1/3 de todos los
clientes tienen preferencia por el color A? use = 0,01.
2. El director de cierto colegio muy famoso cree que, en parte debido al estatus
econmico de los padres, el porcentaje de los que han terminado
secundaria que asisten a este colegio es mayor que el promedio de la
ciudad. En el perodo de los cinco aos precedentes, el 20% de todos los
que terminaron secundaria de la ciudad entraron a la Universidad, mientras
que en el mismo perodo, 350 de los 1500 exalumnos de su colegio entraron
a la Universidad. Se justifica que el director diga que el porcentaje de sus
exalumnos que entraron a la Universidad es significativamente mayor que
20%? Pruebe con el nivel de significacin del 1%.
CIBERTEC
CARRERAS PROFESIONALES
96
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
97
6. En una conferencia de prensa, una alta autoridad anuncia que el 90% de los
habitantes adultos de la ciudad de Lima estn a favor de cierto proyecto
econmico del gobierno. En una muestra aleatoria de 625 adultos se
observ que 540 estn a favor del proyecto. Si usted desea rechazar la
hiptesis verdadera no ms de una en vez de 100. Concluira que la
popularidad del proyecto ha sido exagerada por la autoridad?
CIBERTEC
CARRERAS PROFESIONALES
98
8. Una planta de energa elctrica operada con carbn est considerando dos
sistemas diferentes para abatir la contaminacin del aire. El primer sistema
ha reducido la emisin de contaminantes a niveles aceptables 68% del
tiempo segn se determin de 200 muestras de aire. El segundo sistema,
que es ms caro, ha reducido la emisin de contaminantes a niveles
aceptables 76% de las veces, segn qued determinado de 250 muestras
de aire. Si el sistema caro es significativamente ms eficiente en la
reduccin de contaminantes a niveles aceptables que el otro sistema,
entonces el administrador de la planta deber instalar el sistema caro. Cul
sistema ser instalado si la administracin utiliza un nivel de significancia de
0,02 al tomar la decisin?
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
99
10. Una muestra aleatoria de 100 hombres fue tomada de la ciudad de Lima y
se encontr que 60 se mostraron a favor sobre una ley del divorcio. Una
muestra al azar de 100 mujeres escogidas de la misma ciudad revel que
40 de ellas estn a favor de dicha ley. Es igual la proporcin de hombres
que de mujeres que favorecen una nueva ley sobre el divorcio? Use un nivel
de significancia de 0,05.
CIBERTEC
CARRERAS PROFESIONALES
100
Autoevaluacin
1. De un total de 10200 prstamos otorgados por una cooperativa de crdito
en los ltimos cinco aos, 350 se muestrearon para determinar qu porcin
de prstamos se otorgaron a mujeres. Esta muestra indic que 39% de los
crditos fueron dados a empleadas. Un censo completo de prstamos de
hace cinco aos mostraba que el 41% de los prestatarios eran mujeres. A
un nivel de significancia de 0,02, puede concluir que la porcin de
prstamos otorgados a mujeres ha cambiado significativamente en los
ltimos cinco aos?
2. Los laboratorios Gnova se especializan en el uso de tcnicas de
reproduccin de genes para lograr nuevos compuestos farmacuticos.
Recientemente, desarroll un atomizador nasal que contiene interfern, con
el que se cree habr de limitarse la transmisin del resfriado comn en las
familias. En la poblacin general, a 15,1% les dar gripe ocasionada por el
rota virus una vez que otro miembro de la familia ha contrado tal gripe. El
atomizador de interfern fue probado en 180 personas, en cuyas familias
uno de los miembros contrajo, posteriormente, una gripe ocasionada por
Rota Virus. Slo 17 de los sujetos de la prueba desarroll gripes similares.
A un nivel de significancia de 0,05, debera concluir Gnova que el nuevo
atomizador, efectivamente, reduce la transmisin de la gripe?
3. Algunos tericos financieros cree que los precios diarios del mercado de
valores constituyen un paseo azaroso con rumbo positivo. Si esto es
exacto, entonces el promedio industrial Dow Jones debera mostrar una
ganancia en ms de 50% de todos los das de actividad financiera. Si el
promedio se increment en 101 de 175 das escogidos aleatoriamente,
Qu piensa de la teora sugerida? Use un nivel de significancia de 0,01.
4. El instituto de caf afirma que al menos el 40% de la poblacin de adultos
tomen regularmente una tasa de caf durante el desayuno. Una muestra
aleatoria de 450 individuos revel que 200 de ellos eran tomadores
regulares de caf en el desayuno. Cul es el valor probable para una
prueba de hiptesis que busca mostrar que la afirmacin del Instituto del
Caf es correcta? (Sugerencia: Pruebe H0:p = 0,04, contra H1:p > 0,4)
5. Un fabricante de salsa de tomate est en proceso de decidir si produce una
nueva marca extra picante. El departamento de investigacin de mercado
de la compaa emple una encuesta telefnica nacional de 6000 hogares y
encontr que dicho producto sera comprado por 335 de los encuestados.
Un estudio mucho ms extenso, realizado hace dos aos, mostraba que 5%
de los hogares en ese entonces habran comprado la salsa. A un nivel de
significancia de 2%, debera la compaa concluir que ahora existe un
mayor inters en el nuevo producto?
6. ACE Home Center vende podadoras Steele y est interesada en comparar
la calidad de las podadoras que vende con las podadoras Steele que se
venden a nivel nacional. La ferretera sabe que slo 15% de stas requieren
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
101
CIBERTEC
CARRERAS PROFESIONALES
102
12. Se estima que alrededor del 52% de hogares limeos son suscriptores de la
televisin por cable. Los editores de la revista Cable y ms estaban
seguros de que sus lectores tenan suscripcin por cable en un promedio
ms alto que la poblacin en general y queran usar este hecho para
ayudar a vender este espacio de publicidad para los canales de estreno por
cable. Para verificar este parecer, muestrearon a 250 suscriptores de la
revista y encontraron que 146 de ellos tenan suscripcin a televisin por
cable. A un nivel de significancia de 2%. los datos de la encuesta apoyan
el parecer de los editores?
Para recordar
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
103
SEMANA
9
PRUEBA DE BONDAD DE AJUSTE
TEMAS
OBJETIVOS ESPECFICOS
.
CONTENIDOS
Definicin del x
Ensayos de significacin
Prueba de bondad de ajuste. Tablas de contingencia
Correlacin de la continuidad. Coeficientes de contingencias
Prueba de Kolmogorov-Smirnov
ACTIVIDADES
CIBERTEC
CARRERAS PROFESIONALES
104
E1
E2
Es
...
Ek
O1
O2
Os
...
Ok
e1
e2
es
...
ek
+ ... +
e1
e2
(Ok ek )2
ek
=
j =1
(O
ej )
ej
(O )
j =1
ej
=
2
Y = Yo ( )
2
Y = Yo ( )
1
( 2 )
2
( 2 )
1
2
2
1
2
2
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
105
( =
2
j =1
(O
ej )
ej
(O )
j =1
ej
o =
2
como 02,.95 o 02,.99 que son los valores crticos a los niveles de significacin de
0,05 y 0,01 respectivamente), se deduce que las frecuencias observadas
difieren significativamente de las esperadas y se rechaza Ho al nivel de
significacin correspondiente. En caso contrario, se aceptar o al menos no se
rechazar. Este procedimiento se llama ensayo o prueba de chi cuadrado
de la hiptesis.
Debe advertirse que en aquellas circunstancias en que 2 est muy prximo a
cero debe mirarse con cierto recelo, puesto que es raro que las frecuencias
observadas concuerden demasiado bien con las esperadas. Para examinar
tales situaciones, se puede determinar si el valor calculado de 2 es menor que
CIBERTEC
CARRERAS PROFESIONALES
106
E1
E2
Es
...
Ek
O1
O2
Os
...
Ok
e1
e2
es
...
ek
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
107
=
2
(O
ej )
ej
donde la suma se extiende a todas las casillas de la tabla de contingencia, los
smbolos O j y e j representan, respectivamente, las frecuencias observadas y
esperadas en la casilla j. Esta suma, que es anloga a (I), contiene hk
trminos. La suma de todas las frecuencias observadas se denota por n y es
igual a la suma de todas las frecuencias esperadas ( O j = e j = n ).
j =1
(O
j =1
ej )
ej
1
2
2
e
muy estrechamente aproximada a la dada por Y = Yo ( )
, con tal de
que las frecuencias esperadas no sean demasiado pequeas. El nmero de
grados de libertad de esta distribucin Chi cuadrado est dado para h > 1, k
> 1 por
(a) = (h 1)(k 1) si las frecuencias esperadas pueden calcularse sin tener
que estimar parmetros poblacionales con los estadsticos muestrales.
(b) = (h 1)(k 1) m si las frecuencias observadas pueden solamente
calcularse estimando m parmetros poblacionales con los estadsticos
muestrales.
Las frecuencias esperadas son halladas bajo una determinada hiptesis Ho.
Una hiptesis normalmente supuesta es la de que las dos clasificaciones son
independientes entre s.
Las tablas de contingencia pueden extenderse a un nmero mayor de
dimensiones. As, por ejemplo, se pueden tener tablas h x k x 1 donde estn
presentes 3 clasificaciones.
FRMULAS PARA EL CLCULO DE 2
Se pueden obtener frmulas sencillas para el clculo de XZ que se basen
nicamente en las frecuencias observadas. En lo que sigue se dan los
resultados para tablas de contingencia 2 x 2 y 2 x 3.
Tablas 2 x 2
2 =
n(a1b2 a 2 b1 ) 2
n1 n2 na nb
II
Totales
a1
a2
na
b1
n1
b2
n2
nb
n
Totales
Tablas 2 x 3
CIBERTEC
CARRERAS PROFESIONALES
108
n
=
na
2
II
III
Totales
a1
a2
a3
na
b1
b2
b3
nb
Totales
n1
n2
n3
COEFICIENTE DE CONTINGENCIA
Una medida del grado de relacin, asociacin o dependencia de las
clasificaciones en una tabla de contingencia es dada por:
C=
2
2 +n
r=
n(k 1)
Como el coeficiente de correlacin entre atributos o clasificaciones. Este
coeficiente se encuentra entre 0 y 1
LA PRUEBA DE KOLMOGOROV-SMIRNOV
La prueba de Kolmogorov-Smirnov, bautizada as en honor de los estadsticos
A. N. Kolmogorov y N. V. Smirnov quienes la desarrollaron, se trata de un
mtodo no paramtrico sencillo para probar si existe una diferencia significativa
entre una distribucin de frecuencia observada y otra de frecuencia terica. La
prueba K-S es, por consiguiente, otra medida de la bondad de ajuste de una
distribucin de frecuencia terica, como lo es la prueba Chi cuadrada. Sin
embargo, la prueba K-S tiene varias ventajas sobre la prueba 2 : es una
prueba ms poderosa, y es ms fcil de utilizar, puesto que no requiere que los
datos se agrupen de alguna manera.
La estadstica K-S, Dn, es particularmente til para juzgar qu tan cerca est la
distribucin de frecuencia observada de la distribucin de frecuencia esperada,
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
109
Una prueba K-S siempre debe ser una prueba de un extremo. Los valores
crticos para Dn se han tabulado y pueden encontrarse en la tabla de Valores
crticos de bondad de ajuste de Kolmogorov-Smirnov. Se busca en la fila de n =
3,754 (el tamao de muestra) y la columna para un nivel de significancia de
0,01, se encontrar que el valor crtico de Dn debe calcularse usando la
frmula:
1,63
Dn =
n
1,63
Dn =
= 0,0266
3754
El siguiente paso es comparar el valor calculado de Dn con el valor crtico de Dn
que se encuentra en la tabla. Si el valor de la tabla para el nivel de significancia
CIBERTEC
CARRERAS PROFESIONALES
110
Nmero
ocupado
O
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
Frecuencia Frecuencia
Frecuencia
Frecuencia
Acumulativa Acumulativa Desviacin
Acumulativa
observada
Observada Observada
absoluta
Observada
relativa
esperada
O
O
0,0000
0,0002
0,0002
5
5
0,0013
0,0019
0,0006
14
19
0,0051
0,0093
0,0042
24
43
0,0115
0,0301
0,0186
57
100
0,0266
0,0744
0,0478
111
211
0,0562
0,1496
0,0934
197
408
0,1087
0,2562
0,1475
278
686
0,1827
0,3856
0,2029
378
1,064
0,2834
0,5231
0,2397
418
1,482
0,3948
0,6530
0,2582
461
1,943
0,5176
0,7634
0,2458
433
2,376
0,6329
0,8487
0,2158
413
2,789
0,74*9
0,9091
0,1662
358
3,147
0,8383
0,9486
0,1103
219
3,366
0,8966
0,9726
0,0760
145
3,511
0,9353
0,9862
0,0509
109
3,620
0,9643
0,9934
0,0291
57
3,677
0,9795
0,9970
0,0175
43
3,720
0,9909
0,9987
0,0078
16
3,736
0,9952
0,9995
0,0043
7
3,743
0,9971
0,9998
0,0027
8
3,751
0,9992
0,9999
0,0007
3
3,754
1,0000
1,0000
0,0000
ACTIVIDADES
1. Durante las primeras 13 semanas de la temporada de televisin, se
registraron las audiencias de sbado por la noche, de 8:00 p. m. a 9:00 p.
m. como sigue: ATV 29%, Amrica televisin 28%, Panamericana televisin
25% y otros 18%. Dos semanas despus, una muestra de 300 hogares
arroj los siguientes resultados de audiencia: ATV 95 hogares, Amrica
televisin 89 hogares, Panamericana televisin 70 hogares y otros 46
hogares. Pruebe, con = 0,05, si han cambiado las proporciones de
telespectadores.
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
111
CIBERTEC
CARRERAS PROFESIONALES
112
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
113
Industria
Licenciado en Petrleo Qumica Elctrica Computacin
Administracin
30
15
15
40
Ingeniera
30
30
20
20
Use = 0,01 y pruebe si hay independencia entre licenciatura y tipo de
industria.
Tipos de revista
Tipo de actitud
Cantidad de anuncios Cantidad de anuncios
con actitudes de culpa con
actitudes
de
miedo
20
10
15
11
la
30
19
Noticias y opinin
Editorial general
Orientada
hacia
familia
Comercial o financiera
Orientada hacia la mujer
Afroamericana
22
16
12
17
14
15
CIBERTEC
CARRERAS PROFESIONALES
114
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
115
Padres
Hijos
Hermanos
Parientes polticos
Otros parientes
28
7
8
4
16
31
19
3
10
12
CIBERTEC
25
32
61
47
39
21
18
12
CARRERAS PROFESIONALES
116
51-60
Frecuencia
observada
Frecuencia
esperada
Resultados de la prueba
61-70
71-80
81-90
91-100
30
100
440
500
130
40
170
500
390
100
Autoevaluacin
1. A continuacin, se observa una tabla de contingencias de 3 x 3, con
frecuencias observadas en una muestra de 240. Pruebe la independencia
entre las variables de rengln y de columna usando la prueba x2 con =
0,05.
Variable de rengln
P
Q
R
Variable de columna
A
B
C
20
30
20
30
60
25
10
15
30
2. Una de las preguntas de una encuesta fue la siguiente: Durante los ltimos
12 meses, en viajes de negocios, qu tipo de boleto de avin compr con
ms frecuencia? Las repuestas obtenidas se ven en la siguiente tabla de
contingencias:
Usando = 0,05 pruebe la independencia del tipo de vuelo y tipo de boleto.
Cul es su conclusin?
Tipo de vuelo
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
117
Tipo de boleto
Nacional Internacional
Primera clase
29
22
Clase de negocios o ejecutiva
95
121
Clase econmica
518
135
3. Las cantidades de unidades vendidas por tres agentes de ventas durante un
periodo de tres meses aparecen a continuacin. Use = 0,05 y demuestre
la independencia entre el vendedor y el tipo de producto. Cul es su
conclusin?
Producto
Vendedor A B C
Abanto
14 12 4
Marini
21 16 8
Noel
15 5 10
4. Una encuesta sobre el deporte preferido tuvo los siguientes resultados en
hombres y mujeres:
Deporte preferido
Sexo
Natacin Bsquetbol Ftbol
Hombres
19
15
24
Mujeres
16
18
16
Use = 0,05 y pruebe si las preferencias de hombres y mujeres son iguales.
Cul es su conclusin?
5. Un estudio de niveles educativos de los votantes y su afiliacin poltica tuvo
los siguientes resultados:
Afiliacin al partido
Nivel educativo
Apra PPC UPP
No termin secundaria
40
20
10
Secundaria completa
30
35
15
Licenciatura
30
45
25
Use = 0,01 y determine si la afiliacin poltica es independiente del nivel
educativo de los votantes.
6. Halley Torres y Aarn Delguiudice son crticos de cine que, con frecuencia,
difieren acerca de las mejores pelculas. En un artculo de una revista
especializada, se mencionan los resultados de 160 pelculas por parte de
ambos crticos. Cada resultado puede ser Buena, Regular o Mala.
Calificacin de Delguiudece
Calificacin de Torres Mala
Regular
Buena
Mala
24
8
13
Regular
8
13
11
Buena
10
9
64
CIBERTEC
CARRERAS PROFESIONALES
118
20
22
23
25
25
28
22
27
20
19
31
26
27
25
24
21
29
28
22
24
26
25
25
24
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
119
Frecuencia
48
323
79
16
63
529
Da
Lunes
Martes
Mircoles
Jueves
Viernes
Cantidad de
pasajeros
13
16
28
17
16
13. Los resultados de una Encuesta Anual de satisfaccin de trabajo indic que
el 28% de los gerentes de sistemas de informacin est muy satisfecho con
su trabajo, el 46% medianamente satisfecho, el 12% no est satisfecho ni
insatisfecho, el 10% est medianamente insatisfecho y el 4% est muy
insatisfecho. Suponga que en una muestra de 500 programadores
obtuvieron los siguientes resultados.
CIBERTEC
CARRERAS PROFESIONALES
120
Categora
Cantidad
Muy satisfechos
105
Medianamente satisfechos
235
Ni satisfechos ni insatisfechos
55
Medianamente insatisfechos
90
Muy insatisfechos
15
Haga una prueba con = 0,05 para determinar si la satisfaccin de los
programadores es diferente de la de los gerentes de sistemas de
informacin.
14. Una muestra de partes suministr los datos de la siguiente tabla de
contingencias, acerca de calidad de parte y de turno en que fue producida.
Use = 0,05 y pruebe la hiptesis de que la calidad de las partes es
independiente del turno en que fueron producidas. Cul es su conclusin?
Turno
Cantidad de buenas Cantidad de defectuosas
Primero
368
32
Segundo
285
15
Tercero
176
24
15. El Estudio 1996 de suscriptores de El Mercurio produjo datos acerca de
las clases de empleo de sus suscriptores. Los resultados de la muestra
correspondientes a suscriptores a las ediciones oriental y occidental son los
siguientes:
Regin
Clase de empleo
Edicin oriental Edicin occidental
Tiempo completo
1105
31
Tiempo parcial
31
15
Independiente / consultor
229
186
Sin empleo
485
344
Use = 0,05 y pruebe la hiptesis de que la clase de empleo es
independiente de la regin. Cul es su conclusin?
17. Al nivel de significancia de 0,05, podemos concluir que los siguientes
datos provienen de una distribucin de Poisson con = 3 ?
Nmero de
llegadas por da
6o
ms
Nmero de das
18
30
24
11
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
121
25-30
Frecuencia
observada
Frecuencia
esperada
Ingresos en miles
31-36 37-42 43-48 49-54
55-60
61-66
22
25
30
21
12
17
32
35
18
13
Para recordar
Se deben plantear en forma adecuada la hiptesis nula para una mejor
aplicacin de la prueba de bondad de ajuste.
CIBERTEC
CARRERAS PROFESIONALES
122
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
123
SEMANA
10
REGRESIN LINEAL SIMPLE
TEMAS
OBJETIVOS ESPECFICOS
CONTENIDOS
ACTIVIDADES
CIBERTEC
CARRERAS PROFESIONALES
124
y = a+bx
xy = a x + b x
b=
n xy x y
n x 2 ( x )
( y - y) =
Sx y
S x2
b=
Sx y
S x2
( x x)
Coeficiente de correlacin r:
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
r=
125
n x y x y
n x 2 ( x )
n y 2 ( y )
r=
Sx y
Sx S y
SC ( y ) b2 .SC ( x)
n2
S xy =
( x )
SC(x) =
x2
SP(xy) = xy
a = y bx
CIBERTEC
( x )( y )
n
( y )
SC(y) =
b=
y2
SP(xy)
SC(x)
b 2 .SC(x)
r =
SC(y)
2
CARRERAS PROFESIONALES
126
ACTIVIDADES
1. Son importantes las notas en la universidad para ganar un buen sueldo?
Un estudiante de estadstica comercial tom una muestra aleatoria de
sueldos iniciales y promedios de notas en la universidad de algunos de sus
amigos recin graduados. Los datos son los siguientes:
Sueldo inicial ($ miles) 36 30 30 24 27 33 21 27
Promedio de notas
4,0 3,0 3,5 2,0 3,0 3,5 2,5 2,5
1.1 Represente grficamente estos datos.
1.2 Desarrolle la ecuacin de estimacin que mejor describa los datos.
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
127
del 7,8 6,9 6,7 6,0 6,9 5,2 6,3 8,4 7,2 10,1 10,8 7,7
de 64
73
42
49
71
46
32
88
53
84
85
93
CIBERTEC
CARRERAS PROFESIONALES
128
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
Embarque
1
Volumen Exp. 82
5
129
865
915
950
980
6
102
0
7
125
0
8
132
5
9
147
0
10
161
5
x = 1450
y = 673
x 2 = 218 , 500
xy = 101 , 570
2
y = 47225
CIBERTEC
CARRERAS PROFESIONALES
130
12,00
12,50
13,80
15,40
17,50
18,00
20,00
175
240
280
320
380
420
500
10
15
16
18
26
30
3000
3320
3850
4000
4200
10. Una empresa que fabrica Plantas de zapatillas quiere estudiar la relacin
entre las edades (en aos) de un tipo de mquinas compradas para la
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
131
5.0
453
4
4.5
564
5
4.0
--
3.5
624
8
3.0
679
4
2.5
2.0
--
--
1.5
964
2
1.0
985
5
Autoevaluacin
1. Suponga que usted tiene a su cargo el dinero de la municipalidad de San
Marcos (Ancash). Se le dan los siguientes datos de antecedentes sobre el
suministro de dinero y el producto nacional bruto (ambos en millones de
soles):
Suministro de
dinero
Producto Nacional
Bruto
5,0
5,0 5,5 6,0 7,0 7,2 7,7 8,4 9,0 9,7 10,0
CIBERTEC
CARRERAS PROFESIONALES
132
CARRERAS PROFESIONALES
10 10 15 15 20 20 25
58 41 45 27 26 12 16
CIBERTEC
ESTADISTICA II
133
CIBERTEC
CARRERAS PROFESIONALES
134
Para recordar
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
135
SEMANA
11
REGRESIN NO LINEAL
TEMAS
OBJETIVOS ESPECFICOS
CONTENIDOS
ACTIVIDADES
CIBERTEC
CARRERAS PROFESIONALES
136
y = Ax B
Regresin Exponencial
Regresin Hiperblica
Regresin Cuadrtica
ln y = ln(A) + B.ln(x)
y = Ae Bx
ln y = ln(A) + Bx
y = 1 /( A + Bx)
1/y = A + Bx
y = A + Bx + Cx
2
ACTIVIDADES
1. Ajuste, por el mtodo de mnimos cuadrados, una curva de la forma:
y = Ax B
X
Y
2
1,8
3
2,8
4
4,5
5
6,8
6
8,8
7
8
9
10
12.3 24,8 61,.5 84,.9
y = Ae Bx
X
Y
CARRERAS PROFESIONALES
1,2
1,3
2,3
2,2
3,4
5,5
5,5
6,6
8,6
7,8
CIBERTEC
ESTADISTICA II
137
2
1
3
2
5
5
7
16
9
28
11
38
13
50
16
72
21
90
1
2
3
10,50
Precio ($)
8,200 6,500
0
-----
4,500
3,800
CIBERTEC
CARRERAS PROFESIONALES
138
3
250
4
350
5
700
6
870
7
1080
8
1600
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
139
Presin
(Kg./cm.2)
Volumen (cm3)
50
60
70
85
98
110
1980
1985
Poblacin
10,5
11,2
1990 1994
12,5
13,2
1998
2001
2003
2005
18,8
22,6
27,8
32,8
CIBERTEC
CARRERAS PROFESIONALES
140
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
141
10. Los datos siguientes muestran las ventas (en millones) de cajas y los
gastos de publicidad (en miles de soles) para siete marcas de gaseosas.
Marca
Inca kola
Coca Cola
Kola Real
Pepsi cola
Isaac Kola
Concordia
Sabor
Ventas de cajas
1 929,2
1 348,6
811,4
541,5
536,5
535,6
219,5
CIBERTEC
CARRERAS PROFESIONALES
142
Autoevaluacin
3. A continuacin, observamos datos sobre el porcentaje de vuelos que llegan
puntuales y la cantidad de quejas por 100 00 pasajeros.
Aerolnea
WAYRA PER
L C BUSRE
TACA
AERO
CONDOR
ATSA
IBERIA
LAN PER
STAR PER
AERO MXICO
Porcentaje
puntual
81,8
76,6
76,6
0,21
0,58
0,85
75,7
0,68
73,8
72,2
71,2
70,8
68,5
0,74
0,93
0,72
1,22
1,25
Quejas
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
143
CIBERTEC
CARRERAS PROFESIONALES
144
Clase
75
de llanta
Capacidad
853
de carga
82
85
87
88
91
92
93
105
1
047
1
135
1
201
1
235
1
356
1
389
1
433
2
039
7.1 Trace un diagrama de dispersin para estos datos, con la clase de llanta
como variable independiente.
7.2 Desarrolle una ecuacin de regresin que mejor se aproxime a la
realidad de los datos observados.
7.3 Estime la capacidad de carga para una llanta cuya clase es 90.
8 Los datos siguientes muestran los ingresos de los casinos y de sus hoteles,
en miles de soles.
Compaa
J W Marriott
Swisstel Lima
Sheraton
Hotel de las Amricas
Delfines
El Condado
Plaza del bosque
Sonesta
Costa del Sol
Sol de Oro
Ingreso en hotel
303,5
664,8
121,00
429,6
373,1
670,9
66,4
105,8
102,4
135,8
Ingreso en casino
548,2
664,8
270,7
511,0
404,7
782,8
130,7
105,5
148,7
358,5
8.1 Trace un diagrama de dispersin para estos datos, con los ingresos en
el hotel como variable independiente.
8.2 Desarrolle una ecuacin de regresin que mejor se aproxime a la realidad
de los datos observados.
8.3 Suponga que los ingresos del hotel fueron de s/. 500 millones. Cul es un
estimado de los ingresos del casino?
8.4 Qu tan confiable es dicha ecuacin? Justifique estadsticamente su
respuesta.
9 La siguiente tabla muestra el porcentaje de mujeres que trabaja en cada
empresa (x) y el porcentaje de puestos gerenciales desempeados por
mujeres en esa empresa (y). Los datos son de empresas del sector de
ventas y comercio al menudeo.
Empresa
Wong
Mc Donalds
Hiraoka
Ebel
Aceros Arequipa
Xi
72
47
51
57
55
Yi
61
16
32
46
36
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
145
Deducciones
ajustadas totales (s/.
miles)
9,6
9,6
10,1
11,1
13,5
17,7
25,5
Los Angeles
Chicago
Washington
Atlanta
Dallas
CIBERTEC
Tasa de
ocupacin
(%)
67,9
72,0
68,4
67,7
69,5
Tarifa
promedio
por noche (s/.
)
75,91
92,04
94,42
81,69
74,76
CARRERAS PROFESIONALES
146
San Diego
Anaheim
Santa
Ana
San Francisco
Houston
Miami
Oahu Island
Phoenix
Boston
Tamp
Dtroit
Philadelphia
Nashvile
Seatle
Mineapolis
New Orleans
68,7
69,5
80,86
70,04
78,7
62.0
71,2
80,7
71,4
73,5
63,4
68,7
70,1
67,1
73,4
69,8
70,6
106,47
66,11
85,83
107,11
95,34
105,51
67,45
64,79
83,56
70,12
83,60
73,64
99,00
CARRERAS PROFESIONALES
Venta
acciones
5,0
9,0
6,7
8,75
3,0
13,6
4,6
6,7
3,0
7,7
de Precio
esperado(s/.)
15
14
15
17
11
19
13
14
10
13
CIBERTEC
ESTADISTICA II
147
12.1
Cantidad
vencida
(en soles)
445
539
1 212
2 237
479
1 181
4 187
409
1 002
54,7
2 062
13.1
Determine la ecuacin de regresin para estimar la cantidad de
impuestos vencidos de la valuacin de la propiedad.
13.2
Aplicar la ecuacin de regresin para estimar los impuestos
vencidos para una propiedad cuya valuacin es de s/. 42 400.
13.3
Cree usted que la ecuacin de regresin permita una buena
prediccin de la cantidad de impuestos vencidos?
14 En un proceso de manufactura, se cree que la velocidad de la lnea de
produccin, en pies por minuto, afecta la cantidad de piezas defectuosas
que se encuentran en proceso de inspeccin. Para probar esta teora se
hizo una determinacin en la que el mismo conjunto de partes era
inspeccionado visualmente a diversas velocidades de la lnea. En la tabla
siguiente, se ve una lista de los datos reunidos.
Valor de la lnea
Cantidad
de
encontradas
CIBERTEC
partes
20 20 40 30 60 40
defectuosas 21 19 15 16 14 17
CARRERAS PROFESIONALES
148
14.1
Desarrolle una ecuacin de regresin que mejor se aproxime a la
realidad de los datos observados.
14.2
Tuvo un buen ajuste con los datos de la ecuacin de regresin?
Para recordar
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
149
SEMANA
12
REGRESIN LINEAL MLTIPLE
TEMAS
OBJETIVOS ESPECFICOS
CONTENIDOS
.
ACTIVIDADES
CIBERTEC
CARRERAS PROFESIONALES
150
a o + a1 X 1 + a 2 X
Donde:
Y:
Xi:
2+
a3 X
3+
4 + .......... .... +
a4 X
an X
Variable dependiente
Variable independiente i, cuando i = 1, 2, 3, 4,.......n
Y
YX
na
b X
c X
b X1 + c X X
Y X = a X + b X X +c X 2
1
a X
+
1
2
2
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
151
Para medir esta variacin, se debe utilizar de nuevo la medida conocida como
error estndar de la estimacin:
Y = a + bX 2 + cX 2
Se =
(Y Y ) 2
n k 1
Donde:
.
CIBERTEC
CARRERAS PROFESIONALES
152
ACTIVIDADES
1. Se quiere controlar el precio (valor real) de cierto producto a partir de los de
gastos de publicidad (miles de $) y los gastos en transporte ($/ton.). En un
mes se tom una muestra de 9 ensayos y se observ lo siguiente:
Precio
2,1
2,2
2,5
2,6
2.6
2,7
2,7
2,8
Publico.
12
14
17
22
26
28
32
34
35
Transporte
25
18
6
19
9
21
5
22
7
23
8
27
7
29
5
21
6
23
5
60
69
62
65
69
70
71
65
64
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
153
X2
6,9
6,2
6,5
7,2
7,0
7,1
6,6
6.8
CIBERTEC
X1
X2
4
3
8
6
12
14
16
18
20
29
24
37
28
38
32
42
24
21
20
15
14
10
CARRERAS PROFESIONALES
154
X1
77
61
56
68
57
87
X2
50
60
67
78
89
98
X3
97
51
52
58
56
57
Ajuste a los datos una curva de regresin lineal mltiple y estime P cuando
X1 es 91, X2 es 80 y X3 es 70
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
155
4
6
6
8
7,7
8
9,6
10
10
9
y gastos en
15,4 24,8
10
12
28
10
Gastos ($) 24
34
40
45
45
50
60
70
6.1 Halle la recta de regresin mltiple de mnimos cuadrados para predecir
los gastos en transporte.
6.2 Si se desea enviar a 25 KM un volumen de 15 toneladas de concreto
premezclado, cul ser el gasto en el transporte?.
Autoevaluacin
1. Se desea predecir el nmero de solicitudes de reembolso de los impuestos
prediales, en una municipalidad, durante los das hbiles del perodo que va
del 1 de marzo al 15 de abril, de modo que se pueda planearse mejor las
necesidades de personal durante dicho periodo. Se ha hecho la hiptesis de
que varios factores pueden ser tiles en la prediccin. Los datos
correspondientes a estos factores y el nmero de solicitudes de reembolso
de aos anteriores son las siguientes:
X1
ndice
econmico
99
106
100
129
179
CIBERTEC
X2
Poblacin dentro
de una milla a la
redonda de la
oficina
10 188
8 566
10 557
10 219
9 662
X3
Ingreso promedio
para la
municipalidad
21 465
22 228
27 665
25 200
26 300
Y
Nmero de
solicitudes de
reembolso, del 1 de
marzo al 15 de abril
2 306
1 266
1 422
1 721
2 544
CARRERAS PROFESIONALES
156
Demanda Precio
($)
40
9
45
8
50
9
55
8
60
7
70
6
65
6
65
8
75
5
75
5
80
5
100
3
90
4
95
3
85
4
Ingreso
($)
400
500
600
700
800
900
1000
1100
1200
1300
1400
1500
1600
1700
1800
Sub
($)
10
14
12
13
11
15
16
17
22
19
20
23
18
24
21
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
157
Pies
cuadrados
8,9
9,5
12,6
12,9
19,0
17,6
20,0
20,6
20,5
25,1
22,7
40,8
1,0
1,0
1,5
1,5
1,0
1,0
1,5
1,5
2,0
2,0
2,0
4,0
2
6
11
8
22
17
12
11
9
8
18
12
1
999
1
998
1
997
1
996
1
995
CIBERTEC
Y
Millones de
tons.
vendidas
4,2
X1
Tasa de
inflacin
X3
Nmero de
construcciones
3,1
X2
Limitacin
de
importacin
3,10
3,1
3,9
5,00
5,1
4,0
7,5
2,20
5,7
4,7
10,7
4,50
7,1
4,3
15,5
4,35
6,5
6,2
CARRERAS PROFESIONALES
158
1
994
1
993
3,7
13,0
2,60
6,1
3,5
11,0
3,05
5,9
Promoc
2,5
5,5
6,0
7,9
5,2
7,6
2,0
9,0
4,0
9,6
5,5
3,0
6,0
5,0
3,5
Compet
10
8
12
7
8
12
12
5
8
5
11
12
6
10
10
Gratis
3
6
9
16
15
9
8
10
4
16
7
6
10
4
4
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
159
tiempo
1
2
3
4
5
6
Ventas
(miles de
dlares)
4 618
311
7 119
4 367
5 118
8 887
tiempo
7
8
9
10
11
12
Ventas
(miles de
dlares)
19746
34215
50306
65717
86434
105464
CARRERAS PROFESIONALES
160
GNERO
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
161
CARRERAS PROFESIONALES
162
Para recordar
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
163
SEMANA
13
CORRELACIN
CORRELACIN ENTRE DOS VARIABLES
TEMAS
OBJETIVOS ESPECFICOS
CONTENIDOS
Anlisis de correlacin
Correlacin entre dos variables, dependiente e independiente
Coeficiente de correlacin lineal (frmula de Pearson)
ACTIVIDADES
CIBERTEC
CARRERAS PROFESIONALES
164
r=
n x y x y
n x 2 ( x )
r=
n y 2 ( y )
Sx y
Sx S y
ACTIVIDADES
1. Un estudiante del cuarto ciclo de la carrera de gestin y sistemas elabora un
estudio de compaas que se estn dando a conocer. Tiene curiosidad por
ver si existe o no relacin significativa entre el tamao de la oferta (en
millones de dlares) y el precio por accin.
Tamao 108,00 4,40 3,50 3,60 39,00 68,40 7,50 5,50 375,00 12,20 4,40
Precio
12,0
4,0
5,0
5,0
13,0
19,0
8,5
5,0
15,0
6,0
CARRERAS PROFESIONALES
CIBERTEC
12,0
ESTADISTICA II
165
Litio
Alcalina
3.1
4.2
5.1
6.3
8.1
1.3
1.6
1.8
2.2
3.1
CIBERTEC
CARRERAS PROFESIONALES
166
35
52
62
68
76
80
30
120
180
100
310
200
.
5. Debido a la demanda de sus publicaciones y del fuerte incremento de la
competencia desleal e informal, la editorial Vinces Vives ha tomado la
decisin de preparar algunos libros de uso popular en la educacin primaria.
Teniendo como nico parmetro la cantidad de pginas de dicho libro. Se
toma una muestra de siete (07) de ellos, y se anota el precio de venta que
debera tener por la cantidad de pginas que tendra dicho libro. En la
siguiente tabla, se recopilan dichos datos.
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
Precio
12.00
($)
# Pg. 175
167
12.50
13.80
15.40
17.50
18.00
20.00
140
280
320
280
360
300
15
20
25
30
35
40
45
50
55
CIBERTEC
CARRERAS PROFESIONALES
168
de
400
450
550
600
700
750
produccin Costo
total
(s/.)
4 000
5 000
5 400
5 900
6 400
7 000
7.1 Use estos datos para deducir una ecuacin de regresin con la que se
pueda predecir el costo total para determinado volumen de produccin.
7.2 Cul es el costo variable, o costo adicional, por unidad producida?
7.3 Calcule el coeficiente de determinacin. Qu porcentaje de la
variacin en el costo total puede explicar el volumen de produccin?
7.4 El programa de produccin de la empresa indica que el mes prximo
se deben producir 500 unidades. Cul ser el costo total estimado
para esta operacin?
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
169
Autoevaluacin
1. En finanzas, es de inters ver la relacin entre Y, devolucin promedio de
acciones, y X, la devolucin global del mercado. El coeficiente de pendiente
calculado por la regresin lineal es denominada la beta de las acciones por
los analistas de inversiones. Una beta mayor que 1 indica que las acciones
son relativamente sensibles a cambios de mercado, mientras que una beta
menor que 1 indica que las acciones son relativamente insensibles. Para los
datos siguientes, calcule la beta y pruebe si esta es significativamente
menor que1. Use = 0,05.
Y (%)
X (%)
10
11
12
15
8
3
15
18
9
10
11
12
8
6
10
7
13
18
11
13
( X
n X = 871,56 .
2.1 Encuentre el error estndar del coeficiente de pendiente de regresin.
2.2 Construya un intervalo de confianza de 98% para la pendiente de
poblacin. Interprete el intervalo de confianza.
28,654. La cantidad
1,1
1,5
1,6
1,6
1,4
1,3
1,1
1,7
1,9
1,5
1,3
75
95
110
102
95
87
82
115
122
98
90
3.1
Estime la regresin de mnimos cuadrados para predecir el valor
tasado a partir del tamao.
3.2
Generalmente, las inmobiliarias sienten que el valor de una casa
sube 50 mil dlares por cada 1 000 pies cuadrados de reas. Para esta
muestra, se cumple esta relacin?
4 En 1 999, una agencia gubernamental de salud encontr que, en cierto
nmero de distritos, la relacin de fumadores y muertes, por enfermedades
del corazn para 10 000 pobladores, tena una pendiente de 0,08. Un
estudio reciente en 18 distritos produjo una pendiente de 0,147 y un error
estndar del coeficiente de pendiente de regresin de 0,032.
CIBERTEC
CARRERAS PROFESIONALES
170
Ingresos
ajustados
La Molina
36 664
La Victoria
38 845
Ate
34 886
Brea
32 512
Pueblo Libre
34 531
Jess Mara
35 995
Magdalena
37 799
Surco
33 876
Comas
30 513
San juan de Miraflores
30 174
San
jun
de
30 060
Lurigancho
Chosica
37 153
Miraflores
34 918
Barranco
33 291
San Isidro
31 504
Rmac
29 199
Los Olivos
33072
Ancn
30 859
Independencia
32 566
San Borja
34 296
brutos Porcentaje
auditado
1,3
1,1
1,1
1,1
1,0
1,0
0,9
0,9
0,9
0,9
0,8
0,8
0,7
0,7
0,7
0,6
0,6
0,5
0,5
0,5
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
171
Para recordar
CIBERTEC
CARRERAS PROFESIONALES
172
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
173
SEMANA
14
CORRELACIN ENTRE DOS VARIABLES
TEMAS
OBJETIVOS ESPECFICOS
CONTENIDOS
Coeficiente de Determinacin
Error de estimacin
Pendiente de una recta de poblacin
Coeficiente de correlacin de rango (frmula de Spearman)
ACTIVIDADES
CIBERTEC
CARRERAS PROFESIONALES
174
a y + b x y n y
ny
S 2x y
r = 2 2
Sx S y
2
Se =
a y b x y
n2
y
y
n2
Donde:
y = Es el valor de la variable independiente.
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
175
Sb =
Se
nx
Donde:
Sb = error estndar del coeficiente de regresin
Se = error estndar de estimacin
x = valor de la variable independiente
x = la media de los valores de la variable independiente
Para realizar una prueba de hiptesis respecto a B, se define:
H o : B = Bo
H 1 : B Bo
Para estandarizar la pendiente de la ecuacin de regresin.
b Bo
t=
Sb
b = la pendiente de regresin ajustada
Bo =la pendiente real hipottica para la poblacin
Sb = error estndar del coeficiente de regresin
Puesto que la prueba se basa en una distribucin t student con (n-2) grados de
libertad, usamos t para denotar la estadstica estandarizada.
EL COEFICIENTE DE CORRELACIN DE RANGO
Con la nocin del coeficiente de correlacin, se concluy una medida de la
cercana de asociacin entre dos variables. Con frecuencia, en el anlisis de
correlacin, la informacin no est siempre disponible en forma de valores
numricos. Pero si se puede asignar clasificaciones a los elementos de cada
una de las dos variables que se estn estudiando, entonces puede calcularse
un coeficiente de correlacin de rango. sta es una medida de la correlacin
que existe entre los dos conjuntos de rangos, una medida del grado de
asociacin entre las variables que no podramos calcular de otra manera.
Una segunda razn para aprender el mtodo de correlacin de rango es la
posibilidad de simplificar el proceso de clculo de un coeficiente de correlacin
a partir de un conjunto de datos muy grande para cada una de las dos
variables. Esta medicin se le conoce como el coeficiente de correlacin de
rango de Spearman, en honor al estadstico que lo desarroll a principios de
siglo pasado.
rs = 1
6 d
n n2 1
CIBERTEC
CARRERAS PROFESIONALES
176
ACTIVIDADES
1. Los datos siguientes son los sueldos mensuales, y promedios de
calificaciones x para estudiantes que obtuvieron su licenciatura en
administracin, con especializacin en sistemas de informacin.
Calificacin
2,6
3,4
3,6
3,2
3,5
2,9
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
177
2.1 Con estos datos, forme una ecuacin de regresin que relacione la
indicacin de absorbencia de luz con los miligramos de protena de la
muestra.
2.2 Calcule r2. Se sentira cmodo con este modelo de regresin, al estimar la
cantidad de protena de una muestra?
2.3 En una muestra que se acaba de recibir, la indicacin de absorbencia fue
de 0,941. Estime la cantidad de protena en esa muestra.
30
35
17
31
35
43
28
46
42
50
25
32
19
33
29
42
CIBERTEC
CARRERAS PROFESIONALES
178
5.
8.0
2.0
4.0
3.0
7.0
1.0
6.0
6.0
4.5
2.0
7.0
8.0
4.5
3.0
32
5
43
2
42
2
29
4
56
3
62
2
45
4
39
5
40
4
35
6
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
Compaa
Gastos
Accidentes
179
A
60
5
B
37
7
C
30
6
D
20
9
E
24
7
F
42
4
G
39
8
H
54
2
I
48
4
J
58
3
K
26
8
Existe una correlacin significativa entre los gastos y los accidentes en las
plantas de las compaas qumicas? Use una correlacin de rango (en la que 1
represente el mayor gasto y tasa de accidentes) para respaldar su conclusin.
Pruebe al nivel de significancia de 1 %.
Autoevaluacin
1. El granjerito trat de determinar la relacin entre el porcentaje de
metionina que se agrega al alimento y el peso corporal de pollos. Con los
datos obtenidos se aplic el anlisis de regresin y se determin la siguiente
lnea de regresin:
y = 0,21 + 0,42 x
En donde:
y = peso corporal estimado en kilogramos
X = porcentaje de metionina adicional en el alimento
El coeficiente de determinacin, r2, fue 78, lo que indica que el ajuste fue
razonablemente bueno para los datos. Suponga que se us una muestra de
CIBERTEC
CARRERAS PROFESIONALES
180
Empresa
ASAKA
WONG
MICMAS
TODOS
TECHO
PATIO
PPKSA
1,2
-0,7
-2,5
-2,0
-3,0
-5,5
2,0
4,7
5,0
1,8
1,2
4,1
3,0
2,6
-1,0
2,0
0,5
-1,3
2,5
5,5
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
181
Horas de estudio
45 30 90 60 105 65 90 80 55 75
Total
de
puntos 40 35 75 65 90 50 90 80 45 65
obtenidos
4.1 Forme una ecuacin de regresin que muestre cmo se relaciona el
total de puntos obtenidos con las horas de estudio.
4.2 Cul es el coeficiente de correlacin?
4.3 Prediga los puntos totales que obtendr Karina Lpez. Pas 95 horas
estudiando.
5. Dos profesores de una escuela de comercio discutan sobre lo difcil que es
predecir el xito de los graduados basndose solamente en las
calificaciones. Un profesor pensaba que el nmero de aos de experiencia
que los maestros en administracin de empresas tuvieran antes de regresar
por sus post grados era probablemente el mejor preeditor. Usando los
siguientes datos, al nivel de significancia de 0.02, qu correlacin de rango
es un mejor preeditor de xito profesional?
Aos de experiencia
Promedio de
calificaciones
Rango de xito (10 =
tope)
3.4 3.2 3.5 2.9 3.4 3.9 3.6 3.0 2.5 3.0
4
10
1 2 3 4 5 6 7 8 9 10 11 12 13 1.4
1 11 13 2 12 10 3 4 14 5 6 9 7
8
Encuestador 2
4 12 11 2 14 10 1 3 13
CIBERTEC
7.2 5.5 6.2 8.3 5.2 2.0 3.0 0.5 9.0 6.0
1
10
CARRERAS PROFESIONALES
182
CARRERAS PROFESIONALES
Calificacin de
entrevista
81
88
55
83
78
93
65
87
95
76
60
85
93
66
90
69
87
68
81
84
82
90
63
78
73
79
72
95
81
87
Calificacin de
currculum
113
88
76
111
121
83
129
99
142
93
136
82
91
83
96
126
108
95
65
96
101
79
71
108
68
11
109
121
140
132
CIBERTEC
ESTADISTICA II
183
31
32
33
34
35
93
85
91
94
94
135
143
118
147
138
10. Los siguientes son los salarios y datos de edad de los 10 candidatos a
doctorado que se gradan este ao de la Escuela de Doctorado en
Contabilidad de la Universidad Peruana de Ciencias. Al nivel de significancia
de 0.05, la correlacin de rango de edad y salario sugiere que los
candidatos de mayor edad obtienen salarios iniciales mayores?
Salario en
Edad
dlares
67,000
29
60,000
25
57,500
30
59,500
35
50,000
27
55,000
31
59,500
32
63,000
38
69,500
72,000
28
34
CIBERTEC
Motor
Horas requeridas
para reparacin
1
2
3
4
5
6
7
8
9
10
1,000
1,200
900
1,450
2,000
1,300
1,650
1,700
500
2,100
40
54
41
60
65
50
42
65
43
66
CARRERAS PROFESIONALES
184
Para recordar
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
185
SEMANA
15
SERIE DE TIEMPO
TEMAS
OBJETIVOS ESPECFICOS
CONTENIDOS
ACTIVIDADES
CIBERTEC
CARRERAS PROFESIONALES
186
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
187
Las ideas anteriores suministran una posible tcnica para analizar las series de
tiempo. Se supone que en las series de tiempo la variable Y es un producto de
CIBERTEC
CARRERAS PROFESIONALES
188
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
189
ESTIMACIN DE LA TENDENCIA
La estimacin de la tendencia puede conseguirse de varias formas posibles.
El mtodo de mnimos cuadrados puede utilizarse para hallar la ecuacin de
una recta o curva de tendencia adecuada. De esta ecuacin se pueden calcular
los valores de tendencia T.
El mtodo libre, que consiste en ajustar una recta o curva de tendencia
mediante la sola observacin del grfico, puede utilizarse para estimar T. Sin
embargo, esto tiene el inconveniente de depender en gran parte del criterio
personal.
El mtodo de movimiento medio. Mediante movimientos medios de rdenes
apropiados, pueden eliminarse los movimientos cclicos, estacinales e
irregulares, quedando as solamente el movimiento de tendencia.
Un inconveniente de este mtodo es que los datos del principio y final de la
serie se pierden. As, en el anterior, se comenz con 7 nmeros y con un
movimiento medio de orden 3 se qued con 5 nmeros. Otro inconveniente es
que los movimientos medios pueden originar ciclos u otros movimientos que no
tenan los datos originales. Un tercer inconveniente es que los movimientos
medios estn fuertemente afectados por los valores extremos. Para reducir en
parte estos inconvenientes, se utiliza a veces un movimiento medio ponderado
con pesos adecuados. En tal caso, el trmino (o trminos) central recibe el
peso mayor y los valores extremos los pesos pequeos.
CIBERTEC
CARRERAS PROFESIONALES
190
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
Aos
191
Produccin
media
mensual
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2.2 Un movimiento medio de 4 aos
Aos
Produccin
Movimiento total de
media mensual
4 aos
Movimiento medio de
4 aos
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
CIBERTEC
CARRERAS PROFESIONALES
192
Aos
Movimiento
medio de 4
aos
Movimiento total de
2 aos de la col. 3
Movimiento medio
centrado de 4 aos
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
Aos
193
Movimiento
total de 4
aos
Movimiento
total de 2 aos
de la col. 3
Movimiento
medio
centrado de 4
aos
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2.5 Represente el movimiento medio de (2.1) junto con los datos originales.
2.6 Obtenga los valores de tendencia para los datos de la tabla mediante el
mtodo de semimedias donde la media se toma de (2.1)
CIBERTEC
CARRERAS PROFESIONALES
194
Ao
1991 1992 1993 1994 1995 1996 1997 1998 19969 2000
Valores de
tendencia
2.7 Utilice el mtodo de mnimos cuadrados para ajustar una recta a los
datos de (2.1) y halle los valores de tendencia.
Ao
1991 1992 1993 1994 1995 1996 1997 1998 19969 2000
Valores de
tendencia
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
Aos
Ventas
195
1
400
2
390
3
320
4
340
5
270
6
260
7
300
8
320
9
340
10
370
CIBERTEC
CARRERAS PROFESIONALES
196
Autoevaluacin
1. Identifique con qu movimiento caracterstico de una serie de tiempo se
podra asociar principalmente cada una de los siguientes supuestos:
1.1 Un retroceso
1.2 Un incremento de empleo durante los meses de verano
1.3 La disminucin de mortandad debido al avance de la ciencia
1.4 Una huelga del acero
1.5 Una demanda continuamente creciente de automviles pequeos
(a) tendencia de larga duracin
(b) estacional
(c) cclico
(d) irregular
(e) tendencia de larga duracin
2. Dados los nmeros 1, 0, -1, 0, 1, 0, -1, 0, 1, determine un movimiento medio
de orden
2.1 dos
2.2 tres
2.3 cuatro
2.4 cinco
3. En la siguiente tabla, se da el consumo medio mensual en millares de
fanegas de algodn nacional y de importacin en Estados Unidos durante los
aos 1990-1999. Construya lo siguiente:
3.1 un movimiento medio de 2 aos
3.2 un movimiento medio centrado de 2 aos
3.3 un movimiento medio de 3 aos
3.4 un movimiento medio centrado de 4 aos
3.5 un movimiento medio centrado de 6 aos
3.6 represente los movimientos medios junto con los datos originales y
discuta los resultados obtenidos
3.7muestre que el movimiento medio centrado de 2 aos es equivalente a un
movimiento medio ponderado de 3 aos con pesos 1, 2, 1,
respectivamente.
Ao
Consumo
de
algodn
1990 1991 1992 1993 1994 1995 1996 1997 1998 1999
656
804
836
765
777
711
755
747
696
677
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
197
4.4 Represente el movimiento medio de los apartados (4.2) y (4.3) junto con
los datos originales y compare los resultados
Ene.
Feb
Jun
Jul
Ago. Sep
Oct
Nov
Dic
56,1
53,5
79,3
58,2
58,7
35,5
7.1 Trace la grfica de esta serie de tiempo. Parece haber una tendencia
lineal?
CIBERTEC
CARRERAS PROFESIONALES
198
7.2 Determine una ecuacin del componente de tendencia lineal para la serie
de tiempo.
7.3 Cul es el aumento anual promedio de costo que ha tenido la empresa?
8. Al final de la dcada de los noventa, muchas empresas trataron de reducir su
tamao para disminuir sus costos. Uno de los resultados de esas medidas
de recorte de costos fue una disminucin en el porcentaje de empleos
gerenciales en la industria privada. Los siguientes datos corresponden al
porcentaje de mujeres gerentes, del ao 1995 al 2000.
Ao
Porcentaje
7.51
7.52
7.53
7.65
7.62
7.73
7.68
8.1 Deduzca una ecuacin de tendencia lineal para esta serie de tiempo.
8.2 Use la ecuacin de la tendencia para estimar el porcentaje de mujeres
gerentes para el 2003 y 2004.
Para recordar
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
199
SEMANA
16
SERIE DE TIEMPO
TEMAS
Modelos de estimacin
Mtodos de estimacin de la tendencia
Prediccin mediante la serie de tiempo
OBJETIVOS ESPECFICOS
CONTENIDOS
ACTIVIDADES
CIBERTEC
CARRERAS PROFESIONALES
200
SERIE DE TIEMPO
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
201
CIBERTEC
CARRERAS PROFESIONALES
202
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
203
ACTIVIDADES
1. La Tabla muestra la energa elctrica mensual en millones de kilovatios hora
empleada para el alumbrado de calles y carreteras en el Per durante los
aos 1991-1998.
1991
1992
1993
1994
1995
1996
1997
1998
Ene
318
342
367
392
420
453
487
529
Feb
281
309
328
349
378
412
440
477
Mar
278
299
320
342
370
398
429
463
Abril
250
268
287
311
334
362
393
423
May
231
249
269
290
314
341
370
398
Jun
216
236
251
273
296
322
347
380
Jul
223
242
259
282
305
335
357
389
Ago
245
262
284
305
330
359
388
419
Sep
269
288
309
328
356
392
415
448
Oct
302
321
345
364
396
427
457
493
Nov
325
342
367
389
422
454
491
526
Dic
347
364
394
417
452
483
516
560
CIBERTEC
CARRERAS PROFESIONALES
204
Aos
Consumo total
Medias mensuales
Ene
Feb
1991
1992
1993
1994
1995
1996
1997
1998
Total
Media
1.3 Obtenga el ndice estacional mediante el mtodo de porcentaje de
tendencia (utilice el mtodo de mnimos cuadrados para obtener los
valores de tendencia mensuales)
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
Aos
Medias mensuales
205
CIBERTEC
CARRERAS PROFESIONALES
206
Ene Feb Mar Abril May Jun Jul Ago Sep Oct Nov Dic
1991
1992
1993
1994
1995
1996
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
207
1997
1998
Total
Media
1.6 Ajuste los datos a la tendencia.
Ene
Feb
1991
1992
1993
1994
1995
1996
1997
1998
CIBERTEC
CARRERAS PROFESIONALES
208
Autoevaluacin
1. En la siguiente tabla se da el consumo medio mensual, en millares de
fanegas de algodn nacional y de importacin en Estados Unidos durante los
aos 1990-1999.
1990 1991 1992 1993 1994 1995 1996 1997 1998 1999
Ao
Consumo
de
algodn
656
804
836
765
777
711
755
747
696
677
1.1 Obtenga los valores de tendencia para los datos mediante el mtodo de
semimedias, donde la media se toma como
(a) la media aritmtica
(b) la mediana
Construir un grfico con los resultados obtenidos
1.2 Obtenga los valores de tendencia para los datos mediante
(a) el mtodo libre
(b) un movimiento medio de orden adecuado
Comparar con los resultados
1.3 Emplee el mtodo de mnimos cuadrados para ajustar una recta a los
datos de la tabla
2. En la siguiente tabla, se muestra la produccin mensual de mantequilla en el
Per en miles de kilogramos los aos 1996-2003.
2.1 Represente los datos.
2.2 Construya un ndice estacional mediante el mtodo del porcentaje
medio.
2.3 Obtenga un ndice estacional mediante el mtodo de porcentaje de
tendencia o razn de tendencia.
2.4 Obtenga un ndice estacional mediante el mtodo del porcentaje del
movimiento medio o razn del movimiento medio
2.5 Obtenga un ndice estacional mediante el mtodo de enlaces relativos
1996
1997
1998
1999
2000
2001
2002
2003
Ene
Feb
Mar
Abril
Mayo
Jun
Jul
85,6
78,7
103,9
118,7
108,1
114,6
115,3
118,6
80.9
78,8
101,9
116,6
104,3
114,1
110,3
113,4
92,2
91,5
121,4
143,3
121,1
129,6
124,6
129,5
101,8
102,5
133,5
142,0
129,4
135,4
132,3
130,3
132,6
135,0
156,0
164,5
157,9
151,9
159,3
150.6
141,2
128,0
154,0
160,9
151,9
149,0
148,1
144,7
130,5
117,7
135,6
129,7
123,0
127,6
125,8
126,9
CARRERAS PROFESIONALES
Ago.
Sep
Oct
Nov
CIBERTEC
Dic
70,4
94,6
109,0
97,0
105,8
103,4
105,7
107,2
ESTADISTICA II
209
Feb
Mar
Abril
Mayo
Jun
Jul
Ago.
Sep
Oct
Nov
Dic
1996 12,63 11,72 13,43 12,53 13,29 13,27 12,36 13,27 13,10 13,86 13,39 15,38
1997 11,84 11,74 12,74 13,40 14,85 13,81 13,40 13,45 13,62 14,82 14,01 16,91
1998 13,05 12,33 13,96 14,17 14,66 14,58 14,38 14,18 14,08 14,95 13,96 16,44
1999 12,34 12,06 13,54 14,32 14,25 14,66 14)39 13,90 14,14 14,66 14,53 17,87
2000 13,15 12,64 14,57 15,49 15,33 15,60 15,26 15,48 15,76 15,68 15,75 19,12
2001 13,73 13,55 15,72 14,89 16,11 16,58 15,38 16,19 15,58 16,13 16,49 19,38
2002 14,74 14,06 15,79 16,44 17,20 17,11 16,86 17,49 16,37 16,95 17,13 19,84
2003 15,29 13,78 15,55 16,27 17,36 16,60 16,60 17,00 16,33 17,36 17,04 21,17
Feb.
Mar
Abril
Mayo
Jun
Jul
Ago.
Sep
Oct
Nov
Dic
1998 3661
2834
2999
3152
3977
3295
3807
3307
3312
4317
3139
2700
1999 3562
2911
2868
2912
3678
2606
2969
3149
3364
4156
3139
2672
2000 3351
2730
2801
2957
3883
3204
3758
3229
3153
4024
2797
2413
2001 2967
2462
2412
2445
3345
2730
3251
2708
2711
3629
2685
2518
2002 2505
2556
3256
2757
3754
3052
3015
3883
3148
3282
3758
2669
2003 2713
2751
3517
2971
3835
3143
2397
3700
3155
3284
3740
2641
2004 2565
2616
3446
2696
3558
2959
2708
3737
2849
2920
3223
2221
2005 2164
2108
2702
2105
2729
2489
2138
3146
2570
2733
2462
2188
CIBERTEC
CARRERAS PROFESIONALES
210
1991
1992
1993
1994
1995
1996
1997
1998
Ene
316
338
363
389
425
454
488
519
Feb
285
312
321
353
383
417
446
487
Mar
288
305
315
352
378
402
412
457
Abril
253
274
294
320
324
356
398
425
May
225
244
259
260
315
351
387
402
Jun
225
246
261
283
296
332
357
390
Jul
223
242
259
282
305
335
357
389
Ago
235
252
274
308
330
358
388
419
Sep
269
285
309
325
356
392
415
448
Oct
302
321
345
364
396
427
457
493
Nov
323
342
367
389
422
454
491
526
Dic
352
364
394
421
452
492
521
568
Feb.
Mar
Abril
Ago.
Sep
Oct
Nov
Dic
1996
84,6
87.9
98,2
98,6
90,6
78,4
90,4
1997
77,7
76,8
99,5
92,1
87,7
75,9
98,6
95,0
91,6
91,3 107,0
92,6
87,8
86,8
91,9
94,7
92,7 109,8
92,4
93,1
92,3 106,4
90,1
8607
91,9
Mayo
Jun
Jul
97,7
99,0
90,0 109,2
1990
1999
67.4
81.3
74.3
69.7
82.5
74.8
79.7
77.5
73.7
69.6
CARRERAS PROFESIONALES
CIBERTEC
ESTADISTICA II
211
Ene
Feb
Mar
Abril
Ago.
Sep
Oct
Nov
Dic
1996
85,6
80.9
92,2
93,6
86,6
68,4
70,4
1997
78,7
78,8
91,5
92,1
87,7
75,9
94,6
95,0
91,6
91,3 109,0
92,6
87,8
86,8
91,9
94,7
92,7 105,8
92,4
93,1
92,3 103,4
90,1
8607
91,9
Mayo
Jun
Jul
97,7
97,0
90,0 107,2
Feb
Mar
Abril
Mayo
Jun
Jul
Ago.
Sep
Oct
Nov
Dic
90,9
Feb
Mar
Abril
Mayo
Jun
Jul
Ago.
Sep
Oct
Nov
Dic
1998 3661
2834
2999
3152
3977
3295
3807
3307
3312
4317
3139
2700
1999 3562
2911
2868
2912
3678
2606
2969
3149
3364
4156
3139
2672
2000 3351
2730
2801
2957
3883
3204
3758
3229
3153
4024
2797
2413
2001 2967
2462
2412
2445
3345
2730
3251
2708
2711
3629
2685
2518
2002 2505
2556
3256
2757
3754
3052
3015
3883
3148
3282
3758
2669
2003 2713
2751
3517
2971
3835
3143
2397
3700
3155
3284
3740
2641
2004 2565
2616
3446
2696
3558
2959
2708
3737
2849
2920
3223
2221
2005 2164
2108
2702
2105
2729
2489
2138
3146
2570
2733
2462
2188
CIBERTEC
CARRERAS PROFESIONALES
212
Ene.
Feb.
Mar
Abril
Mayo
Jun
Jul
Ago.
Sep
Oct
2742
2291
2398
2489
3419
2813
2249
2712
2190 2908
Nov
Dic
2403 2376
Ao 1
4
2
3
5
Ao 2
6
3
5
7
Ao 3
7
6
6
8
Ao 1
1690
940
2625
2500
Ao 2
1800
900
2900
2360
Ao 3
1850
1100
2930
2615
Mes
Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre
CARRERAS PROFESIONALES
Ao 1
170
180
205
230
240
315
360
290
240
240
230
195
Gastos
Ao 2
180
205
215
245
265
330
400
335
260
270
255
220
Ao 3
195
210
230
280
290
390
420
330
290
295
280
250
CIBERTEC
ESTADISTICA II
213
25
28
35
50
60
60
40
35
30
25
25
20
16 de julio
28
30
35
60
65
50
50
40
35
25
20
20
17 de julio
35
42
45
72
75
60
60
45
40
25
25
25
13.1 Identifique los ndices estacionales por hora para las 12 indicaciones
de cada da.
13.2 Con los ndices estacinales determinados en el inciso a, se elimin el
efecto estacional la ecuacin de tendencia para los datos
desestacionalizada fue T=32.983 + 3922 t. Use slo el componente de
tendencia para determinar pronsticos para las 12 horas del 18 de julio.
14. En el Per, la ONPE mantiene datos de la edad de votante, cantidad de
votantes registrados y el porcentaje de votacin para elecciones
presidenciales y municipales. En la siguiente tabla, se muestra los
porcentajes nacionales de votantes, en relacin con la poblacin con edad
de votar, desde 1982 hasta 2002.
Ao
%
Movimientos
1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2002
55
38
54
37
52
40
53
36
50
37
55
Para recordar
CIBERTEC
CARRERAS PROFESIONALES