Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Descripción
El curso de Estadística Matemática comprende el estudio de la Estadística
Inferencial aplicando Estadística Paramétrica y Estadística No Paramétrica.
Objetivo general
Al final del curso, el estudiante será capaz de poder hacer prueba de hipótesis
para la toma de decisiones, con una y varias muestras, con muestras pequeñas y
muestras grandes, con estadística paramétrica y estadística no paramétrica.
1
colas.
Bibliografía sugerida:
1. probabilidad y Estadística Para Ingenieros. Walpole/Myers/Myers. Editorial Pearson.
2. Estadística Para Administración y Economía. Levin/Rubin/Balderas/Del Valle/Gómez.
Séptima Edición. Editorial Pearson/Prentice Hall.
Evaluación
Pruebas cortas y tareas ………………………………………………………. 25 puntos
Dos exámenes parciales de 25 puntos cada uno …………………… 50 puntos
Examen final …………………………………………………………….. 25 puntos
Total …………………. 100 puntos
2
ESTADÍSTICA MATEMÁTICA
Conceptos Básicos
Estadístico Parámetro
(muestral) (Poblacional)
Media aritmética ̅
𝒙
Desviación estándar S
Varianza S2 2
Tipos de Muestreo:
1. MUESTREO ALEATORIO SIMPLE. Cuando se estudia una
muestra que es seleccionada al azar, equiprobable, objetiva,
confiable y representativa de la población.
3
1. Es aleatoria o al azar. Cuando los elementos muestrales son
seleccionados sin criterios preestablecidos, (con la tecla Ran# de la
calculadora o aleatorio de Excel).
4
3. MUESTREO POR CONGLOMERADOS. La población se divide
en grupos llamados conglomerados. Los elementos de cada
conglomerado tienen características heterogéneas, es decir
diferentes. Los conglomerados son iguales o semejantes
aentre sí.
Para hacer un muestreo por conglomerados, se seleccionan
aleatoriamente algunos del total de conglomerados, y los que
son seleccionados se muestrean en su totalidad.
5
Ejemplo
Dada la población N = {1, 2, 3, 4, 5, 6}
a) Obtener las muestras tamaño 2, 3, 4, 5
b) Comprobar el TLC en cada caso.
c) Hacer gráfica de distribución de medias para muestras
tamaño 2, 3 , 4 y 5
Laboratorio 1
Dada la población N = {1, 2, 3, 4, 5, 6, 7}, determinar para las
muestras tamaño 3, 4, 5 y 6
a) Sus medias b) Comprobar el Teorema de Límite Central.
c) Hacer gráfica de la distribución de medias
Laboratorio 2
Dada la población N = { 2, 4, 5, 7, 8, 9 }. Determinar para las
muestras tamaño 2, 3, 4, 5 y 6 : a) Sus medias b) Comprobar
el Teorema de Límite Central. c) Hacer gráfica de la
distribución de medias
𝝈
𝛔𝒙̅ =
√𝒏
ERROR ESTÁNDAR DE LA MEDIA CUANDO LA POBLACIÓN ES FINITA.
6
𝝈 𝑵−𝒏
𝛔𝒙̅ = √
√𝒏 𝑵−𝟏
𝑵−𝒏
Donde el factor de corrección finito es el radical √
𝑵−𝟏
Ejemplo.
En una distribución normal con media de 375 y desviación
estándar de 48, ¿qué tan grande se debe tomar una muestra para
que la probabilidad sea al menos de 0.95 de que la media de la
muestra caiga entre 370 y 380? Resp. n = 354 unidades
muestrales
Observaciones:
Dada la probabilidad, para calcular Z en un problema de dos
colas, el nivel de confianza o la probabilidad dada, se divide por 2
y el resultado se busca en tabla de probabilidades normales.
7
El nivel de significancia α es el error tipo I que consiste en
rechazar la hipótesis nula siendo verdadera.
8
P(120 < X < 123.8) = 0.4929
Laboratorio 4
Un técnico de laboratorio de rayos X toma lecturas de su máquina
para asegurarse de que se ajusta a las normas de seguridad
industrial. Sabe que la desviación estándar de la cantidad de
radiación emitida por la máquina es de 150 milirems, pero desea
9
tomar lecturas hasta que el error estándar de la distribución de
muestreo no sea mayor de 25 milirems. ¿Cuántas lecturas debe
tomar? Resp. 36 lecturas
Laboratorio 5
Los padres de familia de un colegio están recolectando fondos
para mejorar las instalaciones. Desean obtener contribuciones
de 36% de los 250 miembros, con recursos, egresados de la
institución. Experiencias anteriores indican que aquellos que
contribuyen, donarán el 4% de sus salarios anuales. Se estima
que los contribuyentes tienen un salario anual promedio de
$32,000 con una desviación estándar de $9,600. Calcule la
probabilidad de que la donación esté entre $110,000 y $120,000.
B) Calcular el tamaño de muestra para obtener a lo más $118,000.
Use nivel de confianza de 95% Resp. A) 0.9124 B) 156
N = 250
n = 0.36(250) = 90 contribuyentes
90/250 = 0.36 que es mayor que 0.05 por lo que se debe usar fcf
Donación media por contribuyente = 0.04 (32,000) = $1,280
10
Laboratorio 6
Laboratorio 7
Laboratorio 8
En un aeropuerto, el departamento de aduanas informa que en
promedio 42 personas diarias, con una desviación estándar de
11, llevan material de contrabando al ingresar al país. ¿Cuál es la
probabilidad de que en cinco días, el número de pasajeros que
llevan contrabando exceda los 50? Resp. 0.0516
Laboratorio 9
11
El gerente de ventas de una empresa productora de café, cree
que el consumo anual por casa está normalmente distribuido con
una media desconocida y una desviación estándar de 1.25 libras.
a) Si se toma una muestra de 36 casas y se registra su consumo
de café durante un año, ¿cuál es la probabilidad de que la media
de la muestra esté en el intervalo de media libra de la media de la
población. Resp. 0. 9836
b) Qué tan grande debe ser la muestra para estar 92 % seguro de
que la media de la muestra está en el intervalo de media libra de
la media de la población.
Resp. n = 19
Laboratorio 10
Un equipo de salvamento submarino se prepara para explorar
un sitio mar adentro, frente a la costa de Florida donde se
hundió una flotilla entera de 45 barcos españoles. A partir de
registros históricos, el equipo espera que estos buques
naufragados generen un promedio de $225,000 de ingresos
cada uno cuando se exploren, con una desviación estándar
de $39,000. El patrocinador del equipo ha establecido que si
no se han recuperado los gastos de exploración que suman
$2.1 millones con los primeros nueve galeones naufragados,
cancelará el resto de la exploración. A) ¿Cuál es la
probabilidad de que la exploración continúe una vez
explorados los nueve primeros barcos. Resp. 0.2393
B) Calcular el tamaño de muestra para obtener a lo más
$1,800,000. Aplique nivel de confianza de 97%. Resp.
Laboratorio 11
Para ayudar a la recuperación del lago Atitlán, una institución
pro-salvación del lago, ha solicitado ayuda económica a 1250
empresas de las cuales se espera que el 60% haga su
contribución. De experiencias anteriores, se tiene que las
empresas contribuyen con el 5% de un fondo que tienen para
donaciones que en promedio es de $12,000 con una
12
desviación estándar de $2800. a) Calcule la
probabilidad de que la contribución de las empresas esté
entre $445,000 y $456,000. b) A un nivel de confianza
de 95% calcule el tamaño de muestra para obtener a lo más
$452,000
Resp: a)
ESTIMACION
Una estimación es un valor que se obtiene con base en la
experiencia o de datos muestrales.
La Estadística inferencial se basa en la estimación para hacer
pruebas de hipótesis respecto a las características de la
población.
TIPOS DE ESTIMACIÓN
Se pueden hacer dos tipos de estimaciones con relación a la
población: una estimación puntual y una estimación por
intervalo.
14
A dos colas, IC = µ ± z𝛔𝒙̅ si el tamaño de muestra es
grande (n ≥ 30)
A dos colas, IC = µ ± t𝛔𝒙̅ si el tamaño de muestra es
pequeño (n < 30) y no se conoce la desviación estándar
de la población.
Importante:
1. Si la muestra es pequeña y se conoce la desviación
estándar de la población , se debe aplicar Z de la
Distribución Normal.
2. Si no se conoce la media y la desviación estándar
de la población se utilizan la media y la desviación
estándar muestral.
3. Cuando no se tienen los datos poblacionales
(parámetros) se usan los datos muestrales
(estadísticos).
Ejemplo
Un estudiante universitario está interesado en adquirir un
automóvil usado. Selecciona al azar 125 ofertas de
automóviles y encuentra que el precio promedio de un
auto es de $3250 con una desviación estándar de $615.
Determine un intervalo de confianza para el precio
promedio de un automóvil al 95.5% de confianza.
Resp. [3139.71 , 3360.29]
Laboratorio 12
El Departamento de Bienestar Social está interesado en
estimar un intervalo del ingreso medio anual de 700
familias de modo que pueda tener 90% de confianza de
que la media de la población se encuentra dentro de ese
intervalo. Se toma una muestra aleatoria de 50 familias y
se obtiene una media de $11,800 con una desviación de
$950. ¿Cuál es el intervalo estimado del ingreso medio
anual de las 700 familias?
15
Resp. [11586.88 , 12013.12]
La proporción estimada es p = x / n
Donde X = cantidad de elementos de la muestra que
cumplen una propiedad o una condición dada.
n = tamaño de muestra
Ejemplo
De una muestra de 70 empresarios, 64 de ellos opinaron
que la disminución de las ventas en el período anterior,
fue causada por la contracción de la economía mundial.
a) Calcule el error estándar de la proporción de
empresarios que atribuyen la disminución de las ventas a
la contracción de la economía mundial. b) Determine
un intervalo de confianza para esta proporción a un nivel
de confianza de 95%. Resp. [0.8486 , 0.9800]
Laboratorio 13
En una empresa, de un total de 3000 cuentas de crédito,
se tomó una muestra de 150 cuentas y se determinó que
60% de ellas estaban bien. a) Calcule el error estándar de
16
estimación y un intervalo de confianza para la proporción
de cuentas buenas a un nivel de confianza de 90%. b)
¿Cuántas cuentas están mal?
Resp [0.5359, 0.6641]
Laboratorio 14
En un examen de estadística se presentaron 85
estudiantes. De una muestra de 50, ganaron 38. A un
nivel de confianza de 92% haga intervalo de confianza
para la proporción de los que ganan. Históricamente, la
proporción de los que ganan esta clase es de 80%.
Resp. [0.7318 , 0.8682]
17
Para calcular el estadístico t, se necesita:
1) grados de libertad, gl, 2) Nivel de significancia α.
3) Determinar si el problema es de una o dos colas.
Ejemplo
Las calificaciones de una muestra de estudiantes de un
total de 58 se dan a continuación : 75, 64, 83, 91, 80,
77, 85, 70, 85, 70, 92, 50, 85, 70, 64, 56. Determine
intervalo de confianza para la media a un nivel de
confianza de 95%. Resp. [69.22 , 80.40], media = 74.81,
S= 12.22, t = 2.13
Laboratorio 15
Las edades de una muestra de estudiantes son 20, 20, 22,
22, 21, 19, 23, 21, 21, 19, 18. Determinar intervalo de
confianza para la media a un nivel de significancia de
0.10 Resp. [19.73 , 21.37], media = 20.55, s = 1.51, t =
1.81
Laboratorio 16
En un curso de Estadística se tienen 42 estudiantes. Las
calificaciones de una muestra son 83, 70, 91, 64, 75, 96,
84, 72, 95, 60. Determine intervalo de confianza para la
media a un nivel de confianza de 90%. Media = 79,
s = 12.75, t = 1.83 [72.48 , 85.52 ]
18
PRUEBA DE HIPÓTESIS
Etapas de una prueba de hipótesis:
1. Definir la hipótesis nula, Ho. Es el supuesto que se
hace respecto al parámetro de la población. La
hipótesis nula es generalmente una igualdad. Está
determinada por el supuesto del investigador, por
datos históricos o por un dato dado de la población.
2. Definir la hipótesis alterna, H1. La hipótesis alterna es
la negación de la hipótesis nula si el problema es de
dos colas. Si el problema es de una cola, la hipótesis
alterna es una desigualdad “mayor que” o “menor
que”. Se acepta la hipótesis alterna solamente si se
rechaza la hipótesis nula, Ho.
3. Calcular el estadístico de prueba. El estadístico de
prueba es z si la muestra es grande; es t si la muestra
es pequeña y no se conoce la desviación estándar de
la población.
4. Determinar el estadístico crítico. El estadístico crítico
está en función del nivel de confianza (o del nivel de
significancia) y es la frontera entre la región de
aceptación y la región de rechazo.
5. Aceptar o rechazar la hipótesis nula. La hipótesis nula
se acepta si el estadístico de prueba cae en región de
aceptación. Se rechaza si cae en región de rechazo.
6. Conclusión. Es la respuesta a la pregunta del
problema.
NOTA. El objetivo de una prueba de hipótesis es
determinar si la diferencia entre el estadístico de una
19
muestra y el parámetro de la población es
significativa.
Para probar la hipótesis nula, se obtiene una muestra y
la media muestral se compara con la media poblacional
de la hipótesis nula. Si la diferencia es
significativamente grande se rechazará la hipótesis
nula; si la diferencia no es significativamente grande la
hipótesis nula será aceptada.
Los datos muestrales sólo se utilizan para calcular el
estadístico de prueba y no para plantear la hipótesis
nula.
PALABRAS CLAVES PARA DETERMINAR SI UN
PROBLEMA DE HIPÓTESIS ES DE UNA O DOS
COLAS
COLA COLA DOS COLAS
IZQUIERDA DERECHA
Menor que Mayor que Igual a
Inferior a Superior a Aproximadamente
A lo más Por lo menos Diferente
Ha Ha Ha variado
disminuido aumentado
Ha cambiado
Menos que Excede a
Alrededor de
Menos Más eficiente
eficiente Más o menos
Promedio
20
PRUEBA DE HIPÒTESIS DE UNA SOLA MUESTRA
PARA MEDIAS
Ejemplo.
En una universidad, el catedrático de estadística
afirma que el promedio de las calificaciones de sus
estudiantes es de 90. Se selecciona aleatoriamente
una muestra de 12 estudiantes y se obtiene una
media de 87 con una desviación estándar de 9. Haga
prueba de hipótesis a un nivel de significancia de 5%
para determinar si la afirmación del catedrático es
verdadera.
1. Hipótesis Nula, Ho: µ = 90
2. Hipótesis Alterna, H1: µ ≠ 90 (problema de dos
colas)
3. Estadístico de prueba es “t” porque la muestra es
pequeña,
t= - 1.15
Para calcular el estadístico de prueba t, a la media
muestral se le resta la media poblacional µ y se
divide el resultado por el error estándar de
estimación.
t = (87 – 90) / (9/√12) = - 1.15
4. Estadístico crítico “t crítico” = ± 2.20
Para determinar el t crítico, se busca en tabla t los
grados de libertad gl = n – 1 = 12 – 1 = 11, α =
0.05 y dos colas.
21
5. Se acepta la hipótesis nula, Ho, porque el
estadístico de prueba t = -1.15 cae en región de
aceptación.
6. Conclusión. La afirmación del catedrático es
verdadera.
Aceptar una hipótesis nula Ho, no prueba que sea cierta;
simplemente, los datos no proporcionan evidencia
estadística para rechazarla.
Laboratorio 17
El decano de la facultad de ingeniería piensa que el
promedio de calificaciones, en una clase X, de 36
estudiantes de primer año es de 75. Se toma una
muestra aleatoria de estudiantes y se obtuvieron las
siguientes calificaciones: 84, 65, 70, 80, 68, 56,
75, 90, 45, 72, 70, 78, 80. A un nivel de
significancia de 10%, haga prueba de hipótesis para
determinar si lo que cree el decano es correcto.
Resp. Media = 71.77 S= 11.9 t = - 1.21
t crítico = 1.78 Se acepta Ho.
Laboratorio 18
El promedio de unidades defectuosas permitidas para
una máquina es a lo más 12 unidades por día. En una
muestra de 40 días se obtuvo una media de 15
unidades defectuosas con una desviación estándar de
7. Si la media no ha aumentado, sólo se hará limpieza
22
y ajustes a la máquina; si la media ha aumentado, la
máquina deberá ser desarmada y reparada. A un nivel
de confianza de 96%, determine si la máquina debe
ser limpiada o desarmada. Z = 2.71 Z crítico= 1.75
Nota:
1. Generalmente, la hipótesis nula es una igualdad.
2. La hipótesis alterna determina si el problema es
de cola derecha o es de cola izquierda.
3. En problemas de una cola, para determinar el
valor de Zcrítico, al nivel de confianza se resta
0.50 y el resultado se busca en tabla de
probabilidades normales.
Laboratorio 19
El precio promedio en el mercado de un televisor LCD
de 40 pulg. es de Q3500. Se desea comprar uno de
estos TV y se obtiene una muestra de precios en 35
centros distribuidores de estos productos y la media es
de Q 3800 con una desviación estándar de Q650.
Haga prueba de hipótesis a un nivel de confianza de
92% para determinar si el precio promedio ha
aumentado.
Recordar que cuando el problema es de muestra
grande y una cola, al nivel de confianza se resta 0.5 y
el resultado se busca en tabla de probabilidades
normales para obtener Z crítico.
Laboratorio. 20
23
Una empresa tiene 48 empleados y el salario promedio
semanal que se ha estado pagando es de Q950. De
una muestra del salario de los trabajadores se
obtienen los siguientes datos: 900, 850, 1000, 770,
1200, 800, 950, 920, 850, 975. Haga prueba de
hipótesis a un nivel de confianza de 90% para
determinar si el salario semanal promedio ha
disminuido. Media = 921.5 S= 122.84
t = - 0.82 t crítico = - 1.38
Laboratorio 21
Un estudiante universitario dispone de Q45,000
para comprar un automóvil. De información
obtenida en 35 predios calculó una media de
Q49,000 con una desviación estándar de Q4,800.
Comprará el auto si la diferencia no es
significativa. Haga prueba de hipótesis a un nivel
de confianza de 96%. ¿ Cuál es su conclusión?
24
becados. A un nivel de confianza de 94%, haga prueba
de hipótesis para determinar si la proporción de
alumnos becados en la universidad ha aumentado.
1) Ho: p = 0.25
2) H1: p > 0.25
3) Estadístico de prueba Z = 0.85
4) Estadístico crítico Zcrítico = 1.555
5) Se acepta Ho porque el estadístico de prueba Z =
0.85 cae en región de aceptación.
6) Conclusión: La proporción de alumnos becados
en la universidad no ha aumentado.
Laboratorio 22
La política de un banco ha sido dar el 45% de
crédito a microempresarios. Este año, de un total
de 1500 créditos se tomó una muestra de 80
créditos y 30 eran para microempresarios. A un
nivel de confianza de 95%, se puede concluir que
la proporción de créditos a microempresarios ha
disminuido? B) ¿Si se pregunta si la
proporción ha variado, la conclusión sería la
misma?
Recuerde comprobar si se debe usar factor de
corrección finito.
Laboratorio 23
25
Una empresa planea comercializar un nuevo
producto si al menos al 40% del público le gusta.
El departamento de mercadeo selecciona 500
personas y encuentra que 225 lo prefieren. Haga
prueba de hipótesis para determinar si se debe
comercializar el producto. Asuma 95% de nivel de
confianza.
Laboratorio 24
En un curso de estadística la media de
calificaciones ha sido de 80. En una muestra se
han obtenido las siguientes calificaciones: 75, 90,
82, 78, 96, 100. Haga prueba de hipótesis a un nivel
de significancia de 10% para determinar si esa
media ha cambiado.
Laboratorio 25
El gerente de una empresa supone que al menos el
60% de los empleados son graduados
universitarios. Una muestra de 80 empleados
revela que 49 tienen grado universitario. Se desea
implementar una política de incremento salarial si
lo que el gerente supone es verdadero. A un nivel
de significancia de 8% haga prueba de hipótesis
para determinar si se debe aplicar la política de
incremento salarial. B) Determine un intervalo de
26
confianza para la proporción a un nivel de
confianza de 90%.
Laboratorio 26
6. En un almacén, el porcentaje de pagos en
efectivo ha sido de 30%. De 150 ventas de un día,
se tomó una muestra de 60 y 21 fueron pagadas en
efectivo. Para estimular estos pagos, la empresa
implementará un plan de descuentos por pagos en
efectivo si la proporción de este tipo de pagos ha
aumentado. A un nivel de confianza de 92%
determine si se debe implementar el plan de
descuentos.
Laboratorio 27
La proporción de unidades defectuosas por día,
producidas por una máquina ha sido a lo más de
0.15. En una muestra de 30 días se obtuvo una
proporción de unidades defectuosas de 0.18. El
costo por máquina parada es significativo. Haga
prueba de hipótesis a un nivel de significancia de
0.10 para determinar si la máquina debe ser
reparada por exceso de unidades defectuosas.
PRUEBA DE HIPÓTESIS
PARA DIFERENCIA DE MEDIAS
27
Esta prueba de hipótesis se aplica cuando se
quieren comparar las medias muestrales de dos
poblaciones distintas.
En estas pruebas, la hipótesis nula Ho, es
generalmente, que las medias poblacionales son
iguales.
Ejemplo
En un curso de Estadística, de una muestra de 30
estudiantes de la sección A, se obtuvo una media
de 70 con una desviación estándar de 15; de una
muestra de 35 estudiantes de la sección B, se
obtuvo una media de 75 con una desviación
estándar de 12. Haga prueba de hipótesis a un
nivel de confianza de 94% para determinar si el
rendimiento de las secciones A y B son iguales.
µ1 = Media de calificaciones de la sección A
µ2 = Media de calificaciones de la sección B
1) Ho: µ1 = µ2 Las medias de las calificaciones
de las secciones A y B son iguales.
2) H1: µ1 ≠ µ2 Las medias de las calificaciones de
las secciones A y B no son iguales ( dos colas)
̅ 𝟏 −𝑿
𝑿 ̅𝟐
3) Estadístico de prueba es Z =
√𝝈𝟐𝟏 /𝒏𝟏+𝝈𝟐𝟐 /𝒏𝟐
28
Z = (70 – 75) / 3.41 = - 1.47
Laboratorio 28
Dos laboratorios de investigación han producido
independientemente los medicamentos A y B. El
medicamento A fue probado en 90 personas con
problema de artritis y produjo un promedio de 8.5
horas de alivio con una desviación estándar de 1.8
horas. El medicamento B, fue probado en 80
enfermos con artritis y produjo una media de 7.6
horas de alivio con una desviación estándar de 2.1
horas. A un nivel de significancia de 5%, se puede
afirmar que el medicamento B proporciona un
período de alivio significativamente más corto?
29
µ1 = Media de horas de alivio del medicamento A
µ2 = Media de horas de alivio del medicamento B
1) Ho: µ1 = µ2 El promedio de horas de alivio de
los medicamentos A y B son iguales.
2) H1: µ2 < µ1 El promedio de horas de alivio del
medicamento B es menor que el promedio de
horas de alivio del medicamento A. (Cola
izquierda)
3) Estadistico de prueba Z = - 2.98
4) Estadístico crítico = - 1.645
5) Se rechaza Ho y se acepta H1.
6) Conclusion. La media de las horas de alivio del
medicamento B es menor que la media de horas de
alivio del medicamento A.
Observación:
Cuando H1 es una desigualdad, en un problema de
diferencia de medias, se puede plantear como de
cola derecha o de cola izquierda. Si se plantea de
cola derecha el estadístico de prueba debe ser
positivo. Si se plantea de cola izquierda, el
estadístico de prueba debe ser negativo.
Laboratorio 29
30
En una empresa, las empleadas mujeres han hecho
un reclamo ante la gerencia porque consideran que
se les paga menos que a los hombres efectuando
trabajos similares. En una muestra aleatoria de 38
operarios varones se encontró que el salario medio
por hora es de $11.38 con una desviación estándar
de $1.84. En una muestra de 45 mujeres, se obtuvo
un salario medio por hora de $9.64 con una
desviación estándar de $1.31. Haga prueba de
hipótesis a un nivel de confianza de 97% para
determinar si el reclamo de las mujeres
trabajadoras es justificado.
µ1 = Media de salario por hora de hombres.
µ2 = Media de salario por hora de mujeres.
1) Ho: µ1 = µ2 La media de salarios por hora de
hombres es igual a la media de salarios por
hora de mujeres.
2) H1: µ1 > µ2 La media de salario por hora de
hombres es mayor que el salario medio por
hora de mujeres.
31
3) Estadístico crítico. El problema es de una cola
por lo que al NC se le resta 0.5. El resultado se
busca en tabla Z.
Z crítico = 1.88
Laboratorio 30
Una empresa debe decidir si sustituye su línea de
ensamblaje semiautomática que tiene actualmente,
por otra totalmente automatizada. Se ha reunido
información acerca de la producción por hora con
los dos tipos de líneas de ensamble y se obtienen
los siguientes datos. En la línea semiautomática,
de una muestra de 150 horas se obtuvo una media
de producción de 198 unidades con una desviación
estándar de 32. En la línea automatizada, de una
muestra de 200 horas se obtuvo una media de 206
unidades con una desviación estándar de 28. Haga
prueba de hipótesis a un nivel de confianza de 92%
para determinar si se debe cambiar el sistema
semiautomático.
32
µ1 = Media de producción por hora con línea
semi-automática.
µ2 = Media de producción por hora con línea
automatizada.
1) Ho: µ1 = µ2 La media de producción con las
dos líneas son iguales.
2) H1: µ2 > µ1 La media de producción con línea
automatizada es mayor que la media de
producción con línea semiautomática.
Sp = 471.92
34
5) Se rechaza Ho y se acepta H1 porque el
estadístico de prueba t = 1.41, cae en región de
rechazo.
Laboratorio 31
En un banco se quiere determinar si las mujeres
son más eficientes que los hombres para captar
cuentas nuevas. Los datos siguientes son el
número de cuentas nuevas, que fueron abiertas
durante el mes anterior, por diez ejecutivas de
ventas y ocho ejecutivos de ventas escogidos
aleatoriamente. A un nivel de confianza de 95%,
¿se puede afirmar que las mujeres son más
efectivas que los hombres para conseguir cuentas
nuevas?
Ejecutivas 12 11 14 15 13 14 13 12 14 15
Ejecutivos 13 14 13 12 13 12 10 14
Laboratorio 32
El decano de la facultad de ingeniería cree que las
calificaciones de Estadística de los estudiantes de
Ing. Administrativa son mayores que las
calificaciones de Ing. Industrial. Las calificaciones
de una muestra aleatoria de estudiantes de las dos
carreras se dan a continuación. Haga prueba de
hipótesis a un nivel de confianza de 99% para
determinar si el decano tiene razón.
Administ. 86 77 80 64 91 50 83 75 90
36
Industrial 85 80 76 63 85 95 53 80 72 45 80 95
Media de Administrac=77.33, Media de Indust=75.75
Sp = 14.5
Laboratorio 33
Una máquina A produce en promedio 15 unidades
defectuosas en un día, con una desviación
estándar de 2.5. La muestra fue de 35 días para A.
En una muestra de 40 días, la máquina B dio un
37
promedio de 18 unidades defectuosas por día, con
una desviación estándar de 3. Haga prueba de
hipótesis al 92% de nivel de confianza para
determinar si las máquinas producen en promedio
igual número de unidades defectuosas. Haga
gráfica.
µ1 = Promedio de unidades defectuosas de
máquina A
µ2 = Promedio de unidades defectuosas de
máquina B
1) Ho: µ1 = µ2 . El promedio de unidades
defectuosas de las máquinas A y B son iguales.
2) H1: µ1 ≠ µ2 El promedio de unidades
defectuosas de las máquinas A y B no son iguales.
Laboratorio 34
Se quiere determinar si el promedio de unidades
defectuosas de las máquinas A y B son iguales.
Las unidades defectuosas obtenidas durante siete
días se dan a continuación. Haga prueba de
hipótesis a un nivel de confianza de 95%.
38
Máq. A 15 12 9 16 6 5 16
Máq. B 12 10 5 12 7 9 10
Laboratorio 35
Hacer prueba de hipótesis a un nivel de confianza
de 95% para determinar si la media salarial de A es
mayor que la de B . Los datos muestrales se dan a
continuación.
39
Emp B 1265 1690 1250 1200 1700 1230 1100
Ejemplo.
Un gimnasio ha anunciado un programa de
reducción de peso. Asegura que después de un
mes, los participantes habrán bajado al menos 12
libras de peso. ¿La muestra aleatoria de diez
participantes en el programa, cuyos datos de peso
en libras se dan en la siguiente tabla, apoyan la
afirmación del gimnasio? Use 5% de nivel de
significancia.
Al inicio 145 224 140 180 160 120 170 200 175 210
Después 138 210 136 165 148 110 165 190 170 200
Diferencia, 7 14 4 15 12 10 5 10 5 10
d
Prueba de hipótesis
1) Ho: D ≥ 12
2) H1: D < 12
3) Estadístico de prueba, t = - 2.3
4) t crítico = - 1.83
5) Se rechaza Ho y se acepta H1 porque el
estadístico de prueba t = - 2.3 cae en región de
rechazo.
6) Conclusión. Lo que el gimnasio afirma es
falso.
Laboratorio 36
El gerente de una empresa está considerando
poner un sistema de música ambiental en todos
los departamentos, porque cree que la música
puede contribuir a una mayor productividad de los
trabajadores. Se muestreó la producción semanal
de seis trabajadores antes y después de tener
música ambiental obteniéndose los siguientes
resultados. Haga prueba de hipótesis a un nivel de
significancia de 2.5% para determinar si se debe
instalar el sistema de música ambiental en la
empresa.
Trabajador 1 2 3 4 5 6
41
Sin 219 205 226 198 209 206
música
Con 235 186 240 203 221 205
música
Diferencia, 16 - 19 14 5 12 -1
d
Laboratorio 37
42
Para determinar si la contracción de la economía
mundial ha tenido efecto en las utilidades de las
empresas, se tomó una muestra aleatoria mensual
en una de las empresas, obteniéndose los
siguientes resultados. Haga prueba de hipótesis a
un nivel de confianza de 95% para determinar si el
problema de la economía mundial produce un
cambio significativo en las utilidades, (en millones
de quetzales).
Empres 1 2 3 4 5 6 7 8 9
a
Utilidad 1.3 1.2 3.2 3.5 2.4 3.2 1.0 1.9 2.7
es en 8 6 4 0 7 1 5 8 2
2015
Utilidad 2.4 1.5 4.5 3.0 2.1 2.8 1.5 0.9 0.5
es en 8 0 9 6 1 0 9 2 0
2016
Diferenc 1.1 - - - - -
ia 0.2 1.3 0.4 0.3 0.4 0.5 1.0 2.2
4 5 4 6 1 4 6 2
43
2) H1: D ≠ 0 La media de las utilidades de las
empresas en los dos años No son iguales (dos
colas)
3) Estadístico de prueba t = 0.38 o t = -0.38
4) t crítico = ± 2.31
5) Se acepta Ho porque el estadístico de prueba
t = 0.38 cae en región de aceptación.
6) No existe diferencia significativa en las
utilidades de las empresas por la contracción
de la economía mundial.
Ejemplo
Una compañía que fabrica productos medicinales,
está probando dos nuevos compuestos para
disminuir la presión arterial. En un grupo de 110
personas, 75 respondieron al medicamento 1 con
reducción de la presión arterial. En un grupo de 90
personas, 58 respondieron al medicamento 2 con
menores niveles de presión sanguínea. La
compañía desea probar a un nivel de significancia
de 5% si existe diferencia entre la eficiencia de las
dos medicinas.
44
p2 = Proporción de personas que respondieron al
medicamento 2 con reducción de la presión
sanguínea.
Laboratorio 38
En la Superintendencia de Administración
Tributaria (SAT) se cree que las declaraciones del
impuesto sobre la renta (ISR) hechas por correo
electrónico tienen menos errores que las que son
hechas personalmente a mano. Se toma una
muestra de 50 declaraciones hechas por correo
electrónico y 7 de ellas tienen errores. En una
muestra de 75 declaraciones personales hechas a
mano, 13 tenían errores. Haga prueba de hipótesis
a un nivel de confianza de 90% para determinar si
lo que se cree en la SAT es verdadero.
45
p1 = Proporción de declaraciones con errores del
ISR hechas por correo electrónico.
p2 = Proporción de declaraciones con errores del
ISR hechas a mano.
Laboratorio 39
Una planta de energía eléctrica operada con
carbón está considerando dos sistemas diferentes
para reducir la contaminación del aire. El primer
sistema ha reducido la emisión de contaminantes
en 136 veces de una muestra de 200 mediciones. El
segundo sistema, que es más caro, ha reducido la
emisión de contaminantes en 190 mediciones de
una muestra de 250 mediciones de aire. Si el
sistema caro es significativamente más eficiente,
46
se instalará el sistema caro. ¿Cuál sistema será
instalado? Haga prueba de hipótesis a un nivel de
significancia de 6%
Laboratorio 40
En una empresa A, de 50 trabajadores 35
participan de un seguro colectivo; en otra
empresa B, de 80 trabajadores 65 participan de un
seguro colectivo. Haga prueba de hipótesis a un
92% de nivel de confianza para determinar si la
47
proporción de trabajadores que participan del
seguro colectivo es mayor en la empresa B.
P1 = Proporción de trabajadores de la empresa A
que participan en el seguro colectivo.
P2 = Proporción de trabajadores de la empresa B
que participan en el seguro colectivo.
1) Ho: p1 = p2 La proporción de trabajadores de
las empresas A y B que participan del seguro
colectivo, son iguales.
2) H1: p2 > p1 La proporción de trabajadores que
participan en el seguro colectivo es mayor en
la empresa B.
3) Estadístico de prueba Z = 1.41
4) Estadístico crítico, Zcrítico = 1.41
5) No se tiene criterio suficiente para rechazar o
aceptar la hipótesis nula.
Laboratorio 41
En una muestra de 50 estudiantes de ing. Industrial
26 estaban becados por la universidad. De 38
estudiantes de ing. Administrativa 20 tenían beca.
Haga prueba de hipótesis a un nivel de confianza
de 92% para determinar si la proporción de
estudiantes becados es mayor en ing. Industrial.
48
La prueba Chi Cuadrado se aplica cuando se
quiere probar si las proporciones de tres o más
poblaciones son iguales. También se aplica en
pruebas de independencia y en pruebas de bondad
de ajuste.
Ejemplo
Probar a un nivel de confianza de 99% si existe
dependencia entre las calificaciones y el número
de horas de estudio por semana. Los datos de
una encuesta se dan a continuación
Estadístico de prueba,
X2 = (3 – 3.88)2 /3.88 + (10 – 9.89)2 /9.89 + … + (8 –
4.96)2 /4.96 = 5.15
X2 = 5.15
Prueba de hipòtesis
1) Ho: Las calificaciones y el número de horas de
estudio son independientes.
O
Ho: No existe relación entre las calificaciones
y las horas de estudio.
51
6) Conclusión: Las calificaciones y las horas de
estudio son independientes.
Laboratorio 42
Un editor de periódicos quiere determinar si la
costumbre de las personas de leer diarios está
relacionada con su nivel educativo. A
continuación, se presentan los resultados de una
muestra de lectores de diferentes periódicos. Se
desea probar a un nivel de significancia de 10% si
la frecuencia con que se lee el periódico está
relacionada con el nivel de educación de los
lectores.
Prueba de hipótesis
1) Ho: La costumbre de leer periódicos es
independiente del nivel de educación de las
personas.
2) H1: La costumbre de leer periódicos depende
del nivel de educación de las personas.
3) Estadístico de prueba X2 = 11.99 con
programa de Geogebra
4) Estadístico crítico, X2 crítico = 10.64
Grados de libertad, gl = (Número de filas –
1)(Número de columnas – 1)
gl = (4 – 1)(3 – 1) = 6
α = 0.10
5) Se rechaza Ho y se acepta H1 porque el
estadìstico de prueba X2 = 11.99 cae en región
de rechazo.
6) Conclusión. El hábito de leer periódicos
depende del nivel de educación de las
personas.
53
Laboratorio 43
Un educador opina que las calificaciones de los
estudiantes dependen del número de horas
semanales que pasan escuchando música. Se
hace un muestreo aleatorio y se obtienen los
siguientes resultados. Haga prueba de hipótesis a
un nivel de significancia de 5% para determinar si
las calificaciones dependen del número de horas
que pasan escuchando música.
Prueba de hipótesis
1) Ho: Las calificaciones son independientes de la
cantidad de horas que los estudiantes pasan
escuchando música.
4) X2 crítico = 21.03
gl = (No. De filas - 1)(No. De columnas – 1) = 12
gl = 3 x 4 = 12 y alfa = 0.05
55
5) Se rechaza Ho y se acepta H1 porque el
estadìstico de prueba X2 = 62.17 cae en región de
rechazo.
Laboratorio 44
Para determinar si las ventas de microchips están
relacionadas con las etapas del ciclo económico,
se han tomado datos correspondientes a las
ventas semanales en las diferentes etapas,
obteniéndose los resultados siguientes. Haga
prueba de hipótesis a un nivel de confianza de 95%
.
56
1) Ho: Las ventas de microchips son
independientes de las etapas del ciclo
económico.
2) H1: Las ventas de microchips dependen de
las etapas del ciclo económico.
3) Estadístico de prueba X2 = 30.63
4) X2 crítico = 12.60
5) Se rechaza Ho y se acepta H1.
6) Conclusión. Las ventas de microchips
dependen de las etapas del ciclo económico.
PRUEBA X2 EN PROBLEMAS DE
BONDAD DE AJUSTE
Esta prueba se aplica cuando se quiere saber si
una serie de datos muestrales corresponden a un
tipo de distribución específica, es decir, cuando se
quiere probar si existe diferencia significativa entre
una distribución de frecuencias observadas y una
distribución de frecuencias teórica.
Ejemplo
El gerente de personal de una empresa piensa que
el proceso de entrevistas puede ser aproximado
por una distribución binomial con una probabilidad
de éxito de 0.40 de obtener una calificación
positiva en cualquiera de tres entrevistas que se
hacen con tres ejecutivos diferentes. El gerente de
personal quiere comprobar su hipótesis a un nivel
57
de significancia de 10%. Los datos de las
calificaciones positivas obtenidas en las
entrevistas se dan a continuación
Solución
Posibles Número de Probabilidades
calificaciones solicitantes con binomiales Frecuencia
positivas en tres cada una de con n=3 y esperada,
entrevistas las p = 0.40 fe
calificaciones,
fo
0 20 0.216 115 (0.216)
58
=24.84
1 52 0.432 115(0.432)
= 49.68
2 28 0.288 115(0.288)
=33.12
3 15 0.064 115(0.064)
= 7.36
Total 115 1.00
115
Prueba de Hipótesis
1. Ho: Una distribución binomial con p = 0.40 y
n = 3 es una buena descripción del proceso de
entrevistas (o se ajusta al proceso de
entrevistas).
2. H1: Una distribución binomial con p=0.40 y n=3
no es una buena descripción del proceso de
entrevistas (o no se ajusta al proceso de
entrevistas).
3. Estadístico de prueba X2 = 9.77
4. X2 crítico = 6.25
Con gl = K – 1 = 4 – 1 = 3 y nivel de
significancia = 0.10
5. Se rechaza Ho y se acepta H1 porque el
estadístico de prueba X2 = 9.77 cae en región
de rechazo.
6. Conclusión. Una distribución binomial con
p= 0.40 y n=3 no es una buena descripción del
proceso de entrevistas o no se ajusta a la
descripción del proceso de entrevistas.
59
Laboratoio 45
En una empresa de correos se han recibido quejas
porque se ha estado extraviando alguna
correspondencia. Se seleccionó una muestra de
310 personas y les fueron enviadas dos cartas de
prueba a cada una. El número de personas que
reportaron cero, una o dos cartas extraviadas fue
de 260, 40 y 10 respectivamente. El gerente de la
empresa ha admitido que la probabilidad de que la
correspondencia sea extraviada es de 0.15. Haga
prueba de hipótesis a un nivel de significancia de
5% para determinar si el número de cartas
extraviadas se ajusta a una distribución binomial
con p = 0.15
60
Solución
Número Número de Probabilidades Frecuencia
posible de Cartas binomiales esperada, fe
Cartas extraviadas con n=2 y p =
extraviadas reportadas, 0.15
fo
0 260 0.7225 310(0.7225)=
223.97
1 40 0. 2550 310(0.2550)
=
79.05
2 10 0.0225 6.98
310 1 310
Prueba de hipótesis
1. Ho: La distribución binomial con p= 0.15 y
n = 2 es una buena descripción del número de
cartas extraviadas (o se ajusta al número de
cartas extraviadas).
2. H1: La distribución binomial con p= 0.15 y n=2
no es una buena descripción del número de
cartas extraviadas o no se ajusta al número de
cartas extraviadas.
3. Estadístico de prueba X2 = 26.40
4. X2 crítico = 5.99
gl = K – 1 = 3 – 1 = 2 y α = 0.05
61
5. Se rechaza Ho y se acepta H1 porque el
estadístico de prueba cae en región de
rechazo.
6. Conclusión. La distribución binomial con
p=0.15 y n=2 no es una buena descripción del
número de cartas extraviadas o no se ajusta al
número de cartas extraviadas.
Laboratorio 46
El número de faltas de asistencia durante una
semana ha sido de 0, 1, 2, 3, 4, y 5. Determine si el
número de faltas se ajusta a una distribución
binomial con p = 0.40. Los datos se dan a
continuación:
Faltas 0 1 2 3 4 5
fo 10 8 5 12 7 4
Laboratorio 47
El gerente de un banco supone que los depósitos
monetarios de sus clientes tienen distribución
normal con media de $1500 y desviación estándar
de $600. Haga prueba de hipótesis a un nivel de
significancia de 10% para comprobar si lo que el
gerente supone es verdadero. Los datos se dan a
continuación.
62
Solución
Primero se debe hacer corrección de continuidad
en los extremos de cada intervalo dado de
depósitos.
Después se deben estandarizar los extremos de
cada intervalo corregido para calcular las
probabilidades en estos intervalos y poder obtener
la frecuencia esperada.
X2 = 1.96
Prueba de hipótesis
1) Ho: La distribución normal con media de $1500
y desviación estándar de $600 es una buena
descripción de los depósitos monetarios.
2) H1: La distribución normal con media de $1500
y desviación estándar de $600 no es una buena
descripción de los depósitos monetarios.
3) Estadístico de prueba, X2 = 1.96
4) X2 crítico = 4.61
K = 3 (Los tres intervalos de depósitos.)
63
Con gl = K – 1 = 3 – 1 = 2 y nivel de
significancia = 0.10
5) Se acepta Ho porque el estadístico de prueba
X2 = 1.96 cae en región de aceptación.
6) Conclusión. Lo que supone el gerente es
verdadero. La distribución normal con media de
$1500 y desviación estándar de $600 es una buena
descripción (o se ajusta) a los depósitos
monetarios.
Laboratorio 48
El director de un hospital quiere comprobar si la
edad (en años) de los pacientes atendidos en una
semana, se ajusta a una distribución normal con
media de 30 años y desviación estándar de 12.
Haga prueba de hipótesis a un nivel de confianza
de 95%. Los datos se dan a continuación.
Edad De 0 a 20 De 21 a 45 De 45 a De 61 y
años años 60 más
Fo 10 25 36 15
Solución
Edad 0 a 20.5 20.5 a 45 45 a 60.5 De
60.5 y
más
fo 10 25 36 15 86
Prob 0.2143 0.8944 – 0.9945 – 0.0055
ab 0.2143= 0.8944 =
0.6801 0.1001
fe 86(0.2143) 86 X 0.6801 = 86 X 0.1001 0.47
64
= 18.43 58.49 8.61
X2 = 559.35
Prueba de hipótesis
1. Ho: Una distribución normal con media de 30
años y desviación estándar de 12, se ajusta a
la edad de los pacientes atendidos en una
semana.
2. H1: Una distribución normal con media de 30 y
desviación estándar de 12 años no se ajusta a
la edad de los pacientes atendidos en una
semana.
3. Estadístico de prueba X2 = 559.35
4) X2 crítico = 7.815
Con gl = K – 1 = 4 – 1 = 3 y nivel de
significancia = 0.05
K = 4 (Los cuatro intervalos de las edades.)
5. Se rechaza Ho y se acepta H1 porque el
estadístico de prueba X2 = 559.35 cae en región
de rechazo.
6. Conclusión. La edad de los pacientes no se
ajusta a una distribución normal con media de 30
años y desviación estándar de 12.
Laboratorio 49
Las calificaciones de un curso de Estadística se
indican a continuación. Hacer prueba de hipótesis
para determinar si los datos se ajustan a una
distribución normal con media de 70 y desviación
estándar de 12. Use nivel de confianza de 90%.
65
Intervalo 0 - 40 40 - 60 61 - 85 85 - 95 96 y
más
fo 20 30 40 25 15
Solución
Interval 0 - 40 – 60.5 – 85 - 95.5 y
o 40 60.5 85 95.5 más
fo 20 30 40 25 15
Probab. 0.006 0.2081 0.0888 0.0168
2 0.6801
fe 0.806 27.053 88.413 11.544 2.184
Prueba de hipótesis
1. Ho: La distribución normal con media de 70 y
desviación estándar de 12, se ajusta a las
calificaciones obtenidas en el curso de
estadística.
2. H1 : La distribución normal con media de 70 y
desviación estándar de 12, no se ajusta a las
calificaciones obtenidas en el curso de
estadística.
3. Estadístico de prueba X2 = 574.81
4. X2 crítico = 7.78 gl= K- 1 = 5 – 1 = 4 y α
= 0.10
5. Se rechaza Ho y se acepta H1
6. Conclusión. La distribución normal con media
de 70 y desviación estándar de 12, no se ajusta
a las calificaciones obtenidas en el curso de
estadística.
66
Laboratorio 50
En un hospital se han examinado los registros de
210 turnos nocturnos escogidos al azar para
determinar la frecuencia de casos de heridos por
accidente. El número de días que se trataron 0, 1,
2, 3, 4 , 5 o más pacientes con heridas por
accidente fueron 25, 55, 65, 35, 20 y 10
respectivamente. A un nivel de significancia de 5%
¿se puede concluir que la incidencia de heridos
por accidente sigue una distribución de Poisson
con lambda λ= 2 ? Resp. X2 = 2.02,
X2 crítico = 11.07.
Prueba de Hipótesis
1) Ho: Una distribución de Poisson con λ=2 se
ajusta al número de heridos por accidente.
2) H1: Una distribución de Poisson con λ =2 no
se ajusta al número de heridos por accidente.
3) Estadístico de prueba X2 = 2.02
67
4) Estadístico crítico, X2crítico = 11.07 con
gl = K – 1 = 6 – 1 = 5 y nivel de significancia de
0.05.
K = Nùmero posible de heridas.
5) Se acepta Ho porque el estadístico de prueba
X2 = 2.02 cae en región de aceptación.
6) Conclusión: Una distribución de Poisson con
λ=2 se ajusta al número de heridos por
accidente.
Laboratorio 51
En una universidad el número de estudiantes que
ha repetido 0, 1 , 2 ,3 ,4, o màs semestres se da a
continuación. A un nivel de confianza de 90%,
determinar si los datos observados, fo, se ajusta a
una distribución de Poisson con lambda = 3
Semestres fo Probabilidad fe
repetidos
0 10 0.0498 3.09
1 15 0.1494 9.26
2 20 0.2240 13.89
3 12 0.2240 13.89
≥4 5 0.3528 21.87
62 62
PRUEBA DE HIPÓTESIS
68
1) Ho : La distribución de Poisson con lambda
λ = 3 se ajusta al número de estudiantes que
ha repetido semestres.
2) H1: La distribución de Poisson con lambda
λ = 3 No se ajusta al número de estudiantes
que ha repetido semestres.
3) Estadìstico de prueba X2 = 34.97
4) X2 crítico = 7.78
5) Se rechaza Ho y se acepta H1 porque el
estadístico de prueba X2 = 34.97 cae en región
de rechazo.
6) Conclusión. La distribución de Poisson con
lambda λ = 3 No se ajusta al número de
estudiantes que ha repetido semestres.
Ejemplo
Se quieren evaluar tres métodos de instrucción
para determinar si existe alguna diferencia en su
69
efectividad. Después de un período de
preparación, se tomaron 16 nuevos empleados que
se habían preparado con los tres métodos y se
midió la producción de cada uno de ellos. A un
nivel de confianza de 95% ¿se puede afirmar que
los tres métodos son igual de eficientes? A
continuación se da la producción diaria (en
unidades) de los 16 empleados con los tres
métodos.
K = 3 (Número de métodos)
Media de medias = (17 + 21 + 19 ) / 3 = 19
70
Segunda estimación de la varianza de la población,
F es la distribución de Fisher
F = 20 / 14.76 = 1.36
Prueba de hipótesis
1. Ho: Las medias de producción de los
empleados con los tres métodos son iguales.
2. H1: Las medias de producción de los
empleados con los tres métodos no son
iguales.
3. Estadístico de prueba, F = 1.36
4. Estadístico crítico, F crítico = 3.81
Con gl del numerador = K – 1 = 3 – 1 = 2
gl del denominador = nt – K = 16 – 3 = 13
Alfa = 0.05
Buscar en Google, tabla de distribución F de Fisher
con alfa = 0.05. Nota: Para cada alfa se
tiene una tabla F
71
6. Conclusión. Las medias de producción de
los empleados con los tres métodos son
iguales, por lo que los tres métodos son
igual de eficientes.
Laboratorio 52
Se quiere evaluar el efecto sobre las ventas de
cuatro tipos de promociones durante una semana.
A continuación se presentan las ventas (en miles
de quetzales) de cinco tiendas que utilizaron los
cuatro tipos de promociones. Haga prueba de
hipótesis a un nivel de confianza de 99% para
determinar si las promociones producen diferentes
efectos sobre las ventas.
Promoción Tiendas
1 2 3 4 5
Muestra gratis 78 87 81 89 85
Regalo 94 91 87 90
Descuentos 80 86 75 82 90
Reembolsos 78 95 92 84
SOLUCIÓN
Media S
Muestra 78 87 81 89 85 84. 00 4.47
gratis
Regalo 94 91 87 90 90. 50 2.89
Descuentos 80 86 75 82 90 82. 60 5.73
Reembolsos 78 95 92 84 87. 25 7.72
72
K=4 (Los 4 tipos de promociones)
Media de medias = 86.09
Primera estimación de la varianza de la población =
55.31
Segunda estimación de la varianza de la población
= 29.64
Estadístico de prueba, F = 55.31 / 29.64 = 1.85
Prueba de hipótesis
1. Ho: Las medias de ventas con los diferentes
tipos de promoción son iguales.
2. H1: Las medias de ventas con los diferentes
tipos de promoción no son iguales.
3. Estadístico de prueba F = 1.85
4. Estadístico crítico, Fcrítico = 5.56
Nivel de significancia, alfa = 0.01
Con gl del numerador = k – 1 = 4 – 1 = 3
K = Número de promociones.
Con gl del denominador = nT – k = 18 – 4 = 14
5. Se acepta Ho porque el estadístico de prueba F
= 1.87 cae en región de aceptación.
6. Conclusión. Las medias de las ventas son
iguales, por lo que, los tipos de promoción no
tienen efecto sobre las ventas.
Laboratorio 53
El sector de la construcción está preocupado por
el efecto que ha tenido el alza de las tasas de
interés en la construcción de casas. A
continuación se dan los datos de nuevas
73
construcciones en los últimos tres trimestres. A un
nivel de significancia de 0.10, ¿existe diferencia
significativa en el número de construcciones
nuevas en los últimos tres trimestres?
Trimestre 1 41 53 54 55 43
Trimestre 2 45 51 48 43
Trimestre 3 34 44 46
Solución
Media s
Trimestre 41 53 54 55 43 49.2 6.65
1
Trimestre 45 51 48 43 46.75 3.5
2
Trimestre 34 44 46 41.33 6.43
3
Prueba de hipótesis
74
1. Ho: Las medias de construcciones nuevas en
los tres trimestres son iguales.
2. H1: Las medias de construcciones nuevas en
los tres trimestres no son iguales.
3. Estadístico de prueba, F = 1. 85
4. Estadístico crítico, Fcrítico = 3.01
gl del numerador = k – 1 = 3 – 1= 2
gl del denominador = nt – K = 12 – 3 = 9
5. Se acepta Ho porque el estadístico de prueba F
= 1.85 cae en región de aceptación.
Ejemplo.
Una empresa trata de seleccionar un sistema de
computación integrado y debe decidir entre tres
modelos que están a prueba. La selección final
dependerá de la productividad de los sistemas. Se
seleccionan aleatoriamente cinco operadores para
manejar cada sistema. El nivel de experiencia que
tienen los operadores en el manejo de
computadoras puede afectar el resultado de la
prueba. A continuación se da la producción en
unidades por hora para los tres sistemas. Haga
prueba de hipótesis a un nivel de significancia de
76
5% para determinar si existe alguna diferencia en
la producción promedio de los tres sistemas.
TRATAMIENTOS
Operario Sistema Sistema Sistema Media
1 2 3
1 27 21 25 24.33
2 31 33 35 33.00
3 42 39 39 40.00
4 38 41 37 38.67
5 45 46 45 45.33
Media 36.6 36 36.20
77
36.27)2 + (45 – 36.27)2 + (46 – 36.27)2 + (45 –
36.27)2 = 806.93
SCT = 806. 93
Número de bloques = b = 5
Número de tratamientos = c = 3
Grados de libertad para tratamientos, gl = c – 1
Grados de libertad para bloques, gl = b -1
Grados de libertad para suma de cuadrados
totales, gl = nt – 1
Donde nt es el total de datos muestrales
Grados de libertad para suma de cuadrados de
error SCE,
gl = (b – 1)(c – 1)
Cuadrados Medios
Cuadrado Medio Total, CMT = SCT / (nt – 1 )
CMT = 806.93 / 14 = 57.64
Estadístico de prueba
F para bloques = CMBL / CME
F de bloques = 191.23 / 5.12 = 37.36------------
79
6. Conclusión. Las medias de producción de
los tres sistemas son iguales, por lo que se
puede seleccionar cualquiera de los sistemas.
Laboratorio 54
En una empresa, los empleados pueden evaluar el
desempeño del personal administrativo. Se
selecciona aleatoriamente a cinco empleados y se
les pide evaluar a cuatro de sus gerentes en una
escala de 10 a 50. Haga prueba de hipótesis a un
nivel de significancia de 1% para determinar si
80
existe diferencia significativa en el promedio de
calificaciones asignadas por los empleados.
Cuadrados medios
Cuadrado medio total = SCT / (nt – 1) =
2266.2 / 19 = 119. 27
Cuadrado medio de tratamiento = SCTR / (c - 1)
= 1097 / 3 = 365. 67
Cuadrado medio de bloques = SCBL / (b – 1) =
= 1093.70 / 4 = 273. 43
Cuadrado medio de error,
CME = SCE / (c – 1) (b – 1) = 75.50 / 3 (4) = 6. 29
Laboratorio 55
Se quiere determinar el efecto que tienen los
métodos de remuneración (bloques) en la
producción de los trabajadores. Una empresa
tiene cuatro plantas y en cada una de ellas a los
trabajadores se les paga por comisión, salario o un
plan de bonificaciones. En cada planta se
seleccionan tres trabajadores y cada uno recibe
diferente tipo de pago. A continuación se da la
producción diaria medida en unidades de las
cuatro plantas. A un nivel de confianza de 95%,
qué puede usted concluir?
Cuadrados Medios
CMT = 82.99
CMTR = 80.40
CMBL = 281.59
CME = 18.09
Estadísticos de prueba
F de tratamientos = 4.44
F de bloques = 15.57
84
2. H1: La media de producción de los
trabajadores en las 4 plantas en función de la
forma de pago no son iguales.
3. Estadístico de prueba F = 15.52
4. Estadístico crítico = 5.14
5. Se rechaza Ho y se acepta H1 porque el
estadìstico de prueba cae en región de rechazo.
6. La media de producción de las 4 plantas en
función de la forma de pago no son iguales. Por
lo que las formas de pago influyen en la
productividad de los trabajadores.
Laboratorio 56
Se tienen tres programas de entrenamiento para
ciclistas. Para que un entrenamiento sea benéfico
debe realizarse a 60% o 70% de la proporción
máxima de los latidos del corazón. Los datos se
muestran registrados en la siguiente tabla. A un
nivel de significancia de 5%, ¿se puede concluir
que existen diferencias en las tasas máximas
promedio de los latidos del corazón?
Programa de entrenamiento
Ciclista 1 2 3 Media
1 0.62 0.68 0.72 0.67
2 0.73 0.52 0.69 0.65
3 0.59 0.59 0.73 0.64
4 0.82 0.63 0.74 0.73
5 0.79 0.61 0.68 0.69
Media 0.71 0.61 0.71
Cuadrados Medios
CMT = SCT /( nt – 1) = 0.095 / 14 = 0.007
CMTR = SCTR / (c – 1) = 0.016 / 4 = 0.004
CMBL = SCBL / (b – 1) = 0.034 / 2 = 0.017
CME = SCE / (c – 1)(b – 1) = 0.045 / 8 = 0.006
88
29)2 + (3.6 – 4.31)2 + …. + (5.1 – 4.31)2 + (1.3 –
1.46)2 + …… + (2.1 – 1.46)2 = 5.67
SCE = 5.67
Prueba de hipótesis:
1) Ho : La media de los depósitos monetarios
en las 4 sucursales bancarias son iguales.
2) H1: La media de los depósitos monetarios
en las 4 sucursales bancarias no son
iguales.
3) Estadístico de prueba F = 78.09
4) Fcrítico = 3.01
gl del numerador = c – 1 = 4 – 1 = 3
gl del denominator = nt – c = 28 – 4 = 24
5) Se rechaza Ho y se acepta H1 porque el
estadìstico de prueba cae en región de
rechazo.
6) Conclusión. La media de los depósitos
monetarios en las sucursales bancarias no
son iguales.
89
PRUEBA DE TUKEY PARA DETERMINAR
DIFERENCIAS SIGNIFICATIVAS ENTRE MEDIAS
90
I 2. 29 – 4.31 l = 2.02 > 0.72
91
I 4. 87 – 4.32 l = 0.56 > 0.54
Laboratorio 57
En el problema de ANOVA de dos vías en el que
los empleados pueden evaluar a los gerentes, se
rechaza Ho para tratamientos y se rechaza Ho para
bloques, aplicar prueba T para tratamientos y DMS
para bloques, determinar las medias que tienen
diferencias significativamente grandes.
En una empresa, los empleados pueden evaluar el
desempeño del personal administrativo. Se
selecciona aleatoriamente a cinco empleados y se
les pide evaluar a cuatro de sus gerentes en una
escala de 10 a 50. Haga prueba de hipótesis a un
nivel de significancia de 1% para determinar si
92
existe diferencia significativa en el promedio de
calificaciones asignadas por los empleados.
Empleado Gerente 1 Gerente 2 Gerente 3 Gerente 4 Media
1 31 35 46 38 37.50
2 29 32 45 36 35.50
3 13 17 35 20 21.25
4 28 38 50 39 38.75
5 14 20 40 20 23.50
Media 23. 28.40 43.20 30.60
Cuadrados medios
Cuadrado medio total = SCT / (nt – 1) =
2266.2 / 19 = 119. 27
Cuadrado medio de tratamiento = SCTR / (c - 1)
= 1097 / 3 = 365. 67
Cuadrado medio de bloques = SCBL / (b – 1) =
= 1093.70 / 4 = 273. 43
Cuadrado medio de error,
CME = SCE / (c – 1) (b – 1) = 75.50 / 3 (4) = 6. 29
93
Prueba de hipótesis para bloques
7) Ho: La media de las calificaciones asignadas a los gerentes por los
empleados son iguales.
8) H1: La media de las calificaciones asignadas por los empleados a los
gerentes no son iguales.
9) Estadístico de prueba F = 43.46
10) Estadístico crítico, F crítico = 5.41
11) Se rechaza Ho y se acepta H1 porque el estadístico de prueba cae en
región de rechazo.
Conclusión. La media de las evaluaciones asignadas por los empleados no
son iguales por lo que el desempeño de los gerentes no son iguales
Laboratorio 58
Los errores de producción en una empresa son de tres tipos: A, B y C. Los
errores cometidos en un día, en los tres turnos, se dan a continuación. Haga
prueba de hipótesis a un nivel de confianza de 95% para determinar si las
medias de cada tipo de error son iguales. Haga prueba de Tukey y Dms si se
rechaza la hipótesis nula, Ho. Considere que el turno puede incidir en la
cantidad de errores que se cometen.
94
PRUEBA DMS PARA PROBLEMAS DE ANOVA
NO BALANCEADOS
Ejemplo. Se quiere determinar si la media de gastos por turista, en acampar,
en pesca y en navegar, de un centro recreativo son iguales. Haga prueba de
hipótesis a un nivel de confianza de 95% y aplique prueba DMS .
Estadístico de prueba
F = CMTR / CME = 164.01 / 21.20 = 7.74
Prueba de hipótesis
1. Ho: La media de gasto por turista en las áreas de acampar, pescar y
navegar son iguales.
2. H1: La media de gasto por turista en las áreas de acampar, pescar y
navegar No son iguales.
3. Estadístico de prueba, F = 7.74
4. Estadístico crítico, Fcrítico = 3.89
Con α = 0.05, gl del numerador = c – 1 = 2
y gl del denominador = nt – c = 15 – 3 = 12
5. Se rechaza Ho y se acepta H1 porque el estadìstico de prueba F = 7.74
cae en región de rechazo.
95
6. Conclusión: La media de gasto individual de los turistas en las áreas
de acampar, pescar y navegar No son iguales.
Laboratorio 59
Las calificaciones en Matemática, Física, Química y Computación en una
muestra de estudiantes se da a continuación. Haga prueba de hipótesis a un
nivel de confianza de 95% para determinar si las medias de las calificaciones
son iguales. Aplique prueba DMS.
Matemática Física Química Computación
65 78 81 75
80 90 65 84
63 86 70 70
70 75 55
98 74
71
Medias 69.5 83. 69 76.33
96
SCE = 1171.67
CMTR = 230.11
CME = 83.69
Prueba de hipótesis:
1) Las medias de calificaciones de los cuatro cursos son iguales.
2) Las medias de calificaciones de los cuatro cursos no son iguales.
3) Estadìstico de prueba F = 2.75
4) F crìtico = 3.34
5) Se acepta Ho.
6) Las medias de calificaciones son iguales.
Laboratorio 60
Una empresa trata de seleccionar un sistema de computación integrado y
debe decidir entre tres modelos que están a prueba. La selección final
dependerá de la productividad de los sistemas. Se seleccionan
aleatoriamente cinco operadores para manejar cada sistema. El nivel de
experiencia que tienen los empleados en el manejo de computadoras puede
afectar el resultado de la prueba. A continuación se da la producción en
unidades por hora para los tres sistemas. Haga prueba de hipótesis a un
nivel de significancia de 5% para determinar si existe alguna diferencia en la
producción promedio de los tres sistemas. Haga prueba DMS donde se
rechaza Ho.
TRATAMIENTOS
Operario Sistema 1 Sistema 2 Sistema 3 Media
1 23 28 35
2 38 36 32
97
3 40 39 43
4 34 32 37
Media
ESTADÍSTICA NO PARAMÉTRICA
Para hacer las pruebas paramétricas es necesario hacer suposiciones
restrictivas sobre las poblaciones de las que se extraen las muestras. Por
ejemplo que las muestras eran grandes o que provenían de poblaciones
normalmente distribuidas. Pero las poblaciones no son siempre normales.
En estadística se han desarrollado técnicas útiles que no requieren de
suposiciones restrictivas respecto a la forma de las distribuciones de las
poblaciones. Estas pruebas se conocen con el nombre de pruebas sin
distribución, o más comúnmente, pruebas no paramétricas.
Ejemplo
Se quiere determinar la eficiencia de las clases con catedráticos titulares o
con alumnos auxiliares. Se pide a una muestra de estudiantes que califique
la efectividad asignando un valor de 1 a 4, donde 4 es la calificación
excelente. Los resultados se dan a continuación. Haga prueba de hipótesis
a un nivel de significancia de 5%.
98
Cated 2 1 4 4 3 3 4 2 4 1 3 3 4 1 2
Auxil 3 2 2 3 4 2 2 1 3 1 3 1 2 1 3
Signo - - + + - + + + + 0 0 + + 0 -
Número de signos + = 8
Número de signos - = 4
Número de ceros =3
TOTAL = 15
n = 15 – 3 = 12
Para calcular la proporción estimada p̂ se divide el número de signos
positivos entre el tamaño de muestra, n = 12
Intervalo de confianza, IC = p ± z σp
np = 12(0.5) = 6 > 5 por lo que se usa z para determinar el IC
99
En un problema de dos colas, para obtener Z el nivel de confianza se divide
por 2 y el resultado se busca en tabla.
0.95 / 2 = 0.475 → z = 1.96
Error estándar de estimación, σp = (pq / n)1/2
Prueba de hipótesis
1. Ho: p = 0.50 Los estudiantes no perciben diferencia significativa en la
eficiencia de la clase impartida por el catedrático titular y el alumno
auxiliar.
4. IC = [ 0.22 , 0.78 ]
Laboratorio 61
Los siguientes datos muestran las unidades defectuosas producidas por los
empleados antes y después de un cambio en el plan de incentivos de
sueldos. Haga prueba de hipótesis a un nivel de significancia de 10% para
determinar si el cambio disminuyó la cantidad de unidades defectuosas
producidas. Aplique prueba de signo. ¿Debe mantenerse el plan de
incentivos?
Antes 8 7 6 9 7 10 8 6 5 8 10 8
Después 6 5 8 6 9 8 10 7 5 6 9 5
+ + - + - + - - 0 + + +
100
En este problema se espera que después, la cantidad de unidades
defectuosas sea menor. Por lo que a la cantidad de unidades defectuosas
antes se debe restar la cantidad de unidades defectuosas después, tomando
en cuenta que sólo interesa el signo.
Número de signos + = 7
Número de signos negativos = 4
Número de ceros = 1
n = 12 – 1 = 11
IC = [0.31 , 1 ]
Prueba de hipótesis
1.Ho: p = 0.50 La proporción de unidades defectuosas antes y
después del plan de incentivos, son iguales.
3 Estadístico de prueba es p̂
= 0.64
Este problema es de una cola, (cola izquierda, significa que la
región de rechazo está a la izquierda de 0.31).
4 IC = [ 0.31 , 1 ]
101
PRUEBA DE SUMA DE RANGOS,
PRUEBA DE KRUSKAL – WALLIS
La prueba Kruskal--Wallis se aplica cuando se tienen tres
o más poblaciones.
Ejemplo
Se quiere probar a un nivel de significancia de 10% la hipótesis de que las
calificaciones medias del examen escrito de los estudiantes con tres
métodos de estudio son iguales. Los datos se dan a continuación.
Aplique la prueba K de Kruskal-Wallis
Video 74 88 82 93 55 70 80 83
Audio 78 80 65 57 89 83
Magistral 68 83 50 91 84 77 94 81 92
Estadístico de prueba
K = (12 / n(n + 1)) ∑ RI2 / nj - 3(n + 1)
Donde
n = Total de elementos muestrales.
nj = Cantidad de elementos en cada grupo muestral (audio, video, magistral).
Rj = Suma de rangos de cada categoría (audio, video, magistral)
102
21 92 M
22 93 V
23 94 M
Suma de rangos:
R1 = RM = 122
R2 = RV = 93.5
R3 = RA = 60.5
Prueba de hipótesis
1. Ho: La media de las calificaciones con los tres métodos de estudio
son iguales.
2. H1: La media de las calificaciones con los tres métodos de estudio
no son iguales.
3. Estadístico de prueba K = 0.97
4. K crítico = X2 crítico = 4.6052
Con gl = k – 1 = 3 – 1 = 2 y α = 0.10
5. Se acepta Ho porque el estadístico de prueba K = 0.97 cae en región de
aceptación.
6. Conclusión. La media de las calificaciones con los tres métodos de
estudio son iguales.
Laboratorio 62
En una tienda, los pagos realizados en un día con tarjetas de crédito, cheque
y efectivo, se dan en la siguiente tabla. Haga prueba de hipótesis a un nivel
de confianza de 95% para determinar si existe diferencia en la media de
pagos con las diferentes modalidades. Aplique prueba K.
Tarjeta 78 64 75 45 82 69 60 86 92
Cheque 100 70 61 53 75 64 61
Efectivo 90 86 61 82 65 70
103
Rango Pagos Categoría
1 45 T
2 53 Ch
3 60 T
5 61 Ch
5 61 Ch
5 61 E
7.5 64 T
7.5 64 Ch
9 65 E
10 69 T
11.5 70 Ch
11.5 70 E
13.5 75 T
13.5 75 Ch
15 78 T
16.5 82 T
16.5 82 E
18.5 86 T
18.5 86 E
20 90 E
21 92 T
22 100 Ch
Suma de rangos:
R1 = RT = 106
R2 = RCh = 66.5
R3 = RE = 80.5
Prueba de hipótesis
1. Ho: La media de pagos con las tres modalidades son iguales.
2. H1: La media de pagos con las tres modalidades no son iguales.
3. Estadístico de prueba K = 1.20
4. K crítico = X2 crítico = 5.991
Con gl = k – 1 = 3 – 1 = 2 y α = 0.05
5. Se acepta Ho porque el estadístico de prueba cae en región de aceptación
6. Conclusión. La media de pagos con las tres modalidades son iguales.
104
El estadístico de prueba es U
U = n1n2 + [n1 (n1 + 1) / 2] – R1
O
Ejemplo
Se quiere determinar si las utilidades mensuales (en miles de quetzales)
de las empresas A y B, durante un año son iguales. Haga prueba de
hipótesis a un nivel de significancia de 5%. Aplique prueba U.
105
21.5 125 A
21.5 125 A
23 140 A
24 155 B
Suma de rangos
R1 = RA = 148
R2 = RB = 152
Estadístico de prueba es U1 = 74
Media de la estadística U,
μU = n1n2 / 2 = 72
Error estándar de la estadística U,
σU = [ n1n2(n1 + n2 +1) / 12 ]1/2 =
Intervalo de confianza, IC = μU ± z σU
IC = [ 38.05 , 105.95 ]
Prueba de hipótesis
1. Ho: El promedio de las utilidades mensuales de las
empresas A y B son iguales.
2. H1: El promedio de las utilidades mensuales de las
empresas A y B no son iguales.
3. Estadístico de prueba, U = 74
4. IC = [ 38.05, 105.95 ]
5. Se acepta Ho porque el estadístico de prueba
U = 74 está dentro del IC.
6. Conclusión. El promedio de las utilidades mensuales
de las empresas A y B son iguales.
106
Esta prueba mide el grado de asociación entre dos
variables.
El estadístico de prueba es el coeficiente de correlación de
rango rs.
Si rs = 1 existe correlación directa perfecta entre las dos
variables.
Si rs = - 1 existe correlación inversa perfecta entre las dos
variables.
Ejemplo
La Organización Mundial de la Salud (OMS), ha hecho
mediciones de la calidad del aire y la evidencia de
enfermedades pulmonares en 11 ciudades importantes del
mundo. Los datos se dan en la siguiente tabla. Haga
prueba de hipótesis a un nivel de confianza de 95% para
determinar si existe correlación entre estas variables.
Ciudad A B C D E F G H I J K
Rango de calidad 4 7 9 1 2 10 3 5 6 8 11
del aire
Rango de 5 4 7 3 1 11 2 10 8 6 9
enfermedad
pulmonar
2 1 9 4 4 1 1 1 25 4 4 4
d
∑d2 = 58
Estadístico de prueba rs
rs = 1 – [6∑d2 / n(n+1)(n-1)]
Laboratorio 63
Un investigador social quiere determinar si personas inteligentes
tienden a elegir personas inteligentes para casarse. Haga prueba de
hipótesis a un nivel de significancia de 0.01. Los datos se dan a
continuación.
Pareja IQ del IQ de la
esposo esposa
1 95 95
2 103 98
3 111 110
4 92 88
5 150 106
6 107 109
7 90 96
8 108 131
9 100 112
10 93 95
11 119 112
12 115 117
13 87 94
14 105 109
108
15 135 114
Rango IQ Sexo
1 87 H
2 88 M
3 90 H
4 92 H
5 93 H
6 94 M
8 95 H
8 95 M
8 95 M
10 96 M
11 98 M
12 100 H
13 103 H
14 105 H
15 106 M
16 107 H
17 108 H
18.5 109 M
18.5 109 M
20 110 M
21 111 H
22.5 112 M
22.5 112 M
24 114 M
25 115 H
26 117 M
27 119 H
28 131 M
29 135 H
30 150 H
Rango Rango
del de la d2
esposo esposa
1 2 1
3 6 9
4 8 16
5 8 9
8 10 4
109
12 11 1
13 15 4
14 18.5 20.25
16 18.5 6.25
17 20 9
21 22.5 2.25
25 22.5 6.25
27 24 9
29 26 9
30 28 4
∑ = 110
rs = 0.80
n = 15 parejas
Prueba de hipótesis
Ejemplo:
Una empresa telefónica lleva un registro de uso diario de celulares. El gerente
piensa que el uso de celulares sigue una distribución de Poisson con una media de
110
8.5 por hora. Haga prueba de hipótesis utilizando K – S a un nivel de confianza de
99%. Los datos se dan a continuación.
Uso fo
X
0 0
1 5
2 14
3 24
4 57
5 111
6 197
7 278
8 378
9 418
10 461
11 433
12 413
13 358
14 219
15 145
16 109
17 57
18 43
19 16
20 7
21 8
22 3
n =3,754
111
0.1228 0.5176 0.1104 0.7634 0.2458
0.1153 0.6329 0.0853 0.8487 0.2157
0.1100 0.7429 0.0604 0.9091 0.1661
0.0954 0.8383 0.0395 0.9486 0.1103
0.0583 0.8966 0.0239 0.9726 0.0759
0.0386 0.9352 0.0136 0.9862 0.0509
0.0290 0.9642 0.0072 0.9934 0.0291
0.0152 0.9794 0.0036 0.9970 0.0175
0.0115 0.9909 0.0017 0.9987 0.0078
0.0043 0.9952 0.0008 0.9995 0.0043
0.0019 0.9971 0.0003 0.9998 0.0027
0.0021 0.9992 0.0001 0.9999 0.0007
0.0008 1.0000 0.0001 1 0
Prueba de hipótesis
1) Ho: El uso de celulares se ajusta a una distribución
de Poisson con media de 8.5 por hora
2) H1: El uso de celulares No se ajusta a una
distribución de Poisson con media de 8.5 por hora.
3) Estadístico de prueba K-S = 0.2582
4) Estadístico K-S crítico (para n > 50 y α = 0.01 ) =
0.025 Buscar test de Kolmogrov-Sminov sobre
bondad de ajuste tabla PDF.
K-S crítico = 1.63/ n1/2 = 1.63 / (3754)1/2 = 0.0266.
5) Se rechaza Ho y se acepta H1 porque el estadìstico
de prueba cae en región de rechazo.
112
6) Conclusión: El uso de celulares No se ajusta a una
distribución de Poisson con media de 8.5 por hora.
Estadístico de prueba es B
B=n[(Coeficiente de asimetría)2 /6 +
(Curtosis – 3)2 /24 ]
Ejemplo
Determinar si los siguientes datos
muestrales fueron obtenidos de una
población normal: 78, 65, 72, 90, 84,
70, 68, 52, 95, 90, 75, 80, 85, 70,
60, 75, 68, 85, 70, 100. Haga prueba
de hipótesis a un nivel de confianza de
95%. Aplique prueba de Bowman -
Sheldon
Coeficiente de asimetría de Fisher=
0.07373
Curtosis = - 0.25592
113
Estadístico de prueba B
= 20[(0.0 7373)2 / 6 + ( - 0.25592 - 3)2 / 24 ] =
Prueba de hipótesis
1) Ho: Los datos muestrales provienen
de una población normal
2) H1: Los datos muestrales no
provienen de una población con
distribución normal
3) Estadístico de prueba B = 8.85
4) Estadístico crítico, Bcrítico = 3.26.
Este dato se obtiene en tabla de
datos estadísticos de Bowman–
Sheldon con n = 20 y alfa = 0.05
5) Se rechaza Ho y se acepta H1
porque el estadìstico de prueba B =
8.85 cae en región de rechazo.
114
6) Conclusión: Los datos muestrales no
provienen de una población con
distribución normal
Laboratorio
Aplique prueba de Bowman– Sheldon
a un nivel de significancia de 10%
para determinar si los datos dados a
continuación fueron tomados de una
115
población con distribución Normal:
68, 58, 98, 62, 65, 72, 68, 93, 89, 63,
84, 70, 65, 69, 80, 75, 82, 90, 65,
72, 90, 100, 68, 56, 95, 70, 65, 71,
80, 75.
n = 30
Coeficiente de asimetría = 0.55984
Curtosis = - 0.7379
Estadístico de prueba B = 19.03
Estadístico crítico= 2.49
Prueba de hipótesis
1) Ho: Los datos muestrales
provienen de una población con
distribución normal.
2) H1: Los datos muestrales no
provienen de una población con
distribución normal
3. Estadístico de prueba B = 19.03
4. Estadístico crítico = 2.49. Este dato
se obtiene en tabla de datos
116
estadísticos de Bowman – Sheldon
con n = 30 y alfa = 0.10
5. Se rechaza Ho y se acepta H1
porque el estadístico de prueba B =
19.03 cae en región de rechazo.
6. Conclusión: Los datos muestrales no
provienen de una población normal.
PRUEBA DE RACHAS
La prueba de rachas se utiliza para
probar si una sucesión de puntos arriba
(A) y debajo (B), de la media de un
proceso es o no aleatorio.
Ejemplo
117
La sucesión de puntos por encima (A) y
debajo (B) de la media de un proceso se
da a continuación: A, B, B, A, A, B, A, A,
A, B, A, B, A, B, B. A un nivel de
significancia de 0.05%, determine si la
sucesión es o no aleatoria.
n1 = 8 letras A y n2 =7 letras B.
Prueba de hipótesis
1) Ho: La sucesión de letras A y B se
genera mediante un proceso
aleatorio.
2) H1: La sucesión de letras A y B se
genera mediante un proceso no
aleatorio.
3) Estadístico de prueba r = 10
rachas.
4) Intervalo de aceptación [4, 12]
5) Se acepta Ho porque el
estadístico de prueba r = 10 está
dentro del intervalo de aceptación.
6) Conclusión. La sucesión de letras
A y B se genera mediante un proceso
aleatorio.
119
distribución normal en la prueba de
rachas.
Ejemplo
A continuación se da la sucesión de
letras A y B en un proceso de control de
facturas incorrectas: B, A, A, B, B, B, A,
A, B, B, B, B, B, B, A, ,A, B, B, B, A, B,
A, B, B, B, B, A, A, B, B, B, A, B, A, B, B,
A, B, B, B. Haga prueba de hipótesis a
un nivel de confianza de 95% para
determinar si el proceso es o no
aleatorio.
n1 = 13 letras A n2 = 27 letras B
120
µr = [2(13)(27) / (13 + 27)] + 1
µr = 18.55
σr = 2.73
Prueba de hipótesis
1. Ho: La sucesión de letras A y B es
generada por un proceso aleatorio.
2. H1: La sucesión de letras A y B No es
generada por un proceso aleatorio.
3. Estadístico de prueba r = 19 rachas.
4. IC = [13.2, 23.9]
5. Se acepta Ho porque el estadístico
de prueba r = 19 está dentro del IC.
121
6. Conclusión. La sucesión de letras A
y B es generada por un proceso
aleatorio.
122
Ejemplo.
A un nivel de confianza de 95%,
determinar si la siguiente sucesión de
pesos (en libras) es aleatoria: 154, 143,
160, 120, 180, 200, 130, 140, 160,
145, 126, 150, 148, 170, 110, 160,
190, 115, 100, 120, 142.
123
Gráfico de Pesos
250
200
150
100
50
0
0 5 10 15 20 25
Sucesión: A, B, A, B, A, A, B, B, A, B, B, A, A, A, B, A,
A, B, B, B, B.
Estadístico de prueba, r = 12
n1 = 10 letras A
n2 = 11 letras B
µr = [2n1n2 / (n1 + n2)] + 1 = 11.48
σr = 2.23
IC = µr ± z σr = [7.11, 15.85]
Prueba de hipótesis
124
1. Ho: La sucesión de letras A y B es generada por
un proceso aleatorio.
2. H1: La sucesión de letras A y B No es generada
por un proceso aleatorio.
3. Estadístico de prueba r = 12
4. IC = µr ± z σr = [7.11, 15.85]
5. Se acepta Ho porque el estadístico de prueba
r = 12 está dentro del intervalo de confianza.
6. Conclusión. La sucesión de letras A y B es
generada por un proceso aleatorio.
Ejemplo
Se quiere comparar las calificaciones de los
consumidores de seis diferentes anuncios
televisivos. Cuatro consumidores clasificaron
cada anuncio en una escala de 1 (malo) a 10
(excelente). El objetivo del experimento es
determinar si existen diferencias en los
niveles de calificación para los seis anuncios.
Los datos se presentan en la siguiente tabla.
Utilice la prueba Fr para determinar si los
125
datos presentan suficiente evidencia para
indicar diferencias en las calificaciones de los
seis anuncios televisivos. Haga prueba de
hipótesis a un nivel de significancia de 5%
Tabla de Calificaciones
ANUNCIOS
Sujeto/anuncio A B C D E F
1 5 8 7 6 4 5
2 6 10 6 7 4 4
3 8 10 9 9 6 7
4 4 6 7 5 3 5
Sujeto 1
Rango
Rango Calificación Anuncio
Modificado
1 4 E 1
2 5 A 2.5
3 5 F 2.5
4 6 D 4
5 7 C 5
6 8 B 6
Sujeto 2
Rango
Rango Calificaciones Anuncio
Modificado
1 4 E 1.5
2 4 F 1.5
3 6 A 3.5
126
4 6 C 3.5
5 7 D 5
6 10 B 6
Sujeto 3
Rango
Rango Calificaciones Categoría
Modificado
1 6 E 1
2 7 F 2
3 8 A 3
4 9 C 4.5
5 9 D 4.5
6 10 B 6
Sujeto 4
Rango
Rango Calificaciones Categoría
Modificado
1 3 E 1
2 4 A 2
3 5 D 3.5
4 5 F 3.5
5 6 B 5
6 7 C 6
Estadístico de prueba
Fr = {12 / bk(k+1)} ∑ Ri2 – 3b(k+1)
b = Bloques = 4
K = Tratamientos = 6
Ri = Total de rangos de cada categoría (de cada
anuncio)
Prueba de hipótesis
1. Ho: Las medias de calificaciones de los seis
anuncios son iguales.
2. H1: Las medias de calificaciones de los seis
anuncios no son iguales.
3. Estadístico de prueba Fr = 16.75
4. Fr crítico = X2 crítico = 11.07 con alfa = 0.05 y
gl = k -1 = 6 – 1 = 5
5. Se rechaza Ho y se acepta H1 porque el
estadìstico de prueba cae en región de rechazo.
6. Conclusión Las calificaciones de los seis
anuncios no son iguales.
Laboratorio
128
A continuación se dan las calificaciones para tres
tratamientos T1, T2 y T3. Haga prueba de Friedman a
un nivel de confianza de 90% para determinar si existe
diferencia en los valores de los tratamientos.
T1 T2 T3
B1 3.2 3.1 2.4
B2 2.8 3.0 1.7
B3 4.5 5.0 3.9
B4 2.5 2.7 2.6
B5 3.7 4.1 3.5
Para B1
Rango Calificación Categoría
1 2.4 T3
2 3.1 T2
3 3.2 T1
Para B2
Rango Calificación Categoría
1 1.7 T3
2 2.8 T1
3 3. T2
Para B3
Rango Calificación Categoría
129
1 3.9 T3
2 4.5 T1
3 5 T2
Para B4
Rango Calificación Categoría
1 2.5 T1
2 2.6 T3
3 2.7 T2
Para B5
Rango Calificación Categoría
1 3.5 T3
2 3.7 T1
3 4.1 T2
Tabla de rangos
T1 T2 T3
B1 3 2 1
B2 2 3 1
B3 2 3 1
B4 1 3 2
130
B5 2 3 1
Suma de 10 14 6
rangos
Estadístico de prueba
Fr = {12/bk(k+1)} ∑ Ri2 – 3b(k+1)
Prueba de hipótesis
1) Ho: Las medias de calificaciones de los tres
tratamientos son iguales.
132