Sei sulla pagina 1di 132

UNIVERSIDAD GALILEO

PROGRAMA DE ESTADÍSTICA MATEMÁTICA/


ESTADÌSTICA II
INGENIERÍA INDUSTRIAL I SEMESTRE 2018
CATEDRÁTICO: DR. J. FRANCISCO FERNÁNDEZ
MARTÍNEZ

Descripción
El curso de Estadística Matemática comprende el estudio de la Estadística
Inferencial aplicando Estadística Paramétrica y Estadística No Paramétrica.

Objetivo general
Al final del curso, el estudiante será capaz de poder hacer prueba de hipótesis
para la toma de decisiones, con una y varias muestras, con muestras pequeñas y
muestras grandes, con estadística paramétrica y estadística no paramétrica.

Semana Contenido Objetivo Actividades


1. Conceptos básicos Conocer los Identificar los
Estadístico y parámetro. Clases de conceptos básicos diferentes tipos
1 muestreo: aleatorio simple, estratificado, del muestreo de muestreo.
por conglomerado y sistemático.
Distribuciones de probabilidad. Comprobar el Aplicar el
2 El teorema de límite central. teorema de límite teorema de límite
central. central.
Estimación puntual y por intervalo
Características de un buen estimador. Error Conocer las Calcular tamaños
estándar de estimación. Intervalos de características de un de muestras para
3 confianza para muestra grande y pequeña. buen estimador. estimar medias y
Distribución t. Tamaño de muestra para proporciones.
estimar medias y proporciones.
3. Prueba de hipótesis de una sola Saber hacer prueba Aplicar los pasos
muestra de hipótesis para para hacer una
4 3.1 Prueba de hipótesis para medias con medias con muestra prueba de
muestra grande con una y dos colas. grande. hipótesis.
Saber hacer prueba Hacer prueba de
5 3.2 Prueba de hipótesis para medias con de hipótesis para hipótesis para
muestra pequeña, con una y dos colas. medias con muestra medias.
Uso de la distribución t. pequeña.
3.3 Prueba de hipótesis para Saber hacer prueba Resolver
6 proporciones con muestra grande, de hipótesis para problemas
con una y dos colas. proporciones. aplicados.
4. Prueba de hipótesis con dos Aprender a hacer Hacer prueba de
muestras. inferencia estadística hipótesis para
4.1 Prueba de hipótesis para diferencia de para medias y diferencia de
7 medias con muestras grandes y proporciones con dos medias y
muestras pequeñas, con una y dos muestras. proporciones.

1
colas.

8 4.2 Prueba de hipótesis para diferencia de Identificar muestras Hacer prueba de


medias con muestras dependientes. dependientes. hipótesis con
muestras
dependientes.
Saber hacer una Resolver proble-
9 4.3 Prueba de hipótesis para diferencia de prueba de hipótesis mas de diferen-
proporciones con muestras grandes, para diferencia de cia de propor-
con una y dos colas. proporciones. ciones.
5. Prueba X2 (Chi o Ji cuadrada) Poder realizar Resolver
10 5.1 X2 como prueba de independencia. pruebas de problemas de
independencia. aplicación.
11 Saber hacer una Hacer prueba de
5.2 X2 como prueba de bondad de ajuste. prueba de bondad de bondad de ajuste.
ajuste.
12 Saber hacer un Aplicar ANOVA
6. Análisis de Varianza (ANOVA) análisis de varianza. para comparar
Prueba de hipótesis para diferencia de tres o más
tres o más medias. medias.
ANOVA de una vía
ANOVA de dos vías.
13 7. Métodos no paramétricos Poder hacer pruebas Explicar la
7.1 Prueba de signo para datos pareados. de hipótesis diferencia entre
aplicando estadística
paramétrica y no
paramètrica
14 7.2 Prueba U de Mann-Whitney Métodos no Hacer pruebas de
7.3 Prueba K de kruskal-Wallis paramétricos para hipòteis con
estadística no
paramétrica.
15 7.4 Coeficiente de correlación de rangos La mejor toma de
de Spearman. decisiones.
7.5 Prueba K-S de Kolmogorov-Smirnof

Bibliografía sugerida:
1. probabilidad y Estadística Para Ingenieros. Walpole/Myers/Myers. Editorial Pearson.
2. Estadística Para Administración y Economía. Levin/Rubin/Balderas/Del Valle/Gómez.
Séptima Edición. Editorial Pearson/Prentice Hall.

Evaluación
Pruebas cortas y tareas ………………………………………………………. 25 puntos
Dos exámenes parciales de 25 puntos cada uno …………………… 50 puntos
Examen final …………………………………………………………….. 25 puntos
Total …………………. 100 puntos

2
ESTADÍSTICA MATEMÁTICA
Conceptos Básicos

ESTADÍSTICO o estadística, es todo dato cuantitativo que se


obtiene de una muestra. Se tienen tantos estadísticos como
muestras se obtengan de la población. Loa estadísticos son
estimaciones del parámetro de la población.

PARAMETRO, es todo dato cuantitativo que se obtiene de una


población. Loa parámetros son únicos y verdaderos.

Estadístico Parámetro
(muestral) (Poblacional)
Media aritmética ̅
𝒙 
Desviación estándar S 
Varianza S2 2

POBLACIÓN, es el total de elementos que son sujetos de estudio.

MUESTRA, es una parte estadísticamente representativa de la


población.

CENSO. Se hace un censo cuando se estudian todos los


elementos de la población.

MUESTREO. Se hace un muestreo cuando se estudian los


elementos muestrales que se seleccionaron de la población.

Tipos de Muestreo:
1. MUESTREO ALEATORIO SIMPLE. Cuando se estudia una
muestra que es seleccionada al azar, equiprobable, objetiva,
confiable y representativa de la población.

Características de una buena muestra

3
1. Es aleatoria o al azar. Cuando los elementos muestrales son
seleccionados sin criterios preestablecidos, (con la tecla Ran# de la
calculadora o aleatorio de Excel).

2. Es representativa de la población. El tamaño de la muestra es


estadísticamente representativo, esto significa que el tamaño de la
muestra es estadísticamente proporcional al tamaño de la población.

3. Es homogénea. Los elementos muestrales deben tener


características iguales o semejantes.

4. Es equiprobable. Todos los elementos de la población tienen la


misma probabilidad de ser seleccionados como elementos de la
muestra.

5. Es objetiva. Cuando el criterio del investigador no afecta los


resultados de la muestra.

6. Es confiable. Cuando los resultados de una muestra son iguales


o semejantes a los resultados de cualquier otra muestra que se
obtenga de la misma población. . Esta propiedad es la que justifica
tomar una sola muestra para hacer inferencia de la población.

Los datos muestrales o estadísticos, son una estimación (una


aproximación) del dato real de la población (del parámetro de la
población). Se tienen tantos estadísticos como muestras se
puedan obtener de la población.

2. MUESTREO ESTRATIFICADO. La población se divide en


grupos llamados estratos. Los elementos de cada estrato
tienen características homogéneas, es decir, que son iguales o
semejantes. Los estratos son diferentes entre sí. Son
criterios de estratificación: las religiones, los partidos
políticos, las razas, las nacionalidades, el idioma, la edad, el
nivel de escolaridad, etc.
Para hacer un muestreo estratificado, se obtiene una muestra
aleatoria simple en todos los estratos.

4
3. MUESTREO POR CONGLOMERADOS. La población se divide
en grupos llamados conglomerados. Los elementos de cada
conglomerado tienen características heterogéneas, es decir
diferentes. Los conglomerados son iguales o semejantes
aentre sí.
Para hacer un muestreo por conglomerados, se seleccionan
aleatoriamente algunos del total de conglomerados, y los que
son seleccionados se muestrean en su totalidad.

Ejemplo. Se quiere estudiar la ideología política de los miembros


de las familias de la zona 1 de la capital. ¿qué tipo de muestreo
aplicaría? Explique.

4. MUESTREO SISTEMÁTICO. Se aplica cuando se tienen


listados de la población, o en sistemas de producción en
serie. Aleatoriamente se selecciona el primer elemento
muestral y a partir de éste se obtienen los demás elementos
muestrales a intervalos regulares de tiempo o de unidades
producidas. Por ejemplo, se selecciona un elemento muestral
cada 30 minutos o cada 100 unidades producidas. Una
desventaja del muestreo sistemático es que no es
equiprobable, es decir, que los elementos de la población no
tienen la misma probabilidad de ser parte de la muestra.

5. Muestreo a criterio del investigador. No tiene validez


estadística, pero se usa mucho en estudios de mercado y
en otras estimaciones.

DISTRIBUCIÓN DE MUESTREO DE LA MEDIA. Es una


distribución de probabilidad de todas las medias muestrales.

TEOREMA DE LÍMITE CENTRAL:


1. La media de las medias muestrales es igual a la media de la
población.
2. Al aumentar la cantidad de medias muestrales, la
distribución de las medias muestrales tiende a ser Normal.

5
Ejemplo
Dada la población N = {1, 2, 3, 4, 5, 6}
a) Obtener las muestras tamaño 2, 3, 4, 5
b) Comprobar el TLC en cada caso.
c) Hacer gráfica de distribución de medias para muestras
tamaño 2, 3 , 4 y 5

Laboratorio 1
Dada la población N = {1, 2, 3, 4, 5, 6, 7}, determinar para las
muestras tamaño 3, 4, 5 y 6
a) Sus medias b) Comprobar el Teorema de Límite Central.
c) Hacer gráfica de la distribución de medias

Laboratorio 2
Dada la población N = { 2, 4, 5, 7, 8, 9 }. Determinar para las
muestras tamaño 2, 3, 4, 5 y 6 : a) Sus medias b) Comprobar
el Teorema de Límite Central. c) Hacer gráfica de la
distribución de medias

Los datos exactos y verdaderos sólo se obtienen al analizar la


población. Cuando se estudia una muestra se obtienen
resultados aproximados a los parámetros de la población.

ERROR ESTÁNDAR DE LA MEDIA. Es la desviación estándar de


la distribución de las medias muestrales.

ERROR ESTÁNDAR DE LA MEDIA CUANDO LA POBLACIÓN ES INFINITA

𝝈
𝛔𝒙̅ =
√𝒏
ERROR ESTÁNDAR DE LA MEDIA CUANDO LA POBLACIÓN ES FINITA.

6
𝝈 𝑵−𝒏
𝛔𝒙̅ = √
√𝒏 𝑵−𝟏

𝑵−𝒏
Donde el factor de corrección finito es el radical √
𝑵−𝟏

Para aplicar el factor de corrección finito, se deben dar el tamaño


de la población N y el tamaño de la muestra n.

El factor de corrección finito se aplica si n/N es mayor o igual que


0.05 es decir si n/N ≥ 0.05

Si no se conoce el tamaño de la población, se asume que es


infinita.

Ejemplo.
En una distribución normal con media de 375 y desviación
estándar de 48, ¿qué tan grande se debe tomar una muestra para
que la probabilidad sea al menos de 0.95 de que la media de la
muestra caiga entre 370 y 380? Resp. n = 354 unidades
muestrales

Observaciones:
Dada la probabilidad, para calcular Z en un problema de dos
colas, el nivel de confianza o la probabilidad dada, se divide por 2
y el resultado se busca en tabla de probabilidades normales.

Dada la probabilidad para calcular Z en un problema de una cola,


al nivel de confianza o la probabilidad dada, se le resta 0.50 y el
resultado se busca en tabla de probabilidades normales.

Los niveles de confianza más utilizados son 0.90, 0.95, 0.99


El nivel de confianza es un valor de probabilidad.

El nivel de significancia α es el complemento del nivel de


confianza, es decir α + NC = 1, de donde α = 1 – NC

7
El nivel de significancia α es el error tipo I que consiste en
rechazar la hipótesis nula siendo verdadera.

El error tipo II o error β consiste en aceptar la hipótesis nula


siendo falsa.

Cuando en una investigación no se da el nivel de confianza al


que fue realizada, se asume que se hizo a un NC de 95%.

A 0.95 / 2 = 0.475 corresponde z = 1.96


Z = (x - µ) / σx = (380 – 375) / (48 / √n)
√n = [(1.96)(48) / 5]2
n = 354

Ejemplo. Un agricultor analiza una muestra de 60 hectáreas


cultivadas de café. Por experiencia sabe que la producción de
cada hectárea está normalmente distribuida con una media de
120 quintales y una desviación estándar de 12 quintales.
Calcular: a) La desviación estándar de la media de muestra de las
cosechas de las 60 hectáreas. b) La probabilidad de que la
cosecha media por hectárea exceda los 123.8 quintales. c) La
probabilidad de que la cosecha media por hectárea caiga entre
117 y 122 quintales.

a) 𝛔𝒙̅ = σ /√n = 12 /√60 = 1.549

b) Z = (123.8 – 120) / 1.549 = 2.45

P(X > 123.8) = 0.5 – 0.4929 = 0.0071 (con tabla de


probabilidades normales)

Nota. Para calcular la probabilidad con la computadora, se


debe aplicar 𝛔𝒙̅ = σ /√n
c) Z = (117 – 120) / 1.549 = - 1.94

P(117 < X ≤ 120) = 0.4738

8
P(120 < X < 123.8) = 0.4929

Z = (122 – 120) / 1.549 = 1.29

P(120 < X < 122) = 0.4015

P(117<X<122) = 0.4738+0.4015 = 0.8753

Ejercicios para reforzar el aprendizaje

En este problema se deben considerar dos cosas:

1) El problema es de una cola.

Cuando el problema es de una cola, para calcular z, al nivel de


confianza o al valor de probabilidad se le resta 0.50 y el resultado
se busca en tabla de probabilidades normales.
Nota. Cuando la media se multiplica o divide por un número, la
desviación estándar, también, debe multiplicarse o dividirse por
el mismo número.
Laboratorio 3

Un transbordador traslada 25 pasajeros en uno de sus viajes. El


peso de cada pasajero tiene distribución normal con media de 63
kilogramos y varianza de 135 kilogramos cuadrados. Los
reglamentos de seguridad establecen que, para este
transbordador, el peso total de pasajeros no debe exceder los
1585 kilogramos. a) Calcule la probabilidad de que el peso total
de los pasajeros exceda los 1585 kilogramos. b) A un 95% de
nivel de confianza, ¿cumple el transbordador con las normas de
seguridad? Resp. a) 0.4317 b) 1670.57 kg no cumple con
las normas de seguridad.

Nota: En el inciso b) el problema es de una cola.

Laboratorio 4
Un técnico de laboratorio de rayos X toma lecturas de su máquina
para asegurarse de que se ajusta a las normas de seguridad
industrial. Sabe que la desviación estándar de la cantidad de
radiación emitida por la máquina es de 150 milirems, pero desea

9
tomar lecturas hasta que el error estándar de la distribución de
muestreo no sea mayor de 25 milirems. ¿Cuántas lecturas debe
tomar? Resp. 36 lecturas

Cuando en un problema se conoce el tamaño de la población N y


el tamaño de la muestra n, se debe determinar si se aplica o no el
multiplicador de corrección finito.

El multiplicador de corrección finito se aplica cuando el cociente


n/N es mayor o igual que 0.05, es decir, cuando n/N ≥ 0.05

Laboratorio 5
Los padres de familia de un colegio están recolectando fondos
para mejorar las instalaciones. Desean obtener contribuciones
de 36% de los 250 miembros, con recursos, egresados de la
institución. Experiencias anteriores indican que aquellos que
contribuyen, donarán el 4% de sus salarios anuales. Se estima
que los contribuyentes tienen un salario anual promedio de
$32,000 con una desviación estándar de $9,600. Calcule la
probabilidad de que la donación esté entre $110,000 y $120,000.
B) Calcular el tamaño de muestra para obtener a lo más $118,000.
Use nivel de confianza de 95% Resp. A) 0.9124 B) 156

N = 250
n = 0.36(250) = 90 contribuyentes
90/250 = 0.36 que es mayor que 0.05 por lo que se debe usar fcf
Donación media por contribuyente = 0.04 (32,000) = $1,280

Donación media de los 90 contribuyentes = 1280(90) = $115,200

Desviación estándar por contribuyente = 0.04 (9,600) = $384

Desviación estándar de los 90 contribuyentes =

= 384 (90) = $34,560

Al estandarizar X = 110,000 y X = 120,000 se debe tener cuidado


de aplicar el multiplicador de corrección finito.

10
Laboratorio 6

Una cadena de 145 supermercados, fue comprada por una


empresa mayor. Antes de que el trato sea firmado, la cadena
mayor quiere tener seguridad de que los 145 supermercados son
rentables. La cadena compradora hace un análisis financiero de
36 supermercados. El gerente general de los supermercados
comprados afirma que las ganancias de los supermercados tiene
una distribución normal con la misma media y una desviación
estándar de $1,200. Si el gerente general está en lo correcto
¿cuál es la probabilidad de que la media de la muestra de los 36
supermercados se encuentre cerca de los $200 de la media real?
Resp. 0.7498

Laboratorio 7

Una empresa ha desarrollado un nuevo sistema descongelante


de alas que ha instalado en 30 aviones. El sistema está diseñado
de tal forma que el porcentaje de hielo eliminado está
normalmente distribuido con una media de 96% y una desviación
estándar de 7%. El departamento de aviación tomará una
muestra aleatoria de 6 aviones que tienen instalado el nuevo
sistema y lo aprobará si al menos, en promedio, 98% del hielo es
eliminado. ¿Cuál es la probabilidad de que el nuevo sistema sea
aprobado por el departamento de aviación? Resp. 0.2209

Laboratorio 8
En un aeropuerto, el departamento de aduanas informa que en
promedio 42 personas diarias, con una desviación estándar de
11, llevan material de contrabando al ingresar al país. ¿Cuál es la
probabilidad de que en cinco días, el número de pasajeros que
llevan contrabando exceda los 50? Resp. 0.0516

Laboratorio 9

11
El gerente de ventas de una empresa productora de café, cree
que el consumo anual por casa está normalmente distribuido con
una media desconocida y una desviación estándar de 1.25 libras.
a) Si se toma una muestra de 36 casas y se registra su consumo
de café durante un año, ¿cuál es la probabilidad de que la media
de la muestra esté en el intervalo de media libra de la media de la
población. Resp. 0. 9836
b) Qué tan grande debe ser la muestra para estar 92 % seguro de
que la media de la muestra está en el intervalo de media libra de
la media de la población.
Resp. n = 19

Laboratorio 10
Un equipo de salvamento submarino se prepara para explorar
un sitio mar adentro, frente a la costa de Florida donde se
hundió una flotilla entera de 45 barcos españoles. A partir de
registros históricos, el equipo espera que estos buques
naufragados generen un promedio de $225,000 de ingresos
cada uno cuando se exploren, con una desviación estándar
de $39,000. El patrocinador del equipo ha establecido que si
no se han recuperado los gastos de exploración que suman
$2.1 millones con los primeros nueve galeones naufragados,
cancelará el resto de la exploración. A) ¿Cuál es la
probabilidad de que la exploración continúe una vez
explorados los nueve primeros barcos. Resp. 0.2393
B) Calcular el tamaño de muestra para obtener a lo más
$1,800,000. Aplique nivel de confianza de 97%. Resp.

Laboratorio 11
Para ayudar a la recuperación del lago Atitlán, una institución
pro-salvación del lago, ha solicitado ayuda económica a 1250
empresas de las cuales se espera que el 60% haga su
contribución. De experiencias anteriores, se tiene que las
empresas contribuyen con el 5% de un fondo que tienen para
donaciones que en promedio es de $12,000 con una
12
desviación estándar de $2800. a) Calcule la
probabilidad de que la contribución de las empresas esté
entre $445,000 y $456,000. b) A un nivel de confianza
de 95% calcule el tamaño de muestra para obtener a lo más
$452,000
Resp: a)

ESTIMACION
Una estimación es un valor que se obtiene con base en la
experiencia o de datos muestrales.
La Estadística inferencial se basa en la estimación para hacer
pruebas de hipótesis respecto a las características de la
población.
TIPOS DE ESTIMACIÓN
Se pueden hacer dos tipos de estimaciones con relación a la
población: una estimación puntual y una estimación por
intervalo.

Una estimación puntual es un número que se utiliza para


estimar un parámetro de población desconocido. Una
estimación puntual con frecuencia resulta insuficiente debido
a que sólo tiene dos opciones: o es correcta o está
equivocada.

Una estimación es por intervalo cuando se determinan dos


valores entre los cuales (inclusive los extremos) puede caer el
parámetro de la población.

Un estimador es cualquier estadística o estadístico que


se obtiene de una muestra para determinar un parámetro
de la población.
13
Una estimación es un valor numérico específico
observado de una estadística.

CARACTERÍSTICAS DE UN BUEN ESTIMADOR.

1. Insesgado o imparcial. Cuando el estadístico tomado


de la muestra es igual al parámetro de la población.

2. Eficiente. La eficiencia se refiere al tamaño del error


estándar de la estadística. Un estimador es más eficiente
cuando es menor su error estándar.

3. Coherente. Un estimador es coherente cuando al


aumentar el tamaño de la muestra el valor de la
estadística se aproxima al valor del parámetro de la
población.

4. Suficiente. Un estimador es suficiente cuando utiliza


la mayor información contenida en una muestra y
suministra la información que ningún otro estimador
puede dar.

INTERVALOS DE CONFIANZA PARA LA MEDIA

En estadística, la probabilidad que se asocia con una


estimación de intervalo se conoce como “nivel de
confianza”.

Un intervalo de confianza es el alcance de la estimación


que se hace.

Intervalos de confianza para la media, IC.

14
A dos colas, IC = µ ± z𝛔𝒙̅ si el tamaño de muestra es
grande (n ≥ 30)
A dos colas, IC = µ ± t𝛔𝒙̅ si el tamaño de muestra es
pequeño (n < 30) y no se conoce la desviación estándar 
de la población.

Importante:
1. Si la muestra es pequeña y se conoce la desviación
estándar de la población , se debe aplicar Z de la
Distribución Normal.
2. Si no se conoce la media y la desviación estándar
de la población se utilizan la media y la desviación
estándar muestral.
3. Cuando no se tienen los datos poblacionales
(parámetros) se usan los datos muestrales
(estadísticos).

Ejemplo
Un estudiante universitario está interesado en adquirir un
automóvil usado. Selecciona al azar 125 ofertas de
automóviles y encuentra que el precio promedio de un
auto es de $3250 con una desviación estándar de $615.
Determine un intervalo de confianza para el precio
promedio de un automóvil al 95.5% de confianza.
Resp. [3139.71 , 3360.29]

Laboratorio 12
El Departamento de Bienestar Social está interesado en
estimar un intervalo del ingreso medio anual de 700
familias de modo que pueda tener 90% de confianza de
que la media de la población se encuentra dentro de ese
intervalo. Se toma una muestra aleatoria de 50 familias y
se obtiene una media de $11,800 con una desviación de
$950. ¿Cuál es el intervalo estimado del ingreso medio
anual de las 700 familias?
15
Resp. [11586.88 , 12013.12]

Recordar que siempre que se dan el tamaño de la


población N y el tamaño de la muestra “n”, se debe
comprobar si se debe aplicar o no el multiplicador de
corrección finito (mcf).

INTERVALO DE CONFIANZA PARA PROPORCIONES

La proporción estimada es p = x / n
Donde X = cantidad de elementos de la muestra que
cumplen una propiedad o una condición dada.
n = tamaño de muestra

La proporción estimada, p se calcula solamente de los


datos muestrales.

Nota: En el cálculo de proporciones usar cuatro


decimales.

Ejemplo
De una muestra de 70 empresarios, 64 de ellos opinaron
que la disminución de las ventas en el período anterior,
fue causada por la contracción de la economía mundial.
a) Calcule el error estándar de la proporción de
empresarios que atribuyen la disminución de las ventas a
la contracción de la economía mundial. b) Determine
un intervalo de confianza para esta proporción a un nivel
de confianza de 95%. Resp. [0.8486 , 0.9800]

Laboratorio 13
En una empresa, de un total de 3000 cuentas de crédito,
se tomó una muestra de 150 cuentas y se determinó que
60% de ellas estaban bien. a) Calcule el error estándar de
16
estimación y un intervalo de confianza para la proporción
de cuentas buenas a un nivel de confianza de 90%. b)
¿Cuántas cuentas están mal?
Resp [0.5359, 0.6641]

Recuerde determinar si se debe usar o no el multiplicador


de corrección finito

Nota. Cuando se tiene un dato histórico o se da un


porcentaje poblacional, a este dato se suma y resta el
error estándar de estimación para determinar el intervalo
de confianza.

Laboratorio 14
En un examen de estadística se presentaron 85
estudiantes. De una muestra de 50, ganaron 38. A un
nivel de confianza de 92% haga intervalo de confianza
para la proporción de los que ganan. Históricamente, la
proporción de los que ganan esta clase es de 80%.
Resp. [0.7318 , 0.8682]

INTERVALOS DE CONFIANZA PARA MUESTRAS


PEQUEÑAS

Cuando la muestra es pequeña (n < 30) y no se conoce la


desviación estándar de la población el estadístico es t de
student.

En google buscar tabla “t” de Student de una y dos colas


web del profesor.

Aunque la muestra sea pequeña pero se conoce la


desviación estándar de la población se usa z.

17
Para calcular el estadístico t, se necesita:
1) grados de libertad, gl, 2) Nivel de significancia α.
3) Determinar si el problema es de una o dos colas.

Los grados de libertad, gl = n – 1 cuando se tiene una


muestra.
Nivel de significancia es α = probabilidad de error tipo 1.
Nivel de confianza + Nivel de significancia = 1
NC + α = 1 de donde α = 1 - NC

Ejemplo
Las calificaciones de una muestra de estudiantes de un
total de 58 se dan a continuación : 75, 64, 83, 91, 80,
77, 85, 70, 85, 70, 92, 50, 85, 70, 64, 56. Determine
intervalo de confianza para la media a un nivel de
confianza de 95%. Resp. [69.22 , 80.40], media = 74.81,
S= 12.22, t = 2.13

Laboratorio 15
Las edades de una muestra de estudiantes son 20, 20, 22,
22, 21, 19, 23, 21, 21, 19, 18. Determinar intervalo de
confianza para la media a un nivel de significancia de
0.10 Resp. [19.73 , 21.37], media = 20.55, s = 1.51, t =
1.81
Laboratorio 16
En un curso de Estadística se tienen 42 estudiantes. Las
calificaciones de una muestra son 83, 70, 91, 64, 75, 96,
84, 72, 95, 60. Determine intervalo de confianza para la
media a un nivel de confianza de 90%. Media = 79,
s = 12.75, t = 1.83 [72.48 , 85.52 ]

18
PRUEBA DE HIPÓTESIS
Etapas de una prueba de hipótesis:
1. Definir la hipótesis nula, Ho. Es el supuesto que se
hace respecto al parámetro de la población. La
hipótesis nula es generalmente una igualdad. Está
determinada por el supuesto del investigador, por
datos históricos o por un dato dado de la población.
2. Definir la hipótesis alterna, H1. La hipótesis alterna es
la negación de la hipótesis nula si el problema es de
dos colas. Si el problema es de una cola, la hipótesis
alterna es una desigualdad “mayor que” o “menor
que”. Se acepta la hipótesis alterna solamente si se
rechaza la hipótesis nula, Ho.
3. Calcular el estadístico de prueba. El estadístico de
prueba es z si la muestra es grande; es t si la muestra
es pequeña y no se conoce la desviación estándar de
la población.
4. Determinar el estadístico crítico. El estadístico crítico
está en función del nivel de confianza (o del nivel de
significancia) y es la frontera entre la región de
aceptación y la región de rechazo.
5. Aceptar o rechazar la hipótesis nula. La hipótesis nula
se acepta si el estadístico de prueba cae en región de
aceptación. Se rechaza si cae en región de rechazo.
6. Conclusión. Es la respuesta a la pregunta del
problema.
NOTA. El objetivo de una prueba de hipótesis es
determinar si la diferencia entre el estadístico de una

19
muestra y el parámetro de la población es
significativa.
Para probar la hipótesis nula, se obtiene una muestra y
la media muestral se compara con la media poblacional
de la hipótesis nula. Si la diferencia es
significativamente grande se rechazará la hipótesis
nula; si la diferencia no es significativamente grande la
hipótesis nula será aceptada.
Los datos muestrales sólo se utilizan para calcular el
estadístico de prueba y no para plantear la hipótesis
nula.
PALABRAS CLAVES PARA DETERMINAR SI UN
PROBLEMA DE HIPÓTESIS ES DE UNA O DOS
COLAS
COLA COLA DOS COLAS
IZQUIERDA DERECHA
Menor que Mayor que Igual a
Inferior a Superior a Aproximadamente
A lo más Por lo menos Diferente
Ha Ha Ha variado
disminuido aumentado
Ha cambiado
Menos que Excede a
Alrededor de
Menos Más eficiente
eficiente Más o menos
Promedio

20
PRUEBA DE HIPÒTESIS DE UNA SOLA MUESTRA
PARA MEDIAS
Ejemplo.
En una universidad, el catedrático de estadística
afirma que el promedio de las calificaciones de sus
estudiantes es de 90. Se selecciona aleatoriamente
una muestra de 12 estudiantes y se obtiene una
media de 87 con una desviación estándar de 9. Haga
prueba de hipótesis a un nivel de significancia de 5%
para determinar si la afirmación del catedrático es
verdadera.
1. Hipótesis Nula, Ho: µ = 90
2. Hipótesis Alterna, H1: µ ≠ 90 (problema de dos
colas)
3. Estadístico de prueba es “t” porque la muestra es
pequeña,
t= - 1.15
Para calcular el estadístico de prueba t, a la media
muestral se le resta la media poblacional µ y se
divide el resultado por el error estándar de
estimación.
t = (87 – 90) / (9/√12) = - 1.15
4. Estadístico crítico “t crítico” = ± 2.20
Para determinar el t crítico, se busca en tabla t los
grados de libertad gl = n – 1 = 12 – 1 = 11, α =
0.05 y dos colas.

21
5. Se acepta la hipótesis nula, Ho, porque el
estadístico de prueba t = -1.15 cae en región de
aceptación.
6. Conclusión. La afirmación del catedrático es
verdadera.
Aceptar una hipótesis nula Ho, no prueba que sea cierta;
simplemente, los datos no proporcionan evidencia
estadística para rechazarla.

Laboratorio 17
El decano de la facultad de ingeniería piensa que el
promedio de calificaciones, en una clase X, de 36
estudiantes de primer año es de 75. Se toma una
muestra aleatoria de estudiantes y se obtuvieron las
siguientes calificaciones: 84, 65, 70, 80, 68, 56,
75, 90, 45, 72, 70, 78, 80. A un nivel de
significancia de 10%, haga prueba de hipótesis para
determinar si lo que cree el decano es correcto.
Resp. Media = 71.77 S= 11.9 t = - 1.21
t crítico = 1.78 Se acepta Ho.

Laboratorio 18
El promedio de unidades defectuosas permitidas para
una máquina es a lo más 12 unidades por día. En una
muestra de 40 días se obtuvo una media de 15
unidades defectuosas con una desviación estándar de
7. Si la media no ha aumentado, sólo se hará limpieza
22
y ajustes a la máquina; si la media ha aumentado, la
máquina deberá ser desarmada y reparada. A un nivel
de confianza de 96%, determine si la máquina debe
ser limpiada o desarmada. Z = 2.71 Z crítico= 1.75
Nota:
1. Generalmente, la hipótesis nula es una igualdad.
2. La hipótesis alterna determina si el problema es
de cola derecha o es de cola izquierda.
3. En problemas de una cola, para determinar el
valor de Zcrítico, al nivel de confianza se resta
0.50 y el resultado se busca en tabla de
probabilidades normales.
Laboratorio 19
El precio promedio en el mercado de un televisor LCD
de 40 pulg. es de Q3500. Se desea comprar uno de
estos TV y se obtiene una muestra de precios en 35
centros distribuidores de estos productos y la media es
de Q 3800 con una desviación estándar de Q650.
Haga prueba de hipótesis a un nivel de confianza de
92% para determinar si el precio promedio ha
aumentado.
Recordar que cuando el problema es de muestra
grande y una cola, al nivel de confianza se resta 0.5 y
el resultado se busca en tabla de probabilidades
normales para obtener Z crítico.
Laboratorio. 20

23
Una empresa tiene 48 empleados y el salario promedio
semanal que se ha estado pagando es de Q950. De
una muestra del salario de los trabajadores se
obtienen los siguientes datos: 900, 850, 1000, 770,
1200, 800, 950, 920, 850, 975. Haga prueba de
hipótesis a un nivel de confianza de 90% para
determinar si el salario semanal promedio ha
disminuido. Media = 921.5 S= 122.84
t = - 0.82 t crítico = - 1.38

Laboratorio 21
Un estudiante universitario dispone de Q45,000
para comprar un automóvil. De información
obtenida en 35 predios calculó una media de
Q49,000 con una desviación estándar de Q4,800.
Comprará el auto si la diferencia no es
significativa. Haga prueba de hipótesis a un nivel
de confianza de 96%. ¿ Cuál es su conclusión?

PRUEBA DE HIPÒTESIS PARA PROPORCIONES


CON UNA MUESTRA
Ejemplo
En años anteriores, la proporción de alumnos becados
en una universidad ha sido de 25%. Se toma una
muestra de 60 estudiantes de los cuales 18 son

24
becados. A un nivel de confianza de 94%, haga prueba
de hipótesis para determinar si la proporción de
alumnos becados en la universidad ha aumentado.
1) Ho: p = 0.25
2) H1: p > 0.25
3) Estadístico de prueba Z = 0.85
4) Estadístico crítico Zcrítico = 1.555
5) Se acepta Ho porque el estadístico de prueba Z =
0.85 cae en región de aceptación.
6) Conclusión: La proporción de alumnos becados
en la universidad no ha aumentado.

Laboratorio 22
La política de un banco ha sido dar el 45% de
crédito a microempresarios. Este año, de un total
de 1500 créditos se tomó una muestra de 80
créditos y 30 eran para microempresarios. A un
nivel de confianza de 95%, se puede concluir que
la proporción de créditos a microempresarios ha
disminuido? B) ¿Si se pregunta si la
proporción ha variado, la conclusión sería la
misma?
Recuerde comprobar si se debe usar factor de
corrección finito.
Laboratorio 23
25
Una empresa planea comercializar un nuevo
producto si al menos al 40% del público le gusta.
El departamento de mercadeo selecciona 500
personas y encuentra que 225 lo prefieren. Haga
prueba de hipótesis para determinar si se debe
comercializar el producto. Asuma 95% de nivel de
confianza.

Laboratorio 24
En un curso de estadística la media de
calificaciones ha sido de 80. En una muestra se
han obtenido las siguientes calificaciones: 75, 90,
82, 78, 96, 100. Haga prueba de hipótesis a un nivel
de significancia de 10% para determinar si esa
media ha cambiado.

Laboratorio 25
El gerente de una empresa supone que al menos el
60% de los empleados son graduados
universitarios. Una muestra de 80 empleados
revela que 49 tienen grado universitario. Se desea
implementar una política de incremento salarial si
lo que el gerente supone es verdadero. A un nivel
de significancia de 8% haga prueba de hipótesis
para determinar si se debe aplicar la política de
incremento salarial. B) Determine un intervalo de

26
confianza para la proporción a un nivel de
confianza de 90%.

Laboratorio 26
6. En un almacén, el porcentaje de pagos en
efectivo ha sido de 30%. De 150 ventas de un día,
se tomó una muestra de 60 y 21 fueron pagadas en
efectivo. Para estimular estos pagos, la empresa
implementará un plan de descuentos por pagos en
efectivo si la proporción de este tipo de pagos ha
aumentado. A un nivel de confianza de 92%
determine si se debe implementar el plan de
descuentos.
Laboratorio 27
La proporción de unidades defectuosas por día,
producidas por una máquina ha sido a lo más de
0.15. En una muestra de 30 días se obtuvo una
proporción de unidades defectuosas de 0.18. El
costo por máquina parada es significativo. Haga
prueba de hipótesis a un nivel de significancia de
0.10 para determinar si la máquina debe ser
reparada por exceso de unidades defectuosas.

PRUEBA DE HIPÓTESIS
PARA DIFERENCIA DE MEDIAS

27
Esta prueba de hipótesis se aplica cuando se
quieren comparar las medias muestrales de dos
poblaciones distintas.
En estas pruebas, la hipótesis nula Ho, es
generalmente, que las medias poblacionales son
iguales.

Ejemplo
En un curso de Estadística, de una muestra de 30
estudiantes de la sección A, se obtuvo una media
de 70 con una desviación estándar de 15; de una
muestra de 35 estudiantes de la sección B, se
obtuvo una media de 75 con una desviación
estándar de 12. Haga prueba de hipótesis a un
nivel de confianza de 94% para determinar si el
rendimiento de las secciones A y B son iguales.
µ1 = Media de calificaciones de la sección A
µ2 = Media de calificaciones de la sección B
1) Ho: µ1 = µ2 Las medias de las calificaciones
de las secciones A y B son iguales.
2) H1: µ1 ≠ µ2 Las medias de las calificaciones de
las secciones A y B no son iguales ( dos colas)
̅ 𝟏 −𝑿
𝑿 ̅𝟐
3) Estadístico de prueba es Z =
√𝝈𝟐𝟏 /𝒏𝟏+𝝈𝟐𝟐 /𝒏𝟐

28
Z = (70 – 75) / 3.41 = - 1.47

4) Estadístico crítico, Zcrítico = ± 1.88


El problema es de dos colas por lo que 0.94 / 2
= 0.47
A 0.47 corresponde Z = 1.88

5) Se acepta Ho porque el estadístico de prueba


Z = - 1.47 cae en región de aceptación.
6) Conclusión. El promedio de las calificaciones
de las dos secciones A y B son iguales.

Nota. Cuando el problema es de dos colas, se llega


a la misma conclusión si en el numerador se
cambia el orden de la resta y se pone 75 – 70. El
valor de Z sería +1.47

Laboratorio 28
Dos laboratorios de investigación han producido
independientemente los medicamentos A y B. El
medicamento A fue probado en 90 personas con
problema de artritis y produjo un promedio de 8.5
horas de alivio con una desviación estándar de 1.8
horas. El medicamento B, fue probado en 80
enfermos con artritis y produjo una media de 7.6
horas de alivio con una desviación estándar de 2.1
horas. A un nivel de significancia de 5%, se puede
afirmar que el medicamento B proporciona un
período de alivio significativamente más corto?
29
µ1 = Media de horas de alivio del medicamento A
µ2 = Media de horas de alivio del medicamento B
1) Ho: µ1 = µ2 El promedio de horas de alivio de
los medicamentos A y B son iguales.
2) H1: µ2 < µ1 El promedio de horas de alivio del
medicamento B es menor que el promedio de
horas de alivio del medicamento A. (Cola
izquierda)
3) Estadistico de prueba Z = - 2.98
4) Estadístico crítico = - 1.645
5) Se rechaza Ho y se acepta H1.
6) Conclusion. La media de las horas de alivio del
medicamento B es menor que la media de horas de
alivio del medicamento A.

Observación:
Cuando H1 es una desigualdad, en un problema de
diferencia de medias, se puede plantear como de
cola derecha o de cola izquierda. Si se plantea de
cola derecha el estadístico de prueba debe ser
positivo. Si se plantea de cola izquierda, el
estadístico de prueba debe ser negativo.

Laboratorio 29

30
En una empresa, las empleadas mujeres han hecho
un reclamo ante la gerencia porque consideran que
se les paga menos que a los hombres efectuando
trabajos similares. En una muestra aleatoria de 38
operarios varones se encontró que el salario medio
por hora es de $11.38 con una desviación estándar
de $1.84. En una muestra de 45 mujeres, se obtuvo
un salario medio por hora de $9.64 con una
desviación estándar de $1.31. Haga prueba de
hipótesis a un nivel de confianza de 97% para
determinar si el reclamo de las mujeres
trabajadoras es justificado.
µ1 = Media de salario por hora de hombres.
µ2 = Media de salario por hora de mujeres.
1) Ho: µ1 = µ2 La media de salarios por hora de
hombres es igual a la media de salarios por
hora de mujeres.
2) H1: µ1 > µ2 La media de salario por hora de
hombres es mayor que el salario medio por
hora de mujeres.

3) Estadístico de prueba Z = 4.88 El estadístico


de prueba Z puede ser mayor que 4 Z indicando
que la diferencia entre el estadístico de la
muestra y el parámetro de la población es
significativamente grande.

31
3) Estadístico crítico. El problema es de una cola
por lo que al NC se le resta 0.5. El resultado se
busca en tabla Z.
Z crítico = 1.88

4) Se rechaza Ho y se acepta la hipótesis alterna


H1 porque el estadìstico de prueba cae en
región de rechazo.
5) Conclusión. Las mujeres tienen razón en su
demanda porque al aceptar la hipótesis
alterna, se acepta que el salario promedio de
los hombres es mayor que el de las mujeres.

Laboratorio 30
Una empresa debe decidir si sustituye su línea de
ensamblaje semiautomática que tiene actualmente,
por otra totalmente automatizada. Se ha reunido
información acerca de la producción por hora con
los dos tipos de líneas de ensamble y se obtienen
los siguientes datos. En la línea semiautomática,
de una muestra de 150 horas se obtuvo una media
de producción de 198 unidades con una desviación
estándar de 32. En la línea automatizada, de una
muestra de 200 horas se obtuvo una media de 206
unidades con una desviación estándar de 28. Haga
prueba de hipótesis a un nivel de confianza de 92%
para determinar si se debe cambiar el sistema
semiautomático.

32
µ1 = Media de producción por hora con línea
semi-automática.
µ2 = Media de producción por hora con línea
automatizada.
1) Ho: µ1 = µ2 La media de producción con las
dos líneas son iguales.
2) H1: µ2 > µ1 La media de producción con línea
automatizada es mayor que la media de
producción con línea semiautomática.

3) Estadístico de prueba, Z = 2.44

4) Estadístico Crítico, Zcrítico= 1.41

5) Se rechaza la hipótesis nula Ho y se acepta la


hipótesis alterna H1 porque el estadìstico de
prueba Z = 2.44 cae en región de rechazo.

6) Conclusión. Se debe instalar el sistema


automatizado.

PRUEBA DE HIPÓTESIS PARA


DIFERENCIA DE MEDIAS CON
MUESTRAS PEQUEÑAS
Ejemplo.
Para celebrar su primer aniversario de bodas, un
esposo decidió comprar un collar para su esposa.
En la joyería le enseñaron nueve collares con
33
piedras preciosas con un precio promedio de
$2,800 y una desviación estándar de $370.
También le mostraron seis collares con diamantes
con un precio promedio de $3,150 con una
desviación estándar de $600. El collar de
diamantes no se comprará si su precio es
significativamente mayor que el de piedras
preciosas. Haga prueba de hipótesis a un nivel de
significancia de 10% para determinar si se compra
el collar de diamantes.
µ1 = Media de precio de un collar con piedras
preciosas.
µ2 = Media de precio de un collar con diamantes.
1) Ho: µ2 = µ1 La media de precios de un collar
con diamantes es igual a la media de precio de un
collar con piedras preciosas.
2) H1: µ2 > µ1 La media de precios de un collar
de con diamantes es significativamente mayor que
el de piedras preciosas.
3) Estadístico de prueba es t = 1.41

Sp = 471.92

4) Estadístico crítico, t crítico = 1.35


Con gl = n1 + n2 – 2 = 9 + 6 – 2 = 13 , alfa = 0.10
y una cola

34
5) Se rechaza Ho y se acepta H1 porque el
estadístico de prueba t = 1.41, cae en región de
rechazo.

6) Conclusión: Se comprará el collar de piedras


preciosas.

Laboratorio 31
En un banco se quiere determinar si las mujeres
son más eficientes que los hombres para captar
cuentas nuevas. Los datos siguientes son el
número de cuentas nuevas, que fueron abiertas
durante el mes anterior, por diez ejecutivas de
ventas y ocho ejecutivos de ventas escogidos
aleatoriamente. A un nivel de confianza de 95%,
¿se puede afirmar que las mujeres son más
efectivas que los hombres para conseguir cuentas
nuevas?

Ejecutivas 12 11 14 15 13 14 13 12 14 15
Ejecutivos 13 14 13 12 13 12 10 14

Medias: 13.30 de mujeres, 12.63 de hombres.


Desviaciones estándar: 1.34 de mujeres, 1.30 de
hombres.
µ1 = Media de cuentas nuevas captadas por
mujeres.
35
µ2 = Media de cuentas nuevas captadas por
hombres.
1) Ho: µ1 = µ2 El promedio de cuentas nuevas
captadas por ejecutivas y ejecutivos son iguales.
2) H1: µ1 > µ2 El promedio de cuentas nuevas
captadas por ejecutivas es mayor que el promedio
de cuentas nuevas captadas por hombres.
3) Estadístico de prueba, t = 1.07
Sp = 1.32

4)Estadístico crítico, t crítico = 1.75

5) Se acepta Ho porque el estadístico de prueba t =


1.07 cae en región de aceptación.

6) Conclusión. Los hombres y las mujeres son


igual de eficientes para captar cuentas nuevas.

Laboratorio 32
El decano de la facultad de ingeniería cree que las
calificaciones de Estadística de los estudiantes de
Ing. Administrativa son mayores que las
calificaciones de Ing. Industrial. Las calificaciones
de una muestra aleatoria de estudiantes de las dos
carreras se dan a continuación. Haga prueba de
hipótesis a un nivel de confianza de 99% para
determinar si el decano tiene razón.

Administ. 86 77 80 64 91 50 83 75 90

36
Industrial 85 80 76 63 85 95 53 80 72 45 80 95
Media de Administrac=77.33, Media de Indust=75.75

Desviaciones estándar: 13.19, 15.39


µ1 = Media de calificaciones de Ing. Administrativa.
µ2 = Media de calificaciones de Ing. Industrial.
1) Ho: µ1 > µ2 La medias de calificaciones de
ingeniería administrativa es mayor que la de ing.
Industrial.
2) H1: µ1 ≤ µ2 La media de calificaciones de
ingeniería administrativa es menor o igual que la
media de ing. Industrial .
3) Estadístico de prueba, t = - 0.25

Sp = 14.5

4) t crítico = - 2.54 (cola izquierda)


5) Se acepta Ho porque el estadístico de prueba
t = - 0.25 cae en región de aceptación.
6) Conclusión: El decano tiene razón, las
calificaciones de ing. Administrativa son
mayores que las de ing. Industrial.

Laboratorio 33
Una máquina A produce en promedio 15 unidades
defectuosas en un día, con una desviación
estándar de 2.5. La muestra fue de 35 días para A.
En una muestra de 40 días, la máquina B dio un
37
promedio de 18 unidades defectuosas por día, con
una desviación estándar de 3. Haga prueba de
hipótesis al 92% de nivel de confianza para
determinar si las máquinas producen en promedio
igual número de unidades defectuosas. Haga
gráfica.
µ1 = Promedio de unidades defectuosas de
máquina A
µ2 = Promedio de unidades defectuosas de
máquina B
1) Ho: µ1 = µ2 . El promedio de unidades
defectuosas de las máquinas A y B son iguales.
2) H1: µ1 ≠ µ2 El promedio de unidades
defectuosas de las máquinas A y B no son iguales.

3) Estadístico de prueba, Z = - 4.72


4) Estadístico crítico, Zcrítico = ± 1.75
5) Se rechaza Ho y se acepta H1 porque el
estadìstico de prueba Z = - 4.72 cae en región de
rechazo.
6) Conclusión. El promedio de unidades
defectuosas producidas por las máquinas A y B no
son iguales.

Laboratorio 34
Se quiere determinar si el promedio de unidades
defectuosas de las máquinas A y B son iguales.
Las unidades defectuosas obtenidas durante siete
días se dan a continuación. Haga prueba de
hipótesis a un nivel de confianza de 95%.

38
Máq. A 15 12 9 16 6 5 16
Máq. B 12 10 5 12 7 9 10

Medias: 10.71, 8. S1=4.39, S2 =3.70


µ1 = Media de unidades defectuosas de la máquina
A.
µ2 = Media de unidades defectuosas de la máquina
B.

1) Ho: µ1 = µ2 . El promedio de unidades


defectuosas de las máquinas A y B son iguales.
2) H1: µ1 ≠ µ2 El promedio de unidades
defectuosas de las máquinas A y B no son iguales.
3) Estadístico de prueba
Sp = 4.06
t = 1.25
4) t crítico = ± 2.18
5) Se acepta Ho
6) El promedio de unidades defectuosas de las dos
máquinas son iguales.

Laboratorio 35
Hacer prueba de hipótesis a un nivel de confianza
de 95% para determinar si la media salarial de A es
mayor que la de B . Los datos muestrales se dan a
continuación.

Emp A 1051 1800 950 1480 1756 1580 1600

39
Emp B 1265 1690 1250 1200 1700 1230 1100

PRUEBA DE HIPÓTESIS PARA DIFERENCIA DE


MEDIAS CON MUESTRAS DEPENDIENTES O
MUESTRAS PAREADAS.
Las muestras son dependientes cuando las
observaciones o mediciones antes y después se
hacen a los mismos objetos o personas.

Ejemplo.
Un gimnasio ha anunciado un programa de
reducción de peso. Asegura que después de un
mes, los participantes habrán bajado al menos 12
libras de peso. ¿La muestra aleatoria de diez
participantes en el programa, cuyos datos de peso
en libras se dan en la siguiente tabla, apoyan la
afirmación del gimnasio? Use 5% de nivel de
significancia.
Al inicio 145 224 140 180 160 120 170 200 175 210
Después 138 210 136 165 148 110 165 190 170 200
Diferencia, 7 14 4 15 12 10 5 10 5 10
d

Las muestras son dependientes porque las


mediciones de peso antes y después se hacen a
las mismas personas.

Para hacer la prueba de hipótesis se calcula la


diferencia de pesos y se considera una muestra de
n = 10 y se hace la prueba de hipótesis como si
fuera una sola muestra.
40
D = Diferencia poblacional
d = Media de las diferencias = 9.20,
S=3.85

Prueba de hipótesis
1) Ho: D ≥ 12
2) H1: D < 12
3) Estadístico de prueba, t = - 2.3
4) t crítico = - 1.83
5) Se rechaza Ho y se acepta H1 porque el
estadístico de prueba t = - 2.3 cae en región de
rechazo.
6) Conclusión. Lo que el gimnasio afirma es
falso.

Laboratorio 36
El gerente de una empresa está considerando
poner un sistema de música ambiental en todos
los departamentos, porque cree que la música
puede contribuir a una mayor productividad de los
trabajadores. Se muestreó la producción semanal
de seis trabajadores antes y después de tener
música ambiental obteniéndose los siguientes
resultados. Haga prueba de hipótesis a un nivel de
significancia de 2.5% para determinar si se debe
instalar el sistema de música ambiental en la
empresa.

Trabajador 1 2 3 4 5 6
41
Sin 219 205 226 198 209 206
música
Con 235 186 240 203 221 205
música
Diferencia, 16 - 19 14 5 12 -1
d

Se supone que la productividad con música es


mayor, por lo que a la productividad con música se
resta la productividad sin música.

Media de las diferencias = 4.50,


S = 13.13

Cuando en el problema no se da un dato numérico


para plantear la hipótesis nula, se supone que la
diferencia poblacional D es igual a cero.

1) Ho: D = 0 No existe diferencia de producción


con música y sin música.
2) H1: D > 0 La diferencia de producción con
música es mayor que cero.
3) Estadístico de prueba, t = 0.84
4) t crítico = 2.57
5) Se acepta Ho porque el estadístico de prueba t
= 0.84 cae en región de aceptación.
6) Conclusión. No se debe instalar el sistema de
audio.

Laboratorio 37

42
Para determinar si la contracción de la economía
mundial ha tenido efecto en las utilidades de las
empresas, se tomó una muestra aleatoria mensual
en una de las empresas, obteniéndose los
siguientes resultados. Haga prueba de hipótesis a
un nivel de confianza de 95% para determinar si el
problema de la economía mundial produce un
cambio significativo en las utilidades, (en millones
de quetzales).

Empres 1 2 3 4 5 6 7 8 9
a
Utilidad 1.3 1.2 3.2 3.5 2.4 3.2 1.0 1.9 2.7
es en 8 6 4 0 7 1 5 8 2
2015
Utilidad 2.4 1.5 4.5 3.0 2.1 2.8 1.5 0.9 0.5
es en 8 0 9 6 1 0 9 2 0
2016
Diferenc 1.1 - - - - -
ia 0.2 1.3 0.4 0.3 0.4 0.5 1.0 2.2
4 5 4 6 1 4 6 2

Se supone que las utilidades en el año 2015 son


menores que las del 2016.

Media = - 0.14 S = 1.10


Para determinar si existe un cambio, el problema
se plantea de dos colas.
1) Ho: D = 0 La media de las utilidades de las
empresas en los dos años son iguales.

43
2) H1: D ≠ 0 La media de las utilidades de las
empresas en los dos años No son iguales (dos
colas)
3) Estadístico de prueba t = 0.38 o t = -0.38
4) t crítico = ± 2.31
5) Se acepta Ho porque el estadístico de prueba
t = 0.38 cae en región de aceptación.
6) No existe diferencia significativa en las
utilidades de las empresas por la contracción
de la economía mundial.

PRUEBA DE HIPÓTESIS PARA DIFERENCIA DE


PROPORCIONES

Ejemplo
Una compañía que fabrica productos medicinales,
está probando dos nuevos compuestos para
disminuir la presión arterial. En un grupo de 110
personas, 75 respondieron al medicamento 1 con
reducción de la presión arterial. En un grupo de 90
personas, 58 respondieron al medicamento 2 con
menores niveles de presión sanguínea. La
compañía desea probar a un nivel de significancia
de 5% si existe diferencia entre la eficiencia de las
dos medicinas.

p1 = Proporción de personas que respondieron al


medicamento 1 con reducción de la presión
sanguínea.

44
p2 = Proporción de personas que respondieron al
medicamento 2 con reducción de la presión
sanguínea.

1. Ho: p1 = p2. La proporción de personas que


responden a los dos medicamentos con
reducción de la presión sanguínea son iguales.
2. . H1: p1 ≠ p2 La proporción de personas que
responden a los dos medicamentos con
reducción de la presión No son iguales.
3. Estadístico de prueba, Z = 0.56
4. Z crítico = ± 1.96
5. Se acepta Ho: p1 = p2 porque el estadístico de
prueba z = 0.56 cae en región de aceptación.
6. Conclusión. La proporción de personas que
responden a la reducción de la presión con los
dos medicamentos son iguales.

Laboratorio 38
En la Superintendencia de Administración
Tributaria (SAT) se cree que las declaraciones del
impuesto sobre la renta (ISR) hechas por correo
electrónico tienen menos errores que las que son
hechas personalmente a mano. Se toma una
muestra de 50 declaraciones hechas por correo
electrónico y 7 de ellas tienen errores. En una
muestra de 75 declaraciones personales hechas a
mano, 13 tenían errores. Haga prueba de hipótesis
a un nivel de confianza de 90% para determinar si
lo que se cree en la SAT es verdadero.
45
p1 = Proporción de declaraciones con errores del
ISR hechas por correo electrónico.
p2 = Proporción de declaraciones con errores del
ISR hechas a mano.

1) Ho: p1 < p2 La proporción de declaraciones


del ISR con errores hechas por correo
electrónico es menor que las hechas a mano.
2) H1: p1 ≥ p2 La proporción de declaraciones
con errores hechas por correo electrónico es
mayor o igual que la proporción de
declaraciones hechas a mano.
3) Estadístico de prueba, Z = 0.51
4) Estadístico crítico, Z crítico = 1.28
5) Se acepta Ho: p1 < p2 porque el estadístico
de prueba Z = 0.51 cae en región de
aceptación.
6) Conclusión. Lo que se cree en la SAT es
verdadero

Laboratorio 39
Una planta de energía eléctrica operada con
carbón está considerando dos sistemas diferentes
para reducir la contaminación del aire. El primer
sistema ha reducido la emisión de contaminantes
en 136 veces de una muestra de 200 mediciones. El
segundo sistema, que es más caro, ha reducido la
emisión de contaminantes en 190 mediciones de
una muestra de 250 mediciones de aire. Si el
sistema caro es significativamente más eficiente,
46
se instalará el sistema caro. ¿Cuál sistema será
instalado? Haga prueba de hipótesis a un nivel de
significancia de 6%

p1 = Proporción de reducción de contaminantes


con el sistema 1.
p2 = Proporción de reducción de contaminantes
con el sistema 2.

1) Ho: p1 = p2 La proporción de reducción de


contaminantes del sistema 1 y del sistema 2
son iguales.
2) H1: p1 < p2 La proporción de reducción de
contaminantes del sistema 1 es menor que la
del sistema 2.
3) Estadístico de prueba Z = - 1.88
4) Z crítico = - 1.555
5) Se rechaza Ho y se acepta H1 porque el
estadìstico de prueba Z = - 1.88 cae en región
de rechazo.
6) Conclusión. Se instalará el sistema más caro
porque es más eficiente.

Laboratorio 40
En una empresa A, de 50 trabajadores 35
participan de un seguro colectivo; en otra
empresa B, de 80 trabajadores 65 participan de un
seguro colectivo. Haga prueba de hipótesis a un
92% de nivel de confianza para determinar si la

47
proporción de trabajadores que participan del
seguro colectivo es mayor en la empresa B.
P1 = Proporción de trabajadores de la empresa A
que participan en el seguro colectivo.
P2 = Proporción de trabajadores de la empresa B
que participan en el seguro colectivo.
1) Ho: p1 = p2 La proporción de trabajadores de
las empresas A y B que participan del seguro
colectivo, son iguales.
2) H1: p2 > p1 La proporción de trabajadores que
participan en el seguro colectivo es mayor en
la empresa B.
3) Estadístico de prueba Z = 1.41
4) Estadístico crítico, Zcrítico = 1.41
5) No se tiene criterio suficiente para rechazar o
aceptar la hipótesis nula.

Laboratorio 41
En una muestra de 50 estudiantes de ing. Industrial
26 estaban becados por la universidad. De 38
estudiantes de ing. Administrativa 20 tenían beca.
Haga prueba de hipótesis a un nivel de confianza
de 92% para determinar si la proporción de
estudiantes becados es mayor en ing. Industrial.

PRUEBA DE HIPÒTESIS APLICANDO CHI


(O JI) CUADRADO, X2

48
La prueba Chi Cuadrado se aplica cuando se
quiere probar si las proporciones de tres o más
poblaciones son iguales. También se aplica en
pruebas de independencia y en pruebas de bondad
de ajuste.

CHI CUADRADO COMO PRUEBA DE


INDEPENDENCIA

En esta prueba, la hipótesis nula es que no existe


relación entre las variables de estudio o que son
independientes.

Ejemplo
Probar a un nivel de confianza de 99% si existe
dependencia entre las calificaciones y el número
de horas de estudio por semana. Los datos de
una encuesta se dan a continuación

Tabla de frecuencias observadas, fo


Horas de Excelente Bueno Deficiente Total
estudio
De 0 a 10 3 10 6 19
horas
De 11 a 20 5 15 4 24
horas
De 21 a 30 8 20 9 37
horas
De 31 a 40 4 6 8 18
horas
49
Total 20 51 27 98

Tabla de frecuencias esperadas, fe Se puede


obtener con Geogebra
Horas de Excelente Bueno Deficiente Total
estudio
De 0 a 10 19*20/98 19*51/98 5.23 19
horas 3.88 9.89
De 11 a 20 24*20/98 12.49 24*27/98 24
horas 4.90 6.61
De 21 a 30 37*20/98 19.26 10.19 37
horas 7.55
De 31 a 40 3.67 18*51/98 4.96 18
horas 9.37
Total 20 51 27 98

Estadístico de prueba,
X2 = (3 – 3.88)2 /3.88 + (10 – 9.89)2 /9.89 + … + (8 –
4.96)2 /4.96 = 5.15
X2 = 5.15

Aplicar Geogebra para calcular X2

Para calcular X2 en Geogebra entrar a Google y


bajar Geogebra en español
Iniciar geogebra con calculadora gràfica, buscar
probabilidad y después Chi Cuadrado.
En el celular, en Google Play se pone Geogebra
aparece calculadora gràfica, Geogebra y
descargar. Hacer clic en tres puntitos en la parte
inferior derecha y buscar probabilidad y Chi
50
cuadrado. Hacer clic en tres puntitos verticales y
seleccionar càlculo de probabilidad salen dos
pestañas: una de distribución y otra de estadística
en la de distribución escribir Chi Cuadrado y en
estadística seleccionar Test de Chi cuadrado.
Poner número de filas y de columnas e ingresar los
datos observados.

Prueba de hipòtesis
1) Ho: Las calificaciones y el número de horas de
estudio son independientes.
O
Ho: No existe relación entre las calificaciones
y las horas de estudio.

2) H1: Las calificaciones y el número de horas de


estudio son dependientes.
O
H1: Existe relación entre las calificaciones y
las horas de estudio.

3) Estadístico de prueba X2 = 5.15 con programa


de Geogebra

4) Estadístico crítico: X2 crítico = 16.81


gl = (No. Filas – 1)(No. Columnas – 1) =
(4 – 1)(3 – 1) = 6
α = 0.01
5) Se acepta Ho porque el estadístico de prueba
X2 = 5.15 cae en región de aceptación.

51
6) Conclusión: Las calificaciones y las horas de
estudio son independientes.

Laboratorio 42
Un editor de periódicos quiere determinar si la
costumbre de las personas de leer diarios está
relacionada con su nivel educativo. A
continuación, se presentan los resultados de una
muestra de lectores de diferentes periódicos. Se
desea probar a un nivel de significancia de 10% si
la frecuencia con que se lee el periódico está
relacionada con el nivel de educación de los
lectores.

Tabla de frecuencias observadas, fo


Frecuencia Profesional Estudiante Sin Total
de lectura universitario estudios
Nunca 10 17 15 42
Algunas 12 23 8 43
veces
Mañana o 35 38 16 89
tarde
Ambas 28 19 13 60
ediciones
Total 85 97 52 234

Tabla de frecuencias esperadas, fe se puede


obtener con Geogebra
Frecuenci Profesiona Estudiante Sin Tota
a de l universitari estudio l
52
Lectura o s
Nunca 15.26 17.41 9.33 42
Algunas 15.62 17.82 9.56 43
veces
Mañana o 32.33 36.89 19.78 89
tarde
Ambas 21.79 24.87 13.33 60
ediciones
Total 85 97 52 234

Estadístico de prueba X2 = 11.99

Prueba de hipótesis
1) Ho: La costumbre de leer periódicos es
independiente del nivel de educación de las
personas.
2) H1: La costumbre de leer periódicos depende
del nivel de educación de las personas.
3) Estadístico de prueba X2 = 11.99 con
programa de Geogebra
4) Estadístico crítico, X2 crítico = 10.64
Grados de libertad, gl = (Número de filas –
1)(Número de columnas – 1)
gl = (4 – 1)(3 – 1) = 6
α = 0.10
5) Se rechaza Ho y se acepta H1 porque el
estadìstico de prueba X2 = 11.99 cae en región
de rechazo.
6) Conclusión. El hábito de leer periódicos
depende del nivel de educación de las
personas.
53
Laboratorio 43
Un educador opina que las calificaciones de los
estudiantes dependen del número de horas
semanales que pasan escuchando música. Se
hace un muestreo aleatorio y se obtienen los
siguientes resultados. Haga prueba de hipótesis a
un nivel de significancia de 5% para determinar si
las calificaciones dependen del número de horas
que pasan escuchando música.

Tabla de frecuencias observadas, fo


Hrs / Repro Regul Buen Muy Excel Total
semana bado ar o Buen ente
escuchan o
d
Menos de 5 16 11 10 13 55
5 horas
5 o más y 2 19 27 25 20 93
menos de
10 horas
10 o más 32 16 71 27 9 155
y menos
que 20
horas
20 o 11 24 41 11 8 95
más
Total 50 75 150 73 50 398

Tabla de frecuencias esperadas, fe


Hrs/sem Repro Regula Buen Muy Excel total
54
ana bado r o Buen
o
Menos 6.91 10.36 20.73 10.09 6.91 55
de 5
5 o más 11.68 17.53 35.05 17.06 11.68 93
y menos
de 10
10 o más 19.47 29.21 58.42 28.43 19.47 155
y menos
que 20
20 o 11.93 17.90 35.80 17.42 11.93 95
más
total 50 75 150 73 50 398

Estadístico de prueba X2 = 62.16

Prueba de hipótesis
1) Ho: Las calificaciones son independientes de la
cantidad de horas que los estudiantes pasan
escuchando música.

2) H1: Las calificaciones no son independientes de


la cantidad de horas que los estudiantes pasan
escuchando música.

3) Estadístico de prueba X2 = 62.17

4) X2 crítico = 21.03
gl = (No. De filas - 1)(No. De columnas – 1) = 12
gl = 3 x 4 = 12 y alfa = 0.05

55
5) Se rechaza Ho y se acepta H1 porque el
estadìstico de prueba X2 = 62.17 cae en región de
rechazo.

6. Conclusión. Las calificaciones dependen del


número de horas que los estudiantes pasan
escuchando música.

Laboratorio 44
Para determinar si las ventas de microchips están
relacionadas con las etapas del ciclo económico,
se han tomado datos correspondientes a las
ventas semanales en las diferentes etapas,
obteniéndose los resultados siguientes. Haga
prueba de hipótesis a un nivel de confianza de 95%
.

Tabla de frecuencias observadas fo y de fe


Etapa/Ventas Bajas Medianas Altas Total
En cresta 3 / 7 / 9.56 20/ 30
6.47 13.97
Decreciendo 5 / 10 / 30 / 45
9.71 14.34 20.96
En recesión 30 / 40 / 25 / 95
20.49 30.27 44.24
Creciendo 6 / 8 / 10.83 20 / 34
7.33 15.83
Total 44 65 95 204

56
1) Ho: Las ventas de microchips son
independientes de las etapas del ciclo
económico.
2) H1: Las ventas de microchips dependen de
las etapas del ciclo económico.
3) Estadístico de prueba X2 = 30.63
4) X2 crítico = 12.60
5) Se rechaza Ho y se acepta H1.
6) Conclusión. Las ventas de microchips
dependen de las etapas del ciclo económico.

PRUEBA X2 EN PROBLEMAS DE
BONDAD DE AJUSTE
Esta prueba se aplica cuando se quiere saber si
una serie de datos muestrales corresponden a un
tipo de distribución específica, es decir, cuando se
quiere probar si existe diferencia significativa entre
una distribución de frecuencias observadas y una
distribución de frecuencias teórica.

Ejemplo
El gerente de personal de una empresa piensa que
el proceso de entrevistas puede ser aproximado
por una distribución binomial con una probabilidad
de éxito de 0.40 de obtener una calificación
positiva en cualquiera de tres entrevistas que se
hacen con tres ejecutivos diferentes. El gerente de
personal quiere comprobar su hipótesis a un nivel

57
de significancia de 10%. Los datos de las
calificaciones positivas obtenidas en las
entrevistas se dan a continuación

n = 3 es el número de ensayos, es el número de


ejecutivos que hacen las entrevistas (que
califican).
p = 0.40 Probabilidad de éxito dado en el
problema
q = 1 – p = 1 – 0.4 = 0.6 probabilidad de no éxito.
K = Calificaciones posibles que puede obtener un
solicitante.
K=4 ( 0, 1, 2, 3 )

Posibles Número de solicitantes


calificaciones con cada una de las
en tres entrevistas. calificaciones, fo
0 20
1 52
2 28
3 15
Total = 115

Solución
Posibles Número de Probabilidades
calificaciones solicitantes con binomiales Frecuencia
positivas en tres cada una de con n=3 y esperada,
entrevistas las p = 0.40 fe
calificaciones,
fo
0 20 0.216 115 (0.216)

58
=24.84
1 52 0.432 115(0.432)
= 49.68
2 28 0.288 115(0.288)
=33.12
3 15 0.064 115(0.064)
= 7.36
Total 115 1.00
115

Estadístico de prueba, X2 = 9.77

Prueba de Hipótesis
1. Ho: Una distribución binomial con p = 0.40 y
n = 3 es una buena descripción del proceso de
entrevistas (o se ajusta al proceso de
entrevistas).
2. H1: Una distribución binomial con p=0.40 y n=3
no es una buena descripción del proceso de
entrevistas (o no se ajusta al proceso de
entrevistas).
3. Estadístico de prueba X2 = 9.77
4. X2 crítico = 6.25
Con gl = K – 1 = 4 – 1 = 3 y nivel de
significancia = 0.10
5. Se rechaza Ho y se acepta H1 porque el
estadístico de prueba X2 = 9.77 cae en región
de rechazo.
6. Conclusión. Una distribución binomial con
p= 0.40 y n=3 no es una buena descripción del
proceso de entrevistas o no se ajusta a la
descripción del proceso de entrevistas.

59
Laboratoio 45
En una empresa de correos se han recibido quejas
porque se ha estado extraviando alguna
correspondencia. Se seleccionó una muestra de
310 personas y les fueron enviadas dos cartas de
prueba a cada una. El número de personas que
reportaron cero, una o dos cartas extraviadas fue
de 260, 40 y 10 respectivamente. El gerente de la
empresa ha admitido que la probabilidad de que la
correspondencia sea extraviada es de 0.15. Haga
prueba de hipótesis a un nivel de significancia de
5% para determinar si el número de cartas
extraviadas se ajusta a una distribución binomial
con p = 0.15

n = 2 Es el número de ensayos, es el número de


cartas enviadas a cada persona.
K = Número posible de cartas extraviadas: 2, 1, 0
K = 3 (2 cartas extraviadas, 1 carta extraviada, 0
carta extraviada).

Número Número de cartas


posible de extraviadas reportadas fo
Cartas
extraviadas
0 260
1 40
2 10
Total = 310

60
Solución
Número Número de Probabilidades Frecuencia
posible de Cartas binomiales esperada, fe
Cartas extraviadas con n=2 y p =
extraviadas reportadas, 0.15
fo
0 260 0.7225 310(0.7225)=
223.97
1 40 0. 2550 310(0.2550)
=
79.05
2 10 0.0225 6.98
310 1 310

X2 = (260–223.97)2/223.97 + (40 – 79.05)2/79.05 + (10


– 6.98)2 /6.98 = 26.40

Prueba de hipótesis
1. Ho: La distribución binomial con p= 0.15 y
n = 2 es una buena descripción del número de
cartas extraviadas (o se ajusta al número de
cartas extraviadas).
2. H1: La distribución binomial con p= 0.15 y n=2
no es una buena descripción del número de
cartas extraviadas o no se ajusta al número de
cartas extraviadas.
3. Estadístico de prueba X2 = 26.40
4. X2 crítico = 5.99
gl = K – 1 = 3 – 1 = 2 y α = 0.05

61
5. Se rechaza Ho y se acepta H1 porque el
estadístico de prueba cae en región de
rechazo.
6. Conclusión. La distribución binomial con
p=0.15 y n=2 no es una buena descripción del
número de cartas extraviadas o no se ajusta al
número de cartas extraviadas.

Laboratorio 46
El número de faltas de asistencia durante una
semana ha sido de 0, 1, 2, 3, 4, y 5. Determine si el
número de faltas se ajusta a una distribución
binomial con p = 0.40. Los datos se dan a
continuación:
Faltas 0 1 2 3 4 5
fo 10 8 5 12 7 4

Laboratorio 47
El gerente de un banco supone que los depósitos
monetarios de sus clientes tienen distribución
normal con media de $1500 y desviación estándar
de $600. Haga prueba de hipótesis a un nivel de
significancia de 10% para comprobar si lo que el
gerente supone es verdadero. Los datos se dan a
continuación.

Depósito De $0 a De $1000 a De $2000 y


$999 $1999 más
fo 30 65 25

62
Solución
Primero se debe hacer corrección de continuidad
en los extremos de cada intervalo dado de
depósitos.
Después se deben estandarizar los extremos de
cada intervalo corregido para calcular las
probabilidades en estos intervalos y poder obtener
la frecuencia esperada.

Depòs De $0 a De $999.5 a De $1999.5


ito $999.5 $1999.5 y màs
fo 30 65 25 120
Proba 0.2021 0.7974 – 1 – 0.7974 =
bil 0.2021 = 0.2026
0.5953
fe 120 X 120 X 0.5953 120 X
0.2021= = 0.2026 =
24.25 71.44 24.31

X2 = 1.96

Prueba de hipótesis
1) Ho: La distribución normal con media de $1500
y desviación estándar de $600 es una buena
descripción de los depósitos monetarios.
2) H1: La distribución normal con media de $1500
y desviación estándar de $600 no es una buena
descripción de los depósitos monetarios.
3) Estadístico de prueba, X2 = 1.96
4) X2 crítico = 4.61
K = 3 (Los tres intervalos de depósitos.)
63
Con gl = K – 1 = 3 – 1 = 2 y nivel de
significancia = 0.10
5) Se acepta Ho porque el estadístico de prueba
X2 = 1.96 cae en región de aceptación.
6) Conclusión. Lo que supone el gerente es
verdadero. La distribución normal con media de
$1500 y desviación estándar de $600 es una buena
descripción (o se ajusta) a los depósitos
monetarios.

Laboratorio 48
El director de un hospital quiere comprobar si la
edad (en años) de los pacientes atendidos en una
semana, se ajusta a una distribución normal con
media de 30 años y desviación estándar de 12.
Haga prueba de hipótesis a un nivel de confianza
de 95%. Los datos se dan a continuación.

Edad De 0 a 20 De 21 a 45 De 45 a De 61 y
años años 60 más
Fo 10 25 36 15

Solución
Edad 0 a 20.5 20.5 a 45 45 a 60.5 De
60.5 y
más
fo 10 25 36 15 86
Prob 0.2143 0.8944 – 0.9945 – 0.0055
ab 0.2143= 0.8944 =
0.6801 0.1001
fe 86(0.2143) 86 X 0.6801 = 86 X 0.1001 0.47
64
= 18.43 58.49 8.61

X2 = 559.35
Prueba de hipótesis
1. Ho: Una distribución normal con media de 30
años y desviación estándar de 12, se ajusta a
la edad de los pacientes atendidos en una
semana.
2. H1: Una distribución normal con media de 30 y
desviación estándar de 12 años no se ajusta a
la edad de los pacientes atendidos en una
semana.
3. Estadístico de prueba X2 = 559.35
4) X2 crítico = 7.815
Con gl = K – 1 = 4 – 1 = 3 y nivel de
significancia = 0.05
K = 4 (Los cuatro intervalos de las edades.)
5. Se rechaza Ho y se acepta H1 porque el
estadístico de prueba X2 = 559.35 cae en región
de rechazo.
6. Conclusión. La edad de los pacientes no se
ajusta a una distribución normal con media de 30
años y desviación estándar de 12.

Laboratorio 49
Las calificaciones de un curso de Estadística se
indican a continuación. Hacer prueba de hipótesis
para determinar si los datos se ajustan a una
distribución normal con media de 70 y desviación
estándar de 12. Use nivel de confianza de 90%.
65
Intervalo 0 - 40 40 - 60 61 - 85 85 - 95 96 y
más
fo 20 30 40 25 15

Solución
Interval 0 - 40 – 60.5 – 85 - 95.5 y
o 40 60.5 85 95.5 más
fo 20 30 40 25 15
Probab. 0.006 0.2081 0.0888 0.0168
2 0.6801
fe 0.806 27.053 88.413 11.544 2.184

Prueba de hipótesis
1. Ho: La distribución normal con media de 70 y
desviación estándar de 12, se ajusta a las
calificaciones obtenidas en el curso de
estadística.
2. H1 : La distribución normal con media de 70 y
desviación estándar de 12, no se ajusta a las
calificaciones obtenidas en el curso de
estadística.
3. Estadístico de prueba X2 = 574.81
4. X2 crítico = 7.78 gl= K- 1 = 5 – 1 = 4 y α
= 0.10
5. Se rechaza Ho y se acepta H1
6. Conclusión. La distribución normal con media
de 70 y desviación estándar de 12, no se ajusta
a las calificaciones obtenidas en el curso de
estadística.

66
Laboratorio 50
En un hospital se han examinado los registros de
210 turnos nocturnos escogidos al azar para
determinar la frecuencia de casos de heridos por
accidente. El número de días que se trataron 0, 1,
2, 3, 4 , 5 o más pacientes con heridas por
accidente fueron 25, 55, 65, 35, 20 y 10
respectivamente. A un nivel de significancia de 5%
¿se puede concluir que la incidencia de heridos
por accidente sigue una distribución de Poisson
con lambda λ= 2 ? Resp. X2 = 2.02,
X2 crítico = 11.07.

No. Heridas por fo Probabilidad fe


noche
0 25 0.1353 28.41
1 55 0.2707 56.85
2 65 0.2707 56.85
3 35 0.1804 37.88
4 20 0.0902 18.94
≥5 10 0.0527 11.07
210 210

Prueba de Hipótesis
1) Ho: Una distribución de Poisson con λ=2 se
ajusta al número de heridos por accidente.
2) H1: Una distribución de Poisson con λ =2 no
se ajusta al número de heridos por accidente.
3) Estadístico de prueba X2 = 2.02
67
4) Estadístico crítico, X2crítico = 11.07 con
gl = K – 1 = 6 – 1 = 5 y nivel de significancia de
0.05.
K = Nùmero posible de heridas.
5) Se acepta Ho porque el estadístico de prueba
X2 = 2.02 cae en región de aceptación.
6) Conclusión: Una distribución de Poisson con
λ=2 se ajusta al número de heridos por
accidente.

Laboratorio 51
En una universidad el número de estudiantes que
ha repetido 0, 1 , 2 ,3 ,4, o màs semestres se da a
continuación. A un nivel de confianza de 90%,
determinar si los datos observados, fo, se ajusta a
una distribución de Poisson con lambda = 3

Semestres fo Probabilidad fe
repetidos
0 10 0.0498 3.09
1 15 0.1494 9.26
2 20 0.2240 13.89
3 12 0.2240 13.89
≥4 5 0.3528 21.87
62 62

X2 = 34.97 X2 crítico = 7.78

PRUEBA DE HIPÓTESIS

68
1) Ho : La distribución de Poisson con lambda
λ = 3 se ajusta al número de estudiantes que
ha repetido semestres.
2) H1: La distribución de Poisson con lambda
λ = 3 No se ajusta al número de estudiantes
que ha repetido semestres.
3) Estadìstico de prueba X2 = 34.97
4) X2 crítico = 7.78
5) Se rechaza Ho y se acepta H1 porque el
estadístico de prueba X2 = 34.97 cae en región
de rechazo.
6) Conclusión. La distribución de Poisson con
lambda λ = 3 No se ajusta al número de
estudiantes que ha repetido semestres.

ANÁLISIS DE VARIANZA (ANOVA)


DE UNA VÍA
El análisis de varianza (ANOVA), permite probar si
la diferencia entre las medias de tres o más
muestras es significativa. Con el análisis de
varianza se puede hacer inferencia acerca de si las
muestras fueron tomadas de poblaciones que
tienen la misma media.

Ejemplo
Se quieren evaluar tres métodos de instrucción
para determinar si existe alguna diferencia en su
69
efectividad. Después de un período de
preparación, se tomaron 16 nuevos empleados que
se habían preparado con los tres métodos y se
midió la producción de cada uno de ellos. A un
nivel de confianza de 95% ¿se puede afirmar que
los tres métodos son igual de eficientes? A
continuación se da la producción diaria (en
unidades) de los 16 empleados con los tres
métodos.

Método 1 Método 2 Método 3


15 22 18
18 27 24
19 18 19
22 21 16
11 17 22
15
Media = 17 Media = 21 Media = 19
S1 = 4.18 S2 = 3.94 S3 = 3.46
n1 = 5 n2 = 5 n3 = 6

K = 3 (Número de métodos)
Media de medias = (17 + 21 + 19 ) / 3 = 19

Primera estimación de la varianza de la población

(σ1)2 = ∑ni (media – media de medias)2 / (K – 1)

(σ1)2 = 5(17 - 19)2 /2 + 5(21 – 19)2 /2 + 6(19 – 19)2 /2


= 20

70
Segunda estimación de la varianza de la población,

(σ2)2 = ∑ [ (ni – 1) / (nT – K) ] Si2

(σ2)2 = [(5 – 1) /(16 – 3)] (4.18)2 + [(5 – 1) /(16 – 3)]


(3.94)2 + [(6 – 1) /(16 – 3)] (3.46)2 = 14.76

Estadístico de prueba F = (σ1)2 / (σ2)2

F es la distribución de Fisher

F = 20 / 14.76 = 1.36

Prueba de hipótesis
1. Ho: Las medias de producción de los
empleados con los tres métodos son iguales.
2. H1: Las medias de producción de los
empleados con los tres métodos no son
iguales.
3. Estadístico de prueba, F = 1.36
4. Estadístico crítico, F crítico = 3.81
Con gl del numerador = K – 1 = 3 – 1 = 2
gl del denominador = nt – K = 16 – 3 = 13
Alfa = 0.05
Buscar en Google, tabla de distribución F de Fisher
con alfa = 0.05. Nota: Para cada alfa se
tiene una tabla F

5. Se acepta Ho porque el estadístico de prueba


F = 1.36 cae en región de aceptación.

71
6. Conclusión. Las medias de producción de
los empleados con los tres métodos son
iguales, por lo que los tres métodos son
igual de eficientes.

Laboratorio 52
Se quiere evaluar el efecto sobre las ventas de
cuatro tipos de promociones durante una semana.
A continuación se presentan las ventas (en miles
de quetzales) de cinco tiendas que utilizaron los
cuatro tipos de promociones. Haga prueba de
hipótesis a un nivel de confianza de 99% para
determinar si las promociones producen diferentes
efectos sobre las ventas.

Promoción Tiendas
1 2 3 4 5
Muestra gratis 78 87 81 89 85
Regalo 94 91 87 90
Descuentos 80 86 75 82 90
Reembolsos 78 95 92 84

SOLUCIÓN
Media S
Muestra 78 87 81 89 85 84. 00 4.47
gratis
Regalo 94 91 87 90 90. 50 2.89
Descuentos 80 86 75 82 90 82. 60 5.73
Reembolsos 78 95 92 84 87. 25 7.72
72
K=4 (Los 4 tipos de promociones)
Media de medias = 86.09
Primera estimación de la varianza de la población =
55.31
Segunda estimación de la varianza de la población
= 29.64
Estadístico de prueba, F = 55.31 / 29.64 = 1.85

Prueba de hipótesis
1. Ho: Las medias de ventas con los diferentes
tipos de promoción son iguales.
2. H1: Las medias de ventas con los diferentes
tipos de promoción no son iguales.
3. Estadístico de prueba F = 1.85
4. Estadístico crítico, Fcrítico = 5.56
Nivel de significancia, alfa = 0.01
Con gl del numerador = k – 1 = 4 – 1 = 3
K = Número de promociones.
Con gl del denominador = nT – k = 18 – 4 = 14
5. Se acepta Ho porque el estadístico de prueba F
= 1.87 cae en región de aceptación.
6. Conclusión. Las medias de las ventas son
iguales, por lo que, los tipos de promoción no
tienen efecto sobre las ventas.

Laboratorio 53
El sector de la construcción está preocupado por
el efecto que ha tenido el alza de las tasas de
interés en la construcción de casas. A
continuación se dan los datos de nuevas
73
construcciones en los últimos tres trimestres. A un
nivel de significancia de 0.10, ¿existe diferencia
significativa en el número de construcciones
nuevas en los últimos tres trimestres?

Trimestre 1 41 53 54 55 43
Trimestre 2 45 51 48 43
Trimestre 3 34 44 46

Solución
Media s
Trimestre 41 53 54 55 43 49.2 6.65
1
Trimestre 45 51 48 43 46.75 3.5
2
Trimestre 34 44 46 41.33 6.43
3

K = 3 (los tres trimestres)


Media de medias = 45. 76
Primera estimación de la varianza de la población =
5(49.2 – 45.76)2 / 2 + 4(46.75 – 45.76)2 / 2 + 3(41.33
– 45.76)2 / 2 ) = 60. 98
Segunda estimación de la varianza de la población
= 32. 93
Estadístico de prueba F = 60.98 / 32.93 = 1. 85

Prueba de hipótesis

74
1. Ho: Las medias de construcciones nuevas en
los tres trimestres son iguales.
2. H1: Las medias de construcciones nuevas en
los tres trimestres no son iguales.
3. Estadístico de prueba, F = 1. 85
4. Estadístico crítico, Fcrítico = 3.01
gl del numerador = k – 1 = 3 – 1= 2
gl del denominador = nt – K = 12 – 3 = 9
5. Se acepta Ho porque el estadístico de prueba F
= 1.85 cae en región de aceptación.

6. Conclusión. Las medias de construcción en


los tres trimestres son iguales por lo que las
tasas de interés no tienen ningún efecto en las
construcciones nuevas.

ANALISIS DE VARIANZA A DOS VÍAS. (DISEÑO


EN BLOQUES ALEATORIZADOS)

En el análisis de varianza a una vía, solamente


existe un factor que tiene influencia en las
unidades experimentales. Con frecuencia se
encuentra que una segunda influencia exterior
puede influir en las unidades de estudio. Por
ejemplo, podemos estar interesados en comparar
la productividad promedio de tres máquinas
(tratamientos), pero esta productividad puede ser
afectada por la destreza y la experiencia del
operador causando confusión sobre cuál máquina
75
es realmente mejor. De manera que se debe
eliminar o corregir la influencia del operador sobre
la producción final.
Para obtener una medida más acertada de la
capacidad de las máquinas, se debe bloquear el
factor externo, colocando las observaciones en
grupos homogéneos con base a la experiencia.
Así, las observaciones se clasifican en bloques y
en tratamientos. El objetivo del bloqueo es reducir
la variación dentro de un tratamiento (tipo de
máquina).

Los tratamientos están determinados por la


variable que se mide (variable de interés). Los
bloques son el factor externo que afecta las
mediciones de la variable que interesa.

Ejemplo.
Una empresa trata de seleccionar un sistema de
computación integrado y debe decidir entre tres
modelos que están a prueba. La selección final
dependerá de la productividad de los sistemas. Se
seleccionan aleatoriamente cinco operadores para
manejar cada sistema. El nivel de experiencia que
tienen los operadores en el manejo de
computadoras puede afectar el resultado de la
prueba. A continuación se da la producción en
unidades por hora para los tres sistemas. Haga
prueba de hipótesis a un nivel de significancia de

76
5% para determinar si existe alguna diferencia en
la producción promedio de los tres sistemas.

TRATAMIENTOS
Operario Sistema Sistema Sistema Media
1 2 3
1 27 21 25 24.33
2 31 33 35 33.00
3 42 39 39 40.00
4 38 41 37 38.67
5 45 46 45 45.33
Media 36.6 36 36.20

Tratamientos son los tres sistemas.


Bloques son los cinco operarios.

Media de medias = 36. 27

Suma de cuadrados totales = SCT


Suma de cuadrados de tratamientos = SCTR
Suma de cuadrados de bloques = SCBL
Suma de cuadrados de error = SCE

SCT = SCTR + SCBL + SCE

Despejando SCE = SCT – SCTR – SCBL

SCT = (27 – 36.27)2 + (21 – 36.27)2 + (25 – 36.27)2 +


(31 – 36.27)2 + … + (33 – 36.27)2 + (35 –
36.27)2 + (42 – 36.27)2 + (39 – 36.27)2 + (39 –

77
36.27)2 + (45 – 36.27)2 + (46 – 36.27)2 + (45 –
36.27)2 = 806.93
SCT = 806. 93

SCTR = 5(36.6 – 36.27)2 + 5(36 – 36.27)2 + 5(36.2 –


36.27)2 = 0. 93
SCTR = 0.93

SCBL = 3(24.33 - 36.27)2 + 3(33 - 36.27)2 + 3(40 –


36.27)2 + 3( 38.67 – 36.27)2 + 3(45.33 - 36.27)2 =
765. 04
SCBL = 765.04

SCE = 806.93 – 0.93 – 765.04 = 40.96

Número de bloques = b = 5
Número de tratamientos = c = 3
Grados de libertad para tratamientos, gl = c – 1
Grados de libertad para bloques, gl = b -1
Grados de libertad para suma de cuadrados
totales, gl = nt – 1
Donde nt es el total de datos muestrales
Grados de libertad para suma de cuadrados de
error SCE,
gl = (b – 1)(c – 1)

Cuadrados Medios
Cuadrado Medio Total, CMT = SCT / (nt – 1 )
CMT = 806.93 / 14 = 57.64

Cuadrado Medio de Tratamientos,


78
CMTR = SCTR / (c – 1)
CMTR = 0.93 / 2 = 0.47

Cuadrado Medio de Bloques, CMBL = SCBL / (b - 1)


CMBL = 765.04 / 4 = 191.23

Cuadrado Medio de Error,


CME = SCE / (c – 1)(b – 1)
CME = 40.96 / 4(2) = 5.12

Estadístico de prueba para tratamientos,


F de tratamientos = CMTR / CME
F de tratamientos = 0.47 / 5.12 = 0.091

Estadístico de prueba
F para bloques = CMBL / CME
F de bloques = 191.23 / 5.12 = 37.36------------

Prueba de hipótesis para tratamientos.


1. Ho : Las medias de producción de los tres
sistemas son iguales.
2. H1: Las medias de producción de los tres
sistemas no son iguales.
3. Estadístico de prueba, F = 0.091
4. Estadístico crítico, F crítico = 4.46
Con gl del numerador = c – 1 = 3 – 1 = 2
gl del denominador = (c – 1)(b – 1) = 8
α = 0.05
5. Se acepta Ho porque el estadístico de prueba
F = 0.091 cae en región de aceptación.

79
6. Conclusión. Las medias de producción de
los tres sistemas son iguales, por lo que se
puede seleccionar cualquiera de los sistemas.

Prueba de hipótesis para bloques


1. Ho: Las medias de producción de los cinco
operarios son iguales.
2. H1: Las medias de producción de los cinco
operarios no son iguales.
3. Estadístico de prueba, F = 37.25
4. Estadístico crítico, Fcrítico = 3.84
Con gl del numerador = b – 1 = 5 -1 = 4
gl del denominador = (b – 1)(c – 1) = 8
α = 0.05
5. Se rechaza Ho y se acepta H1 porque el
estadístico de prueba F= 37.25 cae en región
de rechazo.
6. Conclusión. Las medias de producción de los
operarios no son iguales por lo que la
experiencia de los operadores es un factor
determinante para la producción de los
sistemas.

Laboratorio 54
En una empresa, los empleados pueden evaluar el
desempeño del personal administrativo. Se
selecciona aleatoriamente a cinco empleados y se
les pide evaluar a cuatro de sus gerentes en una
escala de 10 a 50. Haga prueba de hipótesis a un
nivel de significancia de 1% para determinar si
80
existe diferencia significativa en el promedio de
calificaciones asignadas por los empleados.

Empleado Gerente Gerente Gerente Gerente Media


1 2 3 4
1 31 35 46 38 37.50
2 29 32 45 36 35.50
3 13 17 35 20 21.25
4 28 38 50 39 38.75
5 14 20 40 20 23.50
Media 23. 28.40 43.20 30.60

Media de medias, = 31.30


Suma de cuadrados totales, SCT = 2266.20
Suma de cuadrados de tratamientos, SCTR = 1097
Suma de cuadrados de bloques, SCBL = 1093.70
Suma de cuadrados de error, SCE = 75.50

Cuadrados medios
Cuadrado medio total = SCT / (nt – 1) =
2266.2 / 19 = 119. 27
Cuadrado medio de tratamiento = SCTR / (c - 1)
= 1097 / 3 = 365. 67
Cuadrado medio de bloques = SCBL / (b – 1) =
= 1093.70 / 4 = 273. 43
Cuadrado medio de error,
CME = SCE / (c – 1) (b – 1) = 75.50 / 3 (4) = 6. 29

Estadístico de prueba para tratamientos


F de tratamientos = CMTR / CME =
81
365.67 / 6. 29 = 58.14
Estadístico de prueba para bloques
F de bloques = CMBL / CME =
273.43 / 6.29 = 43. 47

Prueba de hipótesis para tratamientos


1) Ho: Las medias de las calificaciones de los
gerentes son iguales.
2) H1: Las medias de las calificaciones de los
gerentes no son iguales.
3) Estadístico de prueba F = 58. 12
4) Estadístico crítico Fcrítico = 5.95
5) Se rechaza Ho y se acepta H1 porque el
estadìstico de prueba cae en región de rechazo.
6) Conclusión. Las media de las calificaciones
asignadas a los gerentes no son iguales, de donde,
se tienen gerentes que son mejores que otros.

Prueba de hipótesis para bloques


1) Ho: La media de las calificaciones asignadas
a los gerentes por los empleados son iguales.
2) H1: La media de las calificaciones asignadas
por los empleados a los gerentes no son
iguales.
3) Estadístico de prueba F = 43.46
4) Estadístico crítico, F crítico = 5.41
5) Se rechaza Ho y se acepta H1 porque el
estadístico de prueba cae en región de
rechazo.
6) Conclusión. La media de las evaluaciones
asignadas por los empleados no son iguales
82
por lo que el desempeño de los gerentes no
son iguales.

Laboratorio 55
Se quiere determinar el efecto que tienen los
métodos de remuneración (bloques) en la
producción de los trabajadores. Una empresa
tiene cuatro plantas y en cada una de ellas a los
trabajadores se les paga por comisión, salario o un
plan de bonificaciones. En cada planta se
seleccionan tres trabajadores y cada uno recibe
diferente tipo de pago. A continuación se da la
producción diaria medida en unidades de las
cuatro plantas. A un nivel de confianza de 95%,
qué puede usted concluir?

Tipo de pago (bloques)


Planta Comisión Salario Bonificación Media
1 25 25 37 29
2 35 22 50 35.67
3 20 20 30 23.33
4 30 25 40 31.67
Media 27.5 23 39.25

Media de medias = 29.92


SCT = (25 – 29.92)2 + (25 – 29.92)2 + (37 – 29.92)2 +
… + (40 – 29.92)2 =
SCT = 912.92

SCTR= 3(29 – 29.92)2 + 3(35.67 – 29.92)2 + 3(23.33 –


29.92)2 + 3(31.67 – 29.92)2 = 241.20
83
SCBL = 563.17
SCE = 108.55

Cuadrados Medios
CMT = 82.99
CMTR = 80.40
CMBL = 281.59
CME = 18.09

Estadísticos de prueba
F de tratamientos = 4.44
F de bloques = 15.57

Prueba de hipótesis para tratamientos


1. Ho: La media de producción de los
trabajadores en las 4 plantas son iguales.
2. H1: La media de producción de los
trabajadores en las 4 plantas no son iguales.
3. Estadístico de prueba F = 4.43
4. Estadístico crítico = 4.76
5. Se acepta Ho porque el estadìstico de prueba
cae en región de aceptación..
6. Las medias de producción de las cuatro plantas
son iguales.

Prueba de hipótesis para bloques


1. Ho: La media de producción de los
trabajadores en función de la forma de pago son
iguales.

84
2. H1: La media de producción de los
trabajadores en las 4 plantas en función de la
forma de pago no son iguales.
3. Estadístico de prueba F = 15.52
4. Estadístico crítico = 5.14
5. Se rechaza Ho y se acepta H1 porque el
estadìstico de prueba cae en región de rechazo.
6. La media de producción de las 4 plantas en
función de la forma de pago no son iguales. Por
lo que las formas de pago influyen en la
productividad de los trabajadores.

Laboratorio 56
Se tienen tres programas de entrenamiento para
ciclistas. Para que un entrenamiento sea benéfico
debe realizarse a 60% o 70% de la proporción
máxima de los latidos del corazón. Los datos se
muestran registrados en la siguiente tabla. A un
nivel de significancia de 5%, ¿se puede concluir
que existen diferencias en las tasas máximas
promedio de los latidos del corazón?
Programa de entrenamiento
Ciclista 1 2 3 Media
1 0.62 0.68 0.72 0.67
2 0.73 0.52 0.69 0.65
3 0.59 0.59 0.73 0.64
4 0.82 0.63 0.74 0.73
5 0.79 0.61 0.68 0.69
Media 0.71 0.61 0.71

Media de medias = 0.68


85
SCT = 0.095
SCTR = 0.016
SCBL = 0.034
SCE = 0.045

Cuadrados Medios
CMT = SCT /( nt – 1) = 0.095 / 14 = 0.007
CMTR = SCTR / (c – 1) = 0.016 / 4 = 0.004
CMBL = SCBL / (b – 1) = 0.034 / 2 = 0.017
CME = SCE / (c – 1)(b – 1) = 0.045 / 8 = 0.006

F de tratamientos = 0.004 / 0.006 = 0.67


F de bloques = 0.017 / 0.006 = 2.83

Prueba de hipótesis para tratamientos


1) Ho: La media de los latidos del corazón de los
ciclistas con los tres programas son iguales.
2) H1: La media de los latidos del corazón de los
ciclistas con los tres programas no son
iguales.
3) Estadístico de prueba F = 0.67
4) F crítico = 3.84
5) Se acepta Ho porque el estadístico de prueba F
= 0.67 cae en región de aceptación.
6) La media de los latidos de todos los ciclistas
son iguales.

Prueba de hipótesis para bloques


1) Ho: La media de los latidos del corazón de los
ciclistas dependiendo del tipo de programa
son iguales
86
2) H1: La media de los latidos del corazón de los
ciclistas dependiendo del tipo de programa NO
son iguales
3) F = 2.83
4) Fcrítico = 4.46
5) Se acepta Ho
6) Conclusión. La media de los latidos del
corazón en función del tipo de entrenamiento
son iguales.

PRUEBA DE TUKEY PARA DETERMINAR


DIFERENCIAS SIGNIFICATIVAS ENTRE
MEDIAS

Cuando se rechaza la hipótesis nula, el análisis de


varianza no revela qué media o medias son
diferentes de las demás. Para esto se utilizan las
pruebas de Tukey y la prueba de la Diferencia
Mínima Significativa (DMS). Estas pruebas
consisten en una comparación por pares, de todos
los pares de medias posibles.
Tanto la prueba de Tukey como la prueba DMS se
utilizan si el problema ANOVA es balanceado, es
decir, si se tiene igual número de observaciones en
cada muestra. Si el diseño no está balanceado
porque las muestras son de diferente tamaño, debe
utilizarse la prueba DMS para diseños no
balanceados.

Ejemplo. Se quiere saber si la media de los


depósitos monetarios en cuatro sucursales
87
bancarias son iguales. Haga prueba de hipótesis a
un nivel de significancia de 5%. Los datos (miles
de quetzales) se dan a continuación. Aplique
prueba de Tukey y DMS.

Suc. 1 Suc. 2 Suc. 3 Suc. 4


5.1 1.9 3.6 1.3
4.9 1.9 4.2 1.5
5.6 2.1 4.5 0.9
4.8 2.4 4.8 1
3.8 2.1 3.9 1.9
5.1 3.1 4.1 1.5
4.8 2.5 5.1 2.1

Medias 4.87 2.29 4.31 1.46

Media de medias = 3.23

Suma de Cuadrados Totales, SCT = (5.1 – 3.23)2 +


(1.9 – 3.23)2 + (3.6 – 3.23)2 + (1.3 – 3.23)2 +……. +
(2.1 – 3.23)2 =
SCT = 61

Suma de Cuadrados de Tratamientos,


SCTR = 7(4.87 – 3.23)2 + 7(2.29 – 3.23)2 + 7(4.31 –
3.23)2 + 7(1.46 – 3.23)2 = SCTR = 55.33

Suma de Cuadrados de Error, SCE


SCE = (5.1 – 4.87)2 + (4.9 – 4.87)2 + …. + (4.8 –
4.87)2 + (1.9 – 2.29)2 + (1.9 – 2.29)2 + ….. + (2.5 – 2.

88
29)2 + (3.6 – 4.31)2 + …. + (5.1 – 4.31)2 + (1.3 –
1.46)2 + …… + (2.1 – 1.46)2 = 5.67
SCE = 5.67

CMTR = SCTR / (c – 1) = 55.33 / 3 = 18.4442


c = 4 = Número de grupos muestrales.

CME = SCE / (nt – c) = 5.67 / (28 – 4) = 5.67 / 24 =


CME = 0.2362

Estadístico de prueba, F = CMTR / CME

F = 18.44 / 0.24 = 78.09

Prueba de hipótesis:
1) Ho : La media de los depósitos monetarios
en las 4 sucursales bancarias son iguales.
2) H1: La media de los depósitos monetarios
en las 4 sucursales bancarias no son
iguales.
3) Estadístico de prueba F = 78.09
4) Fcrítico = 3.01
gl del numerador = c – 1 = 4 – 1 = 3
gl del denominator = nt – c = 28 – 4 = 24
5) Se rechaza Ho y se acepta H1 porque el
estadìstico de prueba cae en región de
rechazo.
6) Conclusión. La media de los depósitos
monetarios en las sucursales bancarias no
son iguales.

89
PRUEBA DE TUKEY PARA DETERMINAR
DIFERENCIAS SIGNIFICATIVAS ENTRE MEDIAS

Valor de prueba de Tukey, T = q (CME / n)1/2

n = 7 = Número de elementos en cada muestra.

En tabla de Tukey se obtiene el valor de


q = 3.9 con 0.05 de nivel de significancia,
gl del numerador, c = 4 y
gl del denominador, nt – c = 28 – 4 = 24

T = 3.9 (0.24 / 7)1/2 = 0.72

El valor de prueba de Tukey se compara con


todos los pares de medias posibles. Si el valor
absoluto de las diferencias de las medias es
mayor que T, la diferencia entre esas medias es
significativamente grande y las medias no son
iguales. Si la diferencia positiva es menor que T, la
diferencia no es significativa y esas medias son
iguales.

Diferencias positivas de medias.


I 4. 87 – 2.29 l = 2.58 > 0.72

I 4. 87 – 4.31 l = 0.56 < 0.72

I 4. 87 –1.46 l = 3.41 > 0.72

90
I 2. 29 – 4.31 l = 2.02 > 0.72

I 2. 29 – 1.46 l = 0.83 > 0.72

I 4.31 – 1.46 l = 2.85 > 0.72

Respuesta: Sólo la diferencia de medias de los


depósitos monetarios de las sucursales 1 y 3 es
menor que 0.72 indicando que sólo estas medias
son aproximadamente iguales. La hipótesis nula
se rechaza porque las demás diferencias de
medias son significativamente grandes.

PRUEBA DE DIFERENCIA MÍNIMA SIGNIFICATIVA


(DMS) EN PROBLEMAS DE ANOVA
BALANCEADOS
En el problema de los depósitos monetarios.

DMS = (2(CME)F/n))1/2 = (2(0.2362)(4.26) / 7))1/2 =


DMS = 0.54
n = 7 Tamaño de cada muestra (en el problema
balanceado)
nt = total de datos = 7 x 4 = 28

F = 4.26 Con α = 0.05


gl del numerador = 1 (Constante)
gl del denominador = nt – c = 28 – 4 = 24

Diferencias positivas (valor absoluto) de medias.


I 4. 87 – 2.29 l = 2.58 > 0.54

91
I 4. 87 – 4.32 l = 0.56 > 0.54

I 4. 87 –1.46 l = 3.41 > 0.54

I 2. 29 – 4.31 l = 2.02 > 0.54

I 2. 29 – 1.46 l = 0.83 > 0.54

I 4.31 – 1.46 l = 2.85 > 0.54

Al comparar el valor DMS = 0.54 con cada una de


las diferencias absolutas de los pares de medias,
se encuentra que todos los resultados son
mayores que 0.54 lo que indica medias
poblacionales diferentes. El método DMS es más
conservador que el de Tukey dado que el valor
DMS es siempre menor que T.

Laboratorio 57
En el problema de ANOVA de dos vías en el que
los empleados pueden evaluar a los gerentes, se
rechaza Ho para tratamientos y se rechaza Ho para
bloques, aplicar prueba T para tratamientos y DMS
para bloques, determinar las medias que tienen
diferencias significativamente grandes.
En una empresa, los empleados pueden evaluar el
desempeño del personal administrativo. Se
selecciona aleatoriamente a cinco empleados y se
les pide evaluar a cuatro de sus gerentes en una
escala de 10 a 50. Haga prueba de hipótesis a un
nivel de significancia de 1% para determinar si
92
existe diferencia significativa en el promedio de
calificaciones asignadas por los empleados.
Empleado Gerente 1 Gerente 2 Gerente 3 Gerente 4 Media
1 31 35 46 38 37.50
2 29 32 45 36 35.50
3 13 17 35 20 21.25
4 28 38 50 39 38.75
5 14 20 40 20 23.50
Media 23. 28.40 43.20 30.60

Media de medias, = 31.30


Suma de cuadrados totales, SCT = 2266.20
Suma de cuadrados de tratamientos, SCTR = 1097
Suma de cuadrados de bloques, SCBL = 1093.70
Suma de cuadrados de error, SCE = 75.50

Cuadrados medios
Cuadrado medio total = SCT / (nt – 1) =
2266.2 / 19 = 119. 27
Cuadrado medio de tratamiento = SCTR / (c - 1)
= 1097 / 3 = 365. 67
Cuadrado medio de bloques = SCBL / (b – 1) =
= 1093.70 / 4 = 273. 43
Cuadrado medio de error,
CME = SCE / (c – 1) (b – 1) = 75.50 / 3 (4) = 6. 29

Estadístico de prueba para tratamientos


F de tratamientos = CMTR / CME =
365.67 / 6. 29 = 58.14
Estadístico de prueba para bloques
F de bloques = CMBL / CME =
273.43 / 6.29 = 43. 47

Prueba de hipótesis para tratamientos


1) Ho: Las medias de las calificaciones de los gerentes son iguales.
2) H1: Las medias de las calificaciones de los gerentes no son iguales.
3) Estadístico de prueba F = 58. 14
4) Estadístico crítico Fcrítico = 5.95
5) Se rechaza Ho y se acepta H1 porque el estadìstico de prueba cae en
región de rechazo.
6) Conclusión. Las media de las calificaciones asignadas a los gerentes no
son iguales, de donde, se tienen gerentes que son mejores que otros.

93
Prueba de hipótesis para bloques
7) Ho: La media de las calificaciones asignadas a los gerentes por los
empleados son iguales.
8) H1: La media de las calificaciones asignadas por los empleados a los
gerentes no son iguales.
9) Estadístico de prueba F = 43.46
10) Estadístico crítico, F crítico = 5.41
11) Se rechaza Ho y se acepta H1 porque el estadístico de prueba cae en
región de rechazo.
Conclusión. La media de las evaluaciones asignadas por los empleados no
son iguales por lo que el desempeño de los gerentes no son iguales

Para tratamientos, estadístico T = 5.82, q = 5.19 con alfa 0.01 y gl del


numerador = C = 4 y gl del denominador = nt - 4 = 16
I 23 – 28.4 I = 5.4 C 5.82 Medias aproximadamente iguales
I 23 – 43.2 I = 20.2 > 5.82 Medias diferentes
I 23 – 30.6 I = 7.6 > 5.82 Medias diferentes
I 28.4 – 43.2 I = 14.8 > 5.82 Medias diferentes
I 28.4 – 30.6 I = 2.2 C 5.82 Medias aproximadamente iguales
I 43.2 – 30.6 I = 12.6 > 5.82 Medias diferentes

Para bloques y estadístico DMS,= 5.22 F = 8.68 con alfa = 0.01,


gl del numerador = 1 (constante) ; gl del denominador = 20 – 5 = 15; b = 5

I 37.5 – 35.5 I = 2 5.22 Medias aproximadamente iguales


I 37.5 – 21.25 I = 16.25 > 5.22 Medias diferentes
I 37.5 – 38.75 I = 1.25 5.22 Medias aproximadamente iguales
I 37.5 – 23.5 I = 14 > 5.22 Medias diferentes
I – I=
I – I = > Medias diferentes

Laboratorio 58
Los errores de producción en una empresa son de tres tipos: A, B y C. Los
errores cometidos en un día, en los tres turnos, se dan a continuación. Haga
prueba de hipótesis a un nivel de confianza de 95% para determinar si las
medias de cada tipo de error son iguales. Haga prueba de Tukey y Dms si se
rechaza la hipótesis nula, Ho. Considere que el turno puede incidir en la
cantidad de errores que se cometen.

Jornada Error tipo A Error tipo B Error tipo C


Matutina 6 10 8
Vespertina 4 12 10
Nocturna 8 15 7

94
PRUEBA DMS PARA PROBLEMAS DE ANOVA
NO BALANCEADOS
Ejemplo. Se quiere determinar si la media de gastos por turista, en acampar,
en pesca y en navegar, de un centro recreativo son iguales. Haga prueba de
hipótesis a un nivel de confianza de 95% y aplique prueba DMS .

Turista Acampar Pesca Navegar


1 $ 38 $ 30 $ 19
2 32 25 35
3 35 31 20
4 36 35 22
5 38 --- 25
6 32 --- ---
Media $ 35.17 $ 30.25 $ 24.20

Media de medias = 29.87

Suma de Cuadrados de Tratamientos,


SCTR = 6(35.17 – 29.87)2 + 4(30.25 – 29.87)2 + 5(24.20 – 29.87)2 = 329.86
SCTR = 328.02

Suma de Cuadrados de Error, SCE = (38 – 35.17)2 + (32 – 35.17)2 + . . . +(30 –


30.25)2 + (25 – 30.25)2 + … + (19 – 24.2)2 + … + (25 – 24.20)2 = 254.38

Cuadrado Medio de Tratamientos,


CMTR = SCTR / (c – 1) = 329.86 / 2 = 164.01

Cuadrado Medio de Error,


CME = SCE / (nt – c) = 254.38 / 12 = 21.20

Estadístico de prueba
F = CMTR / CME = 164.01 / 21.20 = 7.74

Prueba de hipótesis
1. Ho: La media de gasto por turista en las áreas de acampar, pescar y
navegar son iguales.
2. H1: La media de gasto por turista en las áreas de acampar, pescar y
navegar No son iguales.
3. Estadístico de prueba, F = 7.74
4. Estadístico crítico, Fcrítico = 3.89
Con α = 0.05, gl del numerador = c – 1 = 2
y gl del denominador = nt – c = 15 – 3 = 12
5. Se rechaza Ho y se acepta H1 porque el estadìstico de prueba F = 7.74
cae en región de rechazo.

95
6. Conclusión: La media de gasto individual de los turistas en las áreas
de acampar, pescar y navegar No son iguales.

Para identificar diferencias significativas de medias, se aplica la prueba


DMS para problemas no balanceados.

DMS = (( 1/ni + 1/nj )( CME ) F α, c – 1, nt – k )1/2


El valor DMS es diferente en cada par de comparaciones de medias, debido
a que el número de observaciones no es el mismo en cada muestra.

DMS para acampar y pescar


DMS = ((1 / 6 + 1 / 4)(21.2)(3.89))1 / 2 = 5.86

DMS para acampar y navegar


DMS = ((1 / 6 + 1 / 5)(21.2)(3.89))1 / 2 = 5.50

DMS para pescar y navegar


DMS = ((1/4 + 1/5)(21.2)(3.89))1 / 2 = 6.09

Comparando diferencia de medias con su DMS respectiva


I 35.17 – 30.25 I = 4.92 < 5.86

I 35.17 – 24.2 I = 10.97 > 5.5

I 30.25 - 24.20 I = 6.05 < 6.09

Conclusión. A un nivel de confianza de 95% se puede concluir que


solamente las medias de acampar y navegar no son iguales.

Laboratorio 59
Las calificaciones en Matemática, Física, Química y Computación en una
muestra de estudiantes se da a continuación. Haga prueba de hipótesis a un
nivel de confianza de 95% para determinar si las medias de las calificaciones
son iguales. Aplique prueba DMS.
Matemática Física Química Computación
65 78 81 75
80 90 65 84
63 86 70 70
70 75 55
98 74
71
Medias 69.5 83. 69 76.33

Media de medias = 74.46


SCTR = 690.33

96
SCE = 1171.67
CMTR = 230.11
CME = 83.69

Estadístico de prueba F = 230.11/83.69 = 2.75

Prueba de hipótesis:
1) Las medias de calificaciones de los cuatro cursos son iguales.
2) Las medias de calificaciones de los cuatro cursos no son iguales.
3) Estadìstico de prueba F = 2.75
4) F crìtico = 3.34
5) Se acepta Ho.
6) Las medias de calificaciones son iguales.

DMS para Mate y Fìsica = 10.80


DMS para Mate y Quìmica = 11.22
DMS para Mate y Compu = 12.78
DMS para Fìsica y Quìmica = 10.13
DMS para Fìsica y Compu = 11.83
DMS para Quìmica y Compu = 12.22

Comparación de las diferencias de medias con su DMS


I 69.5 – 83 I = 13.5 > 10.80
I 69.5 – 69 I = 0.5 < 11.22
I 69.5 – 76.33 I = 6.83 < 12.78
I 83 – 69 I = 14 > 10.13
I 83 – 76.33 I = 6.67 < 11.83
I 69 – 76.33 I = 7.33 < 12.22

Laboratorio 60
Una empresa trata de seleccionar un sistema de computación integrado y
debe decidir entre tres modelos que están a prueba. La selección final
dependerá de la productividad de los sistemas. Se seleccionan
aleatoriamente cinco operadores para manejar cada sistema. El nivel de
experiencia que tienen los empleados en el manejo de computadoras puede
afectar el resultado de la prueba. A continuación se da la producción en
unidades por hora para los tres sistemas. Haga prueba de hipótesis a un
nivel de significancia de 5% para determinar si existe alguna diferencia en la
producción promedio de los tres sistemas. Haga prueba DMS donde se
rechaza Ho.

TRATAMIENTOS
Operario Sistema 1 Sistema 2 Sistema 3 Media
1 23 28 35
2 38 36 32

97
3 40 39 43
4 34 32 37
Media

ESTADÍSTICA NO PARAMÉTRICA
Para hacer las pruebas paramétricas es necesario hacer suposiciones
restrictivas sobre las poblaciones de las que se extraen las muestras. Por
ejemplo que las muestras eran grandes o que provenían de poblaciones
normalmente distribuidas. Pero las poblaciones no son siempre normales.
En estadística se han desarrollado técnicas útiles que no requieren de
suposiciones restrictivas respecto a la forma de las distribuciones de las
poblaciones. Estas pruebas se conocen con el nombre de pruebas sin
distribución, o más comúnmente, pruebas no paramétricas.

Ventajas de los métodos no paramétricos


1. No requieren del supuesto de que una población tiene distribución
normal u otra forma específica.
2. Generalmente son más fáciles de efectuar y comprender.
3. Requieren de cálculos menos laboriosos y complicados.
4. Algunas veces ni siquiera se requiere de ordenamiento o
clasificación formal.
5. Se utilizan en algunos estudios para hacer mediciones de aspectos
subjetivos como es la preferencia de los consumidores por un
producto dependiendo del color, el sabor, etc.

Desventajas de los métodos no paramétricos


1. Ignoran una cierta cantidad de información.
2. A menudo no son tan eficientes, ni precisos, como las pruebas
paramétricas.

PRUEBA DE SIGNO PARA DATOS PAREADOS


En esta prueba interesa el signo que resulta al comparar las observaciones
en parejas. No interesa su magnitud numérica.

Ejemplo
Se quiere determinar la eficiencia de las clases con catedráticos titulares o
con alumnos auxiliares. Se pide a una muestra de estudiantes que califique
la efectividad asignando un valor de 1 a 4, donde 4 es la calificación
excelente. Los resultados se dan a continuación. Haga prueba de hipótesis
a un nivel de significancia de 5%.

98
Cated 2 1 4 4 3 3 4 2 4 1 3 3 4 1 2
Auxil 3 2 2 3 4 2 2 1 3 1 3 1 2 1 3
Signo - - + + - + + + + 0 0 + + 0 -

En este problema se espera que el catedrático tenga la mejor calificación, de


manera que a la calificación del catedrático se resta la calificación del
auxiliar, estando interesados solamente en el signo.

Se cuenta la cantidad de signos positivos, negativos y la cantidad de ceros.

Número de signos + = 8
Número de signos - = 4
Número de ceros =3
TOTAL = 15

A la muestra de 15 se le resta el número de ceros, porque los ceros no


suministran información.

n = 15 – 3 = 12
Para calcular la proporción estimada p̂ se divide el número de signos
positivos entre el tamaño de muestra, n = 12

Estadístico de prueba, p̂ = x / n Donde x = número de signos


positivos.

Estadístico de prueba, p̂ = 8 / 12 = 0.6667

En la prueba de signo, la hipótesis nula Ho es siempre p = 0.50


porque en el largo plazo se espera igual cantidad de signos positivos y de
signos negativos.

Cuando np ≥ 5 se usa z para calcular los extremos superior e inferior del


intervalo de aceptación.

Intervalo de confianza, IC = p ± z σp
np = 12(0.5) = 6 > 5 por lo que se usa z para determinar el IC

p = 0.5 para hipótesis nula

99
En un problema de dos colas, para obtener Z el nivel de confianza se divide
por 2 y el resultado se busca en tabla.
0.95 / 2 = 0.475 → z = 1.96
Error estándar de estimación, σp = (pq / n)1/2

σp = [(0.50)(0.50) / 12] 1/2 = 0.14

IC = 0.50 ± 1.96(0.14) = 0.50 ± 0.28 = [ 0.22 , 0.78 ]

Prueba de hipótesis
1. Ho: p = 0.50 Los estudiantes no perciben diferencia significativa en la
eficiencia de la clase impartida por el catedrático titular y el alumno
auxiliar.

2. H1: p ≠ 0.50 Los estudiantes perciben diferencia en la eficiencia de las


clases impartidas por el catedrático titular y el alumno auxiliar.

3. Estadístico de prueba es p̂ = 0.67

4. IC = [ 0.22 , 0.78 ]

5. Se acepta Ho porque el estadístico de prueba p̂ = 0.67 está dentro


del IC.

6. Conclusión: Los estudiantes no perciben diferencias significativas entre


la eficiencia de las clases con el catedrático titular y el alumno auxiliar.

Laboratorio 61
Los siguientes datos muestran las unidades defectuosas producidas por los
empleados antes y después de un cambio en el plan de incentivos de
sueldos. Haga prueba de hipótesis a un nivel de significancia de 10% para
determinar si el cambio disminuyó la cantidad de unidades defectuosas
producidas. Aplique prueba de signo. ¿Debe mantenerse el plan de
incentivos?

Este problema es de cola izquierda, por lo que la región de rechazo está a la


izquierda.

Antes 8 7 6 9 7 10 8 6 5 8 10 8
Después 6 5 8 6 9 8 10 7 5 6 9 5
+ + - + - + - - 0 + + +

100
En este problema se espera que después, la cantidad de unidades
defectuosas sea menor. Por lo que a la cantidad de unidades defectuosas
antes se debe restar la cantidad de unidades defectuosas después, tomando
en cuenta que sólo interesa el signo.

Número de signos + = 7
Número de signos negativos = 4
Número de ceros = 1

n = 12 – 1 = 11

Estadístico de prueba: p̂ = 7 / 11 = 0.6364

σp = [(0.50)(0.50) / 11] 1/2 = 0.1508

np = 11(0.50) = 5.5 > 5 por lo que se usa z para determinar el IC

Extremo inferior = 0.50 - 1.28(0.15) = 0.50 - 0.19 = 0.31

IC = [0.31 , 1 ]

Prueba de hipótesis
1.Ho: p = 0.50 La proporción de unidades defectuosas antes y
después del plan de incentivos, son iguales.

2 H1: p < 0.50 La proporción de unidades defectuosas después


del plan de incentivos es menor que 0.5

3 Estadístico de prueba es p̂
= 0.64
Este problema es de una cola, (cola izquierda, significa que la
región de rechazo está a la izquierda de 0.31).

4 IC = [ 0.31 , 1 ]

5 Se acepta Ho porque el estadístico de prueba p̂ = 0.64 está


dentro del IC.

6. Conclusión: La proporción de unidades defectuosas antes y


después, son iguales, por lo que no se debe aplicar el incentivo
salarial.

101
PRUEBA DE SUMA DE RANGOS,
PRUEBA DE KRUSKAL – WALLIS
La prueba Kruskal--Wallis se aplica cuando se tienen tres
o más poblaciones.

Ejemplo
Se quiere probar a un nivel de significancia de 10% la hipótesis de que las
calificaciones medias del examen escrito de los estudiantes con tres
métodos de estudio son iguales. Los datos se dan a continuación.
Aplique la prueba K de Kruskal-Wallis

Video 74 88 82 93 55 70 80 83
Audio 78 80 65 57 89 83
Magistral 68 83 50 91 84 77 94 81 92

Estadístico de prueba
K = (12 / n(n + 1)) ∑ RI2 / nj - 3(n + 1)
Donde
n = Total de elementos muestrales.
nj = Cantidad de elementos en cada grupo muestral (audio, video, magistral).
Rj = Suma de rangos de cada categoría (audio, video, magistral)

Rango Calificación Categoría


1 50 M
2 55 V
3 57 A
4 65 A
5 68 M
6 70 V
7 74 V
8 77 M
9 78 A
10.5 80 V
10.5 80 A
12 81 M
13 82 V
15 83 A
15 83 V
15 83 M
17 84 M
18 88 V
19 89 A
20 91 M

102
21 92 M
22 93 V
23 94 M

Cuando se tienen calificaciones iguales o datos iguales, se asigna a cada


categoría el promedio de los rangos que corresponden a los datos repetidos.
El promedio se debe hacer aunque los datos se repitan para una misma
categoría.

Suma de rangos:
R1 = RM = 122

R2 = RV = 93.5

R3 = RA = 60.5

Estadístico de prueba K = 0.97

La distribución de muestreo de la estadística K puede aproximarse con una


distribución X2 (Chi cuadrado) cuando el tamaño de todas las muestras son
mayores o iguales que 5.

Prueba de hipótesis
1. Ho: La media de las calificaciones con los tres métodos de estudio
son iguales.
2. H1: La media de las calificaciones con los tres métodos de estudio
no son iguales.
3. Estadístico de prueba K = 0.97
4. K crítico = X2 crítico = 4.6052
Con gl = k – 1 = 3 – 1 = 2 y α = 0.10
5. Se acepta Ho porque el estadístico de prueba K = 0.97 cae en región de
aceptación.
6. Conclusión. La media de las calificaciones con los tres métodos de
estudio son iguales.

Laboratorio 62
En una tienda, los pagos realizados en un día con tarjetas de crédito, cheque
y efectivo, se dan en la siguiente tabla. Haga prueba de hipótesis a un nivel
de confianza de 95% para determinar si existe diferencia en la media de
pagos con las diferentes modalidades. Aplique prueba K.

Tarjeta 78 64 75 45 82 69 60 86 92
Cheque 100 70 61 53 75 64 61
Efectivo 90 86 61 82 65 70

103
Rango Pagos Categoría
1 45 T
2 53 Ch
3 60 T
5 61 Ch
5 61 Ch
5 61 E
7.5 64 T
7.5 64 Ch
9 65 E
10 69 T
11.5 70 Ch
11.5 70 E
13.5 75 T
13.5 75 Ch
15 78 T
16.5 82 T
16.5 82 E
18.5 86 T
18.5 86 E
20 90 E
21 92 T
22 100 Ch

Suma de rangos:
R1 = RT = 106
R2 = RCh = 66.5
R3 = RE = 80.5

Estadístico de prueba K = 1.20

Prueba de hipótesis
1. Ho: La media de pagos con las tres modalidades son iguales.
2. H1: La media de pagos con las tres modalidades no son iguales.
3. Estadístico de prueba K = 1.20
4. K crítico = X2 crítico = 5.991
Con gl = k – 1 = 3 – 1 = 2 y α = 0.05
5. Se acepta Ho porque el estadístico de prueba cae en región de aceptación
6. Conclusión. La media de pagos con las tres modalidades son iguales.

PRUEBA DE SUMA DE RANGOS


PRUEBA U DE MANN – WHITNEY
Esta prueba se aplica cuando se tienen dos poblaciones.

104
El estadístico de prueba es U
U = n1n2 + [n1 (n1 + 1) / 2] – R1
O

U = n1n2 + [n2 (n2 + 1) / 2] – R2


n1 = Cantidad de elementos en la muestra 1
n2 = Cantidad de elementos en la muestra 2

R1 = Suma de rangos de la categoría 1


R2 = Suma de rangos de la categoría 2

Ejemplo
Se quiere determinar si las utilidades mensuales (en miles de quetzales)
de las empresas A y B, durante un año son iguales. Haga prueba de
hipótesis a un nivel de significancia de 5%. Aplique prueba U.

A 90 110 85 95 125 95 105 125 140 89 60 120


B 100 95 80 120 110 90 114 89 105 100 155 110

Rango Utilidades Categoría


(empresa)
1 60 A
2 80 B
3 85 A
4.5 89 A
4.5 89 B
6.5 90 A
6.5 90 B
9 95 A
9 95 B
9 95 A
11.5 100 B
11.5 100 B
13.5 105 A
13.5 105 B
16 110 A
16 110 B
16 110 B
18 114 B
19.5 120 B
19.5 120 A

105
21.5 125 A
21.5 125 A
23 140 A
24 155 B

Suma de rangos
R1 = RA = 148
R2 = RB = 152

Estadístico de prueba es U1 = 74

La distribución de muestreo de la estadística U puede aproximarse


mediante la distribución Normal cuando n1 y n2 son mayores que 10.

Media de la estadística U,
μU = n1n2 / 2 = 72
Error estándar de la estadística U,
σU = [ n1n2(n1 + n2 +1) / 12 ]1/2 =
Intervalo de confianza, IC = μU ± z σU
IC = [ 38.05 , 105.95 ]

Prueba de hipótesis
1. Ho: El promedio de las utilidades mensuales de las
empresas A y B son iguales.
2. H1: El promedio de las utilidades mensuales de las
empresas A y B no son iguales.
3. Estadístico de prueba, U = 74
4. IC = [ 38.05, 105.95 ]
5. Se acepta Ho porque el estadístico de prueba
U = 74 está dentro del IC.
6. Conclusión. El promedio de las utilidades mensuales
de las empresas A y B son iguales.

PRUEBA DE CORRELACIÓN DE RANGOS DE


SPEARMAN.

106
Esta prueba mide el grado de asociación entre dos
variables.
El estadístico de prueba es el coeficiente de correlación de
rango rs.
Si rs = 1 existe correlación directa perfecta entre las dos
variables.
Si rs = - 1 existe correlación inversa perfecta entre las dos
variables.

Ejemplo
La Organización Mundial de la Salud (OMS), ha hecho
mediciones de la calidad del aire y la evidencia de
enfermedades pulmonares en 11 ciudades importantes del
mundo. Los datos se dan en la siguiente tabla. Haga
prueba de hipótesis a un nivel de confianza de 95% para
determinar si existe correlación entre estas variables.

Ciudad A B C D E F G H I J K
Rango de calidad 4 7 9 1 2 10 3 5 6 8 11
del aire
Rango de 5 4 7 3 1 11 2 10 8 6 9
enfermedad
pulmonar
2 1 9 4 4 1 1 1 25 4 4 4
d
∑d2 = 58

Estadístico de prueba rs

rs = 1 – [6∑d2 / n(n+1)(n-1)]

n = Número de ciudades evaluadas.


rs = 1 – [6(58) / 11(12)(10)] = 1 – 0.26
107
rs = 0.74
Prueba de hipótesis
1. Ho: No existe correlación entre la calidad del aire y las
enfermedades pulmonares.
2. H1: Existe correlación entre la calidad del aire y las
enfermedades pulmonares.
3. Estadístico de prueba rs = 0.74
4. IC = [ - 0.618 , 0.618] donde 0.618 se obtiene en tabla de
Spearman con alfa 0.05 , “n”=11 y dos colas.
5. Se rechaza Ho y se acepta H1 porque el estadístico de prueba
rs = 0.74 cae fuera del intervalo de confianza.
6. Conclusión. Existe correlación entre la calidad del aire y las
enfermedades pulmonares, es decir, que a mayor contaminación
del aire más enfermedades pulmonares.

Laboratorio 63
Un investigador social quiere determinar si personas inteligentes
tienden a elegir personas inteligentes para casarse. Haga prueba de
hipótesis a un nivel de significancia de 0.01. Los datos se dan a
continuación.

Pareja IQ del IQ de la
esposo esposa
1 95 95
2 103 98
3 111 110
4 92 88
5 150 106
6 107 109
7 90 96
8 108 131
9 100 112
10 93 95
11 119 112
12 115 117
13 87 94
14 105 109

108
15 135 114

Rango IQ Sexo
1 87 H
2 88 M
3 90 H
4 92 H
5 93 H
6 94 M
8 95 H
8 95 M
8 95 M
10 96 M
11 98 M
12 100 H
13 103 H
14 105 H
15 106 M
16 107 H
17 108 H
18.5 109 M
18.5 109 M
20 110 M
21 111 H
22.5 112 M
22.5 112 M
24 114 M
25 115 H
26 117 M
27 119 H
28 131 M
29 135 H
30 150 H

Rango Rango
del de la d2
esposo esposa
1 2 1
3 6 9
4 8 16
5 8 9
8 10 4

109
12 11 1
13 15 4
14 18.5 20.25
16 18.5 6.25
17 20 9
21 22.5 2.25
25 22.5 6.25
27 24 9
29 26 9
30 28 4
∑ = 110

rs = 0.80
n = 15 parejas
Prueba de hipótesis

1) Ho: No existe correlación entre los IQ de los esposos.


2) H1: Existe correlación entre los IQ de los esposos.
3) Estadístico de prueba rs = 0.80
4) IC = [ - 0.654, 0.654] donde 0.654 se obtiene en tabla de
Spearman con “n”=15 y 0.01 de nivel de significancia y dos colas.
5) Se rechaza Ho y se acepta H1 porque el estadístico de prueba rs = 0.80 cae
fuera del IC.
6) Conclusión: Existe correlación entre los IQ de los esposos, es decir, que
personas inteligentes buscan personas inteligentes para casarse.

PRUEBA K – S DE KOLMOGOROV – SMIRNOV


Es una prueba de bondad de ajuste que se utiliza para probar si existe diferencia
significativa entre una distribución de frecuencia observada y otra de frecuencia
teórica.

Ejemplo:
Una empresa telefónica lleva un registro de uso diario de celulares. El gerente
piensa que el uso de celulares sigue una distribución de Poisson con una media de

110
8.5 por hora. Haga prueba de hipótesis utilizando K – S a un nivel de confianza de
99%. Los datos se dan a continuación.

Uso fo
X
0 0
1 5
2 14
3 24
4 57
5 111
6 197
7 278
8 378
9 418
10 461
11 433
12 413
13 358
14 219
15 145
16 109
17 57
18 43
19 16
20 7
21 8
22 3
n =3,754

fo relativa fo relativa Probabilidad Probab. I fo, relativa


acumulada acumulada acumulada - prob.
fe Acumul I
0 0.00 P(x=0)= 0.0002 0.0002 0.0002
0.0013 0.0013 P(x=1)= 0.0017 0.0019 0.0006
0.0037 0.0050 0.0074 0.0093 0.0043
0.0064 0.0114 0.0208 0.0301 0.0187
0.0152 0.0266 0.0443 0.0744 0.0478
0.0296 0.0562 0.0752 0.1496 0.0934
0.0525 0.1087 0.1066 0.2562 0.1475
0.0741 0.1828 0.1294 0.3856 0.2028
0.1007 0.2835 0.1375 0.5231 0.2396
0.1113 0.3948 0.1299 0.6530 0.2582

111
0.1228 0.5176 0.1104 0.7634 0.2458
0.1153 0.6329 0.0853 0.8487 0.2157
0.1100 0.7429 0.0604 0.9091 0.1661
0.0954 0.8383 0.0395 0.9486 0.1103
0.0583 0.8966 0.0239 0.9726 0.0759
0.0386 0.9352 0.0136 0.9862 0.0509
0.0290 0.9642 0.0072 0.9934 0.0291
0.0152 0.9794 0.0036 0.9970 0.0175
0.0115 0.9909 0.0017 0.9987 0.0078
0.0043 0.9952 0.0008 0.9995 0.0043
0.0019 0.9971 0.0003 0.9998 0.0027
0.0021 0.9992 0.0001 0.9999 0.0007
0.0008 1.0000 0.0001 1 0

Estadístico de prueba K – S = Máxima diferencia del


valor absoluto.
En este caso, el estadístico de prueba K – S = 0.2582
para x = 9
La gràfica de la prueba K – S es siempre de cola
derecha.
Los valores críticos se obtienen en tabla de bondad de
ajuste para prueba K – S.

Prueba de hipótesis
1) Ho: El uso de celulares se ajusta a una distribución
de Poisson con media de 8.5 por hora
2) H1: El uso de celulares No se ajusta a una
distribución de Poisson con media de 8.5 por hora.
3) Estadístico de prueba K-S = 0.2582
4) Estadístico K-S crítico (para n > 50 y α = 0.01 ) =
0.025 Buscar test de Kolmogrov-Sminov sobre
bondad de ajuste tabla PDF.
K-S crítico = 1.63/ n1/2 = 1.63 / (3754)1/2 = 0.0266.
5) Se rechaza Ho y se acepta H1 porque el estadìstico
de prueba cae en región de rechazo.
112
6) Conclusión: El uso de celulares No se ajusta a una
distribución de Poisson con media de 8.5 por hora.

PRUEBA DE BOWMAN – SHELDON


Para determinar si los datos muestrales
provienen de una distribución Normal.

Estadístico de prueba es B
B=n[(Coeficiente de asimetría)2 /6 +
(Curtosis – 3)2 /24 ]

Ejemplo
Determinar si los siguientes datos
muestrales fueron obtenidos de una
población normal: 78, 65, 72, 90, 84,
70, 68, 52, 95, 90, 75, 80, 85, 70,
60, 75, 68, 85, 70, 100. Haga prueba
de hipótesis a un nivel de confianza de
95%. Aplique prueba de Bowman -
Sheldon
Coeficiente de asimetría de Fisher=
0.07373
Curtosis = - 0.25592
113
Estadístico de prueba B
= 20[(0.0 7373)2 / 6 + ( - 0.25592 - 3)2 / 24 ] =

Estadístico de prueba B = 20[(0.00091 +


0.44171) = 8.85
B = 8.85

Prueba de hipótesis
1) Ho: Los datos muestrales provienen
de una población normal
2) H1: Los datos muestrales no
provienen de una población con
distribución normal
3) Estadístico de prueba B = 8.85
4) Estadístico crítico, Bcrítico = 3.26.
Este dato se obtiene en tabla de
datos estadísticos de Bowman–
Sheldon con n = 20 y alfa = 0.05
5) Se rechaza Ho y se acepta H1
porque el estadìstico de prueba B =
8.85 cae en región de rechazo.

114
6) Conclusión: Los datos muestrales no
provienen de una población con
distribución normal

Tabla de datos estadísticos de


Bowman – Sheldon.

Tamaño de α = 0.10 α = 0.05


Muestra, n
20 2.13 3.26
30 2.49 3.71
40 2.70 3.99
50 2.90 4.26
75 3.09 4.27
100 3.14 4.29
125 3.31 4.34
150 3.43 4.39

Laboratorio
Aplique prueba de Bowman– Sheldon
a un nivel de significancia de 10%
para determinar si los datos dados a
continuación fueron tomados de una
115
población con distribución Normal:
68, 58, 98, 62, 65, 72, 68, 93, 89, 63,
84, 70, 65, 69, 80, 75, 82, 90, 65,
72, 90, 100, 68, 56, 95, 70, 65, 71,
80, 75.

n = 30
Coeficiente de asimetría = 0.55984
Curtosis = - 0.7379
Estadístico de prueba B = 19.03
Estadístico crítico= 2.49

Prueba de hipótesis
1) Ho: Los datos muestrales
provienen de una población con
distribución normal.
2) H1: Los datos muestrales no
provienen de una población con
distribución normal
3. Estadístico de prueba B = 19.03
4. Estadístico crítico = 2.49. Este dato
se obtiene en tabla de datos

116
estadísticos de Bowman – Sheldon
con n = 30 y alfa = 0.10
5. Se rechaza Ho y se acepta H1
porque el estadístico de prueba B =
19.03 cae en región de rechazo.
6. Conclusión: Los datos muestrales no
provienen de una población normal.

PRUEBA DE RACHAS
La prueba de rachas se utiliza para
probar si una sucesión de puntos arriba
(A) y debajo (B), de la media de un
proceso es o no aleatorio.

Una racha es una subsucesión de


elementos iguales. En la sucesión A, A,
A,/ B,/ A,/ B, B,/ A se tienen 5 rachas.

Un número muy grande o muy pequeño


de rachas, puede ser indicador de una
sucesión no aleatoria o inaleatoria

Ejemplo
117
La sucesión de puntos por encima (A) y
debajo (B) de la media de un proceso se
da a continuación: A, B, B, A, A, B, A, A,
A, B, A, B, A, B, B. A un nivel de
significancia de 0.05%, determine si la
sucesión es o no aleatoria.

El estadístico de prueba es el número de


rachas, r =10

n1 = 8 letras A y n2 =7 letras B.

Nota: Cuando n1 y n2 son menores


que 10 se determina un intervalo de
confianza con tabla de rachas.

En tabla de rachas, dos colas.


Para obtener los extremos del intervalo
de aceptación, se busca 7 en la fila
superior y 8 en la columna de la
izquierda, en la intersección se tiene el
par 4 – 12 que son los extremos r1 = 4 y
r2 = 12 del intervalo. El mismo resultado
118
se obtiene si se busca 8 en la fila y 7 en
la columna.

Prueba de hipótesis
1) Ho: La sucesión de letras A y B se
genera mediante un proceso
aleatorio.
2) H1: La sucesión de letras A y B se
genera mediante un proceso no
aleatorio.
3) Estadístico de prueba r = 10
rachas.
4) Intervalo de aceptación [4, 12]
5) Se acepta Ho porque el
estadístico de prueba r = 10 está
dentro del intervalo de aceptación.
6) Conclusión. La sucesión de letras
A y B se genera mediante un proceso
aleatorio.

Observación. Cuando n1 y n2 son


mayores o igual que 10, se utiliza la

119
distribución normal en la prueba de
rachas.

Ejemplo
A continuación se da la sucesión de
letras A y B en un proceso de control de
facturas incorrectas: B, A, A, B, B, B, A,
A, B, B, B, B, B, B, A, ,A, B, B, B, A, B,
A, B, B, B, B, A, A, B, B, B, A, B, A, B, B,
A, B, B, B. Haga prueba de hipótesis a
un nivel de confianza de 95% para
determinar si el proceso es o no
aleatorio.
n1 = 13 letras A n2 = 27 letras B

Estadístico de prueba es el número de


rachas r = 19

Se utiliza distribución normal porque n1 y


n2 son mayores que 10.

µr = [2n1n2 / (n1 + n2)] + 1

120
µr = [2(13)(27) / (13 + 27)] + 1

µr = 18.55

σr = [2n1n2(2n1n2 - n1 - n2) / (n1 + n2)2(n1


+ n2 – 1)]1/2

σr = 2.73

A dos colas y 95% de nivel de confianza,


Z = 1.96
IC = µr ± z σr = 18.55 ±1.96 (2.73) =
[13.2, 23.9]

Prueba de hipótesis
1. Ho: La sucesión de letras A y B es
generada por un proceso aleatorio.
2. H1: La sucesión de letras A y B No es
generada por un proceso aleatorio.
3. Estadístico de prueba r = 19 rachas.
4. IC = [13.2, 23.9]
5. Se acepta Ho porque el estadístico
de prueba r = 19 está dentro del IC.
121
6. Conclusión. La sucesión de letras A
y B es generada por un proceso
aleatorio.

Otra forma de hacer la prueba de


hipótesis
1. La sucesión de letras A y B es
generada por un proceso aleatorio.
2. La sucesión de letras A y B No es
generada por un proceso aleatorio.
3. Estadístico de prueba
z = (r - µr)/ σr = (19 – 18.55) / 2.73
= 0.16
4. Estadístico crítico a 2 colas y NC
de 95%, z crítico = ± 1.96
5. IC = [ - 1.96 , 1.96 ], se acepta Ho
porque el estadístico de prueba Z =
0.16 cae dentro del intervalo de
confianza.
6. Conclusión. La sucesión de letras
A y B es generada por un proceso
aleatorio.

122
Ejemplo.
A un nivel de confianza de 95%,
determinar si la siguiente sucesión de
pesos (en libras) es aleatoria: 154, 143,
160, 120, 180, 200, 130, 140, 160,
145, 126, 150, 148, 170, 110, 160,
190, 115, 100, 120, 142.

Peso promedio = 145.86 libras


Desviación estándar,S = 26.17 libras

Límite Superior de Control, LSC = 145.86


+ 1.96(26.17) = 197.15 libras

Límite Inferior de Control, LIC = 145.86 –


1.96(26.17) = 94.57 libras

123
Gráfico de Pesos
250

200

150

100

50

0
0 5 10 15 20 25

Sucesión: A, B, A, B, A, A, B, B, A, B, B, A, A, A, B, A,
A, B, B, B, B.

Estadístico de prueba, r = 12
n1 = 10 letras A
n2 = 11 letras B
µr = [2n1n2 / (n1 + n2)] + 1 = 11.48

σr = [2n1n2(2n1n2 - n1 - n2) / (n1 + n2)2(n1 + n2 – 1)]1/2

σr = 2.23
IC = µr ± z σr = [7.11, 15.85]

Prueba de hipótesis
124
1. Ho: La sucesión de letras A y B es generada por
un proceso aleatorio.
2. H1: La sucesión de letras A y B No es generada
por un proceso aleatorio.
3. Estadístico de prueba r = 12
4. IC = µr ± z σr = [7.11, 15.85]
5. Se acepta Ho porque el estadístico de prueba
r = 12 está dentro del intervalo de confianza.
6. Conclusión. La sucesión de letras A y B es
generada por un proceso aleatorio.

Prueba Fr, de Friedman para


diseños en bloques aleatorizados.
La prueba Fr de Friedman, fue propuesta por
el ganador del premio Nobel, el economista
Milton Friedman.

Ejemplo
Se quiere comparar las calificaciones de los
consumidores de seis diferentes anuncios
televisivos. Cuatro consumidores clasificaron
cada anuncio en una escala de 1 (malo) a 10
(excelente). El objetivo del experimento es
determinar si existen diferencias en los
niveles de calificación para los seis anuncios.
Los datos se presentan en la siguiente tabla.
Utilice la prueba Fr para determinar si los
125
datos presentan suficiente evidencia para
indicar diferencias en las calificaciones de los
seis anuncios televisivos. Haga prueba de
hipótesis a un nivel de significancia de 5%
Tabla de Calificaciones
ANUNCIOS
Sujeto/anuncio A B C D E F
1 5 8 7 6 4 5
2 6 10 6 7 4 4
3 8 10 9 9 6 7
4 4 6 7 5 3 5

Sujeto 1
Rango
Rango Calificación Anuncio
Modificado
1 4 E 1
2 5 A 2.5
3 5 F 2.5
4 6 D 4
5 7 C 5
6 8 B 6

Sujeto 2
Rango
Rango Calificaciones Anuncio
Modificado
1 4 E 1.5
2 4 F 1.5
3 6 A 3.5

126
4 6 C 3.5
5 7 D 5
6 10 B 6

Sujeto 3
Rango
Rango Calificaciones Categoría
Modificado
1 6 E 1
2 7 F 2
3 8 A 3
4 9 C 4.5
5 9 D 4.5
6 10 B 6

Sujeto 4
Rango
Rango Calificaciones Categoría
Modificado
1 3 E 1
2 4 A 2
3 5 D 3.5
4 5 F 3.5
5 6 B 5
6 7 C 6

Tabla de rangos para tratamientos (anuncios)


Consumidor/anuncio A B C D E F
Sujeto 1 2.5 6 5 4 1 2.5
Sujeto 2 3.5 6 3.5 5 1.5 1.5
Sujeto 3 3 6 4.5 4.5 1 2
127
Sujeto 4 2 5 6 3.5 1 3.5
Suma de Rangos 11 23 19 17 4.5 9.5

Estadístico de prueba
Fr = {12 / bk(k+1)} ∑ Ri2 – 3b(k+1)

b = Bloques = 4
K = Tratamientos = 6
Ri = Total de rangos de cada categoría (de cada
anuncio)

Fr = {12/4(6)(7)} *(112 + 232 +192 + 172 + 4.52 +


9.52 ) – 3(4)(7) = 16.75

Estadístico de prueba Fr = 16.75

Prueba de hipótesis
1. Ho: Las medias de calificaciones de los seis
anuncios son iguales.
2. H1: Las medias de calificaciones de los seis
anuncios no son iguales.
3. Estadístico de prueba Fr = 16.75
4. Fr crítico = X2 crítico = 11.07 con alfa = 0.05 y
gl = k -1 = 6 – 1 = 5
5. Se rechaza Ho y se acepta H1 porque el
estadìstico de prueba cae en región de rechazo.
6. Conclusión Las calificaciones de los seis
anuncios no son iguales.

Laboratorio
128
A continuación se dan las calificaciones para tres
tratamientos T1, T2 y T3. Haga prueba de Friedman a
un nivel de confianza de 90% para determinar si existe
diferencia en los valores de los tratamientos.
T1 T2 T3
B1 3.2 3.1 2.4
B2 2.8 3.0 1.7
B3 4.5 5.0 3.9
B4 2.5 2.7 2.6
B5 3.7 4.1 3.5

Para B1
Rango Calificación Categoría
1 2.4 T3
2 3.1 T2
3 3.2 T1

Para B2
Rango Calificación Categoría
1 1.7 T3
2 2.8 T1
3 3. T2

Para B3
Rango Calificación Categoría
129
1 3.9 T3
2 4.5 T1
3 5 T2

Para B4
Rango Calificación Categoría
1 2.5 T1
2 2.6 T3
3 2.7 T2

Para B5
Rango Calificación Categoría
1 3.5 T3
2 3.7 T1
3 4.1 T2

Tabla de rangos
T1 T2 T3
B1 3 2 1
B2 2 3 1
B3 2 3 1
B4 1 3 2

130
B5 2 3 1
Suma de 10 14 6
rangos

Estadístico de prueba
Fr = {12/bk(k+1)} ∑ Ri2 – 3b(k+1)

Estadístico de prueba Fr = 6.4

Prueba de hipótesis
1) Ho: Las medias de calificaciones de los tres
tratamientos son iguales.

2) H1: Las medias de calificaciones de los tres


tratamientos no son iguales.

3) Estadístico de prueba Fr = 6.4

4) Fr crítico = X2 crítico = 4.61 con alfa = 0.10 y


gl = k -1 = 3 – 1 = 2

5) Se rechaza Ho y se acepta H1 porque el


estadìstico de prueba Fr = 6.4 cae en región de
rechazo.

6) Conclusión Las calificaciones de los tres


tratamientos no son iguales.
131
7)

132

Potrebbero piacerti anche