Sei sulla pagina 1di 17

DISEÑO Y ANÁLISIS DE EXPERIMENTOS

CAPÍTULO 01

CAPITULO 01
Nociones de Inferencia Estadística
Introducción
El desarrollo de nuevas tecnologías de cualquier tipo, surge del proceso de investigación. De aquí la
importancia de los diseños experimentales en la generación de información confiable.

El diseño estadístico de experimentos se refiere al proceso para planear el experimento de tal forma que se
colecten datos pertinentes, que puedan analizarse mediante métodos estadísticos que lleven a conclusiones
confiables, válidas y objetivas. Cuando el problema incluye datos que están sujetos a errores experimentales,
la metodología estadística es el único enfoque objetivo de análisis. Por lo tanto, cualquier experimento
incluye dos aspectos: El diseño del experimento y el análisis estadístico de los datos.

Es común que durante el proceso de investigación se utilicen diseños experimentales no adecuados, es decir
que no responden al objetivo de la investigación y por lo tanto, su análisis estadístico también será
equivocado, por lo que se llegan a conclusiones erradas; cuando esto ocurre la investigación no tiene ninguna
validez.

En 1990 David Moore escribió: Los principales elementos del pensamiento estadístico son:

 La comprensión de la variación el proceso.


 La necesidad de datos acerca del proceso
 El diseño de producción de datos con variación en importancia
 La cuantificación de la variación
 La explicación de la variación.

La mayor parte de las investigaciones se enfocan a evaluar la relación entre un conjunto de variables. Sin
embargo, el investigador debe considerar que los resultados de un análisis son producto de un proceso previo
de exploración y de búsqueda constante de las causas que generan la variabilidad en las variables bajo
estudio. Existen métodos estadísticos que permiten el análisis estadístico de este tipo de relaciones.

Existen tres tipos de Investigación:

1
INSTRUCTOR: DR. RAÚL HERNÁNDEZ MOLINAR
DISEÑO Y ANÁLISIS DE EXPERIMENTOS

CAPÍTULO 01

a) Experimental. Las unidades experimentales son asignadas en forma tal que es posible asociar los
niveles (tratamientos) de las variables predictoras.
b) Quasi-experimental. Las unidades experimentales asignadas a condiciones de tratamientos sin un
proceso de aleatorización.
c) Observacional. Las observaciones se realizan sin un proceso controlado por aleatorización, o alguna
manipulación artificial.

Clasificación de Variables
Las variables pueden clasificarse de diferentes formas. La clasificación es útil para determinar cuál es el mejor
método para llevar a cabo el análisis de datos. Una manera de clasificar las variables es la siguiente:

a) Variables con cierto nivel de separación


b) Variables descriptivas
c) Variables con niveles de medición

Variables con cierto nivel de separación.


En este tipo de variables existe un “gap” (una distancia, una brecha) entre los valores observados de manera
sucesiva: Si existe una separación (gap) entre las observaciones, se dice que la variable es discreta; si no existe
la separación (gap) entre ellas, la variable es continua. En ocasiones las variables continuas son representadas
como variables discretas cuando se agrupan en tablas de frecuencias. En otras ocasiones las variables
discretas son analizadas como variables continuas cuando los posibles valores se pueden representar en
intervalos razonables.

No hay “Gaps”

Gaps
VALORES DE UNA VARIABLE DISCRETA VALORES DE UNA VARIABLE CONTINUA

Variables Descriptivas
Son variables que describen o son descritas por otras variables. Esta clasificación depende de los objetivos
del estudio, más que de la estructura matemática de la misma variable. Si la variable bajo estudio se describe
con base en otras variables, se denomina variable respuesta o variable dependiente. Si la variable debe ser
empleada conjuntamente con otras variables para describir una variable respuesta determinada, se
denomina variable independiente o variable predictora. Otras variables pueden afectar las relaciones pero
2
INSTRUCTOR: DR. RAÚL HERNÁNDEZ MOLINAR
DISEÑO Y ANÁLISIS DE EXPERIMENTOS

CAPÍTULO 01

no se tiene un interés particular para el estudio en particular. Estas variables se refieren a variables de control
de ruido, y en otros contextos se llaman covariables o variables de confusión (cofounders)

Variables con Niveles de Medición


Este tipo de variables se asocian con el nivel de precisión del sistema de medición de la variable. Se utilizan
tres niveles: Nominal, Ordinal, Intervalo.

El nivel de medición más débil desde un enfoque numérico es el Nominal. En este nivel, los valores que se
supone deben ser asignados a la variable indican simplemente diferentes categorías. La variable GÉNERO, por
ejemplo es Nominal y se asocia un 0 o un 1 para denotar que es masculino o femenino, respectivamente; es
decir la variable se define con base en dos categorías. Una variable que describe diferentes niveles de
concentración se define como Nominal porque es posible determinar los valores del nivel de concentración
de una pintura, pero cual no puede ser asociado a una escala de medición o algún criterio bien definido.

Un nivel más alto de medición es el Ordinal, que permite agrupar y ordenar con base en categorías o criterios
bien definidos. Esto es muy común cuando podemos clasificar las variables, por ejemplo, grupos de edades,
nivel socioeconómico, etcétera. Es posible definir los niveles de la variable dependiendo, por ejemplo: MUY
ALTO, ALTO, BAJO, MUY BAJO, o bien de acuerdo a un criterio establecido por el grupo de investigación. Hay
que considerar que esta variable no tiene un alto grado de precisión, porque no es posible conocer con
detalle el valor real de la variable bajo estudio. Por ejemplo, no es posible establecer con precisión el nivel
social de una persona en una comunidad.

Las variables de Intervalo permiten establecer una medición significativa de la distancia entre categorías.
Para ser variables de Intervalo se deben expresar en términos de algún estándar muy bien definido, el cual
debe ser aceptado como una unidad física de medición que pueda ser interpretada. Por ejemplo, ALTURA,
PESO, PRESIÓN, NÚMERO DE DEFECTOS, TEMPERATURA, EDAD.

Las variables de Intervalo cuya escala inicia en un cero de referencia se denominan variables de Razón (ratio)
o variable de escala de razón (ratio). Por ejemplo, una variable de escala de razón es la ALTURA de una
persona, la temperatura, presión sanguínea.

Se debe tener mucho cuidado en la clasificación de las variables porque en ocasiones se pueden confundir
entre ellas. El grupo de investigación debe establecer correctamente el tipo de variables antes de iniciar el
estudio.

Se debe considerar que estos esquemas de clasificación de variables pueden usarse simultáneamente de tal
manera que cualquier variable puede ser identificada en cualquiera de los tres esquemas descritos. Por

3
INSTRUCTOR: DR. RAÚL HERNÁNDEZ MOLINAR
DISEÑO Y ANÁLISIS DE EXPERIMENTOS

CAPÍTULO 01

ejemplo, la variable Clase Social puede ser clasificada como ordinal, discreta e independiente en un estudio.
La variable Presión puede ser considerada variable de intervalo, continua y dependiente.

Inferencia Estadística
Estadística Descriptiva
Es importante revisar los fundamentos estadísticos necesarios para aplicar técnicas más sofisticadas.

El análisis de datos surge cuando deseamos conocer el comportamiento de una Población, la cual se define
con base en la identificación de la variable aleatoria bajo estudio. La Población se refiere al conjunto de
observaciones que son de interés en la investigación. Una Muestra es un subconjunto de observaciones
seleccionadas a partir de la población. Es conveniente, para poder justificar formalmente los resultados
obtenidos, que estas muestras cumplan con las propiedades inherentes al muestreo estadístico: Validez,
Confiablidad y Representatividad. En general, se dice que cuando los datos se recolectan a partir de un
proceso aleatorio, éstos poseen estas tres propiedades.

En el proceso de investigación se debe tener mucho cuidado con el tipo de instrumentos utilizados; por lo
mismo, es importante considerar las características del sistema de medición. Los datos generados deberán
tener un Sesgo mínimo y una mínima Varianza.

Los valores característicos obtenidos a partir de una Población se denominan Parámetros. Cualquier valor
característico obtenido a partir de una Muestra, es llamado Estadístico. Generalmente un Estadístico es
considerado un Estimador del Parámetro poblacional.

Una vez que los datos muestrales han sido obtenidos, es útil realizar un análisis previo, para explorar el
comportamiento, usando Tablas, Gráficas, y estadística descriptiva.

Se sugiere revisar el Anexo que contiene ecuaciones e información que puede ser de utilidad para revisar
conceptos relacionados con Inferencia Estadística.

4
INSTRUCTOR: DR. RAÚL HERNÁNDEZ MOLINAR
DISEÑO Y ANÁLISIS DE EXPERIMENTOS

CAPÍTULO 01

Distribución Normal y Teorema del Límite Central


La distribución Normal también se denomina Gaussiana y tiene dos parámetros  y , los cuales representan
los valores característicos de la Población bajo estudio. La función de distribución de probabilidad de una
variable aleatoria Gaussiana es la siguiente:

1 1
− (𝑥 − 𝜇)2
𝑓(𝑥) = 𝑒 2𝜎2
𝜎√2𝜋

Se representa de la siguiente forma: 𝑋 ~ 𝑁 (𝜇, 𝜎 2 ),

También es común identificar con un subíndice, la variable a la cual se está haciendo referencia, por
ejemplo: 𝑋 ~ 𝑁 (𝜇𝑋 , 𝜎𝑋2 ), 𝑝̂ ~ 𝑁 (𝜇𝑝̂ , 𝜎𝑝2̂ ), 𝑋̅ ~ 𝑁 (𝜇𝑋̅ , 𝜎𝑋2̅ ), La distribución Normal Estándar
tiene valores de  = 0 y 2 = 1, y se representa como 𝑍 ~ 𝑁 (0 , 1). Esta variable debe estandarizarse
empleando la transformación:

𝑋 − 𝜇
𝑍=
𝜎

De tal manera que siempre se tendrá una correspondencia en probabilidad con la variable X que ha sido
transformada:

𝑎− 𝜇 𝑏− 𝜇
𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = 𝑃 ( ≤ 𝑍 ≤ )
𝜎 𝜎

El Teorema del Límite Central permite justificar la distribución muestral de la variable bajo estudio, bajo el
supuesto de que 𝐸(𝑥̅ ) = 𝜇 y 𝑉(𝑥̅ ) = 𝜎 2 . La media muestral se asocia a una distribución normal en la
siguiente forma:
1 1
− (𝑥̅ − 𝜇)2
𝑓(𝑥̅ ) = 𝑒 2𝜎2
𝜎𝑥̅ √2𝜋

5
INSTRUCTOR: DR. RAÚL HERNÁNDEZ MOLINAR
DISEÑO Y ANÁLISIS DE EXPERIMENTOS

CAPÍTULO 01

La transformación correspondiente para estandarizar la media muestral es la siguiente:

𝑋̅ − 𝜇
𝑍=
𝜎𝑋̅

6
INSTRUCTOR: DR. RAÚL HERNÁNDEZ MOLINAR
DISEÑO Y ANÁLISIS DE EXPERIMENTOS

CAPÍTULO 01

Hipótesis Estadística
Una hipótesis es una aseveración que proporciona información relacionada con la población (variable
aleatoria) bajo estudio. En Estadística, se utiliza el (los) parámetro (parámetros) para identificar el
comportamiento de la población bajo investigación, asumiendo que la variable aleatoria tiene asociada una
función de distribución de probabilidad.

Se dice que una hipótesis representa una conjetura, una aseveración, una declaración acerca del
comportamiento de la población (variable aleatoria) que se desea analizar (investigar).

Sherlock Holmes : “Nosotros aprendemos por experiencia, y nuestro reto, en estos tiempos consiste
en que nunca debemos perder de vista las alternativas”.

Una hipótesis Alternativa representa el objetivo de la investigación. Una hipótesis Nula, “nulifica” el objetivo
de la investigación.

Si  representa un parámetro poblacional, el formato general de las hipótesis nula y alternativa cuando la
función de distribución corresponde a una Gaussiana, son:

H0 :    0 H0 :    0 H0 :    0
HA :    0 HA :    0 HA :    0

7
INSTRUCTOR: DR. RAÚL HERNÁNDEZ MOLINAR
DISEÑO Y ANÁLISIS DE EXPERIMENTOS

CAPÍTULO 01

Ejemplo 1. La resistencia a la presión interna de botellas de vidrio usadas para envasar bebidas gaseosas es
una característica de calidad importante. La empresa embotelladora desea saber si la resistencia media a la
presión excede de 175 psi. Por experiencia se sabe que la desviación estándar de la resistencia es de 10 psi.
El fabricante del vidrio envía lotes de estas botellas a la embotelladora, a la cual interesa probar la hipótesis

H0 :   175

H A :   175

Se selecciona una muestra aleatoria de 25 botellas, las cuales se colocan en una máquina de prueba que
incrementa la presión hidrostática en la botella hasta la ruptura. El promedio de la resistencia a la ruptura es
x  182 psi. Se utilizará un valor de   0.05 .

Ejemplo 2. Se utilizan dos tipos diferentes de máquinas para medir la resistencia a la tensión de una fibra
sintética. Se quiere determinar si las dos máquinas producen los mismos valores medios de dicha resistencia.
Se seleccionan al azar dos máquinas, ocho trozos o probetas de la fibra, y se mide su resistencia usando cada
máquina para cada trozo. Los datos codificados aparecen en la Tabla.

PROBETA MÁQUINA 1 MÁQUINA 2 DIFERENCIA

1 74 78 -2
2 76 79 -3
3 74 75 -1
4 69 66 3
5 58 63 -5
6 71 70 1
7 66 66 0
8 65 67 -2

Observar que en este caso, la variable aleatoria de interés, está representada por la diferencia entre cada una
de las observaciones en cada población, y que el criterio depende en gran medida del objetivo de la
investigación. La unidad experimental sigue siendo cada una de las probetas y lo que se desea analizar es el
comportamiento de cada una de las máquinas, utilizando la diferencia en las mediciones realizadas.

Ejemplo 3. En vista de la disminución de recursos energéticos, la Administración Nacional de Aeronáutica y


del Espacio (NASA) de los Estados Unidos se ha dado a la tarea de encontrar sitios en donde resulte factible
instalar molinos de viento en aquel país en donde resulte factible instalar molinos de viento para generar

8
INSTRUCTOR: DR. RAÚL HERNÁNDEZ MOLINAR
DISEÑO Y ANÁLISIS DE EXPERIMENTOS

CAPÍTULO 01

energía eléctrica. Oficiales de la NASA, han dicho que la velocidad del viento debe promediar al menos 15
millas por hora para que un sitio pueda considerarse aceptable.

Se hicieron 36 mediciones de la velocidad del viento a intervalos aleatorios en un sitio considerado para hacer
la instalación. La velocidad promedio del viento fue x  14.2 mph. Con desviación estándar de 3 mph.
¿Puede considerarse que el sitio no satisface los requerimientos de la NASA para la instalación de un
generador de energía a base de viento? Utilizar A)  0.10 B) =0.05, C) 0.01.

Notar que la hipótesis estadística queda planteada de la siguiente forma:

H0 :   15 : “LA VELOCIDAD PROMEDIO ES MAYOR O IGUAL A 15 mph”


El sitio satisface los requerimientos de la NASA
H A :   15 : “LA VELOCIDAD PROMEDIO ES MENOR QUE 15 mph”
El sitio NO satisface los requerimientos de la NASA

Análisis de los Errores Tipo I y Tipo II


Recordar que:
Error Tipo I: El rechazo incorrecto de la Hipótesis Nula
Error Tipo II: La aceptación incorrecta de la Hipótesis Nula

En el contexto de este problema:

Error Tipo I: Tomar la de decisión de decir que el sitio no satisface los requerimientos cuando en
realidad SI satisface los requerimientos.
Error Tipo II: Tomar la decisión de decir que el sitio SI satisface los requerimientos cuando en
realidad NO satisface los requerimientos.

La siguiente Tabla muestra los riesgos al decidir la aceptación el rechazo de la Hipótesis Nula.

9
INSTRUCTOR: DR. RAÚL HERNÁNDEZ MOLINAR
DISEÑO Y ANÁLISIS DE EXPERIMENTOS

CAPÍTULO 01

SITUACIÓN
REAL
DECISIÓN DEL H0 ES VERDADERA H0 ES FALSA
INVESTIGADOR

DECISIÓN CORRECTA DECISIÓN


ACEPTAR H0 INCORRECTA.
ERROR TIPO II

DECISIÓN INCORRECTA. DECISIÓN


RECHAZAR H0 ERROR TIPO I CORRECTA

Se observa que cuando se plantea una hipótesis estadística empleando un valor de  = 0.05,

P(Aceptar H0/ H0 es Verdadera) = 0.95 P(Rechazar H0/ H0 es Verdadera) = 0.05

P(Aceptar H0/ H0es Falsa) =  P(Rechazar H0/ H0 es Falsa) = 1- 

Se observa también que  es una función condicional, cuyo comportamiento depende de los valores del
verdadero valor de  en el dominio que pertenece a la región de rechazo.

REGIÓN DE ACEPTACIÓN DE H0 REGIÓN DE RECHAZO DE H0

P(Aceptar H0/H0 Verdadera) P(RechazarH0/H0 Falsa))



0 1
VALOR CRÍTICO

10
INSTRUCTOR: DR. RAÚL HERNÁNDEZ MOLINAR
DISEÑO Y ANÁLISIS DE EXPERIMENTOS

CAPÍTULO 01

EJERCICIOS INFERENCIA ESTADÍSTICA


1. Un fabricante de televisores afirma que su producto posee una vida media, sin defectos, de 3 años. Tres
familias en una comunidad, compraron el televisor y se observa que los tres equipos fallan antes de los tres
años, con tiempos hasta antes de la falla de 2.5, 1.9 y 2.9 años, respectivamente. ¿Presentan los datos
evidencia suficiente para contradecir la afirmación del fabricante? A) Realice la prueba con un nivel de
significancia de 0.05. b) Obtenga un intervalo de confianza de 90% para la vida media de los televisores.

2. Se realiza un experimento para comparar dos nuevos diseños de automóviles. Se seleccionaron veinte
personas al azar; se pidió a cada persona que calificara cada diseño en una escala de 1 (inadecuado) a 10
(excelente). Se utilizan las calificaciones resultantes para probar la hipótesis nula de que el nivel medio de
aceptación es el mismo para ambos diseños, contra la hipótesis nula de que se prefiere uno de los diseños
de los automóviles. ¿Satisfacen estos datos los supuestos necesarias para la prueba  de Student ? Explique.

3. Los datos en la tabla se refieren a los accidentes que provocan pérdida de tiempo (los números
proporcionados son las horas hombre perdidas mensualmente, durante un período de un año) antes y
después del realizar un programa de seguridad industrial. Se registraron los datos para seis plantas
industriales. ¿Proporcionan los datos evidencia suficiente para indicar que el programa de seguridad ha
reducido efectivamente el número de accidentes? (Use  = 0.01.)

Datos para los accidentes que provocan pérdida de tiempo:

DATOS REGISTRADOS NÚMERO DE PLANTA


1 2 3 4 5 6
ANTES DEL PROGRAMA 38 64 42 70 58 30
DESPUÉS DEL PROGRAMA 31 58 43 65 52 29

4. El límite de la EPA para la descarga permitida de sólidos en suspensión en ríos y arroyos, es de 60


miligramos por litro (mg/L) por día. Un estudio de muestras de agua, seleccionadas de la descarga de una
mina de fosfato, señala que para un largo período, la descarga media diaria de sólidos en suspensión es de
48 mg/L, pero las lecturas de la descarga son muy variables de un día a otro. Inspectores estatales midieron
las descargas de sólidos en suspensión para n= 20 días y encontraron que s2 = 39 (mg/L). Encuentre un
intervalo de confianza de 90% para 2. Interprete sus resultados.

11
INSTRUCTOR: DR. RAÚL HERNÁNDEZ MOLINAR
DISEÑO Y ANÁLISIS DE EXPERIMENTOS

CAPÍTULO 01

5. Un fabricante de motores eléctricos comparó la productividad de trabajadores de ensamblaje para dos


tipos de horarios semanales de trabajo de 40 horas: uno de cuatro días de 10 Horas (horario)

HORARIO
PARÁMETRO 1 2
MEDIA MUESTRAL 43.1 44.6
VARIANZA MUESTRAL 4.28 3.89

a) ¿Proporcionan los datos evidencia suficiente para indicar una diferencia en la productividad media
para los dos horarios de trabajo? Haga la prueba con  0.05.
b) Obtenga el valor del p-value, aproximado para la prueba e interpretar.
c) Encuentre un intervalo de confianza de 95% para la diferencia en la productividad media para los dos
horarios e interprete el intervalo.

6. Los datos se refieren a las comparaciones de los costos anuales de operación para las versiones
automáticas y manuales de cuatro marcas diferentes de automóviles. Si los datos representan una muestra
aleatoria de los costos comparativos del uso de automóviles, encuentre un intervalo de confianza de 90%
para la diferencia media en los costos de operación entre las versiones automáticas y manuales del mismo
tipo de automóvil. Pruebe la hipótesis con un nivel de confianza de 0.99.

COSTO ANUAL DE OPERACIÓN


MODELO DE AUTOMÓVIL AUTOMÓVIL MANUAL
FORD TEMPO $ 1520 $1440
PLYMOUTH RELIANT $ 1240 $1150
AMC ENCORE $ 1380 $1150
CHEVROLET CAVALIER $ 1150 $1100
7. Se registraron los precios al cierre de dos acciones comunes durante un período de 15 días. Las medias y
las desviaciones estándar son:
𝑋̅1 = 40.33 𝑋̅2 = 42.54
S1 = 1.54 S 2 = 2.96
¿Presentan estos datos evidencia suficiente para indicar una diferencia en variabilidad de los precios de cierre
de las dos acciones? Obtenga el valor del p-value, aproximado para la prueba. Interpretar su valor.

8. La concentración de colorante artificial no comestible en seis refrescos de cierta marca, dio los
registros siguientes: 0.010, 0.013, 0.018, 0.014, 0.015 y 0.013; si se supone que tales concentraciones se
distribuyen normalmente, determine a un nivel de significancia de 0.01 si la desviación estándar de la
concentración de colorantes artificiales en este tipo de refrescos es mayor .001.
12
INSTRUCTOR: DR. RAÚL HERNÁNDEZ MOLINAR
DISEÑO Y ANÁLISIS DE EXPERIMENTOS

CAPÍTULO 01

9. El Director General del Metro de la ciudad de México, afirma tener una varianza en los tiempos de
llegada de sus carros, a las distintas paradas, de no más de 5 min.; un diputado ordenó tomar los tiempos de
llegada en varias paradas para determinar si los conductores están cumpliendo con sus horarios. Si una
muestra de 52 llegadas produjo una varianza de 5.7 y se supone que los tiempos de llegada se distribuyen
normalmente, probar la hipótesis nula correspondiente. Use  = 0.01.

10. Suponga que una empresa llena envases de jugos en dos máquinas diferentes. Se toman muestras
de jugos llenados por ambas máquinas y se miden sus contenidos en litros, los resultados son:
PRIMERA MÁQUINA SEGUNDA MÁQUINA
n1 = 31 n2 = 21
s12 = 0.045 s22 = 0.080

a) ¿Existe evidencia suficiente que indique que 1

11. Una empresa empacadora de azúcar está considerando una máquina nueva para reemplazar su
máquina actual. Los pesos de una muestra de 21 paquetes de 5 libras empacados por la máquina antigua
producen una varianza de s12 = 0.16, mientras que los pesos de 20 paquetes de 5 libras empacados por la
máquina nueva dan una varianza de s22 = 0.09.

¿Aconsejaría usted al gerente considerar que la nueva máquina es superior a la antigua?

12. Una planta de producción tiene dos sistemas de fabricación demasiado complejos, uno de ellos dos
veces más antiguo que el otro. A ambos sistemas se les lubrica y se les da mantenimiento cada dos semanas.
Durante treinta días laborales, se registra el número de productos terminados y fabricados diariamente por
cada uno de los sistemas y se obtienen los siguientes resultados:

SISTEMA ANTIGUO SISTEMA ANTERIOR


𝑋̅1 = 246 𝑋̅2 = 240
s1 = 15.6 s2 = 28.2
¿Existe evidencia suficiente para concluir que la producción diaria justifica un mantenimiento más intensivo
para el sistema antiguo? Usar un nivel de significancia de 0.05

13
INSTRUCTOR: DR. RAÚL HERNÁNDEZ MOLINAR
DISEÑO Y ANÁLISIS DE EXPERIMENTOS

CAPÍTULO 01

EJERCICIOS: DISTRIBUCIÓN T DE STUDENT


1. Los camiones cargados de carbón que llegan a una fábrica se contratan para llevar 10 toneladas de
carbón por carga; una muestra de 15 cargas mostró una media = 9.5 toneladas y una desviación estándar =
0.9. Si se supone que la distribución de pesos es normal, lleve a cabo la correspondiente prueba de hipótesis
utilizando un nivel de significancia de 0.01.

2. Una fábrica de dulce usa una máquina automática para llenar bolsas con 5 libras, la máquina se
instaló inicialmente para despachar un promedio de 5 libras con una desviación estándar de 0.12 libras para
determinar si la máquina está fuera de ajuste, se pesó una muestra aleatoria de 35 bolsas y se encontró que
el peso promedio era de 4.9 libras. Use el nivel de significancia del 1% para determinar si la máquina necesita
un reajuste.

3. Se hizo un estudio para determinar si los recubrimientos interiores de los últimos modelos de
automóviles inhiben el desarrollo del moho. En una muestra aleatoria de 20 coches de fabricación reciente,
12 estaban recubiertos interiormente y 8 no. Después de un periodo de cuatro años de uso, se determinó la
cantidad de moho en pulgadas cuadradas para cada coche. Los resultados aparecen a continuación:

CON RECUBRIMIENTO INTERIOR SIN RECUBRIMIENTO INTERIOR


n1 = 12 n2 = 8
̅
𝑋1 = 30 𝑋̅2 = 38.5
S1 =4.9 S2 = 4.1
Suponer que las poblaciones son normales y que tienen varianzas iguales. Use  = 0.05 para determinar si el
promedio total de moho en los recubrimientos interiores resulta menor que el de los coches sin
recubrimiento, considere que no se tiene información relacionada con la varianza de la población.

4. El fertilizante tipo A se aplicó en seis parcelas, y el fertilizante tipo B en siete. Las cantidades
siguientes representan la producción de maíz, en fanegas, rendida por cada parcela:

Tipo A 50 59 50 58 48 44
Tipo B 57 50 60 51 63 49 55

Si la producción de maíz tiene una distribución Normal, ponga a prueba la hipótesis nula de que la producción
promedio es la misma con los distintos tipos de fertilizantes en contra de que es distinta.
¿Existe evidencia suficiente para afirmar que los tipos de fertilizantes son diferentes? Utilizar un nivel de
confianza del 99%.

14
INSTRUCTOR: DR. RAÚL HERNÁNDEZ MOLINAR
DISEÑO Y ANÁLISIS DE EXPERIMENTOS

CAPÍTULO 01

5. Se realizó un estudio sobre efectividad de un programa de seguridad industrial para reducir los
accidentes que se traducen en pérdida de tiempo. Los resultados, expresados en la media de horas - hombre
perdidas por mes durante un periodo de un año, se tomaron en seis plantas antes y después de que se echara
a andar dicho programa de seguridad. Si la diferencia de las medias de horas hombre perdidas por mes tiene
una distribución normal. ¿Proporcionan los datos de la tabla adjunta, evidencia suficiente para indicar (con
 = 0.02) qué el programa fue más efectivo?

PLANTA 1 2 3 4 5 6
ANTES 40 66 44 72 60 32
DESPUÉS 33 60 45 67 54 31

EJERCICIOS. ERROR TIPO I Y TIPO II


1.- Suponga que un especialista en alergias desea probar la hipótesis de que al menos 30% del público es alérgico a algunos productos
de queso. Explique cómo este especialista podría cometer

a) un error tipo I;
b) un error tipo II.

2.- un sociólogo está interesado en la eficacia de un curso de capacitación diseñado para lograr que más conductores se acostumbren
a utilizar los cinturones de seguridad en el automóvil.

a) ¿Qué hipótesis estará probando esta persona si comete un error tipo I al concluir erróneamente que el curso de capacitación no es
eficaz?
b) ¿Qué hipótesis estará probando esta persona si comete un error tipo II al concluir erróneamente que el curso de capacitación es
eficaz?

3.- Una gran empresa manufacturera ha sido calificada como discriminadora en sus prácticas de contratación.

a) ¿Qué hipótesis se está probando si un jurado comete un error tipo I al encontrar que la compañía es culpable?
b) ¿Qué hipótesis se está probando si un jurado comete un error tipo II al encontrar culpable a la empresa?

4.- Se estima que la proporción de adultos que viven en un pequeño pueblo y que son egresados universitarios es p= 0.3. Para probar
esta hipótesis, se selecciona una muestra aleatoria de 15 adultos. Si el número de graduados en la muestra es una cantidad cualquiera
entre 2 y 7, se aceptará la hipótesis nula de que p= 0.3; de otra forma, se concluirá que p es diferente de 0.3.

a) Evalúe  suponiendo que p= 0.3.


b) Evalúe  para las hipótesis alternativas: p= 0.2 y p= 0.4.
c) ¿Es éste un buen procedimiento de prueba?. ¿ Por qué ?

5.- Repita el ejercicio 4 cuando se seleccionan 200 adultos y se define que la región de aceptación es 48  X  72 , donde X es el
número de egresados universitarios en la muestra. Observe qué es lo que ocurre con cada una de las probabilidades de cometer error (I
y II).

15
INSTRUCTOR: DR. RAÚL HERNÁNDEZ MOLINAR
DISEÑO Y ANÁLISIS DE EXPERIMENTOS

CAPÍTULO 01

6.- La proporción de familias que compra leche de la compañía A en una ciudad se cree que es p= 0.6. Si una muestra aleatoria de 10
familias indica que 3 o menos compran leche de la compañía A, se rechazará la hipótesis de que p= 0.6 en favor de la alternativa p <
0.6.

a) Encuentre la probabilidad de cometer un error tipo I si la proporción verdadera es p= 0.6.


b) Encuentre la probabilidad de cometer un error tipo II para las alternativas P= 0.3, p= 0.4 y p= 0.5.

7.- Repita el ejercicio 6 cuando se seleccionan 50 familias y se determina que la región crítica X  24 , donde x es el número de
familias de la muestra que compran leche de la compañía A.

8.- Un establecimiento para lavado en seco afirma que un nuevo removedor de manchas eliminará más del 70% de las manchas a las
cuales se le aplique. Para verificar esta afirmación, el producto se utilizará en 12 manchas que se escogieron al azar. Si se eliminan
menos de 11 manchas, se aceptará la hipótesis nula de que p= 0.7; de lo contrario, se concluirá que p es mayor que 0.7.

a) Evalúe  suponiendo que p= 0.7.


b) Evalúe  para la alternativa p=0.9.

9.- Repita el ejercicio 8 cuando se tratan de eliminar 100 manchas y se determina que la región crítica es x mayor que 82, donde x es la
cantidad de manchas borradas.

10.- En la publicación Relief from Arthritis de Thorson Publishers, Ltd. (1979), John E. Croft afirma que más del 40% de los que padecen
de artritis ósea experimentaban cierto alivio con el uso de un ingrediente producido por una especie particular de almeja encontrada en
las costas de Nueva Zelanda. Para probar esta afirmación, el extracto de almeja se les administrará a 7 pacientes artríticos. Si 3 o más
de ellos tienen un alivio.

Se aceptará la hipótesis nula de que p= 0.4; de lo contrario se concluirá que p es menor que 0.4.

a) Evalúe  suponiendo que p=0.4.


b) Evalúe  para la alternativa p=0.3.

11.- Repita el ejercicio 10 cuando a 70 pacientes se les da el extracto de almeja y se define que la región crítica es X menor que 24,
donde x es el número de enfermos de artritis ósea que alcanzan cierta mejoría.

12.- A una muestra aleatoria de 400 votantes de una cierta ciudad se le pregunta si está a favor de un impuesto adicional a la venta de
gasolina para proporcionar ingresos necesarios para efectuar trabajos de reparación de calles. Si más de 220 pero menos de 260 están
a favor del impuesto, se concluirá que el 60% de los votantes está a favor.

a) Encuentre la probabilidad de cometer un error tipo I si 60% de los votantes está a favor del nuevo impuesto.
b) ¿Cuál es a probabilidad de cometer un error tipo II al utilizar este procedimiento de prueba si sólo 48% de los votantes está a favor
del nuevo impuesto?

13.- Suponga, que en el ejercicio 12, que se concluye que el 60% de los votantes está a favor del nuevo impuesto a la gasolina, si más
de 214 pero menos de 266 votantes en el ejemplo están a favor. Muestra que esta nueva región de aceptación resulta en un valor más
pequeño para  cuando se incrementa el valor de 

14.- Un fabricante ha desarrollado un nuevo hilo para pesca, del cual afirma que tiene un coeficiente promedio de ruptura de 1.5
kilogramos con una desviación estándar de 0.5 kilogramos.
Para probar la hipótesis de que  15 kilogramos contra la alternativa de que  15, se probará una muestra aleatoria de 50 hilos de
pesca. La región crítica se define en el dominio: x < 14.9.

a) Encuentre la probabilidad de cometer un error tipo I cuando Ho es verdadera.


b) Evalúe  para las siguientes hipótesis alternativas  14.8, 14.85 kilogramos.
16
INSTRUCTOR: DR. RAÚL HERNÁNDEZ MOLINAR
DISEÑO Y ANÁLISIS DE EXPERIMENTOS

CAPÍTULO 01

Observar que el análisis del error tipo II se debe hacer considerando valores del parámetro, en la Región de rechazo de la hipótesis
nula.

15.- Una máquina despachadora de refrescos ubicada en el Longhorn Steak House se ajusta de tal forma que la cantidad de refresco
servido está distribuido aproximadamente en forma normal con una media de 200 mililitros y una desviación estándar de 15 mililitros.

Se verifica la máquina periódicamente tomando una muestra de 9 refrescos y calculando su contenido promedio. Si x pertenece al
intervalo { x: 191 < x < 209 }, se considera que la máquina está operando en forma satisfactoria; de lo contrario, se concluye que  es
diferente a 200 mililitros.

a) Encuentre la probabilidad de cometer un error tipo I cuando  realmente es igual a 200 mililitros.
b) Encuentre la probabilidad de cometer un error tipo II cuando  = 215 mililitros.

16.- Repita el ejercicio 15, considerando que las muestras son de tamaño n = 25. Utilice la misma región crítica. Observe la importancia
del tamaño de muestra al hacer inferencia.

17.- Se ha desarrollado una nueva preparación para un cierto tipo de cemento que da como resultado un coeficiente de compresión de
6000 kilogramos por centímetro cuadrado y una desviación estándar de 120.
Para probar la hipótesis de que  = 5000 en contraposición de la hipótesis alternativa de que  es mejor que 5000, se verifica una
muestra aleatoria de 50 piezas de cemento.

Se define que la región crítica es: x > 5970.

a) Encuentre la probabilidad de cometer un error tipo I cuando Ho es verdadera.


b) Evalúe  para las alternativas  = 5980 y  = 5960.

18.- Si se grafican las probabilidades de aceptar Ho correspondientes a varias alternativas para  (incluyendo el valor especificado por
Ho) y se dibuja una línea constante que una todos los puntos, se obtiene una curva característica de operación basada en el criterio
de prueba, o simplemente la curva CO. Notar que la probabilidad de aceptar Ho cuando es verdadera es simplemente 1 – 

Las curvas características de operación son muy utilizadas en aplicaciones industriales para proporcionar una imagen visual de los
méritos del criterio de prueba.

Con referencia al ejercicio 15, encuentre las probabilidades de aceptar Ho para los siguientes valores de  y grafique la curva CO: 184,
188, 190.5, ,209.5, 212 y 216.

17
INSTRUCTOR: DR. RAÚL HERNÁNDEZ MOLINAR

Potrebbero piacerti anche