Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ )
(𝑝̂ − 𝑝̂ ) − 𝑍 ⁄ ∗ + < 𝑃 − 𝑃 < (𝑝̂ − 𝑝̂ ) + 𝑍 ⁄ ∗ +
𝑛 𝑛 𝑛 𝑛
La interpretación del intervalo se hace igual que el realizado para la diferencia de medias.
Ejercicio 12: Se requiere comparar la acogida de una nueva disposición de tránsito en dos ciudades de Colombia
por parte de los automovilistas. En la ciudad A se tomó una muestra de 550 automovilistas de los cuales 350
estuvieron de acuerdo con la nueva disposición, en la ciudad B se tomó una muestra de 700 automovilistas de los
cuales 400 estuvieron de acuerdo con la nueva disposición. Obtenga un intervalo de confianza para la diferencia de
proporciones y determine si hay diferencias significativas entre las dos ciudades en cuanto a la acogida de la nueva
disposición (use 𝛼 = 0.05).
El intervalo en la diferencia de proporciones es 0.0156; 0.1244, como el intervalo no contiene al cero, se concluye
que las dos poblaciones acogen diferente la nueva disposición de transito con un nivel de confianza de 95%.
En ingeniería, además de los intervalos de confianza, se utilizan otros intervalos denominados intervalos de
tolerancia. El propósito de estos intervalos es determinar si una unidad producida cumple con las especificaciones
de calidad. El manejo de los intervalos de tolerancia se sale de los propósitos del presente curso
18.7 TALLER
1. Se quiere estimar los consumos en el servicio telefónico en dos departamentos de una empresa pública para
lo cual se hizo un seguimiento durante un año con los siguientes consumos en miles de pesos:
Unidad 1 $350 300 350 280 300 320 300 280 320 310 380 320
Unidad 2 $280 300 250 260 250 280 310 295 290 350 250 240
b. Determine si hay diferencias significativas en los consumos en los dos departamentos. Use 𝛼 = 0.10
2. Responda Falso (F) o verdadero (V) para cada una de las siguientes afirmaciones. Debe justificar cada una de
sus respuestas
a. En la gobernación del Valle del Cauca, el sindicato de empleados oficiales sostiene que sus ingresos son
diferentes a los salarios de los empleados públicos. El gerente de datos obtuvo el siguiente intervalo de diferencia
de medias:
−3.41 < 𝜇 −𝜇 ú < −0.19
Con base en el intervalo se puede concluir que hay diferencias significativas en los salarios ( )
Justificación: _________________________________________________________________
b. Para un n fijo, un intervalo de confianza del 95% es mas preciso que un intervalo de confianza del 99% de
confianza ( )
Justificación: _________________________________________________________________
d. Tomar muestras dependientes en lugar de muestras independientes aumenta la precisión del estudio ( )
Justificación: _________________________________________________________________
146
3. Los precios de los repuestos para maquinaria pesada usada en construcciones civiles varían mucho debido a la
variabilidad del dólar. Un constructor hace un seguimiento a dos proveedores con los siguientes resultados:
Proveedor 1 Proveedor 2
Numero de repuestos cotizados 15 12
Costo promedio 4,070 dólares 3,890 dólares
Desviación estándar 270 dólares 450 dólares
a. Determine si hay diferencia significativa en las cotizaciones promedio entre los dos proveedores
b. ¿Qué proveedor recomendaría usted? Justifique su respuesta
Nota: asuma que los precios de las cotizaciones siguen una distribución normal y son independientes entre los
proveedores.
4. Suponga que acaba de ser contratado para realizar un estudio estadístico que estime el consumo promedio de
gaseosa en el concierto de Shakira el próximo 22 abril en la ciudad de Cali. La estadística se requiere con un
96% de confianza, una precisión de 1,000 litros y una estimación del total de personas de 50,000. ¿Cuáles deben
ser los tamaños de muestra en cada uno de los siguientes casos:
a. En un concierto similar en la ciudad de Bogotá el consumo promedio fue de 25,000 litros y una desviación
estándar de 5,000 litros
b. Un muestra piloto en 10 conciertos similares dio los siguientes datos de consumo en litros:
18,610 18,960 13,570 10,000 11,000 9,990 4,560 12,590 14,000 12,000
5. Se investiga la resistencia a la tensión de ruptura del hilo proporcionado por dos fabricantes. De la experiencia
con los procesos de los fabricantes, se sabe que 𝜎 = 5 𝑝𝑠𝑖 y 𝜎 = 4 𝑝𝑠𝑖. Una muestra aleatoria de 20
especímenes de prueba proveniente de cada fabricante arroja como resultados 𝑥̅ = 88 𝑝𝑠𝑖 y 𝑥̅ = 98 𝑝𝑠𝑖
respectivamente. Encuentre un intervalo de confianza del 90% para la diferencia entre las medias de la tensión
de ruptura. ¿Existe alguna evidencia que apoye la afirmación de que el hilo del fabricante 2 tiene una mayor
resistencia media?
6. Se quiere comparar el rendimiento académico de los estudiantes de dos facultades en una institución
universitaria para lo cual se han seleccionado los promedios acumulados de siete estudiantes de cada facultad.
Determine si los rendimientos son estadísticamente diferentes. Use 𝛼 = 0.01
Notas promedio
No. de Facultad 1 Facultad 2
estudiantes
1 4.5 3.9
2 4.2 4.1
3 3.8 4.4
4 3.5 3.9
5 3.2 4.0
6 4.4 3.8
7 2.5 4.0
7. La pintura para autopista se surte de dos colores: blanco y amarillo. El interés se centra en el tiempo de secado
de la pintura; se sospecha que la pintura de color amarillo se seca más rápidamente que la blanca. Se obtienen
mediciones de ambos tipos de pintura. Los tiempos de secado (en minutos) son los siguientes:
Amarilla: 126, 124, 116, 125, 109, 130, 125, 117, 129, 120
147
a. Pruebe que las varianzas de los tiempos de secado son iguales estimando un intervalo de razón de varianzas al
95% de confianza
b. Encuentre un intervalo de confianza del 95% para la diferencia entre en los tiempos de secado promedio.
c. ¿Existe alguna evidencia que indique que la pintura amarilla se seca más rápidamente que la blanca?
b. ¿Hay suficiente evidencia para decidir que la duración del almacenamiento influye en las concentraciones
residuales de ácido sórbico?
9. Director de deportes de una universidad local quiere determinar si los entrenamientos rigurosos del último mes
han mejorado el rendimiento de los integrantes de la selección de fútbol. Selecciona una muestra de 10
estudiantes y registra los tiempos gastados por cada uno en recorrer un circuito de seis kilómetros con los
siguientes resultados (en minutos):
10. La conformabilidad es una propiedad del material que determina su moldeabilidad y capacidad para lograr el
estado final del material deseado. En un laboratorio industrial se sometieron dos tipos de materiales a pruebas
de impacto de conformabilidad encontrándose en 30 especímenes del material 1 una conformabilidad promedio
de 5.43 y una desviación estándar de 1.09 y en 35 especímenes del material 2 una conformabilidad promedio
de 6.08 y una desviación estándar de 1.19. Usando un nivel de confianza del 95%, ¿los dos tipos de materiales
148
presentan diferencias significativas en cuanto a la conformabilidad promedio? (asuma que las dos distribuciones
de conformabilidad son normales)
11. El gerente de mercadeo de una compañía comercial desea determinar si hay diferencias de apreciación en su
intención de compra de los clientes sobre las promociones tales como ofrecer un 20% de descuento en frutas
y verduras. Se hizo una encuesta a clientes de dos sucursales encontrándose los siguientes resultados:
Obtenga un intervalo de confianza para la diferencia de proporciones y determine si hay diferencias significativas
entre las dos sucursales en cuanto a la intención de compra de los clientes (use 𝛼 = 0.10).
149
19.1 Introducción
Con frecuencia, las decisiones de un profesional dependen de la evaluación y/o comparación de procesos, por
ejemplo: 1) en producción, comparar dos líneas de trabajo para determinar cuál es más eficiente; 2) en logística, una
compañía transportadora quiere determinar si una nueva ruta es mejor que otra ya existente en cuanto al menor
consumo de combustible. Es evidente que en la evaluación de cada una de estas conjeturas se deba recurrir a un
procedimiento estadístico en el cual esté implicado el muestreo y la inferencia estadística. A continuación se
presentan algunas situaciones que conducen a un planteamiento de investigación que se denomina prueba de
hipótesis:
2. El tiempo de entrega de suministros del proveedor A es más rápido que el tiempo del proveedor B para una
compañía grande.
3. La proporción de empleados de una organización que en un día normal de trabajo llega tarde es más del 2%.
4. El tiempo de duración de una determinada marca de baterías utilizadas en los automotores de distribución de
una compañía transportadora sigue una distribución normal.
En cada una de estas situaciones se plantea una conjetura o aseveración que hay que validar a través de un
procedimiento de investigación. Por lo general, están implicados uno o más parámetros estadísticos por lo que el
procedimiento de investigación se convierte en una metodología estadística que se denomina Prueba de Hipótesis.
A continuación se formalizaran las definiciones de hipótesis, los tipos de errores y la metodología de prueba de
hipótesis.
Hipótesis estadística es una aseveración o afirmación sobre el valor de un parámetro de una población, los valores
de varios parámetros o sobre la forma de la distribución de probabilidad de una variable.
Ejercicio 1: Formalice las hipótesis planteadas en la introducción como hipótesis estadísticas. Ayuda: la primera
seria 𝐻: 𝜇 = 500,000
En la práctica siempre se formulan simultáneamente dos hipótesis, las cuales determinaran el procedimiento formal
de validación del problema de investigación. Estas hipótesis son la Nula y la Alternativa que se definen a
continuación.
La hipótesis nula, que se representa 𝐻 , indica el comportamiento natural o esperado del parámetro (o situación en
cuestión) analizado, se especifica de tal forma que se mantiene como cierta a no ser que los datos indiquen su
falsedad. Nunca podrá ser probada a no ser que se estudia a toda la población completa.
𝐻 : 𝜇 = 500,000
150
Como ya se mencionó, a la par del planteamiento de la hipótesis nula se debe plantear la hipótesis alternativa, ésta,
dada su mayor importancia, también es denominada la hipótesis de investigación.
La hipótesis alternativa, que se representa 𝐻 , indica un cambio deseado en el parámetro ( o situación planteada)
es contradictoria a la hipótesis nula y solo se aceptara si la evidencia muestral determina que la hipótesis nula es
falsa.
Por norma general a la hipótesis nula siempre se le asigna el signo igual (=). Si a la hipótesis alternativa se le asigna
el signo “menor que” (<) o el signo “mayor que” (>) se dice que la prueba de hipótesis es de una sola cola, por el
contrario, si se le asigna el signo “diferente de” (≠) se dice que la prueba es de dos colas.
Ejercicio 2: Plantee la hipótesis nula y alternativa para cada una de las cuatro situaciones planteadas en la
introducción.
La regla de decisión es la que establece las condiciones para aceptar o rechazar una hipótesis.
Ejercicio 3: Una compañía fabricante de aviones ha decidido cambiar de proveedor de los remaches utilizados en
la unión de las estructuras principales del avión. Los remaches utilizados actualmente tienen una tensión promedio
de 180 libras-fuerza, cualquier nuevo proveedor debe garantizar una tensión superior a esta cantidad. Formule las
hipótesis nula y alternativa y una regla de decisión apropiada.
Ayuda: Para la regla de decisión, piense en un valor de 𝑥̅ teniendo en cuenta el error de muestreo.
Error de tipo I es el rechazo de la hipótesis nula 𝐻 , cuando esta hipótesis es en realidad verdadera. La probabilidad
de cometer error tipo I se representa con la letra griega 𝛼.
Error tipo II es la aceptación de la hipótesis nula 𝐻 cuando esta hipótesis es en realidad falsa. La probabilidad de
cometer un error tipo II se presenta con la letra griega 𝛽.
Ejercicio 6: Discuta con sus compañeros el siguiente interrogante: ¿Cuál de estos riesgos es más conveniente
manejar en un procedimiento de prueba de hipótesis? Identifique el riesgo del productor y el riesgo del consumidor.
La calidad de un procedimiento de prueba de hipótesis se determina por la potencia de la prueba que se define a
continuación.
𝑃 = 1−𝛽
Conceptualmente la potencia tiene importancia en el sentido que informa sobre lo adecuado de los tamaños de
muestra considerados en la investigación y/o sobre qué tan grande es la variabilidad del proceso de tal forma que
se detecten las diferencias esperadas.
En la práctica es aceptada una potencia entre 0.80 y 0.90, valores inferiores significarían errores tipo II muy altos y
valores superiores requieren de tamaños de muestra muy grandes. En conclusión el cálculo de la potencia servirá
para determinar la validez de los resultados permitiendo un análisis posteriori para determinar si los resultados no
significativos obedecen a una falta de poder de la prueba para detectar una diferencia significativa o si realmente
puede no existir tal diferencia.
Ejercicio 7: El consumo de la vitamina E es fundamental para la preservación de la salud en los humanos, la cantidad
promedio diaria estimada para una persona adulta sana es de 15 mg, una deficiencia de esta vitamina generaría
problemas de defensas bajas, problemas musculares y problemas en los nervios, un consumo alto generaría
problemas de sangrados y derrames cerebrales. Un fabricante de medicinas produce un suplemento vitamínico con
esta vitamina. Suponga que el contenido de vitamina E producida por este fabricante tiene una distribución normal,
con un promedio de 15 mg y una desviación estándar de 0.75 mg. En un procedimiento de control de calidad se
desea probar que el valor promedio del contenido de vitamina E es de 15.0 mg, para lo cual se utilizara una muestra
aleatoria de 9 unidades.
19.3 Pasos a seguir en un procedimiento de prueba de hipótesis con una sola muestra
Los pasos a seguir en un procedimiento de prueba de hipótesis con una sola muestra se describen a continuación:
𝐻 :𝜃 < 𝜃 ó 𝐻 :𝜃 ≠ 𝜃 ó 𝐻 :𝜃 > 𝜃
La elección de la hipótesis alternativa depende de lo que se quiere probar, en muchas ocasiones esta hipótesis
relaciona el cambio que se sospecha o espera que haya ocurrido en la población.
3. Nivel de significancia: 𝛼
El nivel de significancia establece al máximo el riesgo que se está dispuesto a aceptar, su valor es subjetivo,
corresponde al investigador establecerlo.
Ejercicio 8: Asumiendo normalidad en la población, realice graficas donde se indique la región de aceptación y la
región o regiones de rechazo de 𝐻 para un nivel de significancia de 𝛼.
Ejercicio 9: Plantee los ocho pasos establecidos para un procedimiento de prueba de hipótesis cuando 𝜃 = 𝜇.
Ejercicio 10: Una empresa distribuidora de abarrotes tiene un proceso de empacado de 500 gramos, el cual se
comporta con distribución normal y desviación estándar de 35 gramos. En una inspección de rutina se tomó una
muestra de 𝑛 = 16 productos encontrándose un peso promedio de 485 gramos. Pruebe las hipótesis 𝐻 : 𝜇 = 500
versus 𝐻 : 𝜇 ≠ 500 usando un nivel de significancia del 5%.
La varianza poblacional 𝜎 se puede estimar con la varianza muestral 𝑠 y dada la normalidad de la población, el
estadístico de prueba sigue una distribución 𝑡 con 𝜐 = 𝑛 − 1 grados de libertad, luego se tiene:
𝑥̅ − 𝜇
𝑘=𝑡=
𝑠 ⁄ √𝑛
La región o regiones de rechazo se establecen igual que el caso 1 pero ahora en función de la distribución t.
153
Ejercicio 11: Un constructor de aviones desea comprobar si un proveedor de accionamientos mecánicos cumple
con la especificación de la tensión promedio que debe ser por lo menos 250 kilogramos- fuerza. Se tomó una
muestra aleatoria de 𝑛 = 9 accionamientos con las siguientes tensiones en kilogramos-fuerza: 248, 250, 248, 249,
250, 251, 248, 247, 250. Pruebe que el proveedor no cumple con la especificación establecida con un nivel de
significancia de 5%.
19.5 Valor p
El nivel de significancia utilizado en los procedimientos de prueba de hipótesis son por lo general 0. 10, 0.05,
0.025, 0.01 o 0.005 que pueden parecer muy arbitrarios, con el auge de los programas estadísticos (Excel, SPSS,
Statgraphics, etc.) se ha desarrollado un modo alternativo de aceptar o rechazar una hipótesis a través del concepto
del Valor p.
El Valor p es el mínimo valor de probabilidad a partir del cual se rechaza la hipótesis nula. Si un Valor p es muy
pequeño (𝑉𝑎𝑙𝑜𝑟 𝑝 < 𝛼). Se concluye que la prueba de hipótesis es significativa.
Para calcular el 𝑉𝑎𝑙𝑜𝑟 𝑝 se recurre al estadístico de prueba 𝑘, en el caso de normalidad, el 𝑉𝑎𝑙𝑜𝑟 𝑝 se calcula de la
siguiente manera:
Si la hipótesis alternativa es tipo mayor (𝐻 : > ) el 𝑉𝑎𝑙𝑜𝑟 𝑝 se obtiene así: 𝑉𝑎𝑙𝑜𝑟 𝑝 = 𝑃(𝑧 > 𝑧 )
Si la hipótesis alternativa es tipo menor (𝐻 : < ) el 𝑉𝑎𝑙𝑜𝑟 𝑝 se obtiene así: 𝑉𝑎𝑙𝑜𝑟 𝑝 = 𝑃(𝑧 < 𝑧 )
Ejercicio 12: El periodo de garantía ofrecido por una fábrica de baterías es de 180 días. Un oficial de la oficina de
protección al cliente inspecciono 36 clientes usuarios de estas baterías encontrando un periodo de vida útil promedio
de las baterías de 175 días con una desviación estándar de 10 días. Pruebe las hipótesis 𝐻 : 𝜇 ≥ 180 versus 𝐻 : 𝜇 <
180 con un 𝛼 = 0.03. Calcule el 𝑉𝑎𝑙𝑜𝑟 𝑝.
Ejercicio 13: Una entidad bancaria quiere probar que el retiro promedio por usuario en un cajero automático en una
quincena de pago es de $ 520,000. Una muestra aleatoria de retiros de 10 clientes contabilizo un promedio de
$588,000 y una desviación estándar $115,250. Haga la prueba asumiendo que los montos de retiros se distribuyen
normal y un nivel de significancia del 5%. Respuesta. 𝑉𝑎𝑙𝑜𝑟 𝑝 = 0.095.
154
En lo tratado hasta aquí, solo se ha manejado la media poblacional, pero igual tratamiento se puede seguir con los
demás parámetros estadísticos y con los casos de las diferencias de medias o razón de varianzas. En la tabla 19.1
se indican las principales pruebas de hipótesis con sus estadísticos de prueba y regiones de rechazo.
(𝑛 − 1)𝑠 𝜒 <𝜒 ⁄ ; o
𝜎 =𝜎 Población normal 𝜒 = 𝜎 ≠𝜎
𝜎 𝜒 >𝜒 ⁄ ;
con 𝜐 = 𝑛 − 1
𝜒 >𝜒 ;
𝜎 >𝜎
(𝑥̅ − 𝑥̅ ) − 𝐷 𝜇 −𝜇 <𝐷 𝑧 < −𝑧
𝜇 −𝜇 =𝐷 𝜎 𝑦𝜎 𝑧= 𝜇 −𝜇 ≠ 𝐷 𝑧> 𝑧 ⁄
conocidas + 𝜇 −𝜇 >𝐷 𝑧>𝑧
Poblaciones (𝑥̅ − 𝑥̅ ) − 𝐷 𝜇 −𝜇 <𝐷 𝑡 < −𝑡 ;
normales, 𝑡=
𝜇 −𝜇 =𝐷 varianzas 𝑠 ∗ + 𝜇 −𝜇 ≠ 𝐷 𝑡> 𝑡 ⁄ ;
iguales pero con 𝜐 = 𝑛 + 𝑛 − 2
desconocidas 𝜇 −𝜇 >𝐷 𝑡>𝑡
( ) ( ) ;
(𝜎 = 𝜎 ) 𝑠 =
(𝑥̅ − 𝑥̅ ) − 𝐷 𝜇 −𝜇 <𝐷 𝑡 < −𝑡 ;
𝑡=
Poblaciones +
normales, 𝜇 −𝜇 ≠ 𝐷 𝑡> 𝑡 ⁄ ;
𝜇 −𝜇 =𝐷 varianzas +
diferentes y 𝜐=
desconocidas + 𝜇 −𝜇 >𝐷 𝑡>𝑡 ;
(𝜎 ≠ 𝜎 )
𝑑̅ − 𝐷 𝜇 <𝐷 𝑡 < −𝑡 ;
𝜇 =𝐷 Población normal 𝑡= 𝑠 𝜇 ≠𝐷 𝑡> 𝑡 ⁄ ;
muestras √𝑛 𝜇 >𝐷 𝑡>𝑡 ;
pareadas
Poblaciones 𝑝̂ − 𝑝̂ 𝑃 <𝑃 𝑧 < −𝑧
binomiales 𝑧=
𝑃 =𝑃 𝑃 ≠𝑃 𝑧> 𝑧 ⁄
𝑛 𝑦 𝑛 ≥ 50 𝑝(1 − 𝑝) + 𝑃 >𝑃 𝑧>𝑧
con 𝑝 =
𝜎 <𝜎 𝑓<𝑓 ; ,
𝑠
Poblaciones 𝑓=
𝜎 =𝜎 𝑠 𝜎 ≠𝜎 𝑓<𝑓 ; , o
normales con 𝜐 = 𝑛 − 1 𝑦 𝜐 = 𝑛 − 1 𝑓>𝑓 ; ,
𝜎 >𝜎 𝑓>𝑓 ; ,
Para el caso de las pruebas de comparación de medias para dos poblaciones, el programa Excel tiene incorporado
en el análisis de datos las pruebas para la comparación de varianzas (Prueba F para varianzas de dos muestras) y
las pruebas de comparación de medias tanto para el caso dependiente (Prueba t para medias de dos muestras
emparejadas) y como para los casos de muestras independientes (Prueba t para medias de dos muestras
suponiendo varianzas iguales, Prueba t para medias de dos muestras suponiendo varianzas desiguales y Prueba z
para medias de dos muestras). Con el ejemplo indicado a continuación se ejemplifica el uso de estas funciones:
Ejemplo: Un investigador quiere determinar si hay diferencias significativas en los ingresos familiares promedio en dos ciudades
capitales del país. Se tomaron muestras aleatorias de familias en las dos ciudades como se indica en la tabla adjunta (valores en
millones de pesos):
Ciudad A Ciudad B
1,35 0,85
2,40 0,85
3,50 1,40
4,80 1,35
4,52 3,55
1,60 1,95
1,95 1,35
2,15 2,50
Dados estos valores, el investigador concluye que es evidente que el ingreso familiar promedio en la ciudad B es menor que el
de la ciudad A. ¿está usted de acuerdo con esta conclusión? Justifique con un razonamiento cuantitativo en términos de la
Inferencia Estadística.
Solución: primero se hace la prueba de comparación de varianzas: 𝐻 : 𝜎 = 𝜎 versus 𝐻 : 𝜎 ≠ 𝜎 como se indican en los
recuadros siguientes:
Note que el Valor p (P(F<=f) una cola) debe multiplicarse por 2 para obtener el resultado del Valor p para la prueba de comparación
de varianzas, en este caso el Valor p es mucho mayor que el valor de 0.05 por lo tanto se acepta la hipótesis de igualdad de
varianzas.
Las hipótesis correspondientes a la pregunta del problema son: 𝐻 : 𝜇 = 𝜇 versus 𝐻 : 𝜇 < 𝜇 que se resuelve como se indican
en los recuadros siguientes: