Sei sulla pagina 1di 7

2.

Prueba de Hipótesis

2.1 Introducción 2.2 Tipos de hipótesis y errores

PRIMERA INVESTIGACIÓN BIBLIOGRÁFICA

Continuando con los lineamientos establecidos en la primera investigación,


realice la siguiente investigación

PRUEBA DE HIPÓTESIS ESTADÍSTICAS Distribución Normal (muestras grandes)


- Fundamentos
- Elementos de una prueba de hipótesis
- Tipos de errores
-Investigar 3 problemas de aplicación aplicados a su carrera profesional

LIGAS ELECTRONICAS
http://www.terra.es/personal2/jpb00000/ttesthipotesis.htm
http://e-stadistica.bio.ucm.es/mod_contraste/contraste5.html
http://www.geocities.com/tutor47/Contraste.htm
http://e-stadistica.bio.ucm.es/cont_mod_1.html
http://www.edustatspr.com/documentos/notasm3026/lec_3.2_Prueba%20de%20Hipotesis.htm
http://web.frm.utn.edu.ar/estadistica/PagWebArchivosPDF/04Capitulo_10.pdf
http://www.edustatspr.com/documentos/notasm3026/lec_3.2_Prueba%20de%20Hipotesis.htm
http://www.terra.es/personal2/jpb00000/ttesthipotesis.htm

INFERENCIA ESTADÍSTICA
CASO REAL
PRUEBAS DE HIPÓTESIS

Suponga que un hospital usa grandes cantidades de


dosis envasadas de un medicamento particular. La
dosis promedio de la medicina es de 100 cc. La
acción del medicamento es tal que el cuerpo
tolerará una dosis superior, pero si es inferior
interfiere en el tratamiento del paciente. El hospital
ha adquirido un nuevo lote del medicamento con el
mismo proveedor y sabe que la desviación estándar
es de 2cc. El hospital inspecciona aleatoriamente 50
dosis de la medicina y encuentra que su media es
de 99.75 cc. Con una confiabilidad del 0.95 ¿Se
aceptará la remesa?
El tiempo de espera para pagar en la caja de
un supermercado esta distribuido de manera
aproximadamente normal con s= 2.5 minutos.
Una muestra de tiempo de espera
correspondiente a 24 clientes predijo una de
10.6 ¿Proporciona suficiente evidencia para
rechazar la afirmación del supermercado en el
sentido de que sus clientes esperan menos de
5 minutos para efectuar su pago? Utilice una
confiabilidad del 90%.

OBSERVE, ANALICE Y COMPARE: ¿Que


diferencias existen con los temas vistos
anteriormente? ¿Qué es lo que se busca?
   

2.1 Introducción

Suponga que el administrador de un gran centro comercial afirma que la


eficiencia de trabajo promedio de sus empleados es de al menos 90% ¿Cómo
podría usted probar la validez de ésta hipótesis? ¿Aceptaría esta afirmación?
Usted no puede aceptar o rechazar una afirmación sobre un parámetro de
población simplemente por intuición, más bien es necesario que usted aprenda
como decidir objetivamente si acepta o rechaza una corazonada, con base en la
información muestral

La prueba de hipótesis comienza con una suposición, llamada hipótesis, que se


hace con respecto a un parámetro de población. Después se recolecta datos de
una muestra, seleccionada aleatoriamente, se obtienen sus estadísticas y se usa
esta información para decidir que tan probable es que sea correcto el
parámetro de la población acerca del cual se hizo la hipótesis. Para comprobar
la validez de la suposición se determina la diferencia entre el valor hipotetizado
y el valor real de la media de la muestra, y se evalúa si esta diferencia es
significativa o no. Mientras más pequeña sea esta diferencia será mayor la
probabilidad de que el valor hipotetizado para la media poblacional sea
correcta.

Desafortunadamente, la diferencia entre el parámetro hipotetizado y el


estadístico de la muestra rara vez es tan grande que obligue a rechazar la
hipótesis, y ni tan pequeño que genere la aceptación de la hipótesis. Así pues,
en la prueba de hipótesis, como en la mayoría de las decisiones importantes,
las soluciones inequívocas son la excepción, no la regla.

2.2 Tipos de hipótesis y errores

2.2.1 Tipos de hipótesis y errores

Para explicar los conceptos básicos es necesario partir de un ejemplo.


Suponga que usted es el jefe de Compras de una empresa constructora la cual
tiene como objetivo la construcción del techo de una nave para el área de
producción. Usted sabe que las especificaciones para el techo, utilizando
láminas de aluminio, es de un grosor promedio de 0.04 pulg. (ni menos ni más)
para generar una estructura adecuada. Para comprobar si su proveedor cumple
con las especificaciones, selecciona 100 láminas y obtiene un grosor promedio
de 0.0408 pulg. Por experiencia se sabe que la desviación estándar de las
láminas del proveedor que está usted estudiando, es de 0.004 pulg. ¿La
muestra proporciona evidencia para aceptar el lote de 10 000 láminas de
aluminio, para construir el techo de la nave? ¿Aceptaría usted el lote?

La pregunta a formularse sería ¿Cuál es la probabilidad de obtener una media


de una muestra que difiera 0.04 pulg en 0.0008 pulg (0.0408 - 0.04) o más?
Para responder esto es necesario obtener el error estándar de la distribución
del muestreo:

Posteriormente se calculará que tanto se aleja la media de la muestra de la


media poblacional, es decir, se estimará la puntuación estándar tipificada:

Finalmente se calculará la probabilidad (área bajo la curva) correspondiente a


dicha puntuación tipificada:
Buscando en la tabla de distribución normal estándar se encuentra una
probabilidad de 0.47725 para z=2, pero como la media de la muestra puede
variar por debajo o por arriba de la media poblacional, por lo tanto el área total
será 2(0.47725)= 0.955, existiendo un área en extremos de 1-0.955=0.045,
siendo en cada extremo 0.045/2= 0.0225, observe la siguiente gráfica:

OBSERVE Y ANALICE: La probabilidad de 0.045, indica la probabilidad de que la


media de la muestra sea, 0.0225 arriba de 0.0408 y 0.0225 inferior a 0.0392,
es decir la media de la muestra difiere 2 errores estándar de la media
poblacional, por lo tanto con esta baja probabilidad se puede concluir que no es
probable que la media de la población real de 0.04 produzca una media de
muestra igual a ella. Por lo tanto se puede tomar la decisión de rechazar el lote
de 10000 láminas, puesto que el grosor promedio no es de 0.04 pulg.
En este caso la diferencia entre la media poblacional y la media de la muestra
es grande y la probabilidad de que la población produzca una muestra aleatoria
semejante es muy baja. El porqué de que 0.0445 sea una probabilidad baja,
está a juicio del responsable de la toma de decisión. El consejo que se puede
tomar es que se deben analizar los costos resultantes de la toma de decisiones
y el nivel de riesgo que se está dispuesto a asumir.
En nuestro ejemplo se podría decir que se tiene un porcentaje de 4.55% de
rechazar un lote de láminas de aluminio cuyo grosor medio es de 0.04 pulg. Por
lo tanto, el estándar mínimo para una probabilidad aceptable, 45%, también es
el riesgo que se corre de rechazar la hipótesis siendo verdadera, En ésta o en
cualquier otra toma de decisiones, no puede haber transacciones que estén
libres de riesgo.

Para comprobar un supuesto sobre el parámetro de la población, es necesario


establecer las hipótesis. En estadística existen tres juegos de hipótesis cada una
de ella compuesta por dos hipótesis. A continuación se indican éstas:
En ésta prueba exiten dos hipótesis:

a) Hipótesis nula (H0): Representa la afirmación a comprobar, siempre se


refiere a un valor especificado del parámetro poblacional (media
poblacional ).
El planteamiento de H0 siempre contiene el signo de igualdad con respecto al
valor especificado (hipotetizado) del parámetro:
H 0: = 0

b) Hipótesis alternativa (H1): Representa la afirmación contraria a la


hipótesis nula y representa la conclusión a la que se llegaría si la hipótesis
nula fuera rechazada.
El planteamiento de H1 nunca contiene el signo de igualdad con respecto al
valor especificado del parámetro poblacional:
H1 : 0
Con base en lo indicado, existen tres juegos de hipótesis:

PRUEBA DE PRUEBA DE PRUEBA DE


HIPÓTESIS HIPÓTESIS HIPÓTESIS
BILATERAL UNILATERAL UNILATERAL

PRIMER JUEGO SEGUNDO JUEGO TERCER JUEGO

EJEMPLO 1

A continuación se exponen ejercicios para que usted se familiarice con el


planteamiento de los juegos de hipótesis y su representación simbólica
Establezca la hipótesis nula y alternativa que se utilizarían en una prueba de
hipótesis relacionada con cada una de las afirmaciones siguientes

a) El número promedio de las cuentas por cobrar es superior a 26

H1: > 26
H 0: 26

b) El peso promedio de los paquetes enviados por avión durante el mes pasado
fue menor a 36.7lb

H1: <36.7lb
H 0: 36.7lb

c) El número promedio mensual de cheque emitidos por la compañía no es


mayor a 210

H1: > 210


H 0: 210

d) El puntaje promedio obtenido por los trabajadores en el curso de


capacitación que tomaron en el mes de julio no es de 80

H1: 80
H 0: = 80

OBSERVE Y ANALICE: En todos los enunciados, aquellos que inmiscuyen el


signo igual corresponde a la hipótesis nula.

Después de establecer las hipótesis (nula y alternativa), es necesario establecer


qué criterio utilizar para decidir si aceptar o rechazar la hipótesis nula.
En el ejemplo de las láminas para la construcción de la nave, la hipótesis a
comprobar seria:

H1: 0.04 La cual corresponde al primer juego de hipótesis


H 0: = 0.04 (bilateral)

Se decidió que una diferencia entre el estadístico y el parámetro tenía sólo


4.5% de ocurrir, por lo tanto se rechazo la hipótesis nula de que la media de la
población fuera de 0.04. En términos estadísticos el valor de 0.045 se conoce
como nivel de significancia ( ).
Si se supone que la hipótesis nula es correcta, entonces el nivel de significancia
indicará el porcentaje de medias de muestra que esta fuera de ciertos
límites (recuerde que en estimación, el nivel de confianza indicaba el
porcentaje de medias de muestra que caían dentro de los límites de confianza
definidos).
Comprobemos una hipótesis de tipo:

PRIMER JUEGO

Con un nivel de significancia del 0.05, esto significa que se rechazará la


hipótesis nula, si la diferencia entre la estadística y el parámetro hipotetizado
es lo bastante grande como para que ocurra ésta u otra diferencia mayor, en
promedio, sólo cinco veces de cada 100n muestras, cuando el parámetro
hipotetizado es correcto.
En la siguiente figura se ilustra como interpretar el nivel de significancia.:

Datos:

Nivel de confianza ( 1 - )=0.95


Nivel de significancia ( )= 0.05
Cada extremo: /2=0.05/2=0.025

Obtener el valor crítico: el valor crítico es una puntuación "z"


estandarizada, calculada en función a la probabilidad o riesgo ( )deseado en
la prueba estadística. Este valor indica el número de errores estándar que el
estadístico se aleja de la media poblacional.
Si se busca en la tabla la puntuación tipificada, correspondiente al área del
extremo 0.025; se obtendría de la siguiente manera: 0.50-0.025=0.475,
recuerde que el área que está en la tabla es la de z=0 a la Z buscada, que en
este caso sería 0.475, la cual corresponde a una z= + - 1.96.
El valor crítico de la distribución se refiere a un valor que sirva para poder
tomar la decisión de rechazar o no rechazar la hipótesis nula
Como se puede observar para calcular el valor crítico se tendrá que tener en
cuenta el tipo de distribución de muestreo, que en este caso, la distribución a
utilizar es la normal, puesto que se está trabajando con muestras grandes y
con desviación poblacional conocida.
Con base en el tipo de hipótesis a comprobar se deberá dividir el área bajo la
curva de distribución de muestreo en dos regiones. las cuales son divididas
precisamente por el valor crítico.

• Zona de rechazo (región crítica): Región representado por (nivel de


significación) en donde si existe una diferencia significativa entre el
estadístico y el parámetro a comprobar.

• Zona de no rechazo: Región representado por 1- (nivel de confianza) en


donde no existe una diferencia significativa entre el estadístico y el parámetro a
comprobar.
La metodología para la prueba de hipótesis está diseñada de modo que el
rechazo de la hipótesis nula esté basado en evidencias proporcionadas por la
muestra. Sin embargo el hecho de no rechazar la hipótesis nula no es una
prueba de que ésta sea verdadera, nunca se puede probar que la hipótesis nula
sea verdadera ya que se está basando la decisión únicamente en la información
de la muestra, no en la población entera. Por lo tanto será correcto, bajo ésta
prueba estadística, poder rechazar la hipótesis nula, pero no aceptarla, en éste
caso se dice que no existe suficiente evidencia para no rechazarla.

OBSERVE Y ANALICE: En el gráfico que el rechazar o el no rechazar la hipótesis


nula depende precisamente de los valores críticos y éstos del nivel de
significancia, de aquí que la pregunta inmediata a formular es ¿Cómo
seleccionar el nivel de significancia? La respuesta es: no existe un nivel único o
universal, ( 1%, 5%, 10%, o incluso más pequeños) depende de la probabilidad
de riesgo que usted esté dispuesto a asumir, pero deberá usted de tomar en
cuenta que mientras más grande sea el nivel de significancia mayor será la
probabilidad de rechazar la hipótesis nula cuando es cierta.
Cuando se está utilizando una estadística muestral (media de la muestra) para
tomar decisiones acerca de un parámetro, existe el riesgo de llegar a una
conclusión incorrecta. De hecho se pueden presentar dos tipos de errores
diferentes:

PROBABILIDAD
ERROR RIESGO DECISIÓN
DE COMETERLO
Rechazo de la hipótesis nula siendo
Rechazo Nivel de
Tipo I verdadera y por lo tanto debería ser
erróneo significancia ( )
aceptada
No rechazo de la hipótesis nula, Aceptación Coeficiente de
Tipo II
cuando es falsa y debería rechazarse. errónea confianza ( )

La probabilidad de cometer un tipo de error puede reducirse sólo si se desea


incrementar la probabilidad de otro tipo de error.

EJEMPLO 2

Considere el ejercicio de la construcción del techo de la nave del área de


producción

a) Qué error es preferible cometer


b) Qué nivel de significancia tomaría: bajo o alto

H0: Las láminas de aluminio sí cumplen con el grosor promedio de 0.04 pulg.
H1: Las láminas de aluminio no cumplen con el grosor promedio de 0.04 pulg.

Error tipo I:
Rechazar la hipótesis nula siendo cierta: Rechazar que el grosor es de 0.04
pulgadas siendo cierto.
Esto implicaría mas tiempo y los problemas de volver a trabajar el lote de las
laminas de aluminio que deberían haber sido aceptados.

Error tipo II:


Aceptar la hipótesis nula siendo falsa: Aceptar que el grosor promedio de las
láminas es de 0.04 pulg siendo falso.
Esto significa arriesgar a todas las personas que trabajan en área de producción
al venirse abajo el techo de la nave.

a) Evidentemente se preferirá cometer el error tipo I que el tipo II.


b) Se establecerá niveles de significancia muy altos en las pruebas para
obtener "betas" bajas.

2.2.2 Ejercicios resueltos

Suponga la hipótesis "el motor funciona bien"

a) Qué error es preferible cometer


b) Qué nivel de significancia tomaría: bajo o alto

Error tipo I: Rechazar que el motor funciona bien dado que es falso.
Implica desarmar todo un motor en la fábrica, generando costos.

Error tipo II: Aceptar que el motor funciona dado que es falso.
Implica realizar reparaciones de garantía relativamente baratas por parte de los
comerciantes.
Entonces es más probable que el fabricante prefiera el error tipo II y que
establezca menores niveles de significancia en sus pruebas.

Ya que se ha establecido el objetivo, las hipótesis y el nivel de significancia, es


necesario establecer el tipo de distribución de probabilidad con el cual se
trabajará y con base en ésto calcular el valor crítico para "z" (tablas).
La selección del tipo de distribución depende del juego de hipótesis a
comprobar, de aquí que, si existen tres juegos de hipótesis entonces también
se trabajará con tres tipos de distribuciones. Este tema se tratará en la sección
siguiente (2.3).

Potrebbero piacerti anche