Sei sulla pagina 1di 109

PRUEBA DE HIPÓTESIS

CONTENIDO
INTRODUCCIÓN
HIPÓTESIS
TIPOS DE PRUEBAS DE HIPÓTESIS
ERRORES TIPO I Y TIPO II
REGLAS DE DECISIÓN
ELECCIÓN DE ESTADÍSTICOS
PROCEDIMIENTO GENERAL

PRUEBA DE HIPÓTESIS PROCEDIMIENTOS


UNA MUESTRA DOS MUESTRAS
MEDIA: Varianza conocida, n≥30 MEDIAS INDEPENDIENTES: Varianza conocida, n≥30
MEDIAS INDEPENDIENTES: Varianza desconocida, varianzas iguales (n<30)
MEDIA: Varianza desconocida, n<30
MEDIAS INDEPENDIENTES: Varianza desconocida, varianzas desiguales (n<30)
PROPORCIÓN POBLACIONAL
MEDIAS DEPENDIENTES (RELACIONADAS)
VARIANZA POBLACIONAL PARA PROPORCIONES
PARA VARIANZAS
PRUEBA DE HIPÓTESIS

INTRODUCCIÓN
A menudo, el problema al que se enfrentan el
investigador no es tanto la estimación de un parámetro
poblacional, sino la toma de decisión sobre la base del
análisis de datos experimentales, la cual ofrezca una
conclusión acerca del fenómeno estudiado. Cualquiera
que sea el caso, el investigador postula o conjetura algo
acerca del objeto de estudio (hipótesis). Los
procedimientos que conducen al rechazo o no rechazo
de hipótesis, comprenden un área importante de la
inferencia estadística que se denomina prueba o
contraste de hipótesis.
PRUEBA DE HIPÓTESIS

HIPÓTESIS: DEFINICIÓN
Es una afirmación o suposición tentativa sujeta a
confirmación sobre una pregunta de investigación, el tipo
de distribución de una variable de estudio, la relación
entre dos variables o el valor de un parámetro poblacional.
Según el diccionario de la Real Academia Española (RAE),
es una suposición de algo posible o imposible para sacar
de ello una consecuencia.
PRUEBA DE HIPÓTESIS

TIPOS DE HIPÓTESIS
Las hipótesis pueden ser DE TRABAJO o bien ESTADÍSTICAS. Una
hipótesis de trabajo se plantea en términos de lo que espera el
investigador del proceso y ejecución de la investigación en
cuanto a los datos y su correspondiente análisis estadístico, con
base al conocimiento previo sobre el objeto de estudio. Según
Anderson y Sweeney (2008), como lineamiento general, la
hipótesis de investigación debe plantearse en términos de
hipótesis alternativa. Según el diccionario de la RAE, es una
hipótesis que se establece provisionalmente como base de una
investigación que puede confirmar o negar la validez de aquella.
Las hipótesis estadísticas se plantean para cada una de las
pruebas a realizar en la investigación, estableciendo relaciones
comparativas de igualdad o desigualdad acerca de una
característica poblacional o parámetro muestral.
PRUEBA DE HIPÓTESIS
HIPÓTESIS NULA (Ho)
Es la suposición de una relación de igualdad que se desea
someter a prueba, se formula sobre la base de lo considerado
cierto, aceptado o conocido con el propósito de ser rechazada.
Es una hipótesis conservadora en el sentido que se mantiene
mientras no se demuestre lo contrario. Es la pretensión de
creencia previa que se supone cierta. La palabra nulo significa
“sin ningún valor, efecto o consecuencia”. Se simboliza HO o H0
(hache o, o bien, hache sub-cero).
PRUEBA DE HIPÓTESIS
LA HIPÓTESIS NULA
Algunos ejemplos de hipótesis nulas según el tipo de prueba
estadística son:
• En la prueba de hipótesis para un parámetro poblacional:
Ho: La media muestral es igual a la media inicial o hipotética.
Ho: La diferencia de las medias muestrales es igual a cero.
• En la prueba de hipótesis para la relación entre variables:
Ho: Las variables son independientes.
Ho: El coeficiente de correlación es igual cero
• En la prueba de hipótesis de distribución normal de una variable
Ho: La distribución de la variable aleatoria es igual a la distribución
normal.
• En la prueba de hipótesis para el efecto de tratamientos
Ho: El efecto sobre la variable de estudio de uno de los
tratamientos, es igual a cualquiera del resto de tratamientos
evaluados.
PRUEBA DE HIPÓTESIS
HIPÓTESIS ALTERNATIVA
HIPÓTESIS ALTERNATIVA (Ha): Se formula con base a lo que el
investigador espera o cree que es verdadero, es la negación de
la hipótesis nula. El contenido establece lo contrario de lo que
dice la hipótesis nula. Implica un cambio de lo habitual o
conocido que requiere de evidencia muestral conclusiva. Se
simboliza Ha o H1 (hache a, o bien, hache sub-uno).

RELACIÓN ENTRE Ho y Ha
▪ El rechazo de Ho confirma lo establecido en la Ha.
▪ El no rechazo de Ho, niega lo establecido en la Ha
Las hipótesis nula y alternativa son afirmaciones opuestas. Una de las
dos, ya sea la hipótesis nula o la alternativa es verdadera, pero no
ambas.
PRUEBA DE HIPÓTESIS
¿DE UNA O DOS COLAS?
Ejemplos pares de hipótesis para la media de una
población expresadas en forma simbólica:

Ho :  = 0 Ho :   0 Ho :   0
Ha :   0 Ha :  0 Ha :  0

HIPÓTESIS ESTADÍSTICAS HIPÓTESIS ESTADÍSTICAS


BILATERALES UNILATERALES

PRUEBA DE HIPÓTESIS PRUEBA DE HIPÓTESIS


DE DOS COLAS DE UNA COLA
En las hipótesis: ≤0 y ≥0, el
término de igual es condición suficiente
PRUEBA DE HIPÓTESIS
Dependiendo de la forma en que se planteen las hipótesis, las pruebas
pueden de dos colas (inferior y superior), o bien, de una cola (inferior
o superior), como se muestra en la figura. El hecho que una prueba de
hipótesis sea de una o dos colas lo determina la forma de la hipótesis
alternativa. 0.5
0.5 0.5

0.4 0.4 0.4

0.3 0.3 0.3

0.2 0.2 0.2

0.1 0.1 0.1

-3 -2 -1 1 2 3 -3 -2 -1 1 2 3 -3 -2 -1 1 2 3

Ho :   0 Ho :  = 0 Ho :   0
Ha :  0 Ha :   0 Ha :  0

DE UNA COLA DE DOS COLAS DE UNA COLA


“INFERIOR” “SUPERIOR”
PRUEBA DE HIPÓTESIS
TIPOS DE ERRORES
La prueba de hipótesis es un procedimiento inferencial para la
toma de decisiones, y como tal, implica la probabilidad de llegar
a una conclusión errónea. Lo ideal es que la prueba de hipótesis
lleve al no rechazo de H0 cuando H0 es realmente verdadera, o
bien, a la no aceptación de H0 cuando Ho es efectivamente
falsa. Las conclusiones correctas no siempre son posibles. Como
la prueba de hipótesis se basa en una información muestral debe
tenerse en cuenta que existe la posibilidad de error en la
decisión.
PRUEBA DE HIPÓTESIS
TIPOS DE ERRORES
En toda prueba de hipótesis existe la posibilidad de cometer dos
tipos de errores, uno al tomar la decisión de aceptar la hipótesis
nula cuando es falsa (error tipo II) y el otro la de rechazar la
hipótesis nula cuando es verdadera (error tipo I). Usualmente se
prueba Ho controlando solamente el error tipo I. Por lo general el
investigador no determina la probabilidad de cometer el error de
tipo II, aunque, se debe advertir sobre la importancia de tenerla
en cuenta. La importancia relativa de los errores depende de los
costos inherentes a cada tipo de error y estos costos deberían
servir como pautas para fijar las probabilidades de cometerlos (Di
Rienzo et. al., 2009).
PRUEBA DE HIPÓTESIS
TIPOS DE ERRORES
Según Gujarati (2006) (pag. 114) ”Lo ideal sería que minimizar
ambos tipos de errores. Pero, desafortunadamente, para
cualquier tamaño muestral, no es posible minimizar ambos
errores de manera simultánea. El planteamiento clásico de
este problema, incorporado en los trabajos de los estadísticos
Neyman y Pearson, consiste en suponer que es más probable
que un error de tipo I sea más grave, en la práctica, que uno
de tipo II. Por tanto, se debería intentar mantener la
probabilidad de cometer error de tipo I a un nivel bastante
bajo, como 0.01 ó 0.05, y después minimizar el error de tipo II
todo lo que se pueda.
PRUEBA DE HIPÓTESIS
TIPOS DE ERRORES
Por ejemplo, en un juicio, la hipótesis nula es que la persona
acusada de un delito es inocente.
▪ Se comete error tipo I cuando la persona es declarada culpable
(se rechaza Ho), dado que en realidad es inocente (Ho es
verdadera).
▪ Se comete error tipo II cuando la persona es declarada inocente
(se acepta Ho), dado que en realidad es culpable (Ho es falsa).

Aunque en términos generales se considere que el error tipo II es


menos dañino que el error tipo I, no deja de ser relativo. En el
presente caso, a la persona individual le es más dañino que el juez
cometa error tipo I en la decisión. Pero a la sociedad, le es más
dañino que el juez cometa error tipo II en la decisión.
PRUEBA DE HIPÓTESIS
TIPOS DE ERRORES
Otro ejemplo. En procesos productivos, la hipótesis nula podría ser que
la producción de aceite de palma (actividad actual) tenga una
rentabilidad mayor o igual que la producción de cacao para exportación
(actividad alterna).
▪ El productor comete error tipo I cuando toma la decisión de
producir cacao para exportación (rechaza Ho), dado que en realidad
la producción de aceite es, efectivamente, más rentable (Ho
verdadera)
▪ El productor comete error tipo II cuando toma la decisión de
continuar produciendo aceite de palma africana (acepta Ho), dado
que en realidad la producción de cacao para exportación es más
rentable.
En el presente caso, no hay duda que sería más dañina la probabilidad
de cometer error tipo I, dada la pérdida de recursos que ocasionaría
cambiar una actividad productiva por otra que en realidad es menos
rentable que aquella.
PRUEBA DE HIPÓTESIS
NIVEL DE SIGNIFICANCIA ()
El nivel de significancia se define como la probabilidad de tomar la
decisión de rechazar la hipótesis nula cuando ésta es verdadera
(falso positivo), es decir, es la probabilidad de cometer error tipo I.
Esto es, la probabilidad de que el estadístico utilizado para
contrastar las hipótesis se realice en la región de rechazo cuando la
hipótesis nula es cierta. A las aplicaciones estadísticas y pruebas de
hipótesis en que sólo se controla el error tipo I se les llama
pruebas de significancia. Muchas aplicaciones de las pruebas de
hipótesis son de este tipo. En la práctica la persona responsable de
la prueba de hipótesis, es quién fija el nivel de significancia. Al
elegir un valor, el nivel de significación fijado es la probabilidad
máxima y admisible de cometer el error de tipo I y constituye el
instrumento que tiene el investigador para controlar la frecuencia
con que puede ocurrir este tipo de error.
PRUEBA DE HIPÓTESIS
NIVEL DE SIGNIFICANCIA ()
Para Anderson, Sweeney & Williams (2010), el nivel de
significancia es la probabilidad de cometer un error tipo I cuando
la hipótesis nula es verdadera como igualdad. Tener en cuenta
que el rechazo de una hipótesis nula se da a partir de la
evidencia de la muestra, no obstante, existe una pequeña
probabilidad de obtener información muestral de la misma
población, en la que de hecho, la hipótesis nula es verdadera.
Entonces, el nivel de significancia indica el porcentaje de
medias muestrales en las que Ho podría ser verdadera,
habiéndose rechazado.
PRUEBA DE HIPÓTESIS
NIVEL DE SIGNIFICANCIA ()
Un nivel de significación estándar es 0.05 (tasa de error tipo I), pero
niveles de significación como 0.01 y 0.001 son también convencionales.
Se puede pensar en que lo ideal sería que la tasa de error tipo I fuera
cero o muy pequeña porque aumenta la confiabilidad, pero, el
problema es que cuando se disminuye la tasa de error tipo I aumenta la
probabilidad de ocurrencia de del error tipo II, disminuyendo la
potencia de la prueba. Del mismo modo, a medida que el nivel de
significación aumenta, disminuye la probabilidad de cometer un error
tipo II y con ello, se incrementa la potencia de la prueba (Montgomery y
Runger, 2010). La única forma de reducir la probabilidad de incurrir en
error tipo II sin aumentar la probabilidad de cometer error de tipo I es
aumentar el tamaño de la muestra, lo que no siempre es posible en la
práctica”. Para uno u otro nivel de significación fijado, es razonable
alcanzar una potencia de al menos de 0.80 y, a lo sumo, una
probabilidad de cometer error tipo II (probabilidad beta) de 0.20.
PRUEBA DE HIPÓTESIS
SOBRE EL TAMAÑO DE LA MUESTRA
El tamaño muestral afecta a la probabilidad de la significación estadística a
través del error estándar que se hace más pequeño cuantos más
observaciones tenga el estudio. Por esta razón una pequeña diferencia
puede ser estadísticamente significativa si se dispone de un tamaño
muestral lo suficientemente grande y por el contrario un efecto o diferencia
relativamente grande puede no alcanzar la significación estadística si la
variabilidad es grande debida a un pequeño tamaño muestral. Por ello,
definir el nivel de significación de la prueba y decidir el tamaño de la
muestra por consideraciones prácticas, conlleva perder el control del error
tipo II, por ello, esa no es la forma científica de hacerlo. En este sentido, una
fórmula que puede utilizarse para calcular el tamaño muestral y que toma
en cuenta la probabilidad alpha, probabilidad Beta, la desviación estándar y
la diferencia relevante a detectar en el estudio es la siguiente:
   
n=
diferencia relevante
PRUEBA DE HIPÓTESIS
¿SE ACEPTA O NO SE RECHAZA Ho?
Aunque en la mayor parte de las aplicaciones de las pruebas de
hipótesis se controla la probabilidad de cometer un error tipo I,
no siempre sucede lo mismo con un error tipo II. Por tanto, si se
decide aceptar Ho no sería posible establecer la confianza en
esa decisión. Debido a la incertidumbre de cometer un error
tipo II al realizar una prueba de significancia los dedicados a la
estadística suelen recomendar que se diga “no se rechaza Ho”
en lugar de “se acepta Ho”. En efecto, al no aceptar
directamente Ho, se evita el riesgo de cometer un error tipo II.
Siempre que no se determine y controle la probabilidad de
cometer un error tipo II, NO SE DIRÁ “SE ACEPTA Ho”. De ahí
que sólo son posibles dos conclusiones: no se rechaza Ho o se
rechaza Ho (Anderson, Sweeney & Williams, 2012, pág. 355)
PRUEBA DE HIPÓTESIS

CÁLCULO DEL ERROR TIPO II


No obstante, aunque no es común hacerlo, es posible
controlar el error tipo II en una prueba de hipótesis. Para ello
se establece un valor relevante para la media en el rango de
valores en que la hipótesis nula puede ser rechazada,
calculados a partir del nivel de significancia. Si se ha
establecido un control adecuado para el error tipo II, las
medidas basadas en la conclusión “se acepta Ho” son
adecuadas (Anderson, Sweeney & Williams, 2012).
PRUEBA DE HIPÓTESIS
POTENCIA DE UNA PRUEBA ()
Cuando la hipótesis nula no se rechaza puede deberse a dos causas: la
hipótesis nula es cierta o la prueba de hipótesis no tuvo la potencia
suficiente para detectar que la hipótesis nula es falsa. Esto último
ocurre, por ejemplo, cuando la media muestral es diferente de la
media hipotética (y por lo tanto la hipótesis nula es falsa), pero la
discrepancia entre ambos es pequeña y/o el tamaño de la muestra es
insuficiente para detectarla dada la magnitud del error experimental.
La probabilidad de que con una muestra de tamaño n y error
experimental determinados pueda detectar una discrepancia
específica entre dos valores se conoce como potencia. Esta
probabilidad se representa usualmente con la letra griega π.
PRUEBA DE HIPÓTESIS
POTENCIA DE UNA PRUEBA ()
Un aspecto importante del diseño de un experimento debe contemplar
el número de repeticiones (tamaño de la muestra) necesarias para que,
dado un nivel de error experimental, la prueba estadística tenga una
potencia razonable para detectar una discrepancia dada (por ejemplo
una potencia igual o mayor que 0.80).
Los cálculos de potencia son importantes para asegurar que los
experimentos tengan el potencial de proporcionar conclusiones útiles.
Muchos organismos que proporcionan financiamiento para
investigación científica requieren que con cada propuesta se presenten
cálculos de potencia de las pruebas de hipótesis que realizarán
(Navidi, 2006).
PRUEBA DE HIPÓTESIS
POTENCIA DE UNA PRUEBA
En estadística se tienen unas pruebas que son conservadoras y otras
con mayor potencia. Por regla general, entre más conservadora es una
prueba menos potente es. Se dice que una prueba estadística es
conservadora cuando se controla la probabilidad de cometer error tipo I
(el nivel de significancia), y por consiguiente, en el nivel de confianza de
la conclusión, con el objeto de no detectar diferencias significativas
cuando en realidad no existen, es decir, estas pruebas tienden a
“conservar” la hipótesis nula.
Se dice que una prueba estadística no es conservadora cuando se
controla la probabilidad de cometer error tipo II, y por consiguiente, la
potencia de la prueba, con el objeto de detectar diferencias cuando
éstas realmente existen, es decir, estas pruebas tienden a “no
conservar” la hipótesis nula.
La potencia de la prueba es una medida de cuan buena es la prueba.
Dadas dos pruebas que son conservadoras la de mayor potencia sería la
mejor y la que debe utilizarse.
PRUEBA DE HIPÓTESIS
ERRORES Y CONCLUSIONES CORRECTAS
SITUACIÓN EN LA POBLACIÓN
CONCLUSIÓN
HO VERDADERA HO FALSA
( vn ) ( fn )
NO SE RECHAZA HO Conclusión
Error tipo II
correcta
(Se acepta Ho)
1− 
( fp ) ( vp )
SE RECHAZA HO Conclusión
Error tipo I
(No se acepta Ho)  correcta
1− 

▪ A la probabilidad de cometer error tipo I en la conclusión se le llama nivel de significancia (),


es decir, de rechazar la hipótesis nula cuando es verdadera, que sería detectar diferencias
cuando éstas realmente no existen. A la probabilidad de no rechazar acertadamente Ho
cuando es verdadera se le llama nivel de confianza (1− ).
▪ A la posibilidad de cometer error tipo II en la conclusión se le llama probabilidad beta (), es
decir, de aceptar la hipótesis nula cuando es falsa, que sería no detectar diferencias cuando
éstas realmente existen. A la probabilidad de no aceptar acertadamente Ho cuando es falsa se
le llama potencia de la prueba (1− ).
PRUEBA DE HIPÓTESIS
REFERENCIA ESTADÍSTICA DE LA DECISIÓN
TASA DE ERROR SUPUESTO DE DECISIÓN SEGÚN LA PRUEBA
BAJO CONTROL LA PRUEBA NO SE RECHAZA Ho SE RECHAZA Ho
Ho ES Nivel de confianza Nivel del
ERROR TIPO I
VERDADERA (1-) significancia ()
Ha ES Probabilidad Beta Potencia de la
ERROR TIPO II
VERDADERA () prueba (1−)
Si en la prueba de hipótesis se controla la tasa de error tipo I, el supuesto de la prueba es que la
hipótesis nula es verdadera. Si se fija un nivel de significancia de 5% y la decisión en dicha prueba es
no rechazar Ho, entonces se dice: “Con un nivel de confianza de 95%, no se rechaza la hipótesis
nula”. En este caso la referencia estadística de la decisión es el nivel de confianza y no el nivel de
significancia fijado. Ahora, si la decisión es “rechazar la Ho”, la referencia estadística sería
efectivamente la probabilidad de cometer error tipo I, es decir, el nivel de significancia.

Si en la prueba de hipótesis se controla la tasa de error tipo II, el supuesto de la prueba es que la
hipótesis alternativa es verdadera. Si se fija una probabilidad beta de 20% y la decisión en dicha
prueba es aceptar Ho (no rechazar Ho), entonces se dice: “Con una probabilidad beta de 20%, se
acepta la hipótesis nula”. En este caso la referencia estadística de la decisión es efectivamente la
probabilidad de cometer error tipo II y no la potencia de la prueba. Ahora, si la decisión es “no
aceptar Ho” (rechazar Ho), la referencia estadística sería la potencia de la prueba.
PRUEBA DE HIPÓTESIS
RECURSOS PARA EL CÁLCULO DE ERRORES TIPO I,
TIPO II Y POTENCIA DE LA PRUEBA
❑ Tipos de error en test de significancia (en R)
library(tigerstats)
library(shinyjs)
library(manipulate)
shiny::runApp(system.file("Type12Errors",package="tigerstats"))

❑ Entendiendo el poder estadístico y las pruebas de significación una


visualización interactiva:
https://rpsychologist.com/d3/NHST/

❑ Utilizando XlStat o Gpower 3.1


PRUEBA DE HIPÓTESIS

VALOR DEL ESTADÍSTICO Y REGLAS DE DECISIÓN


Según sea el caso, z (normal), t (Student) o F (Fischer), debe
diferenciarse entre el valor del estadístico de prueba
calculado (zcal) y el valor del estadístico tabulado o valor
crítico (ztab). En el caso específico del estadístico z, por
ejemplo, z tabulado (ztab) queda definido por el nivel de
significancia y define la región de rechazo y no rechazo de la
hipótesis nula. Mientras que el valor de z calculado (zcal) se
define a partir de la relación entre el valor de parámetro
poblacional hipotético y el estimado a partir de la muestra.
La regla de decisión de rechazar o no rechazar la hipótesis
nula puede basarse en el valor y ubicación de zcal, o bien, en
su correspondiente valor-p.
PRUEBA DE HIPÓTESIS

0.4 zcal = 1.23 No se rechaza Ho


 = 0.05 p( z = 1.23) = 0.1093
valor p = 2 ( 0.1093) = 0.2186
0.3 ztab = 1.96 valor p 

zcal = 2.1 Se rechaza Ho


Densidad

p( z = 1.23) = 0.0179
0.2 valor p = 2 ( 0.0179 ) = 0.0358
zcal ztab valor p  

zcal  ztab REGIÓN DE NO zcal  ztab


0.1 Región de RECHAZO Ho Región de
rechazo Ho rechazo Ho

0.025 0.025
0.0
-1.960 0 1.960
X
PRUEBA DE HIPÓTESIS
0.5

VALOR DE ESTADÍSTICO Y REGLAS DE DECISIÓN


0.4

Bilateral de dos colas,


inferior y superior
0.3

Ho :  = 0
Ha :   0
0.2

Zona de NO
Zona de rechazo de Ho Zona de
rechazo Ho 0.1 rechazo Ho

-3
ztab
-2 -1 1
ztab2 3

 
p-valor = 2  P( zcal ) 
2 2
PRUEBA DE HIPÓTESIS
0.5

VALOR DE ESTADÍSTICO Y REGLAS DE DECISIÓN


0.4

Ho :   0
0.3 Ha :  0
Unilateral de
0.2
cola superior

Zona de
0.1 rechazo Ho

-3 -2 -1 1
ztab 2 3

 p-valor = P( zcal )
PRUEBA DE HIPÓTESIS
VALOR DE ESTADÍSTICO Y REGLAS DE DECISIÓN
A) Según el valor y la ubicación del zcal, la regla de
decisión es la siguiente:

Si zcal  ztab  SE RECHAZA LA HIPÓTESIS NULA

Si zcal ztab  NO SE RECHAZA LA HIPÓTESIS NULA

En el caso que zcal sea mayor o igual que el valor crítico (ztab),
aquel tendrá que ubicarse necesariamente en la zona de
rechazo de la hipótesis nula. Pero si es menor, la ubicación
será en la zona de no rechazo de la hipótesis nula. Por tanto,
el valor crítico (ztab) es el mayor valor del estadístico que
hará que se rechace la hipótesis nula.
PRUEBA DE HIPÓTESIS
VALOR DE ESTADÍSTICO Y REGLAS DE DECISIÓN
B) Regla de decisión basada en el p-valor
El valor p es el riesgo que se corre, según los datos
muestrales, de rechazar la hipótesis nula cuando en
realidad es verdadera. El p-valor se obtiene de la tabla de
distribución del estadístico muestral utilizo, obteniendo la
probabilidad que le corresponde al valor del estadístico
calculado.
PRUEBA DE HIPÓTESIS
VALOR DE ESTADÍSTICO Y REGLAS DE DECISIÓN
B) Regla de decisión basada en el p-valor
El p-valor se obtiene a partir del estadístico de prueba
calculado. La regla de decisión resulta de la comparación
entre el nivel de significancia observado (p-valor) y el
nivel de significancia fijado ():

Si p-valor    SE RECHAZA LA HIPÓTESIS NULA


En este caso se dice que el p-valor es lo suficientemente pequeño para
rechazar la hipótesis nula.

Si p -valor   NO SE RECHAZA LA HIPÓTESIS NULA


En este caso se dice que p-valor NO ES lo suficientemente pequeño para
rechazar la hipótesis nula.
PRUEBA DE HIPÓTESIS

RECHAZO DE LA HIPÓTESIS NULA: SIGNIFICADO


Cuando no se rechaza la hipótesis nula esto no prueba que la
hipótesis nula (H0) sea verdadera; simplemente no existe
evidencia estadística para rechazarla. Es así porque la única
forma en que puede aceptarse la hipótesis con seguridad, es
cuando se conoce el parámetro de población y,
desafortunadamente, esto no es posible. Por consiguiente,
siempre que se afirme que se rechaza la hipótesis nula, en
realidad lo que se quiere decir es que existe suficiente
evidencia estadística para rechazarla.
PRUEBA DE HIPÓTESIS

RECHAZO DE LA HIPÓTESIS NULA: SIGNIFICADO


Algunas expresiones equivalentes para indicar el significado del
“rechazo de la hipótesis nula” son:
▪ La diferencia es estadísticamente significativa
▪ Existe suficiente evidencia para dudar de la hipótesis nula
▪ Existe suficiente evidencia para no confiar en la hipótesis nula
▪ El resultado observado no es compatible con la hipótesis nula
▪ Los datos de la muestra no son consistentes con la hipótesis nula
▪ Es probable que el resultado observado no sea debido al azar
▪ Las muestras proceden de poblaciones diferentes

La estructura general de la conclusión relacionada con una prueba de


hipótesis es la siguiente:
Referencia estadística/decisión/significado e interpretación contextual
PRUEBA DE HIPÓTESIS
ELECCIÓN DEL ESTADÍSTICO DE PRUEBA A UTILIZAR
EN PRUEBAS DE HIPÓTESIS
En analogía con el tema de intervalos de confianza, el estadístico t de Student se
utiliza cuando la varianza es desconocida y n<30, de lo de lo contrario se utiliza
distribución normal. El mismo criterio se utiliza para el caso de pruebas de hipótesis
de dos muestras.
El estadístico t de Student se utiliza también en el caso de pruebas de hipótesis que
incluyen dos muestras DEPENDIENTES (un solo grupo, con dos observaciones por
cada elemento muestral) y cuando se tienen dos muestras INDEPENDIENTES (dos
grupos con una observación por cada elemento muestral) con varianzas iguales o
desiguales. Así, los términos dependiente e independiente se refieren a que si las dos
muestras provienen de la observación de un solo grupo, o bien, de dos grupos de
entes, respectivamente. El análisis de dos grupos independientes puede resultar en
muestras que tienen varianzas homogéneas (estadísticamente iguales) o
heterogéneas (estadísticamente desiguales). Valores extremos en el conjunto de
observaciones o el uso de variables no relativizadas, entre otros factores, pueden
generar heterocedasticidad de varianzas. En cualquier caso, lo ideal es realizar una
prueba de homocedasticidad de varianzas para verificar si se trata de varianzas
homogéneas o heterogéneas.
PRUEBA DE HIPÓTESIS
PROCEDIMIENTO GENERAL PARA REALIZAR UNA PRUEBA
DE HIPÓTESIS
1. Identificar si se trata de una prueba de hipótesis para la media, la varianza o
una proporción
2. Establecer si se trata de una prueba de hipótesis de una muestra o de dos
muestras.
3. Determinar si trata de una prueba de una o dos colas y luego plantear
hipótesis nula y alternativa
4. Elegir el estadístico de prueba a utilizar.
5. Determinar el valor del estadístico tabulado (valor crítico) en función del
nivel de significancia y definir la zona de rechazo y no rechazo de la hipótesis
nula
6. Obtener el valor del estadístico de prueba calculado (o su p-valor si es
requerido)
7. Comparar el valor crítico (el tabulado) con el valor de estadístico de prueba
calculado. O bien comparar el nivel de significancia con el p-valor
8. Emitir conclusión en función de la situación planteada.
PRUEBA DE HIPÓTESIS: UNA MUESTRA
INTRODUCCIÓN: IGUALDAD MATEMÁTICA
Y ESTADÍSTICA
En matemática la igualdad entre dos valores corresponde al
principio lógico de identidad de manera que: a=a y 3=3, por citar dos
ejemplos. De hecho, dos valores pueden ser diferentes desde el
punto de vista matemático, pero estadísticamente iguales. En
estadística se trata de determinar, si la diferencia observada entre
dos valores es más grande que la esperada como producto del azar o
la casualidad, de ser ese el caso, se dice que la diferencia es
significativa y que los valores son estadísticamente diferentes.
Ahora bien, si la diferencia es tal, que la misma podría ocurrir debido
al azar o la causalidad, se dice que la diferencia no es significativa, y
en consecuencia, que los valores son estadísticamente iguales.
PRUEBA DE HIPÓTESIS: UNA MUESTRA

INTRODUCCIÓN: PROPÓSITO
El propósito de la prueba de hipótesis es hacer un juicio
respecto a la diferencia entre el valor calculado del estadístico
de una muestra y un parámetro hipotético de la población. La
prueba comienza con una suposición llamada hipótesis, que
se hace acerca de un parámetro poblacional. Para probar la
validez de esa suposición se recolectan datos para formar una
muestra, se obtienen estadísticos muestrales y se determina
la diferencia entre el valor hipotético y el valor de la media
muestral. Después se juzga si la diferencia obtenida es
significativa o no, para decidir qué tan probable es que el
parámetro hipotético de la población sea correcto.
PRUEBA DE HIPÓTESIS: UNA MUESTRA

INTRODUCCIÓN: PROPÓSITO
Lo que se pretende con las pruebas de hipótesis es determinar,
por ejemplo, si dos valores son estadísticamente diferentes, o
bien, si la diferencia es significativa. De hecho dos valores
pueden ser diferentes o uno mayor que otro, pero dicha
diferencia puede no ser estadísticamente significativa.
Desafortunadamente, la diferencia entre el parámetro de
población hipotético y el estadístico de la muestra rara vez es tan
grande que se deba rechazar automáticamente la hipótesis, o tan
pequeña, que deba aceptarse con la misma rapidez. Mientras
más pequeña sea la diferencia, mayor será la probabilidad de que
el valor hipotético para la media sea correcto. Mientras mayor
sea la diferencia, más pequeña será la probabilidad de que el
valor hipotético para la media sea correcto.
PRUEBA DE HIPÓTESIS: UNA MUESTRA

¿A qué se refieren los términos de las hipótesis?

Media poblacional
() cuyo estimador
puntual es la media
muestral ( )
Ho :  = 0
Ha :   0

Media poblacional
hipotética o inicial
PRUEBA DE HIPÓTESIS: UNA MUESTRA
EJEMPLO
A manera de ilustración, se sabe que el tiempo promedio de los estudiantes
para graduarse en la universidad, desde el ingreso, es 10 años con una
desviación promedio de 3.75 años. Un grupo de investigadores creen que
dicho promedio ha disminuido en los últimos años. Como parte del proceso
de búsqueda de evidencias que apoyen la afirmación de que hoy en día el
tiempo promedio poblacional es menor a 10.0 años, se selecciona
aleatoriamente una muestra de 36 estudiantes, obteniéndose un promedio
de 8.5 años.
a) Redacte los escenarios en que se incurría en error tipo I y tipo II.
b) Realice una prueba de hipótesis para contrastar la hipótesis nula fijando
un nivel de significancia de 0.05 y emita una conclusión.
c) Calcule la diferencia relevante y la distancia de Cohen.
d) Calcule la probabilidad de cometer error tipo II y la potencia de la prueba
de hipótesis, en el supuesto que la hipótesis alternativa es verdadera.
PRUEBA DE HIPÓTESIS: UNA MUESTRA
EJEMPLO
Aunque el texto no indica expresamente relaciones de orden como “mayor
que o menor que”, la expresión: “dicho promedio ha disminuido” implica que
la prueba de hipótesis es de una cola y que la hipótesis alternativa es de cola
inferior. Las hipótesis son las siguientes.
Ho :   10.0
Ha :  10.0
a) Los escenarios en que se incurría en error tipo I y tipo II:
Error tipo I: corresponde a la eventual conclusión de los investigadores de que el
tiempo promedio para obtener el título universitario es menor que 10 años, cuando en
realidad el promedio es igual o mayor que 10 años. Es decir, rechazar Ho≥10, dado que
Ho es verdadera.
Error tipo II: corresponde a la eventual conclusión de los investigadores de que el
tiempo promedio para obtener el título universitario es igual o mayor a 10 años,
cuando en realidad el promedio es menor a 10 diez años. Es decir, aceptar Ho≥10,
dado que Ha es verdadera (Ho falsa).
Una u otra situación dependerá del valor de la media muestral
obtenido a partir de una muestra de tamaño n.
PRUEBA DE HIPÓTESIS: UNA MUESTRA
EJEMPLO
b) Realice una prueba de hipótesis para contrastar la hipótesis nula
fijando un nivel de significancia de 0.05 y emita una conclusión

En el presente ejemplo se utilizará el estadístico muestra z porque la


varianza es conocida (3.752). Además, no se requirió calcularla a partir
de la muestra y el tamaño de la muestra es mayor a 30 datos.
Dado que se ha fijado un nivel de significancia, se deduce que el error
que se controla en la prueba es el error tipo I, en el supuesto que la
hipótesis nula es verdadera. Con estos antecedentes se determina el
valor crítico (ztab) en función del nivel de significancia utilizando la tabla
de distribución normal estándar. Con este valor se define la zona de
rechazo y no rechazo de Ho.

ztab( =0.05) = z ( p  0.05 ) = −1.645


Este valor define la zona de rechazo y de no rechazo de la hipótesis nula
PRUEBA DE HIPÓTESIS: UNA MUESTRA
EJEMPLO
Ahora se calcula el estadístico de prueba:
x − 0 x − 0 8.5 − 10.0 −1.5
zcal = = = = = −2.4
EE  3.75 0.625
n 36

−2.4 −1.645
Z cal Ztab

Con un nivel de significancia de


0.05, se rechaza la hipótesis nula.
Zona de Zona de NO
rechazo Ho rechazo de Ho Existe suficiente evidencia para
dudar de la hipótesis nula, el tiempo
promedio para graduarse en la
universidad es menor que 10 años.
−2.4 −1.645
zcal ztab
PRUEBA DE HIPÓTESIS: UNA MUESTRA
EJEMPLO
c) Calcule la diferencia relevante y la distancia de Cohen.
▪ La diferencia relevante consiste en la diferencia entre la media
hipotética y la muestral. Cuando se expresa como distancia de Cohen (d)
se le denomina tamaño del efecto.
x − 0 8.5 − 10 x − 0 8.5 − 10 En ambos casos es
z= = = −2.4 d= = = −0.4 negativo, −2.4 y −0.4,
EE 0.625  3.75 cola unilateral inferior.

d) Calcule la probabilidad de cometer error tipo II y la potencia de la


prueba de hipótesis, en el supuesto que la hipótesis alternativa es
verdadera.
▪ El valor crítico (ztab) se expresa en términos de la variable de estudio:
xcrit − 0 ztab( =0.05) = z ( p  0.05 ) = −1.645
ztab =
EE xcrit = ztab  EE + 0
xcrit = ztab  EE + 0
xcrit = −1.645  0.625 + 10 = 8.97 años
PRUEBA DE HIPÓTESIS: UNA MUESTRA
EJEMPLO
▪ Ahora se estandariza la diferencia entre media muestral y la media
crítica.
x = 8.5 años xcrit = 8.97 años
xcrit − x 8.97 − 8.5 0.47
z= = = = 0.752
EE 0.625 0.625
▪ Calculado la probabilidad de cometer error tipo II:
 = p ( z  0.752 ) = 1 − p ( z  0.752 ) = 1 − 
 = p ( z  0.752 ) = 0.774 Probabilidad de no aceptar Ho cuando Ha es verdadera (potencia
de la prueba).

 = 1 −  = 1 − 0.774
 = 0.226 Probabilidad de aceptar Ho cuando Ha es verdadera.
PRUEBA DE HIPÓTESIS: UNA MUESTRA

EJEMPLO
Por lo tanto, si la hipótesis alternativa es verdadera y μ=8.5,
entonces β0.23. Si se toman sucesivas muestra de tamaño 36
de una población con μ=8.5 (en lugar de 10.0) y σ=3.75, la regla
de decisión que se ha usado con α=0.05 conducirá a aceptar
incorrectamente la hipótesis nula 23 de cada 100 veces.
Por otro lado, la potencia de la prueba es 0.77. Esto significa
que si el tiempo promedio para graduarse en la universidad es,
en realidad, igual que 8.5 años, entonces, la probabilidad de
que la prueba de hipótesis detecte el hecho que efectivamente
dicho promedio es menor que 10 años es 77%, cuando el
tamaño de la muestra es 36. O bien, la regla de decisión que se
ha utilizado con α=0.05 conducirá a NO aceptar correctamente
la hipótesis nula 77 de cada 100 veces. Ambas situaciones se
muestran en las siguientes figuras.
PRUEBA DE HIPÓTESIS: UNA MUESTRA

Suponiendo que
Ho es verdadera

Zona de Zona de NO
rechazo Ho rechazo de Ho

 = 0.05  = 0.95

z = −1.645 z=0

Suponiendo que
Ha es verdadera

Zona de
Zona de NO aceptación Ho
aceptación Ho
 = 0.77  = 0.23

z=0
z = 0.752
PRUEBA DE HIPÓTESIS: UNA MUESTRA

Distancia de
Cohen (d)

En el supuesto que En el supuesto que


Ha es verdadera Ho es verdadera
PRUEBA DE HIPÓTESIS: UNA MUESTRA
EJERCICIO
Embarques de granos de café se examinan en busca de humedad. Un alto
índice de humedad indica posible contaminación de agua, lo que origina
el rechazo del embarque. Sea  la media del contenido de humedad (en
porcentaje por peso) en un embarque. Se hicieron cinco mediciones de
humedad a los granos elegidos aleatoriamente del embarque. Se hará una
prueba de hipótesis Ho: ≤10 contra Ha: >10 a un nivel de significancia
de 5%.
a) ¿Cuál es la potencia de la prueba si el contenido de humedad
verdadero es de 12%, y la desviación estándar, s=1.5%?
b) Encuentre el tamaño muestral necesario con el propósito de que la
potencia sea al menos 0.9.

(Tomado de: Navidi, 2006, pág. 454)


PRUEBA DE HIPÓTESIS: UNA MUESTRA
EJERCICIO
Se realizó un estudio sobre residuos de pesticidas en tomate en Cobán Alta Verapaz. El LMR
indica el límite máximo de residuo de un plaguicida en un determinado producto con base en
estudios de ingesta diaria promedio del alimento y la toxicidad del plaguicida en particular.
Recogida las muestras se procedió a la separación e identificación de cada uno de los
plaguicidas mediante cromatografía de gases con detector de microcaptura electrónica (µ-ECD).
Los resultados de la evaluación revelan la presencia de Clorpirifós en las cantidades mostradas
a continuación. Esta substancia es uno de los insecticidas organofosforados más utilizados en
agricultura para el control de larvas de lepidópteros, mosca blanca y trips, según la Agencia de
Protección Ambiental (EPA). Para el CODEX ALIMENTARIUS, el LMR del Clorpirifós en tomate es
0.5 mg/kg y se quiere determinar, con base a los resultados de la muestra, si los residuos
exceden el límite máximo.
a) Redacte los escenarios en que se incurría en error tipo I y tipo II.
b) Realice una prueba de hipótesis para contrastar la hipótesis nula fijando un nivel
de significancia de 0.05 y emita una conclusión
c) Calcule la diferencia relevante y la distancia de Cohen.
d) Calcule la probabilidad de cometer error tipo II y la potencia de la prueba de
hipótesis, en el supuesto que la hipótesis alternativa es verdadera.

0.56 0.53 0.60 0.58 0.62 0.57 0.47 0.55 0.57


0.59 0.58 0.44 0.50 0.47 0.60 0.38 0.50 0.56
PRUEBA DE HIPÓTESIS: UNA MUESTRA
EJERCICIO
Se acepta que después de 3 años de almacenamiento el vigor de un
arbusto forrajero medido como peso seco alcanzado a los 20 días de la
germinación es de 45 miligramos promedio. Se propone un nuevo
método de almacenamiento para aumentar el vigor. Se evalúan para
ello 20 lotes de 10 semillas cada uno y al cabo de 3 años se las hace
germinar, obteniéndose los siguientes resultados de peso seco
promedio a los 20 días:
49 43 56 57 59 65 52 51 50 55
60 65 53 57 67 56 53 37 45 42

a) Plantear las hipótesis nula y alternativa asociadas al problema.


b) Realizar un contraste de hipótesis con un nivel de significación
α=0.01.
c) Calcule la probabilidad beta y la potencia de la prueba
d) De acuerdo a la conclusión que se obtuvo en el inciso b, ¿se justifica
realizar un cálculo de potencia?; ¿por qué?
(Tomado de: Di Rienzo et. al., 2009)
PRUEBA DE HIPÓTESIS: UNA MUESTRA

http://www.r-tutor.com/elementary-statistics/type-2-errors

https://rpsychologist.com/d3/NHST/
http://www.southampton.ac.uk/~cpd/anovas/datasets/Power.htm
PRUEBA DE HIPÓTESIS: UNA MUESTRA
PARA LA MEDIA CON VARIANZA CONOCIDA (n30)
Hace algunos años, la renta promedio de un departamento se calculó
en Q895 por mes, con desviación estándar poblacional de Q175.00.
Un estudio reciente, en una muestra de 180 sitios de alquiler en todo
el país revela que la renta por departamento mensual es Q915.00.
¿Estos datos muestrales permiten concluir que la media actual de la
renta de departamentos es superior a la media encontrada hace
algunos años? Plantear las hipótesis. Cuál es el valor de tabla del
estadístico y el p- valor correspondiente. Con alfa de 0.01, ¿cuál es la
conclusión?

Estadístico de prueba:
x − 0 x − 0
zcal = =
 EE
n
PRUEBA DE HIPÓTESIS: UNA MUESTRA

Se utiliza el estadístico z porque es para muestra grande. Es una


prueba de hipótesis unilateral de cola superior porque se quiere
determinar si la media muestral es superior a la media hipotética.

Planteamiento de hipótesis
Ho :   Q895.00
Ha :  Q895.00

Valor crítico (ztab)

ztab( =0.01) = z ( p  0.99 ) = 2.33


PRUEBA DE HIPÓTESIS: UNA MUESTRA
Definiendo zona de rechazo y no rechazo de hipótesis nula
0.4

0.3

0.2

Zona de
rechazo Ho
0.1

Zona de NO rechazo de Ho
-3 -2 -1 1 2 3

1.53 2.33
zcal ztab
Calculando el estadístico de prueba:

n ( x − 0 ) 180 ( 915 − 895 )


zcal = = = 1.53
 175
PRUEBA DE HIPÓTESIS: UNA MUESTRA
0.4

0.3

0.2

Zona de
rechazo Ho
0.1

Zona de NO rechazo de Ho

-3 -2 -1 1 2 3

1.53 2.33
zcal ztab
zcal se ubica en la zona de no rechazo de la hipótesis nula, porque es
menor que ztab. Por ello, con un nivel de significancia de 1%, no se
rechaza Ho, es decir, no existe suficiente evidencia estadística para
concluir que la media de la renta actual de departamentos sea
superior a la media encontrada hace algunos años.
PRUEBA DE HIPÓTESIS: UNA MUESTRA

Calculando el p-valor:
Z cal = 1.53
P ( z = 1.53) = 0.4370
p -valor = 0.5 − 0.437 = 0.063
p -valor = 0.063

0.063 0.01
p -valor 

No se rechaza la hipótesis nula. El p-valor no es lo suficiente


pequeño para rechazar Ho. No existe suficiente evidencia
estadística para afirmar que la renta mensual por departamento
es superior a la media encontrada hace algunos años.
PRUEBA DE HIPÓTESIS: UNA MUESTRA
PARA LA MEDIA CON VARIANZA CONOCIDA (n30)
Hace algunos años, la renta promedio de un departamento se calculó
en Q895 por mes, con desviación estándar poblacional de Q175.00.
Un estudio reciente, en una muestra de 180 departamentos en todo
el país revela que la renta por departamento mensual es Q925.00.
¿Estos datos muestrales permiten concluir que la media actual de la
renta de departamentos es diferente a la media encontrada hace
algunos años? Plantear las hipótesis. Cuál es el valor de tabla del
estadístico y el p- valor correspondiente. Con alfa de 0.05, ¿cuál es la
conclusión?
PRUEBA DE HIPÓTESIS: UNA MUESTRA
EJERCICIOS
Según un estudio a nivel nacional, un hogar paga en promedio Q32.79
semanales por el servicio de internet. En una muestra de 50 hogares del
oriente del país, la media muestral fue Q30.63. Use una desviación
estándar poblacional de Q5.60, para determinar si los datos muestrales
favorecen la conclusión de que la cantidad media pagada por el
servicio de internet en la costa sur es menor a la media de todo el
país. Cuál es su conclusión con un alfa de 0.01.

Se sabe que en el 2006, las empresas pagaron en promedio


Q125,000.00 por empleado a nivel nacional por concepto de
prestaciones, con desviación estándar poblacional de Q30,000. Se tomó
una muestra en la ciudad capital para saber si la media es diferente a
la reportada para la toda la república. Teniendo en cuenta que una
muestra de 40 empleados revela un pago de prestaciones de
118,000.00 por trabajador, cuál es su conclusión con un nivel de
significancia de 0.05.
PRUEBA DE HIPÓTESIS: UNA MUESTRA
PARA LA MEDIA CON VARIANZA DESCONOCIDA (n30)
El consumo anual per cápita de leche en ámbito nacional es 21.6
galones, pero se cree en el oriente del país el consumo de leche es
mayor. A partir de una muestra de 16 personas del oriente, se
determinó que el consumo promedio anual fue de 24.1 galones con
desviación estándar de 4.8. Desarrolle una prueba de hipótesis para
determinar si el consumo medio anual en el oriente del país es mayor
que la media nacional utilizando un nivel de significancia de 0.05.

Estadístico de prueba:

x − 0 n ( x − 0 )
ttab = =
s s
n
PRUEBA DE HIPÓTESIS: UNA MUESTRA

Se utiliza el estadístico t porque es para una muestra pequeña. Es una


prueba de hipótesis unilateral de cola superior porque se quiere
determinar si la media muestral es superior a la media hipotética.

Planteamiento de hipótesis
Ho :   21.6
Ha :  21.6

Valor crítico (ttab)

ttab( 0.05,15) = 1.753


PRUEBA DE HIPÓTESIS: UNA MUESTRA
til
Definiendo zona de rechazo y no rechazo de hipótesis nula
Versión Estudiantil
n Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil Versión Estudiantil
til Versión Estudiantil T Student(15):
Versión p(evento)=0.0516
Estudiantil Versión Estudiantil Versión Estudiantil
0.39
n Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
til Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
n Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
til Versión
0.29Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
n Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
til Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
n Estudiantil
0.20
Versión Estudiantil Versión Estudiantil Zona de
Versión Estudiantil Versión Estudiantil
til Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
n Estudiantil Versión Estudiantil Versión Estudiantilrechazo Ho
Versión Estudiantil Versión Estudiantil
til Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
n Estudiantil
0.10 Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
til Versión Estudiantil Zona de NO
Versión Estudiantil
Versión Estudiantil Versión Estudiantil
n Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
til Versión Estudiantil rechazo de Versión
Versión Estudiantil Ho Estudiantil Versión Estudiantil
0.00
n Estudiantil Versión
-5.371 Estudiantil
-3.581 -1.790Versión
0.000 Estudiantil
1.790 Versión
3.581 Estudiantil
5.371 Versión Estudiantil
til Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
1.753 2.083
ttab tcal
Calculando el estadístico de prueba:

n ( x − 0 ) 16 ( 24.1 − 21.6 )
tcal = = = 2.083
s 4.8
PRUEBA DE HIPÓTESIS: UNA MUESTRA
diantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
ersión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
diantil Versión Estudiantil T Student(15):
Versión p(evento)=0.0516
Estudiantil Versión Estudiantil Versión Estudiantil
0.39
ersión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
diantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
ersión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
diantil Versión
0.29Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
ersión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
diantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
ersión Estudiantil
0.20
Versión Estudiantil Versión Estudiantil Zona de
Versión Estudiantil Versión Estudiantil
diantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
ersión Estudiantil Versión Estudiantil Versión Estudiantilrechazo Ho
Versión Estudiantil Versión Estudiantil
diantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
ersión Estudiantil
0.10 Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
diantil Versión Estudiantil Zona de NO
Versión Estudiantil Versión Estudiantil Versión Estudiantil
ersión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
diantil Versión Estudiantil rechazo de Versión
Versión Estudiantil Ho Estudiantil Versión Estudiantil
0.00
ersión Estudiantil Versión
-5.371 Estudiantil
-3.581 -1.790Versión
0.000 Estudiantil
1.790 Versión
3.581 Estudiantil
5.371 Versión Estudiantil
diantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
1.753 2.083
ttab tcal
tcal se ubica en la zona de rechazo de la hipótesis nula,
porque es mayor que ttab. Por ello, con un nivel de
significancia de 5% existe suficiente evidencia estadística
para concluir que la media del consumo anual per cápita
de leche en el oriente es mayor que la media nacional
PRUEBA DE HIPÓTESIS: UNA MUESTRA
PROPORCIÓN DE POBLACIÓN: MUESTRA GRANDE
Una muestra aleatoria de 150 donaciones recientes en cierto
banco de sangre revela que 82 fueron de sangre tipo A. ¿Sugiere
esto que el porcentaje de donaciones tipo A difiere de 40%,
siendo este valor el porcentaje de la población que tiene sangre
tipo A? Realice una prueba de las hipótesis apropiadas utilizando
un nivel de significación de 0.01. ¿Habría sido diferente su
conclusión si se hubiera utilizado un nivel de significación de
0.05?
Estadístico de prueba
pˆ − p0
zcal =
p0 (1 − p0 )
n
PRUEBA DE HIPÓTESIS: UNA MUESTRA
Se utiliza el estadístico z porque es para muestra grande. Es una
prueba de hipótesis bilateral de dos colas porque se quiere
determinar si la proporción muestral es diferente a la proporción
hipotética.
Planteamiento de hipótesis
Ho : p = 40%
Ha : p  40%

Valor crítico (ztab)

ztab  = −2.575
( 2
= 0.005 )
PRUEBA DE HIPÓTESIS: UNA MUESTRA

Definiendo zona de rechazo y no rechazo de hipótesis nula


0.4

0.3

0.2

Zona de Zona de
rechazo Ho rechazo Ho
0.1

Zona de NO rechazo de Ho

−3.667 −2.575
-3 -2 -1 1 2 3

2.575 3.667
zcal ztab ztab zcal
Calculando el estadístico de prueba:
zcal =
pˆ − p0
=
( 150 − 0.40 )
82
= 3.667
p0 (1 − p0 ) 0.4 ( 0.6 )
n 150
PRUEBA DE HIPÓTESIS: UNA MUESTRA
0.4

0.3

0.2

Zona de Zona de
rechazo Ho rechazo Ho
0.1

Zona de NO rechazo de Ho

−3.667 −2.575
-3 -2 -1 1 2 3

2.575 3.667
zcal ztab ztab zcal
zcal se ubica en la zona de rechazo de la hipótesis nula, porque es
mayor que ztab. Por ello, con un nivel de significancia de 1% existe
suficiente evidencia estadística para concluir que el porcentaje de la
población con sangre tipo A es diferente a 40%.
Dado que el valor crítico de z un nivel de significación de 0.05 es
menor que la de 0.01, la conclusión no cambiaría.
PRUEBA DE HIPÓTESIS: UNA MUESTRA
EJERCICIO
Un fabricante de salsa de tomate está en proceso de decidir
si produce o no una versión picante. El departamento de
investigación de mercados de la compañía usó un sondeo
telefónico nacional de 6,000 casas y encontró que 335 de
ellos comprarían la salsa con picante. Un estudio más
extenso hecho dos años antes mostró que 5% de las casas
compraría la marca. Con un nivel de significancia del 2%,
¿debe la compañía concluir que hay un incremento en el
interés por el sabor con picante?
PRUEBA DE HIPÓTESIS: UNA MUESTRA

EJERCICIO
Asúmase que la residualidad (persistencia) de un insecticida tiene
distribución normal con desviación estándar de 2.5. Se sabe que el
insecticida en uso tiene una residualidad media de 30 días. Otro
laboratorio promueve otro insecticida con las mismas características,
pero dicen que tiene una mayor residualidad. En un ensayo con el
objetivo de verificar tal afirmación, una muestra aleatoria simple de
tamaño 12 dio como resultado un promedio de 32 días como
duración del efecto del insecticida. ¿Puede establecerse , al nivel del
5%, que el nuevo insecticida tiene un efecto residual de mayor
duración?
PRUEBA DE HIPÓTESIS: UNA MUESTRA

EJERCICIO
En el envasado de concentrado de tomate una máquina funcionando
correctamente debe envasar en promedio 245 g, con una desviación
estándar de 6 g por tarro. Un técnico con el fin de verificar si la
máquina está funcionando correctamente toma una muestra
aleatoria de tarros de la línea de envasado y mide su contenido. Los
valores que obtuvo fueron: 232; 235; 249; 241; 233; 247; 244; 246;
241; 248; 245 y 243. ¿los resultados de la muestra anterior, al nivel
del 5%, son suficiente para que se detenga el funcionamiento de la
máquina y sea ésta sometida a reparaciones?
Volver a realizar el presente ejercicio asumiendo que no se da el valor de la
desviación estándar poblacional equivalente a 6 g por tarro.
PRUEBA DE HIPÓTESIS: UNA MUESTRA

EJERCICIO
Se cree que una nueva tecnología en crianza de cerdos
produce a los 5 meses de edad ejemplares de peso promedio
mayor a 85 kg. Se toma una muestra aleatoria de 8 cerdos de 5
meses producidos según la nueva tecnología, cuyos pesos
resultan ser: 88; 89; 83; 86; 91; 82; 92 y 89 ¿Es posible concluir
con los datos de la muestra, al nivel del 5 %, que con la nueva
tecnología se obtienen cerdos de 5 meses con peso promedio
mayor a 85 kg?
PRUEBA DE HIPÓTESIS: UNA MUESTRA

EJERCICIO
Un constructor afirma que a lo sumo en el 70% de las
casas que se construyen se instalan sistemas de bombeo y
almacenamiento de agua potable. ¿Estaría de acuerdo con
esta afirmación, si una encuesta aleatoria revela que 37 de
cada 50 casas recién construidas tienen instalados dichos
sistemas? Utilice un nivel de significancia de 0.05.
PRUEBA DE HIPÓTESIS: UNA MUESTRA
VARIANZA DE UNA POBLACIÓN
Es frecuente que se desee comprobar si la variación o dispersión de
una variable es distinta o ha tenido alguna modificación, lo cual se
hace con la prueba de hipótesis para la varianza o de una desviación
estándar poblacional. Para ello pueden utilizarse los estadísticos de
chi-cuadrado o de Fisher. El primero se utiliza en casos de una
muestra y el segundo en casos de dos muestras. Para el caso de una
muestra el estadístico de prueba es:

2 =
( n − 1) s 2

2
Los supuestos son que la muestra es aleatoria simple y que la
población tiene una distribución normal. Éste es un requisito mucho
más estricto que el de una distribución normal, cuando se prueban
aseveraciones acerca de medias.
PRUEBA DE HIPÓTESIS: UNA MUESTRA
VARIANZA DE UNA POBLACIÓN
La empresa que envasa productos biológicos para el control de plagas y
enfermedades utiliza una máquina para llenar los envases, de tal modo
que la desviación estándar de los pesos es de 0.15 onzas. Se prueba una
nueva máquina en 71 envases y la desviación estándar de esta muestra es
de 0.12 onzas. La compañía que fabrica la nueva máquina asevera que ésta
llena los envases con menor variación. Con un nivel de significancia de
0.05, pruebe la afirmación hecha por la compañía.
Planteamiento de hipótesis Gráfica de distribución
Chi-cuadrada, df=70

Ho :   0.15 0.035

Ha : 
0.030
0.15
0.025

0.95
Densidad

0.020

Valor crítico (2 tab) 0.01 5

0.01 0
Región de no

 2tab( =0.95,70) = 51.74


rechazo de Ho
0.005 Región de
rechazo de Ho
0.000
51.74
X
PRUEBA DE HIPÓTESIS: UNA MUESTRA
VARIANZA DE UNA POBLACIÓN

Calculando el estadístico de prueba:

2 =
( n − 1) s 2

=
( 71 − 1)  0.12 2

= 44.8
 2
0.15 2

 cal
2
( 44.8) tab
2
( 51.74 )
Como chi cuadrada es siempre positivo, esta relación de orden implica que el
estadístico de prueba calculado esté ubicado en la zona de rechazo de Ho. Esta
regla de decisión es particularmente distinta a otros estadísticos cuando se trabaja
con hipótesis unilateral de cola inferior.

Conclusión
Hay evidencia suficiente para sustentar la
aseveración de que la variación en el llenado de los
envases es menor con la nueva máquina.
PRUEBA DE HIPÓTESIS: UNA MUESTRA
VARIANZA DE UNA POBLACIÓN

Reglas de decisión en pruebas de hipótesis para una varianza poblacional


PRUEBA DE HIPÓTESIS: UNA MUESTRA
VARIANZA DE UNA POBLACIÓN
Una empresa del giro alimenticio desea determinar si el lote de
una materia prima tiene o no una varianza poblacional
mayor a 15 en su grado de endulzamiento. Se realiza un
muestreo de 20 elementos y se obtiene una varianza muestral
de 20.98; realizar la prueba de hipótesis con alfa = 0.05.
Gráfica de distribución
Chi-cuadrada, df=1 9
0.07

0.06

 cal = 26.57
0.05
2
Densidad

0.04

0.03

0.02 Región de
Región de no rechazo de Ho
0.01 rechazo de Ho
0.05
0.00
0 30.14
X

Conclusión
En este caso2cal cae dentro de la región de no rechazo de la hipótesis
nula. Por lo tanto la varianza poblacional del grado de endulzamiento de
la materia prima es igual a 15.
PRUEBA DE HIPÓTESIS: UNA MUESTRA
VARIANZA DE UNA POBLACIÓN
Una empresa consultora desea determinar la variabilidad
existente en la opinión pública sobre el desempeño del
Gobierno del Estado; históricamente la varianza ha sido de 2
en los puntos de calificación que le otorga la ciudadanía al
gobierno; en el último muestreo se detecto una varianza de 3
tomando como referencia rápida 20 personas; ¿hay elementos
estadísticos suficientes para asegurar que la varianza ha
AUMENTADO? Realice la prueba de hipótesis para contestar la
pregunta anterior con un alfa = 0.10 (equivalente al 10%)
a) Plantee las hipótesis indicando si debe ser prueba de una o
dos colas.
b) Determine mediante el estadístico de prueba chi cuadrada
si se acepta o rechaza la hipótesis nula y cuál sería la
consecuencia del resultado obtenido para la pregunta.
En cuanto a la consecuencia, tome en cuenta que con la misma calificación promedio pero con una varianza muy alta se puede interpretar que hay
gente contenta con el gobierno que le ha asignado calificaciones muy arriba del promedio; pero hay un conjunto poblacional muy molesto con el
gobierno que asigna calificaciones muy por debajo del promedio.
PRUEBA DE HIPÓTESIS: UNA MUESTRA
VARIANZA DE UNA POBLACIÓN
Una pieza para tractores debe fabricarse con medidas de tolerancia
muy estrechas para que sea aceptada por el cliente. Las
especificaciones de producción indican que la varianza máxima en la
longitud de la pieza debe ser 0.0004. Suponga que en 30 piezas la
varianza muestral encontrada ha sido de 0.0005. Use α =0.05 para
probar si se está violando la especificación para la varianza
poblacional de la longitud de la pieza.
PRUEBA DE HIPÓTESIS: UNA MUESTRA
VARIANZA DE UNA POBLACIÓN
Las tasas de interés en hipotecas para vivienda a 30 años con plazos
fijos varían en el tiempo. En el verano de 2000, los datos de varias
partes del país indicaban que la desviación estándar de las tasas de
interés era 0.096. En un estudio realizado en 2001, las tasas de interés
en préstamos a 30 años con plazo fijo en una muestra de 20
instituciones de préstamo mostraron una desviación estándar
muestral de 0.114. Realice una prueba de hipótesis para determinar si
los datos muestrales indican que la variabilidad en las tasas de interés
ha cambiado. Use un nivel de significación de 0.05 y concluya.

No rechaces Ho. No se puede concluir que


la desviación estándar en las tasas de
interés haya cambiado.
PRUEBA DE HIPÓTESIS: DOS MUESTRAS

DOS MUESTRAS
INDEPENDIENTES DEPENDIENTES

(d −d)
n

d
2

CON VARIANZA CON VARIANZA i


sd = i
d= i =1
n −1
CONOCIDA (N≥30) DESCONOCIDA (N<30) n
x1 − x2 d
zcal = tcal =
 12  22 VARIANZAS VARIANZAS sd
+ IGUALES DESIGUALES
n1 n2 n
x1 − x2 x1 − x2
tcal = tcal =
1 1 s12 s22
sp + +
n1 n2 2
n1 n2  s12 s22 
s12 ( n1 − 1) + s22 ( n2 − 1) n +n 
s ( mayor )
2
 1 2 
sp = 3 gl =
n1 + n2 − 2 s ( menor )
2 2 2 2
1  2
s1  1  s2 
+
n1 − 1  n1  n2 − 1  n2 
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
PRUEBA DE HIPÓTESIS PARA DOS MUESTRAS INDEPENDIENTES
CON VARIANZAS DESCONOCIDAS PERO IGUALES
Este es el caso en que se analizan dos grupos, seleccionando muestras
aleatorias independientes (una de cada grupo). Adicionalmente, en ambas
muestras debe cumplirse el supuesto que las observaciones siguen una
distribución normal. Esta prueba debe utilizarse cuando el investigador
está dispuesto a suponer que las varianzas poblacionales son iguales.
Cuando se usa esta suposición, las dos desviaciones estándar muestrales
se combinan para obtener una varianza muestral combinada (sp):
Estadístico de prueba Valor crítico
x1 − x2
tcal = t , gl o t , gl
1 1 2
sp + t ,( n1 + n2 − 2) o t
n1 n2 ,( n1 + n2 − 2 )
2

s12 ( n1 − 1) + s22 ( n2 − 1)
sp =
n1 + n2 − 2
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
PRUEBA DE HIPÓTESIS PARA DOS MUESTRAS INDEPENDIENTES
CON VARIANZAS DESCONOCIDAS PERO IGUALES
El procedimiento de dos muestras que usa una estimación agrupada de la varianza
común s2 se apoya en cuatro importantes suposiciones:
▪ Las muestras deben ser seleccionadas al azar. Las muestras no seleccionadas al
azar pueden introducir sesgo en el experimento y así alterar los niveles de
significancia que el experimentador informe.
▪ Las muestras deben ser independientes. Si no es así, éste no es el procedimiento
estadístico apropiado. Existe otro procedimiento para muestras dependientes.
▪ Las poblaciones de las cuales se muestrea deben ser normales. No obstante, las
desviaciones moderadas desde la normalidad no afectan seriamente la
distribución del estadístico de prueba, en especial si los tamaños muestrales son
casi iguales.
▪ Las varianzas poblacionales deben ser estadísticamente iguales para asegurar
que los procedimientos sean válidos. Si las varianzas están lejos de ser iguales,
hay un procedimiento alternativo. Como regla práctica, NO se podrá utilizar este
procedimiento, si la razón entre las dos varianzas muestrales es mayor que 3.
s 2 mayor
2
3 Mendenhall & Beaver (2010)
s menor
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
La siguiente tabla presenta los resultados de una experiencia conducida
para determinar si una dieta rica en lecitina favorece la producción de leche
en vacas Holstein. En este experimento se utilizaron 18 ejemplares, de los
cuales se seleccionaron aleatoriamente 9 para recibir un suplemento de
lecitina y los restantes actuaron como control. Los resultados están
expresados en litros por día (lpd) promedio por vaca. Emitir una conclusión
realizando una prueba de hipótesis con un nivel de significancia del 5% y
utilice el p-valor como criterio de decisión.
Sin Lecitina 13.0 14.5 16.0 15.0 14.5 15.2 14.1 13.3 15.6
Con Lecitina 17.0 16.5 18.0 17.3 18.1 16.7 19.0 18.3 18.5

p − p1
Estadístico de prueba Valor crítico t= ( t − t ) + t1
p2 − p1 2 1
x1 − x2 t , gl o t
tcal =
( t − t1 )
, gl
1 1 2
sp + p=
t2 − t1
( p2 − p1 ) + p1
n1 n2 t ,( n1 + n2 − 2) o t ,( n1 + n2 − 2 )
2 2
 n 
s12 ( n1 − 1) + s22 ( n2 − 1)   xi 
xi −  i =1 
n

sp =  2

n1 + n2 − 2 s 2 = i =1
n
n −1
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
Planteamiento de hipótesis
Ho : 1 = 2
Ha : 1  2
Se calculan la media y la varianza de cada muestra:
Sin Lecitina Con lecitina
x1 = 14.578 s = 0.999
2
1
x2 = 17.711 s22 = 0.754
Prueba de igualdad de
x1 − x2
varianzas: Estadístico de prueba tcal =
s 2 ( mayor ) 0.999 1 1
= = 1.32 s12 ( n1 − 1) + s22 ( n2 − 1) sp +
s 2 ( menor ) 0.754 sp = n1 n2
n1 + n2 − 2
Son estadísticamente iguales 14.578 − 17.711
tcal =
0.999 ( 8 ) + 0.754 ( 8 ) 1 1
Valor crítico sp = 0.936 +
16 9 9
t , gl o t s p = 0.936
2
, gl tcal = −7.1
t0.05 ,( 9 + 9 − 2 )
= t0.025,16 = 2.12 tcal ttab
2
−7.1 2.12 Se rechaza la hipótesis nula
PRUEBA DE HIPÓTESIS: DOS MUESTRAS

Resultados InfoStat Resultado Excel


Prueba t para dos muestras suponiendo varianzas iguales
Sin Lecitina Con Lecitina
Media 14.5777778 17.7111111
Varianza 0.9994444 0.7536111
Observaciones 9.0000000 9.0000000
Varianza agrupada 0.8765278
Diferencia hipotética de las medias 0.0000000
Grados de libertad 16.0000000
Estadístico t -7.0995368
P(T<=t) dos colas 0.0000025
Valor crítico de t (dos colas) 2.1199053

CONCLUSIÓN
Con un nivel de significancia menor a 0.05, se rechaza la hipótesis nula.
Existe diferencia significativa entre los promedios de producción de
leche por vaca. La media obtenida en los animales alimentados con
lecitina es estadística diferente a la observada en los animales
alimentados sin lecitina, por lo tanto, una dieta rica en lecitina favorece
la producción de leche en vacas Holstein.
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
EJERCICIO
A continuación se muestran información sobre los flujos de carga
expresados en miles de toneladas por día que se registran en dos
puertos guatemaltecos. Se desea determinar si el flujos de carga diaria
de los puertos son diferentes. Desarrolle una prueba de hipótesis con
un nivel de significancia del 5%. Resolver suponiendo varianza iguales
(el procedimiento tanto en Excel como en InfoStat es el mismo).
P BARRIOS 9.10 15.10 8.80 10.00 7.50 10.50 8.30 9.10 6.00 5.80 12.10 9.30
P QUETZAL 4.70 6.00 9.20 8.30 5.50 7.20 4.10 12.60 3.40 7.00

p − p1
Estadístico de prueba Valor crítico t= ( t − t ) + t1
p2 − p1 2 1
x1 − x2 t , gl o t
tcal =
( t − t1 )( p2 − p1 ) + p
, gl
1 1 2
sp + p=
n1 n2 t ,( n1 + n2 − 2) o t t2 − t1 1
,( n1 + n2 − 2 )
2 2
 n 
s12 ( n1 − 1) + s22 ( n2 − 1)   xi 
xi −  i =1 
n

sp =  2

n1 + n2 − 2 s 2 = i =1
n
n −1
PRUEBA DE HIPÓTESIS: DOS MUESTRAS

Resultados InfoStat Resultado Excel


Prueba t para dos muestras suponiendo varianzas iguales

P BARRIOS P QUETZAL
Media 9.300000 6.800000
Varianza 6.465455 7.493333
Observaciones 12.000000 10.000000
Varianza agrupada 6.928000
Diferencia hipotética de las medias0.000000
Grados de libertad 20.000000
Estadístico t 2.218275
P(T<=t) dos colas 0.038274
Valor crítico de t (dos colas) 2.085963
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
PRUEBA DE HIPÓTESIS PARA DOS MUESTRAS INDEPENDIENTES
CON VARIANZAS DESCONOCIDAS PERO DESIGUALES (EXCEL)
Se utiliza cuando se analizan dos grupos que provienen de dos
poblaciones, seleccionando muestras aleatorias independientes, una de
cada población, pero en casos que no se puede asumir que los datos
provengan de poblaciones con varianzas iguales.
Es un procedimiento más general y se recomienda para la mayoría de las
aplicaciones cuando las varianzas son desconocidas, ya que los resultados
no varían mucho de darse el caso que las varianzas fuesen iguales. Las
muestras pueden ser de diferente tamaño, aunque es mejor que sean
iguales o casi iguales. Cuando el tamaño total de la muestra, n1+n2, sea
por lo menos 20 se esperan buenos resultados, aun cuando las
poblaciones no sean normales. Si las distribuciones de las poblaciones
son muy sesgadas o contienen valores atípicos se recomienda usar
muestras más grandes. Muestras pequeñas sólo deben usarse cuando el
analista está convencido de que las distribuciones de las poblaciones
con aproximadamente normales (Anderson, Sweeney & Williams, 2008).
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
A continuación se muestran información sobre los flujos de carga
expresados en miles de toneladas por día que se registran en dos
puertos guatemaltecos. Se desea determinar si el flujos de carga diaria
de los puertos son diferentes. Desarrolle una prueba de hipótesis con
un nivel de significancia del 5%.
P BARRIOS 9.20 13.10 11.90 10.00 9.80 10.50 10.30 9.10 12.40 11.30 12.70 9.60
P QUETZAL 10.70 6.20 12.40 8.30 5.50 7.90 4.10 12.60 5.40 7.00

Estadístico de prueba Para : t , gl o t , gl


x1 − x2
2

tcal = 2
2 2  s12 s22 
s1
+
s 2 n +n 
n1 n2 gl =  1 2 
2 2 2 2
1  s1  1  s2 
+
n1 − 1  n1  n2 − 1  n2 
 

Aproximar al entero más cercano


según las reglas de redondeo
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
Planteamiento de hipótesis
Ho : 1 = 2
Ha : 1  2
Se calculan la media y la varianza de cada muestra:
Puerto Barrios Puerto Quetzal
x1 = 10.825 s12 = 1.980 x2 = 8.010 s22 = 8.930
Prueba de igualdad de varianzas:
s 2 ( mayor ) 8.930
= = 4.51 Son estadísticamente desiguales
s 2 ( menor ) 1.980

Calculando los grados de libertad:

( )
2
 s12 s22  2
n +n  1.98
+
8.93
gl =  1 2 
= 12 10 = 12.29  12
2 2 2 2
( ) ( )
2 2
1  s  1  s  1 1.98
+
1 8.93
+
n1 − 1  n1  n2 − 1  n2 
1 2
11 12 9 10
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estu

Valor crítico (ttab): dos colas


Versión Estudiantil
Versión Estudiantil Versión
0.39
Versión Estudiantil
Estudiantil Versión
Versión Estudiantil
T Student(7): p(evento)=0.0746
Estudiantil Versión
Versión Estudiantil
Estudiantil Versión
Ve
Estu
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Ve

ttab( 0.025,12) = 2.179


Versión Estudiantil

Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión
0.29Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estu
Ve
Versión Estu
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Ve
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estu
Versión Estudiantil Zona de
Versión Estudiantil Versión Estudiantil
Zona de
Versión Estudiantil Ve
0.19
Versión Estudiantil Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
rechazo
Versión Ho
Estudiantil Versión Estudiantil
rechazo
Versión Estudiantil
Ho
Versión Estu
Versión Estudiantil Ve
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estu
Versión Estudiantil
0.10 Versión Estudiantil Versión Estudiantil Versión Estudiantil Ve
Versión Estudiantil Versión Estudiantil Zona de NO Versión Estudiantil
Versión Estudiantil Versión Estu
Versión Estudiantil Versión Estudiantil rechazo deEstudiantil
Versión Ho Versión Estudiantil Ve
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estu
0.00
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Ve
Versión Estudiantil
-5.92
−2.737 −2.179
Versión Estudiantil
-2.96 0.00
Versión Estudiantil
2.96 5.92
2.179 2.737
Versión Estudiantil Versión Estu

tcal ttab ttab tcal

Calculando el estadístico de prueba (tcal):


Conclusión: Se rechaza la
x1 − x2 10.825 − 8.010 hipótesis nula, con un nivel
tcal = = = 2.737 de significancia de 5%, el
s12 s22 1.980 8.930
+ flujo promedio de carga en
+ 12 10 los dos puertos es diferente.
n1 n2
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
PRUEBA DE HIPÓTESIS PARA DOS MUESTRAS INDEPENDIENTES
CON VARIANZAS DESCONOCIDAS PERO DESIGUALES CON
CORRECCIÓN DE SATTERTHWAITE (VERSIÓN INFOSTAT)

Estadístico de prueba 2
x1 − x2 s 2
s 
2

n +n 
1 2
tcal =
s12 s22 gl =  1 2 
−2
+ 2 2
1  s1  1  s2 
2 2
n1 n2
+
n1 + 1  n1  n2 + 1  n2 
 

Valor crítico Se toma solo la parte entera del


t , gl o t , gl
resultado
2
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
A continuación se muestran información sobre los flujos de carga
expresados en miles de toneladas por día que se registran en dos
puertos guatemaltecos. Se desea determinar si el flujos de carga diaria
de los puertos son diferentes. Desarrolle una prueba de hipótesis con
un nivel de significancia del 5%. Utilizar el procedimiento de InfoStat.
P BARRIOS 9.20 13.10 11.90 10.00 9.80 10.50 10.30 9.10 12.40 11.30 12.70 9.60
P QUETZAL 10.70 6.20 12.40 8.30 5.50 7.90 4.10 12.60 5.40 7.00

Planteamiento de hipótesis
Ho : 1 = 2
Ha : 1  2
Se calculan la media y la varianza de cada muestra:
Puerto Barrios Puerto Quetzal
x1 = 10.825 s12 = 1.980 x2 = 8.010 s22 = 8.930
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
Calculando los grados de libertad:

2
 s12 s22 
n +n 
gl =  1 2 
−2
2 2 2
1  s1  1  s2 
2
+
n1 + 1  n1  n2 + 1  n2 

( )
2
1.98 8.93
+ Se toma solo la
gl = 12 10 − 2 = 13.007  13
( ) ( )
2 2 parte entera del
1 1.98 1 8.93
+ resultado
13 12 11 10

Valor crítico (ttab): dos colas

ttab( 0.025,13) = 2.160


PRUEBA DE HIPÓTESIS: DOS MUESTRAS
ión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
ión Estudiantil Versión T Student(7): p(evento)=0.0746
0.39Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
ión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
ión Estudiantil Versión
0.29Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
ión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Zona de
Versión Estudiantil Versión Estudiantil
Zona de
Versión Estudiantil Versión Estudiantil
0.19
ión Estudiantil Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
rechazo
Versión Ho
Estudiantil
Versión Estudiantil
Versión Estudiantil
rechazo Ho
Versión Estudiantil
Versión Estudiantil Versión Estudiantil
ión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil
0.10 Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
ión Estudiantil Versión Estudiantil Zona de NO Versión Estudiantil
Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil rechazo deEstudiantil
Versión Ho Versión Estudiantil Versión Estudiantil
ión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
0.00
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
ión Estudiantil
-5.92
−2.737 −2.16
Versión Estudiantil
-2.96 0.00
Versión Estudiantil
2.96
2.16
Versión Estudiantil
5.92
2.737
Versión Estudiantil

tcal ttab ttab tcal

Calculando el estadístico de prueba (tcal):


Conclusión: Se rechaza la
x1 − x2 10.825 − 8.010 hipótesis nula, con un nivel
tcal = = = 2.737 de significancia de 5%, el
s12 s22 1.980 8.930
+
+ 12 10
flujo promedio de carga en
n1 n2 los dos puertos es diferente.
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
PRUEBA DE HIPÓTESIS PARA DOS MUESTRAS RELACIONADAS,
PAREADAS O DEPENDIENTES CON VARIANZAS DESCONOCIDAS

Existen varias situaciones experimentales en las cuales hay sólo un


conjunto de n individuos u objetos experimentales y se realizan
dos observaciones de cada individuo u objeto. Se toman datos en
dos circunstancias o de distinta índole (dos observaciones) pero en
el mismo conjunto de objetos experimentales o fuentes de
información. El número de datos tiene que ser el mismo en ambas
muestras porque la información se recoge en pares. Se analiza el
mismo grupo, antes y después de la manipulación de una variable
de estudio.
PRUEBA DE HIPÓTESIS: DOS MUESTRAS

Con la finalidad de evaluar un fungicida recomendado para el


control de una enfermedad foliar, se realizaron tres
aplicaciones en una plantación de 2.5 hectáreas en el lapso de
tres semanas. Se dividió en terreno en parcelas del mismo
tamaño y se seleccionaron 8 aleatoriamente para determinar la
incidencia (en porcentaje) de la enfermedad antes de la
primera aplicación y una semana después de la última
aplicación del producto. ¿Es estadísticamente diferente la
incidencia promedio antes y después de la aplicación? =0.05

Momento 1 2 3 4 5 6 7 8
Antes de aplicación 15 38 37 25 32 11 23 16
Después de la aplicación 9 30 10 20 30 5 20 12
PRUEBA DE HIPÓTESIS: DOS MUESTRAS

Estadístico de prueba:
ttab 
d ( , gl )
tcal =
2

sd ttab 
( 2
, n −1 )
n
Donde: 2
  n

n   di 
 i =1 
n

d i  d i
2

n
d= i =1 sd = i =1

n n −1
PRUEBA DE HIPÓTESIS: DOS MUESTRAS

Planteamiento de hipótesis
Ho : 1 = 2
Ha : 1  2

Valor crítico (ttab): dos colas

ttab( 0.025,7 ) = 2.365


Versión Estudiantil

Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión
0.39 Estudiantil
Versión Estudiantil
Versión Estudiantil
T Student(7):
Versión
Versión Estudiantil
Versión Estudiantil
p(evento)=0.0500
Estudiantil Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión
Versión Estu
Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estu
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estu
Versión Estudiantil Versión
0.29Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estu
Versión Estudiantil Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Zona de
Versión Estudiantil Versión Estudiantil
Zona de
Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estu
0.19
Versión Estudiantil Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
rechazo Ho
Versión Estudiantil Versión Estudiantil
rechazo Ho
Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estu
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil
0.10 Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estu
Versión Estudiantil Versión Estudiantil Zona de NOVersión Estudiantil Versión Estudiantil
Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versiónde
rechazo Estudiantil
Ho Versión Estudiantil Versión Estu
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
0.00
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estu

−2.365
-5.92 -2.96 0.00 2.96 5.92
Versión Estudiantil Versión Estudiantil Versión Estudiantil
2.365
Versión Estudiantil Versión Estudiantil

ttab ttab
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
Parcela Antes Después di di2
1 15 9 6 36
Para calcular la
2 38 30 8 64
diferencia promedio, al
3 37 10 27 729 realizar la suma debe
4 25 20 5 25 considerarse el signo de
5 32 30 2 4 las diferencias.
6 11 5 6 36
7 23 20 3 9
8 16 12 4 16
TOTALES 61 919
n

d i
61
d= i =1
= = 7.625 d 7.625
n 8 tcal = = = 2.678
sd 8.0523
2
 n  8
  di  n
 i =1 
n

 d i
2

n 919 −
612
8 = 8.0523
sd = i =1
=
n −1 7
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
udiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
ersión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
udiantil Versión T Student(7): p(evento)=0.0500
0.39Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
ersión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
udiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
ersión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
udiantil Versión
0.29Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
ersión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
udiantil Versión Estudiantil
ersión Estudiantil
Versión Estudiantil
Zona de
Versión Estudiantil Versión Estudiantil
Zona de
Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil
0.19
udiantil Versión Estudiantil
ersión Estudiantil
Versión Estudiantil
rechazo Ho
Versión Estudiantil Versión Estudiantil
rechazo Ho
Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil
udiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
ersión Estudiantil
0.10 Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
udiantil Versión Estudiantil Zona de NOVersión Estudiantil Versión Estudiantil
Versión Estudiantil
ersión Estudiantil Versión Estudiantil rechazo deEstudiantil
Versión Ho Versión Estudiantil Versión Estudiantil
udiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
0.00
ersión Estudiantil Versión Estudiantil Versión Estudiantil2.96
Versión Estudiantil Versión Estudiantil

−2.678 −2.365
-5.92 -2.96 0.00 5.92
udiantil Versión Estudiantil Versión Estudiantil
2.365 2.678
Versión Estudiantil Versión Estudiantil

tcal ttab ttab tcal


tcal se ubica en la zona de rechazo de la hipótesis nula porque es
mayor que ttab. Por ello, con un nivel de significancia de 5%, el
promedio de la incidencia de la enfermedad, antes y después de
la aplicación, son estadísticamente diferentes, es decir el
promedio de las diferencias es significativamente diferente de
cero. El fungicida evaluado muestra un control significativo de la
enfermedad foliar.
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
PRUEBA DE HIPÓTESIS PARA DOS MUESTRAS PAREADAS O
DEPENDIENTES CON VARIANZAS DESCONOCIDAS
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
PRUEBA DE HIPÓTESIS PARA DOS MUESTRAS PAREADAS O
DEPENDIENTES CON VARIANZAS DESCONOCIDAS
Planteamiento de hipótesis
Ho : 1  2
Ha : 1 2
Valor crítico (ttab): una cola
ttab( 0.01,11) = 2.718 Gráfica de distribución
T, df=1 1
0.4

0.3

Zona de
Densidad

0.2 rechazo Ho
Zona de NO
0.1
rechazo de Ho
0.01
0.0
0 2.718
X
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
2 n
Estudiante ANTES DESPUÉS di di
1
2
87
78
83
84
4
-6
16
36
d i
45
3 85 79 6 36 d= i =1
= = 3.75
4 93 88 5 25 n 12
5 76 75 1 1
6 80 81 -1 1 2
 n 
  di 
7 82 74 8 64
8 77 71 6 36
 i =1 
n
9 91 78 13 169  d i
2

n 449 −
452
12 = 5.0475
10 74 73 1 1
sd = i =1
=
11 76 76 0 0 n −1 11
12 79 71 8 64
Totales 45 449

d 3.75
tcal = = = 2.574
sd 5.0475
n 12
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
PRUEBA DE HIPÓTESIS PARA DOS MUESTRAS PAREADAS O
DEPENDIENTES CON VARIANZAS DESCONOCIDAS
Gráfica de distribución
T, df=1 1
0.4

0.3

Zona de
Densidad

0.2
rechazo Ho
Zona de NO
0.1
rechazo de Ho
0.01
0.0
0 2.574 2.718
X
ttab
tcal ttab
2.574 2.718 No se rechaza la hipótesis nula

R/ No existe suficiente evidencia estadística para rechazar la hipótesis


nula. La tensión promedio de los estudiantes no es significativamente
mayor previo a la realización de los exámenes, porque el promedio de las
diferencias es estadísticamente igual a cero.
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
PRUEBA DE HIPÓTESIS PARA DOS MUESTRAS PAREADAS O
DEPENDIENTES CON VARIANZAS DESCONOCIDAS

Levin, 7ª. Ed.

R/ En promedio, la impresora de inyección de tinta Apson no es


significativamente menos costosa que la Okaydata.

Utilizar una cola

Potrebbero piacerti anche