Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
CONTENIDO
INTRODUCCIÓN
HIPÓTESIS
TIPOS DE PRUEBAS DE HIPÓTESIS
ERRORES TIPO I Y TIPO II
REGLAS DE DECISIÓN
ELECCIÓN DE ESTADÍSTICOS
PROCEDIMIENTO GENERAL
INTRODUCCIÓN
A menudo, el problema al que se enfrentan el
investigador no es tanto la estimación de un parámetro
poblacional, sino la toma de decisión sobre la base del
análisis de datos experimentales, la cual ofrezca una
conclusión acerca del fenómeno estudiado. Cualquiera
que sea el caso, el investigador postula o conjetura algo
acerca del objeto de estudio (hipótesis). Los
procedimientos que conducen al rechazo o no rechazo
de hipótesis, comprenden un área importante de la
inferencia estadística que se denomina prueba o
contraste de hipótesis.
PRUEBA DE HIPÓTESIS
HIPÓTESIS: DEFINICIÓN
Es una afirmación o suposición tentativa sujeta a
confirmación sobre una pregunta de investigación, el tipo
de distribución de una variable de estudio, la relación
entre dos variables o el valor de un parámetro poblacional.
Según el diccionario de la Real Academia Española (RAE),
es una suposición de algo posible o imposible para sacar
de ello una consecuencia.
PRUEBA DE HIPÓTESIS
TIPOS DE HIPÓTESIS
Las hipótesis pueden ser DE TRABAJO o bien ESTADÍSTICAS. Una
hipótesis de trabajo se plantea en términos de lo que espera el
investigador del proceso y ejecución de la investigación en
cuanto a los datos y su correspondiente análisis estadístico, con
base al conocimiento previo sobre el objeto de estudio. Según
Anderson y Sweeney (2008), como lineamiento general, la
hipótesis de investigación debe plantearse en términos de
hipótesis alternativa. Según el diccionario de la RAE, es una
hipótesis que se establece provisionalmente como base de una
investigación que puede confirmar o negar la validez de aquella.
Las hipótesis estadísticas se plantean para cada una de las
pruebas a realizar en la investigación, estableciendo relaciones
comparativas de igualdad o desigualdad acerca de una
característica poblacional o parámetro muestral.
PRUEBA DE HIPÓTESIS
HIPÓTESIS NULA (Ho)
Es la suposición de una relación de igualdad que se desea
someter a prueba, se formula sobre la base de lo considerado
cierto, aceptado o conocido con el propósito de ser rechazada.
Es una hipótesis conservadora en el sentido que se mantiene
mientras no se demuestre lo contrario. Es la pretensión de
creencia previa que se supone cierta. La palabra nulo significa
“sin ningún valor, efecto o consecuencia”. Se simboliza HO o H0
(hache o, o bien, hache sub-cero).
PRUEBA DE HIPÓTESIS
LA HIPÓTESIS NULA
Algunos ejemplos de hipótesis nulas según el tipo de prueba
estadística son:
• En la prueba de hipótesis para un parámetro poblacional:
Ho: La media muestral es igual a la media inicial o hipotética.
Ho: La diferencia de las medias muestrales es igual a cero.
• En la prueba de hipótesis para la relación entre variables:
Ho: Las variables son independientes.
Ho: El coeficiente de correlación es igual cero
• En la prueba de hipótesis de distribución normal de una variable
Ho: La distribución de la variable aleatoria es igual a la distribución
normal.
• En la prueba de hipótesis para el efecto de tratamientos
Ho: El efecto sobre la variable de estudio de uno de los
tratamientos, es igual a cualquiera del resto de tratamientos
evaluados.
PRUEBA DE HIPÓTESIS
HIPÓTESIS ALTERNATIVA
HIPÓTESIS ALTERNATIVA (Ha): Se formula con base a lo que el
investigador espera o cree que es verdadero, es la negación de
la hipótesis nula. El contenido establece lo contrario de lo que
dice la hipótesis nula. Implica un cambio de lo habitual o
conocido que requiere de evidencia muestral conclusiva. Se
simboliza Ha o H1 (hache a, o bien, hache sub-uno).
RELACIÓN ENTRE Ho y Ha
▪ El rechazo de Ho confirma lo establecido en la Ha.
▪ El no rechazo de Ho, niega lo establecido en la Ha
Las hipótesis nula y alternativa son afirmaciones opuestas. Una de las
dos, ya sea la hipótesis nula o la alternativa es verdadera, pero no
ambas.
PRUEBA DE HIPÓTESIS
¿DE UNA O DOS COLAS?
Ejemplos pares de hipótesis para la media de una
población expresadas en forma simbólica:
Ho : = 0 Ho : 0 Ho : 0
Ha : 0 Ha : 0 Ha : 0
-3 -2 -1 1 2 3 -3 -2 -1 1 2 3 -3 -2 -1 1 2 3
Ho : 0 Ho : = 0 Ho : 0
Ha : 0 Ha : 0 Ha : 0
Si en la prueba de hipótesis se controla la tasa de error tipo II, el supuesto de la prueba es que la
hipótesis alternativa es verdadera. Si se fija una probabilidad beta de 20% y la decisión en dicha
prueba es aceptar Ho (no rechazar Ho), entonces se dice: “Con una probabilidad beta de 20%, se
acepta la hipótesis nula”. En este caso la referencia estadística de la decisión es efectivamente la
probabilidad de cometer error tipo II y no la potencia de la prueba. Ahora, si la decisión es “no
aceptar Ho” (rechazar Ho), la referencia estadística sería la potencia de la prueba.
PRUEBA DE HIPÓTESIS
RECURSOS PARA EL CÁLCULO DE ERRORES TIPO I,
TIPO II Y POTENCIA DE LA PRUEBA
❑ Tipos de error en test de significancia (en R)
library(tigerstats)
library(shinyjs)
library(manipulate)
shiny::runApp(system.file("Type12Errors",package="tigerstats"))
p( z = 1.23) = 0.0179
0.2 valor p = 2 ( 0.0179 ) = 0.0358
zcal ztab valor p
0.025 0.025
0.0
-1.960 0 1.960
X
PRUEBA DE HIPÓTESIS
0.5
Ho : = 0
Ha : 0
0.2
Zona de NO
Zona de rechazo de Ho Zona de
rechazo Ho 0.1 rechazo Ho
-3
ztab
-2 -1 1
ztab2 3
p-valor = 2 P( zcal )
2 2
PRUEBA DE HIPÓTESIS
0.5
Ho : 0
0.3 Ha : 0
Unilateral de
0.2
cola superior
Zona de
0.1 rechazo Ho
-3 -2 -1 1
ztab 2 3
p-valor = P( zcal )
PRUEBA DE HIPÓTESIS
VALOR DE ESTADÍSTICO Y REGLAS DE DECISIÓN
A) Según el valor y la ubicación del zcal, la regla de
decisión es la siguiente:
En el caso que zcal sea mayor o igual que el valor crítico (ztab),
aquel tendrá que ubicarse necesariamente en la zona de
rechazo de la hipótesis nula. Pero si es menor, la ubicación
será en la zona de no rechazo de la hipótesis nula. Por tanto,
el valor crítico (ztab) es el mayor valor del estadístico que
hará que se rechace la hipótesis nula.
PRUEBA DE HIPÓTESIS
VALOR DE ESTADÍSTICO Y REGLAS DE DECISIÓN
B) Regla de decisión basada en el p-valor
El valor p es el riesgo que se corre, según los datos
muestrales, de rechazar la hipótesis nula cuando en
realidad es verdadera. El p-valor se obtiene de la tabla de
distribución del estadístico muestral utilizo, obteniendo la
probabilidad que le corresponde al valor del estadístico
calculado.
PRUEBA DE HIPÓTESIS
VALOR DE ESTADÍSTICO Y REGLAS DE DECISIÓN
B) Regla de decisión basada en el p-valor
El p-valor se obtiene a partir del estadístico de prueba
calculado. La regla de decisión resulta de la comparación
entre el nivel de significancia observado (p-valor) y el
nivel de significancia fijado ():
INTRODUCCIÓN: PROPÓSITO
El propósito de la prueba de hipótesis es hacer un juicio
respecto a la diferencia entre el valor calculado del estadístico
de una muestra y un parámetro hipotético de la población. La
prueba comienza con una suposición llamada hipótesis, que
se hace acerca de un parámetro poblacional. Para probar la
validez de esa suposición se recolectan datos para formar una
muestra, se obtienen estadísticos muestrales y se determina
la diferencia entre el valor hipotético y el valor de la media
muestral. Después se juzga si la diferencia obtenida es
significativa o no, para decidir qué tan probable es que el
parámetro hipotético de la población sea correcto.
PRUEBA DE HIPÓTESIS: UNA MUESTRA
INTRODUCCIÓN: PROPÓSITO
Lo que se pretende con las pruebas de hipótesis es determinar,
por ejemplo, si dos valores son estadísticamente diferentes, o
bien, si la diferencia es significativa. De hecho dos valores
pueden ser diferentes o uno mayor que otro, pero dicha
diferencia puede no ser estadísticamente significativa.
Desafortunadamente, la diferencia entre el parámetro de
población hipotético y el estadístico de la muestra rara vez es tan
grande que se deba rechazar automáticamente la hipótesis, o tan
pequeña, que deba aceptarse con la misma rapidez. Mientras
más pequeña sea la diferencia, mayor será la probabilidad de que
el valor hipotético para la media sea correcto. Mientras mayor
sea la diferencia, más pequeña será la probabilidad de que el
valor hipotético para la media sea correcto.
PRUEBA DE HIPÓTESIS: UNA MUESTRA
Media poblacional
() cuyo estimador
puntual es la media
muestral ( )
Ho : = 0
Ha : 0
Media poblacional
hipotética o inicial
PRUEBA DE HIPÓTESIS: UNA MUESTRA
EJEMPLO
A manera de ilustración, se sabe que el tiempo promedio de los estudiantes
para graduarse en la universidad, desde el ingreso, es 10 años con una
desviación promedio de 3.75 años. Un grupo de investigadores creen que
dicho promedio ha disminuido en los últimos años. Como parte del proceso
de búsqueda de evidencias que apoyen la afirmación de que hoy en día el
tiempo promedio poblacional es menor a 10.0 años, se selecciona
aleatoriamente una muestra de 36 estudiantes, obteniéndose un promedio
de 8.5 años.
a) Redacte los escenarios en que se incurría en error tipo I y tipo II.
b) Realice una prueba de hipótesis para contrastar la hipótesis nula fijando
un nivel de significancia de 0.05 y emita una conclusión.
c) Calcule la diferencia relevante y la distancia de Cohen.
d) Calcule la probabilidad de cometer error tipo II y la potencia de la prueba
de hipótesis, en el supuesto que la hipótesis alternativa es verdadera.
PRUEBA DE HIPÓTESIS: UNA MUESTRA
EJEMPLO
Aunque el texto no indica expresamente relaciones de orden como “mayor
que o menor que”, la expresión: “dicho promedio ha disminuido” implica que
la prueba de hipótesis es de una cola y que la hipótesis alternativa es de cola
inferior. Las hipótesis son las siguientes.
Ho : 10.0
Ha : 10.0
a) Los escenarios en que se incurría en error tipo I y tipo II:
Error tipo I: corresponde a la eventual conclusión de los investigadores de que el
tiempo promedio para obtener el título universitario es menor que 10 años, cuando en
realidad el promedio es igual o mayor que 10 años. Es decir, rechazar Ho≥10, dado que
Ho es verdadera.
Error tipo II: corresponde a la eventual conclusión de los investigadores de que el
tiempo promedio para obtener el título universitario es igual o mayor a 10 años,
cuando en realidad el promedio es menor a 10 diez años. Es decir, aceptar Ho≥10,
dado que Ha es verdadera (Ho falsa).
Una u otra situación dependerá del valor de la media muestral
obtenido a partir de una muestra de tamaño n.
PRUEBA DE HIPÓTESIS: UNA MUESTRA
EJEMPLO
b) Realice una prueba de hipótesis para contrastar la hipótesis nula
fijando un nivel de significancia de 0.05 y emita una conclusión
−2.4 −1.645
Z cal Ztab
= 1 − = 1 − 0.774
= 0.226 Probabilidad de aceptar Ho cuando Ha es verdadera.
PRUEBA DE HIPÓTESIS: UNA MUESTRA
EJEMPLO
Por lo tanto, si la hipótesis alternativa es verdadera y μ=8.5,
entonces β0.23. Si se toman sucesivas muestra de tamaño 36
de una población con μ=8.5 (en lugar de 10.0) y σ=3.75, la regla
de decisión que se ha usado con α=0.05 conducirá a aceptar
incorrectamente la hipótesis nula 23 de cada 100 veces.
Por otro lado, la potencia de la prueba es 0.77. Esto significa
que si el tiempo promedio para graduarse en la universidad es,
en realidad, igual que 8.5 años, entonces, la probabilidad de
que la prueba de hipótesis detecte el hecho que efectivamente
dicho promedio es menor que 10 años es 77%, cuando el
tamaño de la muestra es 36. O bien, la regla de decisión que se
ha utilizado con α=0.05 conducirá a NO aceptar correctamente
la hipótesis nula 77 de cada 100 veces. Ambas situaciones se
muestran en las siguientes figuras.
PRUEBA DE HIPÓTESIS: UNA MUESTRA
Suponiendo que
Ho es verdadera
Zona de Zona de NO
rechazo Ho rechazo de Ho
= 0.05 = 0.95
z = −1.645 z=0
Suponiendo que
Ha es verdadera
Zona de
Zona de NO aceptación Ho
aceptación Ho
= 0.77 = 0.23
z=0
z = 0.752
PRUEBA DE HIPÓTESIS: UNA MUESTRA
Distancia de
Cohen (d)
http://www.r-tutor.com/elementary-statistics/type-2-errors
https://rpsychologist.com/d3/NHST/
http://www.southampton.ac.uk/~cpd/anovas/datasets/Power.htm
PRUEBA DE HIPÓTESIS: UNA MUESTRA
PARA LA MEDIA CON VARIANZA CONOCIDA (n30)
Hace algunos años, la renta promedio de un departamento se calculó
en Q895 por mes, con desviación estándar poblacional de Q175.00.
Un estudio reciente, en una muestra de 180 sitios de alquiler en todo
el país revela que la renta por departamento mensual es Q915.00.
¿Estos datos muestrales permiten concluir que la media actual de la
renta de departamentos es superior a la media encontrada hace
algunos años? Plantear las hipótesis. Cuál es el valor de tabla del
estadístico y el p- valor correspondiente. Con alfa de 0.01, ¿cuál es la
conclusión?
Estadístico de prueba:
x − 0 x − 0
zcal = =
EE
n
PRUEBA DE HIPÓTESIS: UNA MUESTRA
Planteamiento de hipótesis
Ho : Q895.00
Ha : Q895.00
0.3
0.2
Zona de
rechazo Ho
0.1
Zona de NO rechazo de Ho
-3 -2 -1 1 2 3
1.53 2.33
zcal ztab
Calculando el estadístico de prueba:
0.3
0.2
Zona de
rechazo Ho
0.1
Zona de NO rechazo de Ho
-3 -2 -1 1 2 3
1.53 2.33
zcal ztab
zcal se ubica en la zona de no rechazo de la hipótesis nula, porque es
menor que ztab. Por ello, con un nivel de significancia de 1%, no se
rechaza Ho, es decir, no existe suficiente evidencia estadística para
concluir que la media de la renta actual de departamentos sea
superior a la media encontrada hace algunos años.
PRUEBA DE HIPÓTESIS: UNA MUESTRA
Calculando el p-valor:
Z cal = 1.53
P ( z = 1.53) = 0.4370
p -valor = 0.5 − 0.437 = 0.063
p -valor = 0.063
0.063 0.01
p -valor
Estadístico de prueba:
x − 0 n ( x − 0 )
ttab = =
s s
n
PRUEBA DE HIPÓTESIS: UNA MUESTRA
Planteamiento de hipótesis
Ho : 21.6
Ha : 21.6
n ( x − 0 ) 16 ( 24.1 − 21.6 )
tcal = = = 2.083
s 4.8
PRUEBA DE HIPÓTESIS: UNA MUESTRA
diantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
ersión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
diantil Versión Estudiantil T Student(15):
Versión p(evento)=0.0516
Estudiantil Versión Estudiantil Versión Estudiantil
0.39
ersión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
diantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
ersión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
diantil Versión
0.29Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
ersión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
diantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
ersión Estudiantil
0.20
Versión Estudiantil Versión Estudiantil Zona de
Versión Estudiantil Versión Estudiantil
diantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
ersión Estudiantil Versión Estudiantil Versión Estudiantilrechazo Ho
Versión Estudiantil Versión Estudiantil
diantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
ersión Estudiantil
0.10 Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
diantil Versión Estudiantil Zona de NO
Versión Estudiantil Versión Estudiantil Versión Estudiantil
ersión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
diantil Versión Estudiantil rechazo de Versión
Versión Estudiantil Ho Estudiantil Versión Estudiantil
0.00
ersión Estudiantil Versión
-5.371 Estudiantil
-3.581 -1.790Versión
0.000 Estudiantil
1.790 Versión
3.581 Estudiantil
5.371 Versión Estudiantil
diantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
1.753 2.083
ttab tcal
tcal se ubica en la zona de rechazo de la hipótesis nula,
porque es mayor que ttab. Por ello, con un nivel de
significancia de 5% existe suficiente evidencia estadística
para concluir que la media del consumo anual per cápita
de leche en el oriente es mayor que la media nacional
PRUEBA DE HIPÓTESIS: UNA MUESTRA
PROPORCIÓN DE POBLACIÓN: MUESTRA GRANDE
Una muestra aleatoria de 150 donaciones recientes en cierto
banco de sangre revela que 82 fueron de sangre tipo A. ¿Sugiere
esto que el porcentaje de donaciones tipo A difiere de 40%,
siendo este valor el porcentaje de la población que tiene sangre
tipo A? Realice una prueba de las hipótesis apropiadas utilizando
un nivel de significación de 0.01. ¿Habría sido diferente su
conclusión si se hubiera utilizado un nivel de significación de
0.05?
Estadístico de prueba
pˆ − p0
zcal =
p0 (1 − p0 )
n
PRUEBA DE HIPÓTESIS: UNA MUESTRA
Se utiliza el estadístico z porque es para muestra grande. Es una
prueba de hipótesis bilateral de dos colas porque se quiere
determinar si la proporción muestral es diferente a la proporción
hipotética.
Planteamiento de hipótesis
Ho : p = 40%
Ha : p 40%
ztab = −2.575
( 2
= 0.005 )
PRUEBA DE HIPÓTESIS: UNA MUESTRA
0.3
0.2
Zona de Zona de
rechazo Ho rechazo Ho
0.1
Zona de NO rechazo de Ho
−3.667 −2.575
-3 -2 -1 1 2 3
2.575 3.667
zcal ztab ztab zcal
Calculando el estadístico de prueba:
zcal =
pˆ − p0
=
( 150 − 0.40 )
82
= 3.667
p0 (1 − p0 ) 0.4 ( 0.6 )
n 150
PRUEBA DE HIPÓTESIS: UNA MUESTRA
0.4
0.3
0.2
Zona de Zona de
rechazo Ho rechazo Ho
0.1
Zona de NO rechazo de Ho
−3.667 −2.575
-3 -2 -1 1 2 3
2.575 3.667
zcal ztab ztab zcal
zcal se ubica en la zona de rechazo de la hipótesis nula, porque es
mayor que ztab. Por ello, con un nivel de significancia de 1% existe
suficiente evidencia estadística para concluir que el porcentaje de la
población con sangre tipo A es diferente a 40%.
Dado que el valor crítico de z un nivel de significación de 0.05 es
menor que la de 0.01, la conclusión no cambiaría.
PRUEBA DE HIPÓTESIS: UNA MUESTRA
EJERCICIO
Un fabricante de salsa de tomate está en proceso de decidir
si produce o no una versión picante. El departamento de
investigación de mercados de la compañía usó un sondeo
telefónico nacional de 6,000 casas y encontró que 335 de
ellos comprarían la salsa con picante. Un estudio más
extenso hecho dos años antes mostró que 5% de las casas
compraría la marca. Con un nivel de significancia del 2%,
¿debe la compañía concluir que hay un incremento en el
interés por el sabor con picante?
PRUEBA DE HIPÓTESIS: UNA MUESTRA
EJERCICIO
Asúmase que la residualidad (persistencia) de un insecticida tiene
distribución normal con desviación estándar de 2.5. Se sabe que el
insecticida en uso tiene una residualidad media de 30 días. Otro
laboratorio promueve otro insecticida con las mismas características,
pero dicen que tiene una mayor residualidad. En un ensayo con el
objetivo de verificar tal afirmación, una muestra aleatoria simple de
tamaño 12 dio como resultado un promedio de 32 días como
duración del efecto del insecticida. ¿Puede establecerse , al nivel del
5%, que el nuevo insecticida tiene un efecto residual de mayor
duración?
PRUEBA DE HIPÓTESIS: UNA MUESTRA
EJERCICIO
En el envasado de concentrado de tomate una máquina funcionando
correctamente debe envasar en promedio 245 g, con una desviación
estándar de 6 g por tarro. Un técnico con el fin de verificar si la
máquina está funcionando correctamente toma una muestra
aleatoria de tarros de la línea de envasado y mide su contenido. Los
valores que obtuvo fueron: 232; 235; 249; 241; 233; 247; 244; 246;
241; 248; 245 y 243. ¿los resultados de la muestra anterior, al nivel
del 5%, son suficiente para que se detenga el funcionamiento de la
máquina y sea ésta sometida a reparaciones?
Volver a realizar el presente ejercicio asumiendo que no se da el valor de la
desviación estándar poblacional equivalente a 6 g por tarro.
PRUEBA DE HIPÓTESIS: UNA MUESTRA
EJERCICIO
Se cree que una nueva tecnología en crianza de cerdos
produce a los 5 meses de edad ejemplares de peso promedio
mayor a 85 kg. Se toma una muestra aleatoria de 8 cerdos de 5
meses producidos según la nueva tecnología, cuyos pesos
resultan ser: 88; 89; 83; 86; 91; 82; 92 y 89 ¿Es posible concluir
con los datos de la muestra, al nivel del 5 %, que con la nueva
tecnología se obtienen cerdos de 5 meses con peso promedio
mayor a 85 kg?
PRUEBA DE HIPÓTESIS: UNA MUESTRA
EJERCICIO
Un constructor afirma que a lo sumo en el 70% de las
casas que se construyen se instalan sistemas de bombeo y
almacenamiento de agua potable. ¿Estaría de acuerdo con
esta afirmación, si una encuesta aleatoria revela que 37 de
cada 50 casas recién construidas tienen instalados dichos
sistemas? Utilice un nivel de significancia de 0.05.
PRUEBA DE HIPÓTESIS: UNA MUESTRA
VARIANZA DE UNA POBLACIÓN
Es frecuente que se desee comprobar si la variación o dispersión de
una variable es distinta o ha tenido alguna modificación, lo cual se
hace con la prueba de hipótesis para la varianza o de una desviación
estándar poblacional. Para ello pueden utilizarse los estadísticos de
chi-cuadrado o de Fisher. El primero se utiliza en casos de una
muestra y el segundo en casos de dos muestras. Para el caso de una
muestra el estadístico de prueba es:
2 =
( n − 1) s 2
2
Los supuestos son que la muestra es aleatoria simple y que la
población tiene una distribución normal. Éste es un requisito mucho
más estricto que el de una distribución normal, cuando se prueban
aseveraciones acerca de medias.
PRUEBA DE HIPÓTESIS: UNA MUESTRA
VARIANZA DE UNA POBLACIÓN
La empresa que envasa productos biológicos para el control de plagas y
enfermedades utiliza una máquina para llenar los envases, de tal modo
que la desviación estándar de los pesos es de 0.15 onzas. Se prueba una
nueva máquina en 71 envases y la desviación estándar de esta muestra es
de 0.12 onzas. La compañía que fabrica la nueva máquina asevera que ésta
llena los envases con menor variación. Con un nivel de significancia de
0.05, pruebe la afirmación hecha por la compañía.
Planteamiento de hipótesis Gráfica de distribución
Chi-cuadrada, df=70
Ho : 0.15 0.035
Ha :
0.030
0.15
0.025
0.95
Densidad
0.020
0.01 0
Región de no
2 =
( n − 1) s 2
=
( 71 − 1) 0.12 2
= 44.8
2
0.15 2
cal
2
( 44.8) tab
2
( 51.74 )
Como chi cuadrada es siempre positivo, esta relación de orden implica que el
estadístico de prueba calculado esté ubicado en la zona de rechazo de Ho. Esta
regla de decisión es particularmente distinta a otros estadísticos cuando se trabaja
con hipótesis unilateral de cola inferior.
Conclusión
Hay evidencia suficiente para sustentar la
aseveración de que la variación en el llenado de los
envases es menor con la nueva máquina.
PRUEBA DE HIPÓTESIS: UNA MUESTRA
VARIANZA DE UNA POBLACIÓN
0.06
cal = 26.57
0.05
2
Densidad
0.04
0.03
0.02 Región de
Región de no rechazo de Ho
0.01 rechazo de Ho
0.05
0.00
0 30.14
X
Conclusión
En este caso2cal cae dentro de la región de no rechazo de la hipótesis
nula. Por lo tanto la varianza poblacional del grado de endulzamiento de
la materia prima es igual a 15.
PRUEBA DE HIPÓTESIS: UNA MUESTRA
VARIANZA DE UNA POBLACIÓN
Una empresa consultora desea determinar la variabilidad
existente en la opinión pública sobre el desempeño del
Gobierno del Estado; históricamente la varianza ha sido de 2
en los puntos de calificación que le otorga la ciudadanía al
gobierno; en el último muestreo se detecto una varianza de 3
tomando como referencia rápida 20 personas; ¿hay elementos
estadísticos suficientes para asegurar que la varianza ha
AUMENTADO? Realice la prueba de hipótesis para contestar la
pregunta anterior con un alfa = 0.10 (equivalente al 10%)
a) Plantee las hipótesis indicando si debe ser prueba de una o
dos colas.
b) Determine mediante el estadístico de prueba chi cuadrada
si se acepta o rechaza la hipótesis nula y cuál sería la
consecuencia del resultado obtenido para la pregunta.
En cuanto a la consecuencia, tome en cuenta que con la misma calificación promedio pero con una varianza muy alta se puede interpretar que hay
gente contenta con el gobierno que le ha asignado calificaciones muy arriba del promedio; pero hay un conjunto poblacional muy molesto con el
gobierno que asigna calificaciones muy por debajo del promedio.
PRUEBA DE HIPÓTESIS: UNA MUESTRA
VARIANZA DE UNA POBLACIÓN
Una pieza para tractores debe fabricarse con medidas de tolerancia
muy estrechas para que sea aceptada por el cliente. Las
especificaciones de producción indican que la varianza máxima en la
longitud de la pieza debe ser 0.0004. Suponga que en 30 piezas la
varianza muestral encontrada ha sido de 0.0005. Use α =0.05 para
probar si se está violando la especificación para la varianza
poblacional de la longitud de la pieza.
PRUEBA DE HIPÓTESIS: UNA MUESTRA
VARIANZA DE UNA POBLACIÓN
Las tasas de interés en hipotecas para vivienda a 30 años con plazos
fijos varían en el tiempo. En el verano de 2000, los datos de varias
partes del país indicaban que la desviación estándar de las tasas de
interés era 0.096. En un estudio realizado en 2001, las tasas de interés
en préstamos a 30 años con plazo fijo en una muestra de 20
instituciones de préstamo mostraron una desviación estándar
muestral de 0.114. Realice una prueba de hipótesis para determinar si
los datos muestrales indican que la variabilidad en las tasas de interés
ha cambiado. Use un nivel de significación de 0.05 y concluya.
DOS MUESTRAS
INDEPENDIENTES DEPENDIENTES
(d −d)
n
d
2
s12 ( n1 − 1) + s22 ( n2 − 1)
sp =
n1 + n2 − 2
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
PRUEBA DE HIPÓTESIS PARA DOS MUESTRAS INDEPENDIENTES
CON VARIANZAS DESCONOCIDAS PERO IGUALES
El procedimiento de dos muestras que usa una estimación agrupada de la varianza
común s2 se apoya en cuatro importantes suposiciones:
▪ Las muestras deben ser seleccionadas al azar. Las muestras no seleccionadas al
azar pueden introducir sesgo en el experimento y así alterar los niveles de
significancia que el experimentador informe.
▪ Las muestras deben ser independientes. Si no es así, éste no es el procedimiento
estadístico apropiado. Existe otro procedimiento para muestras dependientes.
▪ Las poblaciones de las cuales se muestrea deben ser normales. No obstante, las
desviaciones moderadas desde la normalidad no afectan seriamente la
distribución del estadístico de prueba, en especial si los tamaños muestrales son
casi iguales.
▪ Las varianzas poblacionales deben ser estadísticamente iguales para asegurar
que los procedimientos sean válidos. Si las varianzas están lejos de ser iguales,
hay un procedimiento alternativo. Como regla práctica, NO se podrá utilizar este
procedimiento, si la razón entre las dos varianzas muestrales es mayor que 3.
s 2 mayor
2
3 Mendenhall & Beaver (2010)
s menor
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
La siguiente tabla presenta los resultados de una experiencia conducida
para determinar si una dieta rica en lecitina favorece la producción de leche
en vacas Holstein. En este experimento se utilizaron 18 ejemplares, de los
cuales se seleccionaron aleatoriamente 9 para recibir un suplemento de
lecitina y los restantes actuaron como control. Los resultados están
expresados en litros por día (lpd) promedio por vaca. Emitir una conclusión
realizando una prueba de hipótesis con un nivel de significancia del 5% y
utilice el p-valor como criterio de decisión.
Sin Lecitina 13.0 14.5 16.0 15.0 14.5 15.2 14.1 13.3 15.6
Con Lecitina 17.0 16.5 18.0 17.3 18.1 16.7 19.0 18.3 18.5
p − p1
Estadístico de prueba Valor crítico t= ( t − t ) + t1
p2 − p1 2 1
x1 − x2 t , gl o t
tcal =
( t − t1 )
, gl
1 1 2
sp + p=
t2 − t1
( p2 − p1 ) + p1
n1 n2 t ,( n1 + n2 − 2) o t ,( n1 + n2 − 2 )
2 2
n
s12 ( n1 − 1) + s22 ( n2 − 1) xi
xi − i =1
n
sp = 2
n1 + n2 − 2 s 2 = i =1
n
n −1
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
Planteamiento de hipótesis
Ho : 1 = 2
Ha : 1 2
Se calculan la media y la varianza de cada muestra:
Sin Lecitina Con lecitina
x1 = 14.578 s = 0.999
2
1
x2 = 17.711 s22 = 0.754
Prueba de igualdad de
x1 − x2
varianzas: Estadístico de prueba tcal =
s 2 ( mayor ) 0.999 1 1
= = 1.32 s12 ( n1 − 1) + s22 ( n2 − 1) sp +
s 2 ( menor ) 0.754 sp = n1 n2
n1 + n2 − 2
Son estadísticamente iguales 14.578 − 17.711
tcal =
0.999 ( 8 ) + 0.754 ( 8 ) 1 1
Valor crítico sp = 0.936 +
16 9 9
t , gl o t s p = 0.936
2
, gl tcal = −7.1
t0.05 ,( 9 + 9 − 2 )
= t0.025,16 = 2.12 tcal ttab
2
−7.1 2.12 Se rechaza la hipótesis nula
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
CONCLUSIÓN
Con un nivel de significancia menor a 0.05, se rechaza la hipótesis nula.
Existe diferencia significativa entre los promedios de producción de
leche por vaca. La media obtenida en los animales alimentados con
lecitina es estadística diferente a la observada en los animales
alimentados sin lecitina, por lo tanto, una dieta rica en lecitina favorece
la producción de leche en vacas Holstein.
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
EJERCICIO
A continuación se muestran información sobre los flujos de carga
expresados en miles de toneladas por día que se registran en dos
puertos guatemaltecos. Se desea determinar si el flujos de carga diaria
de los puertos son diferentes. Desarrolle una prueba de hipótesis con
un nivel de significancia del 5%. Resolver suponiendo varianza iguales
(el procedimiento tanto en Excel como en InfoStat es el mismo).
P BARRIOS 9.10 15.10 8.80 10.00 7.50 10.50 8.30 9.10 6.00 5.80 12.10 9.30
P QUETZAL 4.70 6.00 9.20 8.30 5.50 7.20 4.10 12.60 3.40 7.00
p − p1
Estadístico de prueba Valor crítico t= ( t − t ) + t1
p2 − p1 2 1
x1 − x2 t , gl o t
tcal =
( t − t1 )( p2 − p1 ) + p
, gl
1 1 2
sp + p=
n1 n2 t ,( n1 + n2 − 2) o t t2 − t1 1
,( n1 + n2 − 2 )
2 2
n
s12 ( n1 − 1) + s22 ( n2 − 1) xi
xi − i =1
n
sp = 2
n1 + n2 − 2 s 2 = i =1
n
n −1
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
P BARRIOS P QUETZAL
Media 9.300000 6.800000
Varianza 6.465455 7.493333
Observaciones 12.000000 10.000000
Varianza agrupada 6.928000
Diferencia hipotética de las medias0.000000
Grados de libertad 20.000000
Estadístico t 2.218275
P(T<=t) dos colas 0.038274
Valor crítico de t (dos colas) 2.085963
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
PRUEBA DE HIPÓTESIS PARA DOS MUESTRAS INDEPENDIENTES
CON VARIANZAS DESCONOCIDAS PERO DESIGUALES (EXCEL)
Se utiliza cuando se analizan dos grupos que provienen de dos
poblaciones, seleccionando muestras aleatorias independientes, una de
cada población, pero en casos que no se puede asumir que los datos
provengan de poblaciones con varianzas iguales.
Es un procedimiento más general y se recomienda para la mayoría de las
aplicaciones cuando las varianzas son desconocidas, ya que los resultados
no varían mucho de darse el caso que las varianzas fuesen iguales. Las
muestras pueden ser de diferente tamaño, aunque es mejor que sean
iguales o casi iguales. Cuando el tamaño total de la muestra, n1+n2, sea
por lo menos 20 se esperan buenos resultados, aun cuando las
poblaciones no sean normales. Si las distribuciones de las poblaciones
son muy sesgadas o contienen valores atípicos se recomienda usar
muestras más grandes. Muestras pequeñas sólo deben usarse cuando el
analista está convencido de que las distribuciones de las poblaciones
con aproximadamente normales (Anderson, Sweeney & Williams, 2008).
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
A continuación se muestran información sobre los flujos de carga
expresados en miles de toneladas por día que se registran en dos
puertos guatemaltecos. Se desea determinar si el flujos de carga diaria
de los puertos son diferentes. Desarrolle una prueba de hipótesis con
un nivel de significancia del 5%.
P BARRIOS 9.20 13.10 11.90 10.00 9.80 10.50 10.30 9.10 12.40 11.30 12.70 9.60
P QUETZAL 10.70 6.20 12.40 8.30 5.50 7.90 4.10 12.60 5.40 7.00
tcal = 2
2 2 s12 s22
s1
+
s 2 n +n
n1 n2 gl = 1 2
2 2 2 2
1 s1 1 s2
+
n1 − 1 n1 n2 − 1 n2
( )
2
s12 s22 2
n +n 1.98
+
8.93
gl = 1 2
= 12 10 = 12.29 12
2 2 2 2
( ) ( )
2 2
1 s 1 s 1 1.98
+
1 8.93
+
n1 − 1 n1 n2 − 1 n2
1 2
11 12 9 10
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estu
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión
0.29Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estu
Ve
Versión Estu
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Ve
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estu
Versión Estudiantil Zona de
Versión Estudiantil Versión Estudiantil
Zona de
Versión Estudiantil Ve
0.19
Versión Estudiantil Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
rechazo
Versión Ho
Estudiantil Versión Estudiantil
rechazo
Versión Estudiantil
Ho
Versión Estu
Versión Estudiantil Ve
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estu
Versión Estudiantil
0.10 Versión Estudiantil Versión Estudiantil Versión Estudiantil Ve
Versión Estudiantil Versión Estudiantil Zona de NO Versión Estudiantil
Versión Estudiantil Versión Estu
Versión Estudiantil Versión Estudiantil rechazo deEstudiantil
Versión Ho Versión Estudiantil Ve
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estu
0.00
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Ve
Versión Estudiantil
-5.92
−2.737 −2.179
Versión Estudiantil
-2.96 0.00
Versión Estudiantil
2.96 5.92
2.179 2.737
Versión Estudiantil Versión Estu
Estadístico de prueba 2
x1 − x2 s 2
s
2
n +n
1 2
tcal =
s12 s22 gl = 1 2
−2
+ 2 2
1 s1 1 s2
2 2
n1 n2
+
n1 + 1 n1 n2 + 1 n2
Planteamiento de hipótesis
Ho : 1 = 2
Ha : 1 2
Se calculan la media y la varianza de cada muestra:
Puerto Barrios Puerto Quetzal
x1 = 10.825 s12 = 1.980 x2 = 8.010 s22 = 8.930
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
Calculando los grados de libertad:
2
s12 s22
n +n
gl = 1 2
−2
2 2 2
1 s1 1 s2
2
+
n1 + 1 n1 n2 + 1 n2
( )
2
1.98 8.93
+ Se toma solo la
gl = 12 10 − 2 = 13.007 13
( ) ( )
2 2 parte entera del
1 1.98 1 8.93
+ resultado
13 12 11 10
Momento 1 2 3 4 5 6 7 8
Antes de aplicación 15 38 37 25 32 11 23 16
Después de la aplicación 9 30 10 20 30 5 20 12
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
Estadístico de prueba:
ttab
d ( , gl )
tcal =
2
sd ttab
( 2
, n −1 )
n
Donde: 2
n
n di
i =1
n
d i d i
2
−
n
d= i =1 sd = i =1
n n −1
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
Planteamiento de hipótesis
Ho : 1 = 2
Ha : 1 2
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión
0.39 Estudiantil
Versión Estudiantil
Versión Estudiantil
T Student(7):
Versión
Versión Estudiantil
Versión Estudiantil
p(evento)=0.0500
Estudiantil Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión
Versión Estu
Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estu
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estu
Versión Estudiantil Versión
0.29Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estu
Versión Estudiantil Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Zona de
Versión Estudiantil Versión Estudiantil
Zona de
Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estu
0.19
Versión Estudiantil Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
rechazo Ho
Versión Estudiantil Versión Estudiantil
rechazo Ho
Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estu
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil
0.10 Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estu
Versión Estudiantil Versión Estudiantil Zona de NOVersión Estudiantil Versión Estudiantil
Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versiónde
rechazo Estudiantil
Ho Versión Estudiantil Versión Estu
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
0.00
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estu
−2.365
-5.92 -2.96 0.00 2.96 5.92
Versión Estudiantil Versión Estudiantil Versión Estudiantil
2.365
Versión Estudiantil Versión Estudiantil
ttab ttab
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
Parcela Antes Después di di2
1 15 9 6 36
Para calcular la
2 38 30 8 64
diferencia promedio, al
3 37 10 27 729 realizar la suma debe
4 25 20 5 25 considerarse el signo de
5 32 30 2 4 las diferencias.
6 11 5 6 36
7 23 20 3 9
8 16 12 4 16
TOTALES 61 919
n
d i
61
d= i =1
= = 7.625 d 7.625
n 8 tcal = = = 2.678
sd 8.0523
2
n 8
di n
i =1
n
d i
2
−
n 919 −
612
8 = 8.0523
sd = i =1
=
n −1 7
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
udiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
ersión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
udiantil Versión T Student(7): p(evento)=0.0500
0.39Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
ersión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
udiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
ersión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
udiantil Versión
0.29Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
ersión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
udiantil Versión Estudiantil
ersión Estudiantil
Versión Estudiantil
Zona de
Versión Estudiantil Versión Estudiantil
Zona de
Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil
0.19
udiantil Versión Estudiantil
ersión Estudiantil
Versión Estudiantil
rechazo Ho
Versión Estudiantil Versión Estudiantil
rechazo Ho
Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil
udiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
ersión Estudiantil
0.10 Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
udiantil Versión Estudiantil Zona de NOVersión Estudiantil Versión Estudiantil
Versión Estudiantil
ersión Estudiantil Versión Estudiantil rechazo deEstudiantil
Versión Ho Versión Estudiantil Versión Estudiantil
udiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
0.00
ersión Estudiantil Versión Estudiantil Versión Estudiantil2.96
Versión Estudiantil Versión Estudiantil
−2.678 −2.365
-5.92 -2.96 0.00 5.92
udiantil Versión Estudiantil Versión Estudiantil
2.365 2.678
Versión Estudiantil Versión Estudiantil
0.3
Zona de
Densidad
0.2 rechazo Ho
Zona de NO
0.1
rechazo de Ho
0.01
0.0
0 2.718
X
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
2 n
Estudiante ANTES DESPUÉS di di
1
2
87
78
83
84
4
-6
16
36
d i
45
3 85 79 6 36 d= i =1
= = 3.75
4 93 88 5 25 n 12
5 76 75 1 1
6 80 81 -1 1 2
n
di
7 82 74 8 64
8 77 71 6 36
i =1
n
9 91 78 13 169 d i
2
−
n 449 −
452
12 = 5.0475
10 74 73 1 1
sd = i =1
=
11 76 76 0 0 n −1 11
12 79 71 8 64
Totales 45 449
d 3.75
tcal = = = 2.574
sd 5.0475
n 12
PRUEBA DE HIPÓTESIS: DOS MUESTRAS
PRUEBA DE HIPÓTESIS PARA DOS MUESTRAS PAREADAS O
DEPENDIENTES CON VARIANZAS DESCONOCIDAS
Gráfica de distribución
T, df=1 1
0.4
0.3
Zona de
Densidad
0.2
rechazo Ho
Zona de NO
0.1
rechazo de Ho
0.01
0.0
0 2.574 2.718
X
ttab
tcal ttab
2.574 2.718 No se rechaza la hipótesis nula