Contrastes de Hipotesis

17/2/2016 Contrastes de hipotesis
3. Contrastes de hipótesis
3.1. Introducción
Los métodos descriptivos proporcionan una idea de cómo es la muestra. Para obtener conclusiones relativas a la población necesitamos utilizar técnicas de inferencia
estadística. Dentro de éstas la más habitual es el contraste de hipótesis.
Una hipótesis es una afirmación sobre las características estadísticas de un proceso, por lo que se puede considerar una hipótesis como una conjetura. Por
ejemplo: si un técnico observa el consumo de energía durante varias horas, sabrá el consumo medio de las horas que observó. Con la ayuda de la inferencia, puede
avanzar un paso más y conjeturar que el consumo medio de todas las horas de trabajo en esa fábrica es de 120. El proceso científico consiste entonces en probar su
hipótesis contra una hipótesis alternativa:
Hipótesis nula H0: consumo medio = 120

Hipótesis alternativa H1: consumo medio ≠ 120
Un test consiste en un procedimiento estadístico para determinar la validez de una hipótesis (la hipótesis nula). Si los datos de la muestra resultan poco creíbles
de obtenerse en caso de ser cierta dicha hipótesis, nuestra razón nos obligará a rechazarla. En caso contrario, no hay base suficiente para rechazarla. La aceptación de
la hipótesis nula es muy difícil si sólo se usan procedimientos estadísticos. Sin embargo, desde el punto de vista práctico, el no rechazo de una hipótesis nos llevará a
concluir que no hay evidencias significativas en contra de dicha hipótesis y, por tanto, que puede considerarse admisible.
La forma habitual de presentar los resultados de un test de hipótesis es a través del pvalor o nivel crítico. Simplemente con este número se puede concluir si la
hipótesis nula es o no rechazada a un nivel de significación (α). El pvalor es el nivel de significación menor que llevaría al rechazo de la hipótesis nula H0. Una vez
que se conoce el pvalor, el responsable de tomar las decisiones puede determinar por sí mismo en qué medida son significativos los datos sin que se le imponga
formalmente un nivel de significación predeterminado. Una vez conocido el valor del pvalor y fijado el nivel de significación del contraste, la decisión a tomar se
obtiene comparando ambos valores, tal como puede verse en el cuadro 2.
Cuadro 2: Regla de decisión.
REGLA DE DECISIÓN
Pvalor < α Rechazo H0
Pvalor ≥ α No rechazo H0
Generalmente se considera α = 0′05.
La decisión es el último paso de un contraste de hipótesis. Un esquema de todo el proceso asociado a un contraste puede verse en la figura 5. En dicho esquema
se pone de manifiesto el hecho de que los niveles de significación habituales son siempre menores de 0′1, destacando los valores 0′1, 0′05 y 0′01. De entre todos
ellos, el nivel 0′05 predomina con claridad.
http://uce.uniovi.es/cursolineal/Informese3.html 1/30
Figura 5: Pasos en un contraste de hipótesis.
Como ejemplos de test de hipótesis, vamos a considerar algunos de los más habituales en la práctica. Éstos aparecen descritos a continuación, junto con un
ejemplo de pregunta que sería contestada mediante dicho test.
Promedio de una población: ¿El consumo medio es menor de 140?
Comparación de promedios: ¿El consumo medio es mayor cuando hubo averías?
Proporción poblacional: ¿El porcentaje de horas con averías es mayor del 10 %?
Comparación de proporciones: ¿El porcentaje de horas con averías es mayor cuando estaba encendido el sistema que cuando no?
Desviación típica: ¿La variabilidad del consumo es menor de 50?
Comparación de desviaciones típicas: ¿La variabilidad del consumo es la misma durante las horas que hubo averías y durante las que no?
Ejemplos de la mayoría de los contrastes anteriores serán analizados en detalle en las Secciones 3.2 a 3.6.
3.2. Tests para el promedio
Para realizar un test cualquiera debemos considerar las siguientes etapas: seleccionar el contraste adecuado en el caso en estudio, establecer quiénes son H0 y H1 en
ese contraste e interpretar el pvalor. En un test sobre el valor promedio de la población, debemos tener en cuenta si los datos siguen aproximadamente una
distribución normal o no, así como el tamaño de la muestra, y según sea el resultado, decidir qué contraste realizamos (cuadro 3).
Cuadro 3: Contrastes para el promedio.
Contraste para la ¿Distribución aproximadamente Tipo de test

normal o n grande?
Media ( μ) Sí Test t para una muestra
Mediana ( Me) No Test de Wilcoxon para una muestra
Si la muestra dispone de un suficiente número de datos (habitualmente se exige que tenga al menos 30), se puede utilizar el test t para una muestra para realizar
contrastes acerca de la media de la población. En caso contrario, es necesario que se pueda admitir la normalidad de los datos para realizar dicho test. Si no fuera
normal, se utilizaría el test de Wilcoxon para una muestra. En los contrastes de normalidad de los datos utilizaremos del test de ShapiroWilk. Para este test las
hipótesis a contrastar son:
TEST DE BONDAD DE AJUSTE A LA NORMAL
H0: los datos provienen de una población normal
H1: los datos NO provienen de una población normal
REGLA DE DECISIÓN
Pvalor < α Rechazo H 0 (la distribución no es normal)
Pvalor ≥ α No rechazo H0 (se puede admitir la normalidad)
Generalmente se considera α = 0′05
.
En nuestro ejemplo, si queremos analizar el valor promedio de la variable consumo, al tener 117 datos ya podemos utilizar directamente el test t para una
muestra. Así pues, estamos en condiciones de realizar un contraste para la media, comparándola con el valor 120. El test adecuado en este caso es el test t para una
muestra, cuyas hipótesis a contrastar (H0 y H1) pueden ser de tres tipos:
H0 : μ = 120 H0 : μ ≥ 120 H0 : μ ≤ 120

H1 : μ≠120 H1 : μ < 120 H1 : μ > 120
Ejemplo 3.1. ¿Es el consumo medio igual a 120?
Solución: En este caso se tiene:
H0: el consumo medio es de 120
H1: el consumo medio no es de 120
Estadísticos
➥Medias
➥Test t para una muestra...
Seleccionar la variable consumo
➥Ponemos 120 en la hipótesis nula
➥Aceptar
Las salidas de este test son:
ʴŜſɛřʰɨɩɥřŜʰɥŜɰɬƀ

Ş

śɛ
ʰɪŜɯɨɪɭřʰɨɨɭřŞʰɥŜɥɥɥɩɩɨɥ
śɨɩɥ
ɰɬś
ɨɩɰŜɪɬɨɭɨɫɰŜɬɭɨɫ
ś

ɨɪɰŜɫɬɭɬ
Puesto que la adaptación de la regla de decisión a este test en particular sería:
Pvalor < α Rechazo H0 (consumo medio ≠ 120)
Pvalor ≥ α No rechazo H0 (consumo medio = 120)
Generalmente se considera α = 0′05.
simplemente debemos considerar el valor del pvalor asociado a este contraste para esta muestra y, en base a él, tomar la decisión correspondiente. Puesto que hemos
obtenido que el pvalor es 0′0002210, éste es menor que α = 0′05, por lo que la decisión es rechazar la hipótesis nula (H0). Como conclusión podemos decir que la
media poblacional es distinta de 120. __
El ejemplo anterior corresponde al tipo de test bilateral, puesto que la hipótesis alternativa es que el valor del parámetro es distinto de un número. Cuando la
alternativa lleve el símbolo menor (<) o mayor (>), en lugar del símbolo distinto (≠, se denomina test unilateral. En ejemplo de dicho tipo de test unilateral puede
verse a continuación.
Ejemplo 3.2. ¿El consumo medio es menor de 140?
Solución: En este caso, tal como comentamos en el ejemplo anterior, se verifican las hipótesis para utilizar el test t para una muestra. Así, el test adecuado para
contestar a esta pregunta contrastaría las siguientes hipótesis:
H0: el consumo medio es mayor o igual que 140
H1: el consumo medio es menor de 140
y sería realizado tal como sigue:
Estadísticos
➥Medias
➥Test t para una muestra
Seleccionar la variable consumo
➥Ponemos 140 en la hipótesis nula
➥Marcar Media poblacional < mu0
➥Aceptar
Los resultados obtenidos son:
ʴŜſɛřʰɌɌřʰɨɫɥřŜʰɥŜɰɬƀ

Ş

śɛ
ʰŞɥŜɨɥɭɬřʰɨɨɭřŞʰɥŜɫɬɮɮ
śɨɫɥ
ɰɬś
ŞɨɫɮŜɰɨɬɰ
ś

ɨɪɰŜɫɬɭɬ
Como el pvalor (0′4577) supera los valores habituales de α, no se rechaza la hipótesis nula, por lo que podemos concluir que estos datos no aportan evidencias
suficientes de que la media sea menor de 140. __
Vamos por último a analizar el caso de una variable en la que no se den las condiciones para aplicar el test t para una muestra.
Ejemplo 3.3. Durante los días que hubo averías, ¿la producción promedio de galvanizado 1 se sitúa en menos de 400 toneladas?
Solución:
Comenzaremos seleccionando los datos para quedarnos sólo con aquellos que corresponden a días en los que hubo averías. Para ello podemos seguir los
siguientes pasos:
Datos
➥Conjunto de datos activo
➥Filtrar el conjunto de datos...
Seleccionar averias
➥Expresión de… averias=="Sí"
➥Nombre del nuevo… acero2
➥Aceptar
Datos
➥Conjunto de datos activo
➥Actualizar conjunto de datos activo
Así, disponemos de un nuevo conjunto de datos activado, solamente con los datos relativos a las horas en las que hubo avería. Como son 28 datos, tal como
vimos en el ejemplo 2.1, no podemos aplicar sin más el test t para la media y debemos comprobar si se cumple la hipótesis de normalidad.
Realizaremos pues el test de normalidad a la variable pr.galv1.
Estadísticos
➥Resúmenes
➥Test de normalidad de Shapiro…
Seleccionar pr.galv1
➥Aceptar
Los resultados de dicho test son:
ʴŜſɩɛŜɨƀ
Ş

śɩɛŜɨ
ʰɥŜɯɯɥɬřŞʰɥŜɥɥɫɨɨɮ
Como el pvalor (0′004118) es menor que α = 0′05, se rechaza la hipótesis nula, por lo tanto no hay normalidad.
¿Cómo podemos hacer para contrastar la hipótesis sobre el valor promedio de la producción de galvanizado 1 en las horas con averías? Al no haber normalidad y
disponer de pocos datos, debemos realizar el test de Wilcoxon para una muestra. Para éste los distintos tipos de contrastes de hipótesis para la mediana son:
H0 : Me = 400 H0 : Me ≥ 400 H0 : Me ≤ 400

H1 : Me≠400 H1 : Me < 400 H1 : Me > 400
two.sided less greater
La hipótesis que nos interesa es:
¿La producción promedio es menor de 400?
H0 : Me ≥ 400 (la producción promedio es alta)
H1 : Me < 400 (la producción promedio es baja)
Para realizar este test escribimos en la ventana de instrucciones lo que sigue:
ŜſɩɛŜ
ɨřʰɌɌřʰɫɥɥƀ
y pinchamos en Ejecutar.

Figura 6: Test de Wilcox para una muestra
Lo que da como resultado
ʴŜſɩɛŜɨřʰɌɌřʰɫɥɥƀ

śɩɛŜɨ
ʰɩɮɮřŞʰɥŜɰɬɬɩ
śɫɥɥ
Como el pvalor (0′9552) es mayor que el nivel de significación α, no se rechaza la hipótesis nula, por lo tanto podemos suponer que la producción es alta, es
decir mayor o igual de 400. __
3.3. Comparación de dos promedios
La comparación de dos promedios consiste en comprobar si el promedio de una variable varía según determinadas características. Dependiendo de la situación
existen diversas posibilidades de contrastes. El cuadro 4 recoge los principales tests aplicados habitualmente.
Cuadro 4: Contrastes para igualdad de promedios.
¿Distribuciones ¿Independientes? Tipo de test

Contrastes para aproximadamente
comparar dos normales o tamaños
muestrales grandes?
Medias Sí Sí Test t para muestras independientes
Medias Sí No Test t para datos relacionados
Medianas No Sí Test de Wilcoxon para dos muestras
Medianas No No Test de Wilcoxon para muestras pareadas
Ejemplo 3.4. ¿Se puede afirmar que cuando se producen averías el consumo de energía se incrementa?
Solución: Lo primero de todo será volver a activar la base de datos acero. Para ello, pinchamos a la derecha de Conjunto de datos:, en el botón que pone acero2
y seleccionamos de nuevo la base de datos acero.
Una vez hecho esto, vamos a verificar la normalidad del consumo para cada uno de las dos situaciones (cuando haya averías y cuando no) mediante el test de
ShapiroWilk. Para esto ponemos en la línea de comandos:

Figura 7: Normalidad del consumo según las averías
Los resultados de ejecutar ambas líneas de comando son:
ʴŜſſřʰʰʰɌɌƀɛƀ
Ş

śſřʰʰʰɌɌƀɛ
ʰɥŜɰɯɭɰřŞʰɥŜɬɨɪɮ
ʴŜſſřʰʰʰɌÃɌƀɛƀ
Ş

śſřʰʰʰɌÃɌƀɛ
ʰɥŜɰɭɫɫřŞʰɥŜɫɫɥɯ
Los pvalores correspondientes superan el nivel α, por lo que podemos considerar normalidad en ambos casos.
Por la naturaleza del problema, es evidente que se puede trabajar con la hipótesis de que las poblaciones son independientes, con lo cual estamos en condiciones
de aplicar el test t para muestras independientes. Ahora bien, a la hora de realizar dicho test es necesario especificar si se supone que las varianzas son iguales o
no, puesto que el estadístico utilizado al obtener el pvalor y, por tanto, el valor de dicho pvalor, difiere según la opción elegida. En la sección 3.4 se puede ver
cómo contrastar la igualdad de varianzas. El contraste para este ejemplo en particular está realizado en el Ejemplo 3.6, donde se obtiene que no hay evidencias en
contra de suponer que las varianzas de ambas poblaciones sean iguales. En estas circunstancias, aplicamos el test t para muestras independientes, suponiendo las
varianzas iguales.
¿Quiénes son H0 y H1 en ese contraste?
Dependiendo de la hipótesis alternativa considerada, los tres contrastes que podemos realizar con el test t para muestras independientes para comparar las
medias de dos poblaciones son:
H0 : μ1 = μ2 H0 : μ1 ≥ μ2 H0 : μ1 ≤ μ2

H1 : μ1≠μ2 H1 : μ1 < μ2 H1 : μ1 > μ2
Ahora bien, antes de nada debemos tener claro a quien asigna R como primera clase (clase 1 con media μ1) y como segunda clase (clase 2 con media μ2). Por
defecto, el programa considera el orden alfabético, es decir, si como en este caso las clases son No y Sí, la primera clase corresponde al no (sin averías y la segunda
al sí (con avería). Que consuma más con avería se traduciría por lo tanto en μ2 > μ1, por lo que para este ejemplo vamos a considerar el contraste:
H0 : μ1 ≥ μ2 (consumo menor o igual con avería)
H1 : μ1 < μ2 (consumo mayor con avería)
y para calcularlo procedemos de la siguiente forma:
Estadísticos
➥Medias
➥Test t para muestras independientes
Seleccionar las variables averias y consumo
➥Marcar: Diferencias < 0
➥Marcar: Varianzas iguales
➥Aceptar
Los resultados de estos pasos son:
ʴŜſɌřʰɌɌřŜʰɥŜɰɬř
ʫŜʰřʰƀ
Ş

ś
ʰŞɥŜɰɫɩɪřʰɨɨɬřŞʰɥŜɨɮɫ
śɥ
ɰɬś
ŞɯŜɬɭɫɨɨɪ
ś
Ã
ɨɪɭŜɮɬɯɬɨɫɯŜɥɪɩɨ
Como el pvalor (0′174) es mayor que el nivel de significación α, no se rechaza la hipótesis nula. Así pues, los datos no aportan evidencias de que el consumo
promedio sea mayor cuando haya avería. __
¿Qué ocurriría si las poblaciones no fueran independientes?
En tal caso, si suponemos normalidad, realizamos el test t para muestras relacionadas. Se elige la siguiente opción del menú:
Estadísticos
➥Medias
➥Test t para muestras relacionadas
Sería este el caso, por ejemplo, si comparamos la resistencia de una pieza antes y después de aplicarle un procedimiento en el horno, el nivel de glóbulos rojos de
una persona antes y después de recibir un determinado tratamiento o la producción de galvanizado tipo 1 y la producción de galvanizado tipo 2.
Cuando las poblaciones no son normales y no tienen suficiente número de datos (habitualmente se suele exigir al menos 30) se realiza el test de Wilcoxon para
dos muestras si las poblaciones son independientes, o el test de Wilcoxon para muestras pareadas si tal independencia no es supuesta. Realicemos unos
ejemplos para aclarar tales situaciones.
Ejemplo 3.5. Estudie el comportamiento de la producción de galvanizado 1 en función de las averías.
Solución:
Aunque ya sabemos que no podemos asegurar que la producción de galvanizado 1 siga una distribución normal, vamos a actuar como si aún no conociésemos
dicha información. Así, determinamos el tipo de test más apropiado. Para ello aplicamos el test de normalidad de ShapiroWilk a ambas poblaciones:

Figura 8: Test Shapiro de galvanizado por averias
y los resultados de los mismos se detallan a continuación:
ʴŜſſřʰʰʰɌɌƀɛŜɨƀ

Ş

śſřʰʰʰɌɌƀɛŜɨ
ʰɥŜɯɬɭɪřŞʰɯŜɥɯɨŞɥɯ
ʴŜſſřʰʰʰɌÃɌƀɛŜɨƀ

Ş

śſřʰʰʰɌÃɌƀɛŜɨ
ʰɥŜɯɯɥɬřŞʰɥŜɥɥɫɨɨɮ
A la vista de los resultados (ambos pvalores son menores de 0′0042) podemos considerar la no normalidad de los datos y no disponemos de un número
suficiente de datos (para horas con avería sólo contamos con 28 observaciones, tal como vimos en el ejemplo 2.1). Por tanto vamos a abordar este problema
realizando un test para muestras sin normalidad, el test de Wilcoxon. En este caso, dada la naturaleza de los datos, se realizará el test de Wilcoxon para muestras
independientes.
Para este problema, puesto que el No representa la clase 1 y el Sí la clase 2, las hipótesis a contrastar son:
H0 : Me1 ≥ Me2 (producción menor o igual con avería)
H1 : Me1 < Me2 (producción mayor con avería)
aunque de nuevo se podría considerar de la misma forma la alternativa de mayor (>) o de distinto (≠), tal como ocurría con el test t de igualdad de medias.
Para realizar el test seguimos los siguientes pasos:
Estadísticos
➥Test no paramétricos
➥Test de Wilcoxon para dos muestras
Seleccionar las variables averias y pr.galv1
➥Marcar: Diferencia < 0
➥Aceptar
Los resultados obtenidos en este caso son:
ʴſɛřɛřřŜʰƀ
Ã
ɨɪɭŜɥɬɨɫɯŜɬɭ
ʴŜſɌřʰɌɌřʰƀ

ś
ʰɨɥɯɯŜɬřŞʰɥŜɨɬɮɰ
śɥ
Como el pvalor (0′1579) es mayor que el nivel de significación considerado (α), no se rechaza la hipótesis nula y, por tanto, no podemos concluir que la
producción de galvanizado 1 sea mayor cuando haya averías. __
En el caso de que las muestras no fueran independientes se tendría que haber elegido, si no se supone normalidad, el test de Wilcoxon para muestras pareadas.
Dicho test se realiza eligiendo la siguiente opción del menú:
Estadísticos
➥Test de Wilcoxon para muestras pareadas
3.4. Comparación de dos varianzas
Como ya comentamos, un paso previo al contraste t de igualdad de medias es determinar la igualdad de varianzas, lo cual supone la realización de un test previo de
igualdad de varianzas. Para este contraste de hipótesis vamos a considerar dos tipos de test, según la naturaleza de los datos, tal como se detalla en el cuadro 5
Cuadro 5: Contrastes para igualdad de varianzas.
Contrastes para ¿Normalidad? Tipo de test

comparar dos
Varianzas Sí Test F para dos varianzas
Varianzas No Test de Levene
En nuestro ejemplo comparamos el consumo con o sin averías y ya habíamos visto que se podían suponer ambas poblaciones normales. Por lo que realizaremos
el test F para dos varianzas.
¿Quiénes son H0 y H1 en ese contraste?
Los distintos tipos de contrastes de hipótesis para dos varianzas, según la hipótesis alternativa considerada, son:
H0 : σ12 = σ22 H0 : σ12 ≥ σ22 H0 : σ12 ≤ σ22

H1 : σ12≠σ22 H1 : σ12 < σ22 H1 : σ12 > σ22
En el contraste de igualdad de medias, la comprobación previa consiste precisamente en el primero de estos tres contrastes. Vamos a ver como se realiza
mediante el siguiente ejemplo.
Ejemplo 3.6. ¿Son iguales las varianzas del consumo con o sin averías?
Solución:
Las hipótesis para el test son las siguientes.
H0 : σ12 = σ22 (varianzas iguales)
H1 : σ12≠σ22 (varianzas distintas)
Los pasos a seguir para obtener el pvalor asociado a dicho contraste son:
Estadísticos
➥Varianzas
➥Test F para dos varianzas...
Seleccionar las variables averias y consumo
➥Señalar Bilateral
➥Aceptar
Los resultados que presenta el R al finalizar estos pasos son:
Ã
ɪɨɩɪŜɮɫɯɩɯɥɩŜɭɪɥ
ʴŜſɌřʰɌŜɌřŜʰɥŜɰɬř
ʫʰƀ

ś
ʰɨŜɨɨɫɭřʰɯɯřʰɩɮřŞʰɥŜɮɮɪɨ
śɨ
ɰɬś
ɥŜɬɭɰɭɫɩɮɨŜɰɭɯɭɮɫɯ
ś

ɨŜɨɨɫɬɮɮ
Como el pvalor (0′7731) es mayor que el nivel de significación α, no se rechaza la hipótesis nula y, por tanto, podemos suponer que no existen diferencias
significativas entre las varianzas del consumo con o sin avería (tienen la misma varianza). __
Como ya hemos comentado, si quisiésemos comparar la varianza de dos poblaciones que no suponemos normales, se debería realizar el test de Levene. Vamos a
ver su funcionamiento mediante un ejemplo.
Ejemplo 3.7. ¿Es homocedástica la producción de galvanizado 1 (pr.galv1) según las averías?
Solución:
Para la variable pr.galv1 sabíamos que los datos se comportan sin normalidad. En este caso se realiza el test de Levene. Las hipótesis del test son:
H0 : σ12 = σ22 (varianzas iguales)
H1 : σ12≠σ22 (varianzas distintas)
La realización de este test se lleva acabo como sigue:
Estadísticos
➥Varianzas
➥Test de Levene
Seleccionar las variables averias y pr.galv1
➥Aceptar
Los resultados del test de Levene para estos datos son:
ʴŜſɛŜɨřɛƀ

Ã
ɨɨɫɭɪɫŜɪɥɰɨɭɰɫŜɩɮ
Ũ
ſʴ ƀ
ɨɫŜɨɩɰɪɥŜɥɫɫɫɬƋ
ɨɨɬ
ŞŞŞ
ŜśɥŨƋƋƋŨɥŜɥɥɨŨƋƋŨɥŜɥɨŨƋŨɥŜɥɬŨŜŨɥŜɨŨŨɨ
Como el pvalor (0′04445) es menor que α se rechaza la hipótesis nula, podemos por tanto suponer que hay diferencias significativas entre las varianzas. Más
aún, podemos ver que la varianza sin avería es de 114634′30 mientras que cuando hay avería la varianza toma el valor de 91694′27. __
3.5. Test para la proporción
Es frecuente el interés por saber qué proporción o porcentaje de individuos de una población, presentan una característica A, frente a los que no la presentan. Dicha
proporción no será en general conocida, pero se pueden hacer contrastes de hipótesis sobre su valor, en función de los datos de una muestra. Para la realización de
dichos tests es necesario un tamaño suficiente de muestra. Habitualmente se exige que dicho tamaño (n) sea mayor o igual que 30.
Por ejemplo de aplicación de dichos tests sería si queremos saber si porcentaje de horas con avería es excesivo, considerándose excesivo si el porcentaje es
mayor del 10 %.
Para responder a esta pregunta un contraste de hipótesis adecuado es el test de proporciones para una muestra. Vamos a ver un ejemplo de aplicación de
dicho test.
Ejemplo 3.8. Siguiendo con los datos de nuestro ejemplo, ¿puede considerarse que el porcentaje de averías es mayor del 10 %?
Solución:
Tendríamos en cuenta que p es la primera clase por orden alfabético, en este caso No. Plantearse si el porcentaje de horas con averías es mayor del 10 % es lo
mismo que plantearse si el porcentaje de horas sin averías es menor del 90 %. Puesto que los distintos tipos de contrastes de hipótesis para la proporción son de la
forma:
H0 : p = 90 % H0 : p ≥ 90 % H0 : p ≤ 90 %

H1 : p≠ 90 % H1 : p < 90 % H1 : p > 90 %
las hipótesis a contrastar serían:
H0 : p ≥ 90 % (proporción razonable de averías)
H1 : p < 90 % (proporción excesiva de averías)
Ahora solo habría que hacer
Estadísticos
➥Proporciones
➥Test de proporciones para una muestra
Seleccionar la variable averias
➥Escribir 0.9 como hipótesis nula
➥Proporción de la población < p0
➥Aceptar
Las soluciones de este procedimiento son:
ʴŜſſſɌřʰƀƀřʰɌɌř
ʫʰɥŜɰřŜʰɥŜɰɬřʰ ƀ

ɨŞ

śſſɌřʰƀƀřɥŜɰ
ŞʰɩɬŜɩɪɨɮřʰɨřŞʰɩŜɬɫɩŞɥɮ
śɥŜɰ
ɰɬś
ɥŜɥɥɥɥɥɥɥɥŜɯɨɰɩɥɭɩ
ś

ɥŜɮɭɥɭɯɪɯ

Como el pvalor es tan pequeño (2′542 ‫ڄ‬ 107), se rechaza la hipótesis nula, por lo que se concluye que ha habido un porcentaje excesivo de averías. En la muestra
se ve que dicho porcentaje ha sido de alrededor del 24 %.
Otra manera de abordar el problema, sobre todo si hubiera más de 2 clases sería reordenar los niveles de factor y poner como primer factor de la variable averias
el factor Sí.
Datos
➥Modificar variables
➥Recodificar niveles de factor
➥Aceptar
Reordenar de la forma deseada
➥Aceptar
Las salidas obtenidas son:
ʴɛʳŞſɛřʰſɌÃɌřɌɌƀƀ

De esta manera las nuevas hipótesis del test serán:
H0 : p ≤ 10 % (proporción razonable de averías)
H1 : p > 10 % (proporción excesiva de averías)
En estas condiciones el test se realizaría del siguiente modo:
Estadísticos
➥Proporciones
➥Test de proporciones para una muestra
➥Escribimos 0.1 como hipótesis nula
➥Proporción de la población > p0
➥Aceptar
Las salidas obtenidas son:
ʴŜſſſɌřʰƀƀřʰɌɌř
ʫʰɥŜɨřŜʰɥŜɰɬřʰ ƀ

ɨŞ

śſſɌřʰƀƀřɥŜɨ
ŞʰɩɬŜɩɪɨɮřʰɨřŞʰɩŜɬɫɩŞɥɮ
śɥŜɨ
ɰɬś
ɥŜɨɯɥɮɰɪɯɨŜɥɥɥɥɥɥɥ
ś

ɥŜɩɪɰɪɨɭɩ

Como el pvalor (2′542e 07) (que es el mismo para los dos contrastes) es menor que α se rechaza la hipótesis nula y se concluye que la proporción de averías es
excesiva.
De nuevo vemos que para estos datos el porcentaje de horas con averías es de aproximadamente el 24 %. __
3.6. Comparación de dos proporciones
Además de analizar el comportamiento de una proporción, se puede querer comparar la proporción de una determinada característica en dos poblaciones distintas. Al
igual que ocurría en la sección anterior, el número de datos en cada muestra debe ser suficientemente grande (habitualmente se exigen al menos 30 datos por
muestra).
Así, por ejemplo, para poder determinar si el porcentaje de horas con avería es mayor cuando estaba apagado el sistema que cuando no, deberíamos plantear un
test de proporciones para dos muestras.
Los distintos tipos de contrastes de hipótesis en este caso son:
H0 : p1 = p2 H0 : p1 ≥ p2 H0 : p1 ≤ p2

H1 : p1≠ p2 H1 : p1 < p2 H1 : p1 > p2
donde p1 representa la proporción en el primer grupo (por orden alfabético) y p2 en el segundo.
Vamos a ver el funcionamiento de este test a través de un ejemplo concreto.
Ejemplo 3.9. ¿El porcentaje de horas con avería es mayor cuando estaba encendido el sistema que cuando no?
Solución:
Hemos de tener en cuenta que p1 es siempre la primera clase por orden alfabético. Como en este caso trabajamos con las modalidades No y Sí, las hipótesis a
contrastar son:
H0 : pNO ≥ pSI (igual o mejor con el sistema encendido)
H1 : pNO < pSI (peor con el sistema encendido)
La obtención del pvalor asociado a este test se realizaría mediante los siguientes pasos en R:
Estadísticos
➥Proporciones
➥Test de proporciones para dos muestras...
Seleccionar las variables sistema y averias
➥Marcar: Diferencia < 0
➥Aceptar
Las salidas de este procedimiento son:
ʴŜſſɌʫřʰƀřʰɌɌř
ʫŜʰɥŜɰɬřʰ ƀ

ɩŞ

śſɌʫřʰƀ
ŞʰɥŜɭɭɫɨřʰɨřŞʰɥŜɩɥɮɭ
ś
ɰɬś
ŞɨŜɥɥɥɥɥɥɥŜɥɭɬɥɥɮ
ś
ɨɩ
ɥŜɮɩɯɯɨɪɭɥŜɮɰɪɨɥɪɫ

Como el pvalor (0′2076) es mayor que α no se rechaza la hipótesis nula, no hay evidencias de que vaya peor con el sistema encendido. __
3.7. Relaciones entre variables
Muchas veces nos podemos preguntar si tiene sentido estudiar dos variables de forma conjunta, si existe una relación entre ellas y en caso de existir como de fuerte
es esa relación.
Para contestar a estas preguntas se establece una serie de coeficientes:
Para estudiar la relación general, se puede estudiar, entre otros, el coeficiente Chicuadrado de Pearson.
Para estudiar la relación lineal, el más habitual es el coeficiente de correlación de Pearson.
Para seleccionar el contraste más adecuado a la muestra, tendremos en cuenta la naturaleza de nuestras variables.
Para variables Cuantitativas, CuantitativasDiscretas o cuantitativasContinuas Discretizadas, se utiliza el test Chicuadrado de Pearson de independencia.
Para variables CuantitativasContinuas, se usará el test de correlación de Pearson.
Las hipótesis a contrastar en este tipo de problemas son siempre del tipo:
H0: no existe relación entre las variables
H1: sí existe relación entre las variables
donde la relación será o no del tipo lineal dependiendo del coeficiente utilizado en el contraste.
Así pues, un pvalor claramente menor de 0′05 indicará que existe relación entre las variables. Si es mayor de 0′05, los datos no nos proporcionarán evidencias de
dicha relación.
Ejemplo 3.10. ¿Existe relación entre que haya habido o no averías y la línea utilizada?
Solución:
Como las variables son cualitativas vamos a utilizar el test chicuadrado. Para hacer esto vamos a
Estadísticos
➥Tablas de contingencias
➥Tabla de doble entrada…
Seleccionar las variables averias y linea
➥Aceptar
Las salidas de este procedimiento son:
ʴſɌʫřʰƀ

ɪɨɩɯɪɥ
Ãɯɨɨɰ

ʴŜſſɌʫřʰƀřʰ ƀ

ŨŞ

śſɌʫřʰƀ
ŞʰɥŜɭɬɮɪřʰɩřŞʰɥŜɮɨɰɰ

Como el pvalor (0′7199) es mayor que α no se rechaza la hipótesis nula, es decir, no hay evidencias de que las líneas afecten en que haya o no averías.
__
Ejemplo 3.11. ¿Existe relación entre la producción de galv1 y de galv2?
Solución:
Como las variables son cuantitativas continuas, podemos utilizar el test de correlación de Pearson, para lo cual haremos:
Estadísticos
➥Resúmenes…
➥Matriz de correlaciones
Seleccionar las variables pr.galv1 y pr.galv2
➥Aceptar
ʴŜſɛŜɨřɛŜɩřʰɌŜɌř
ʫʰɌɌƀ

ŨŞ

śɛŜɨɛŜɩ
ʰɥŜɬɪɪɨřʰɨɨɬřŞʰɥŜɬɰɬ
śɥ
ɰɬś
ŞɥŜɨɪɪɥɯɬɰɥŜɩɩɰɨɨɫɭ
ś

ɥŜɥɫɰɭɫɭɬɬ

Como el pvalor (0′595) es mayor que α no se rechaza la hipótesis nula. Así pues, de nuevo no hay evidencias de relación lineal entre las dos producciones (al
aumentar una no tiene por qué aumentar o disminuir significativamente la otra).
__
3.8. Comparación de más de dos promedios
El análisis de varianza (ANOVA) de un factor sirve para comparar varios grupos en una variable cuantitativa. Se trata, por tanto, de una generalización del test t para
dos muestras independientes en el caso de diseños con más de dos factores de agrupación. Veremos aquí su utilización como simple generalización de dicho test,
aunque volveremos sobre este tema en más profundidad en los capítulos 5 y 6.
A la variable categórica (nominal u ordinal) que define los grupos que deseamos comparar, la llamamos independiente o factor. A la variable cuantitativa (de
intervalo o razón) en la que deseamos comparar los grupos, la llamamos dependiente.
Si queremos, por ejemplo, averiguar cuál de tres programas distintos de incentivos aumenta de forma más eficaz el rendimiento de un determinado colectivo,
podemos seleccionar tres muestras aleatorias de ese colectivo y aplicar a cada una de ellas uno de los tres programas. Después, podemos medir el rendimiento de
cada grupo y averiguar si existen o no diferencias entre ellos. Tendremos una variable independiente categórica (el tipo de programa de incentivos) cuyos niveles
deseamos comparar entre sí, y una variable dependiente cuantitativa (la medida del rendimiento), en la cual queremos comparar los tres programas. El ANOVA de
un factor permite obtener información sobre el resultado de esa comparación. Es decir, permite concluir si los sujetos sometidos a distintos programas difieren de la
medida de rendimiento utilizada.
La hipótesis que se pone a prueba en el ANOVA de un factor es que las medias poblacionales (las medias de la variable dependiente en cada nivel de la variable
independiente) son iguales. Si las medias poblacionales son iguales, eso significa que los grupos no difieren en la variable dependiente y que, en consecuencia, la
variable independiente o factor no influye en la variable dependiente.
Lo que habitualmente se conoce como Análisis de la varianza es una versión paramétrica del test de la F. Para poder aplicarse deben verificarse ciertas
condiciones previas (normalidad, independencia y homocedasticidad (igualdad de varianzas)). En caso contrario existen alternativas paramétricas y no paramétricas.
NORMALIDAD HOMOCEDASTICIDAD TEST RECOMENDADO

Sí Sí Test de la F
NO* Sí
Sí NO Test de Welch o
Test de Kruskal Wallis
NO Sí o NO Test de Kruskal Wallis
*No drástico, pvalores del test de normalidad entre 0’01 y 0’05.
Recordar que la normalidad la estudiábamos con el test de ShapiroWilk, mientras que la homocedasticidad se puede comprobar utilizando el test de Barlett.
En este tipo de tests de igualdad de más de dos promedios, las hipótesis a contrastar son:
H0: promedios iguales
H1: no todos los promedios son iguales
Si volvemos a mirar la regla de decisión, dicha decisión en este caso sería:
Pvalor < α Rechazo H0 (no todos los promedios son iguales)
Pvalor ≥ α No rechazo H0 (los promedios son iguales)
Vamos a ver varios ejemplos con algunos de los casos que se pueden presentar.
Ejemplo 3.12. Comparar el consumo promedio para las tres temperaturas.
Solución:
Lo primero que tenemos que estudiar es la normalidad de los datos para cada grupo de temperatura, para ello utilizábamos es test de ShapiroWilk, que tenía
como hipótesis:
H0: los datos provienen de una población normal
H1: los datos NO provienen de una población normal
La forma más rápida de realizar los tres tests (uno para cada modalidad de la temperatura) es escribir en la línea de comandos:

Figura 9: Test de ShapiroWilk para el consumo por temperatura
Cuyos resultados son:

Ş

ʰɥŜɰɮɫɯřŞʰɥŜɫɨɨɩ


Ş

ʰɥŜɰɫɰɰřŞʰɥŜɨɪɩɪ


Ş

ʰɥŜɰɭɭɩřŞʰɥŜɩɰɰɪ

Los pvalores obtenidos son, respectivamente, 0′4112, 0′1323 y 0′2993, con lo que en todos los casos es suficientemente grande como para no rechazar la
hipótesis nula (se puede admitir la normalidad).
Para contrastar la igualdad de varianzas en más de dos poblaciones, se utiliza el test de Barlett, que tiene como hipótesis:
H0: las varianzas son iguales
H1: las varianzas son distintas
Para realizar dicho test vamos a:
Estadísticos
➥Varianzas
➥Test de Bartlett
Seleccionar temperatura y consumo
➥Aceptar
Cuyas salidas son:
ʴŜſɌřʰƀ

ś
ŨŞʰɨŜɫɥɬɩřʰɩřŞʰɥŜɫɰɬɪ

Como el pvalor (0′4953) es mayor que α no se rechaza la hipótesis nula, con lo que se pueden suponer las varianzas iguales. Como hay normalidad y
homocedasticidad, el test que realizaremos es el test de la F para la igualdad de medias, es decir, el típico análisis de la varianza de un factor. A este modelo le
vamos a llamar Anova1. Los pasos a seguir para obtener el correspondiente pvalor son:
Estadísticos
➥Medias
➥ANOVA de un factor
Introducimos el nombre Anova1
➥Seleccionar temperatura y consumo
➥Aceptamos
Cuyos resultados son:
ʴɨʳŞſɌřʰƀ
ʴſɨƀ

ſʴ ƀ

ɩɨɥɨɬɭɮɬɥɮɯɪɩɪŜɥɥɨɫŜɥɭŞɥɰƋƋƋ
ɨɨɫɩɬɨɮɥɨɩɩɥɯ
ŞŞŞ
ŜśɥƋƋƋɥŜɥɥɨƋƋɥŜɥɨƋɥŜɥɬŜɥŜɨɨ

ʴſɛřʰɛřʰſɌɌř
ʫɌɌƀƀ

ɨɥɰŜɫɫɥɰɬɨŜɨɪɮɨɰɫɭ
ɨɪɯŜɮɩɰɮɫɬŜɬɯɭɯɬɪɯ
ɨɯɩŜɨɪɪɪɫɩŜɩɬɫɪɮɪɪ

Como el pvalor (4′06 ‫ڄ‬ 109) es menor que α, se rechaza la hipótesis nula, con lo que se puede suponer que no todas las medias son iguales.
Gráficamente podríamos ver como se comporta cada grupo haciendo los correspondientes diagramas de cajas o gráficos de medias.
Comenzaremos con los diagramas de cajas:
Gráficas
➥Diagrama de cajas...
Seleccionar consumo
➥Gráfica según:temperatura
➥Aceptar
Con lo que se obtiene:
ʴſɌřʰɌɌřʰɌɌř
ʫʰƀ

Aunque el diagrama de cajas es muy utilizado, al estar comparando medias, un gráfico más adecuado podría ser el de medias. Para obtenerlo los pasos a seguir
son:
Gráficas
➥Gráficas de la media
Seleccionar las variables temperatura y consumo
➥Aceptar
Con el procedimiento anterior se obtendrían los gráficos de medias para los tres grupos de temperatura. Bien modificando las salidas en la ventana de
instrucciones o bien tecleando directamente, podemos cambiar las opciones del gráfico, como por ejemplo las etiquetas de los ejes o el título del gráfico. Para ello
deberíamos ejecutar la siguiente orden:
Cuyas salidas son:
ʴſɛřɛřŜʰɌŜɌř
ʫʰɥŜɰɬřʰɌɌřʰɌɌřŜʰ ř
ʫʰɌÜɌřʰɌɌř
ʫʰɌɌřʰƀ

Si se rechaza la hipótesis nula, es decir, si se concluye que las medias no son todas iguales, no ocurre como en el caso de dos poblaciones en el que claramente
una de ellas tendría media superior a la otra, sino que ahora habrá que evaluar las relaciones entre las distintas poblaciones. Existen una gran cantidad de test que
realizan comparaciones múltiples. Cabe destacar, por su uso más extendido, Duncan, NewmanKeuls, Bonferroni, Scheffé y HSD de Tukey.
Para realizar esta comparación solo hay que marcar la casilla: Comparación dos a dos de las medias, tal como puede verse a continuación:
Estadísticos
➥Medias
➥ANOVA de un factor
Introducimos el nombre Anova1
➥Seleccionanos temperatura y consumo
➥Comparación dos a dos de las medias
➥Aceptamos
Cuyas salidas son:
ʴʳŞſɨřʰſʰɌɌƀƀ
ʴſƀ

ś

śſʰɌřʰƀ

ś
ŜſʴŶŶƀ
ŞʰʰɥɮɩŜɭɰɨɥŜɮɩɭŜɮɯɨʳɥŜɥɥɨƋƋƋ
ŞʰʰɥɩɰŜɩɰɨɥŜɪɥɩŜɯɫɪɥŜɥɨɫɭƋ
ŞʰʰɥŞɫɪŜɫɥɨɨŜɨɯŞɪŜɯɯɩʳɥŜɥɥɨƋƋƋ
ŞŞŞ
ŜśɥƋƋƋɥŜɥɥɨƋƋɥŜɥɨƋɥŜɥɬŜɥŜɨɨ
ſŞŞŞƀ

ś

śſʰɌřʰƀ

ʰɩŜɪɮɪɯ
ɰɬʩŞ

ś

ŞʰʰɥɮɩŜɭɰɩɬɫɮŜɩɫɮɨɰɯŜɨɪɮɯ
ŞʰʰɥɩɰŜɩɯɯɰɫŜɯɪɮɮɬɪŜɮɫɥɥ
ŞʰʰɥŞɫɪŜɫɥɪɭŞɭɰŜɰɫɫɩŞɨɭŜɯɭɪɥ

ʴſƀ

Para añadir la línea vertical tenemos que poner en la línea de comandos:
tal como puede verse a continuación:
ſʰɥřʰɌɌƀ

y ejecutar la línea de comando.
A la vista del gráfico podemos concluir que el consumo a temperatura alta es mayor que a temperatura media o baja y el consumo a temperatura media es
significativamente mayor que el consumo a temperatura baja. __
Ejemplo 3.13. Comparar el consumo promedio para las tres líneas.
Solución:
Al igual que antes veamos si los datos están normalizados y hay homocedasticidad.
Para la normalidad aplicamos el test de ShapiroWilk, como lo hay que realizar por casos lo tenemos que implementar por comandos, para ello escribimos
y obtenemos:

Ş

ʰɥŜɰɬɰɮřŞʰɥŜɨɮɪɯ


Ş

ʰɥŜɰɫɯɬřŞʰɥŜɥɮɪɥɩ


Ş

ʰɥŜɰɯɯɮřŞʰɥŜɰɬɯɫ

Para los datos de la línea A el pvalor es 0′1738, para los de la línea B es 0′07302 y para los de la C es 0′9584. En los tres casos suficientemente grande como
para que no se rechace la hipótesis nula (se puede admitir la normalidad).
La homocedasticidad la estudiamos por medio del test de Bartlett:
Estadísticos
➥Varianzas
➥Test de Bartlett
Seleccionar las variables linea y consumo
➥Aceptar


ɨɬɮɫŜɥɮɰɪɬɬɰŜɭɥɪɩɩɪɰŜɥɭɪ

ʴŜſɌřʰƀ

ś
ŨŞʰɭŜɪɨɭɨřʰɩřŞʰɥŜɥɫɩɬɨ

Dado que el pvalor (0′04251) es menor que α, se rechaza la hipótesis nula al nivel 0′05, con lo que no pueden suponerse las varianzas iguales. En este caso,
como no hay homocedasticidad, realizaremos el test de KruskalWallis, donde las hipótesis a contrastar son:
H0 : promedios iguales para A, B y C
H1: no todas los promedios son iguales
Para realizar el test hacemos:
Estadísticos
➥Test de KruskalWallis
➥Aceptar
Obteniendo los siguientes resultados:
ʴŜſɌřʰƀ

Ş

ś
ŞŞʰɩɭŜɬɯɪɭřʰɩřŞʰɨŜɭɯɯŞɥɭ

Como el pvalor (1′688 ‫ڄ‬ 106) es menor que α se rechaza la hipótesis nula, no todas las medias son iguales. Gráficamente lo podemos ver mediante diagramas de
cajas:
Gráficas
➥Diagrama de cajas
Seleccionar consumo
➥Gráfica según:linea
➥Aceptar
Bien tecleando directamente el código o bien modificando las salidas del proceso anterior se pueden hacer modificaciones en el gráfico. Así, mediante la orden
por comandos
obtenemos el siguiente diagrama de cajas:
ʴſɌřʰɌɌřʰɌɌřʰƀ

Aunque en este caso sería menos aconsejable, también podríamos hacer un gráfico de medias. Los pasos a seguir son:
Gráficas
➥Gráficas de la media
➥Aceptar
Con el procedimiento anterior se obtendría el correspondiente gráfico de medias. No obstante, vamos a hacer modificaciones en la ventana de instrucciones a fin
de especificar ciertas opciones del gráfico. Así, ejecutaremos la siguiente orden de comandos:
Dicha ejecución da lugar a las siguientes salidas:
ʴſɛɌɛřŜʰɌŜɌř
ʫʰɥŜɰɬřʰɌɌřʰɌɌřŜʰ ř
ʫʰɌÜɌřʰɌɌř
ʫʰɌɌřʰƀ

__

Contrastes de Hipotesis

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Contrastes de Hipotesis

Caricato da

Copyright:

Formati disponibili

17/2/2016 Contrastes de hipotesis

Hipótesis nula H0: consumo medio = 120

Contraste para la ¿Distribución aproximadamente Tipo de test

H0 : μ = 120 H0 : μ ≥ 120 H0 : μ ≤ 120

Pvalor < α Rechazo H0 (consumo medio ≠ 120)

H0 : Me = 400 H0 : Me ≥ 400 H0 : Me ≤ 400

¿Distribuciones ¿Independientes? Tipo de test

H0 : μ1 = μ2 H0 : μ1 ≥ μ2 H0 : μ1 ≤ μ2

Contrastes para ¿Normalidad? Tipo de test

H0 : σ12 = σ22 H0 : σ12 ≥ σ22 H0 : σ12 ≤ σ22

H0 : p = 90 % H0 : p ≥ 90 % H0 : p ≤ 90 %

H0 : p1 = p2 H0 : p1 ≥ p2 H0 : p1 ≤ p2

NORMALIDAD HOMOCEDASTICIDAD TEST RECOMENDADO

ſʴ ƀ

Potrebbero piacerti anche

Contrastes de Hipotesis

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Contrastes de Hipotesis

Caricato da

Copyright:

Formati disponibili

17/2/2016 Contrastes de hipotesis

Hipótesis nula H0: consumo medio = 120

Contraste para la ¿Distribución aproximadamente Tipo de test

H0 : μ = 120 H0 : μ ≥ 120 H0 : μ ≤ 120

P­valor < α Rechazo H0 (consumo medio ≠ 120)

H0 : Me = 400 H0 : Me ≥ 400 H0 : Me ≤ 400

¿Distribuciones ¿Independientes? Tipo de test

H0 : μ1 = μ2 H0 : μ1 ≥ μ2 H0 : μ1 ≤ μ2

Contrastes para ¿Normalidad? Tipo de test

H0 : σ12 = σ22 H0 : σ12 ≥ σ22 H0 : σ12 ≤ σ22

H0 : p = 90 % H0 : p ≥ 90 % H0 : p ≤ 90 %

H0 : p1 = p2 H0 : p1 ≥ p2 H0 : p1 ≤ p2

NORMALIDAD HOMOCEDASTICIDAD TEST RECOMENDADO

 ſʴ ƀ

Potrebbero piacerti anche

Pvalor < α Rechazo H0 (consumo medio ≠ 120)

ſʴ ƀ