Sei sulla pagina 1di 30

17/2/2016 Contrastes de hipotesis

3. Contrastes de hipótesis

3.1. Introducción

Los métodos descriptivos proporcionan una idea de cómo es la muestra. Para obtener conclusiones relativas a la población necesitamos utilizar técnicas de inferencia
estadística. Dentro de éstas la más habitual es el contraste de hipótesis.

Una hipótesis es una afirmación sobre las características estadísticas de un proceso, por lo que se puede considerar una hipótesis como una conjetura. Por
ejemplo: si un técnico observa el consumo de energía durante varias horas, sabrá el consumo medio de las horas que observó. Con la ayuda de la inferencia, puede
avanzar un paso más y conjeturar que el consumo medio de todas las horas de trabajo en esa fábrica es de 120. El proceso científico consiste entonces en probar su
hipótesis contra una hipótesis alternativa:

Hipótesis nula H0: consumo medio = 120


Hipótesis alternativa H1: consumo medio ≠ 120

Un test consiste en un procedimiento estadístico para determinar la validez de una hipótesis (la hipótesis nula). Si los datos de la muestra resultan poco creíbles
de obtenerse en caso de ser cierta dicha hipótesis, nuestra razón nos obligará a rechazarla. En caso contrario, no hay base suficiente para rechazarla. La aceptación de
la hipótesis nula es muy difícil si sólo se usan procedimientos estadísticos. Sin embargo, desde el punto de vista práctico, el no rechazo de una hipótesis nos llevará a
concluir que no hay evidencias significativas en contra de dicha hipótesis y, por tanto, que puede considerarse admisible.

La forma habitual de presentar los resultados de un test de hipótesis es a través del p­valor o nivel crítico. Simplemente con este número se puede concluir si la
hipótesis nula es o no rechazada a un nivel de significación (α). El p­valor es el nivel de significación menor que llevaría al rechazo de la hipótesis nula H0. Una vez
que se conoce el p­valor, el responsable de tomar las decisiones puede determinar por sí mismo en qué medida son significativos los datos sin que se le imponga
formalmente un nivel de significación predeterminado. Una vez conocido el valor del p­valor y fijado el nivel de significación del contraste, la decisión a tomar se
obtiene comparando ambos valores, tal como puede verse en el cuadro 2.

Cuadro 2: Regla de decisión.

REGLA DE DECISIÓN

P­valor < α Rechazo H0

P­valor ≥ α No rechazo H0

Generalmente se considera α = 0′05.

La decisión es el último paso de un contraste de hipótesis. Un esquema de todo el proceso asociado a un contraste puede verse en la figura 5. En dicho esquema
se pone de manifiesto el hecho de que los niveles de significación habituales son siempre menores de 0′1, destacando los valores 0′1, 0′05 y 0′01. De entre todos
ellos, el nivel 0′05 predomina con claridad.

http://uce.uniovi.es/cursolineal/Informese3.html 1/30
17/2/2016 Contrastes de hipotesis

Figura 5: Pasos en un contraste de hipótesis.

Como ejemplos de test de hipótesis, vamos a considerar algunos de los más habituales en la práctica. Éstos aparecen descritos a continuación, junto con un
ejemplo de pregunta que sería contestada mediante dicho test.

Promedio de una población: ¿El consumo medio es menor de 140?
Comparación de promedios: ¿El consumo medio es mayor cuando hubo averías?
Proporción poblacional: ¿El porcentaje de horas con averías es mayor del 10 %?
Comparación de proporciones: ¿El porcentaje de horas con averías es mayor cuando estaba encendido el sistema que cuando no?
Desviación típica: ¿La variabilidad del consumo es menor de 50?
Comparación de desviaciones típicas: ¿La variabilidad del consumo es la misma durante las horas que hubo averías y durante las que no?

Ejemplos de la mayoría de los contrastes anteriores serán analizados en detalle en las Secciones 3.2 a 3.6.

3.2. Tests para el promedio

Para realizar un test cualquiera debemos considerar las siguientes etapas: seleccionar el contraste adecuado en el caso en estudio, establecer quiénes son H0 y H1 en
ese contraste e interpretar el p­valor. En un test sobre el valor promedio de la población, debemos tener en cuenta si los datos siguen aproximadamente una
distribución normal o no, así como el tamaño de la muestra, y según sea el resultado, decidir qué contraste realizamos (cuadro 3).

Cuadro 3: Contrastes para el promedio.

Contraste para la ¿Distribución aproximadamente Tipo de test


normal o n grande?
Media ( μ) Sí Test t para una muestra
Mediana ( Me) No Test de Wilcoxon para una muestra

http://uce.uniovi.es/cursolineal/Informese3.html 2/30
17/2/2016 Contrastes de hipotesis
Si la muestra dispone de un suficiente número de datos (habitualmente se exige que tenga al menos 30), se puede utilizar el test t para una muestra para realizar
contrastes acerca de la media de la población. En caso contrario, es necesario que se pueda admitir la normalidad de los datos para realizar dicho test. Si no fuera
normal, se utilizaría el test de Wilcoxon para una muestra. En los contrastes de normalidad de los datos utilizaremos del test de Shapiro­Wilk. Para este test las
hipótesis a contrastar son:

TEST DE BONDAD DE AJUSTE A LA NORMAL

H0: los datos provienen de una población normal
H1: los datos NO provienen de una población normal
REGLA DE DECISIÓN
P­valor < α   Rechazo H 0 (la distribución no es normal)
P­valor ≥ α   No rechazo H0 (se puede admitir la normalidad)
Generalmente se considera α = 0′05
.

En nuestro ejemplo, si queremos analizar el valor promedio de la variable consumo, al tener 117 datos ya podemos utilizar directamente el test t para una
muestra. Así pues, estamos en condiciones de realizar un contraste para la media, comparándola con el valor 120. El test adecuado en este caso es el test t para una
muestra, cuyas hipótesis a contrastar (H0 y H1) pueden ser de tres tipos:

H0 : μ = 120 H0 : μ ≥ 120 H0 : μ ≤ 120


H1 : μ≠120 H1 : μ < 120 H1 : μ > 120

Ejemplo 3.1. ¿Es el consumo medio igual a 120?

Solución: En este caso se tiene:

H0: el consumo medio es de 120
H1: el consumo medio no es de 120

Estadísticos
➥Medias
➥Test t para una muestra...

Seleccionar la variable consumo
➥Ponemos 120 en la hipótesis nula
➥Aceptar

Las salidas de este test son:

ʴ–Ŝ–‡•–ſƒ…‡”‘ɛ…‘•—‘ř—ʰɨɩɥř…‘ˆŜŽ‡˜‡ŽʰɥŜɰɬƀ


‡ƒ’Ž‡–Ş–‡•–

†ƒ–ƒśƒ…‡”‘ɛ…‘•—‘
–ʰɪŜɯɨɪɭř†ˆʰɨɨɭř’ޘƒŽ—‡ʰɥŜɥɥɥɩɩɨɥ
ƒŽ–‡”ƒ–‹˜‡Š›’‘–Š‡•‹•ś–”—‡‡ƒ‹•‘–‡“—ƒŽ–‘ɨɩɥ
ɰɬ’‡”…‡–…‘ˆ‹†‡…‡‹–‡”˜ƒŽś
ɨɩɰŜɪɬɨɭɨɫɰŜɬɭɨɫ
•ƒ’Ž‡‡•–‹ƒ–‡•ś
‡ƒ‘ˆš
ɨɪɰŜɫɬɭɬ

Puesto que la adaptación de la regla de decisión a este test en particular sería:

P­valor < α Rechazo H0 (consumo medio ≠ 120)

http://uce.uniovi.es/cursolineal/Informese3.html 3/30
17/2/2016 Contrastes de hipotesis
P­valor ≥ α No rechazo H0 (consumo medio =  120)

Generalmente se considera α = 0′05.

simplemente debemos considerar el valor del p­valor asociado a este contraste para esta muestra y, en base a él, tomar la decisión correspondiente. Puesto que hemos
obtenido que el p­valor es 0′0002210, éste es menor que α = 0′05, por lo que la decisión es rechazar la hipótesis nula (H0). Como conclusión podemos decir que la
media poblacional es distinta de 120. __

El ejemplo anterior corresponde al tipo de test bilateral, puesto que la hipótesis alternativa es que el valor del parámetro es distinto de un número. Cuando la
alternativa lleve el símbolo menor (<) o mayor (>), en lugar del símbolo distinto (≠, se denomina test unilateral. En ejemplo de dicho tipo de test unilateral puede
verse a continuación.

Ejemplo 3.2. ¿El consumo medio es menor de 140?

Solución: En este caso, tal como comentamos en el ejemplo anterior, se verifican las hipótesis para utilizar el test t para una muestra. Así, el test adecuado para
contestar a esta pregunta contrastaría las siguientes hipótesis:

H0: el consumo medio es mayor o igual que 140
H1: el consumo medio es menor de 140

y sería realizado tal como sigue:

Estadísticos
➥Medias
➥Test t para una muestra

Seleccionar la variable consumo
➥Ponemos 140 en la hipótesis nula
➥Marcar Media poblacional < mu0
➥Aceptar

Los resultados obtenidos son:

ʴ–Ŝ–‡•–ſƒ…‡”‘ɛ…‘•—‘řƒŽ–‡”ƒ–‹˜‡ʰɌŽ‡••Ɍř—ʰɨɫɥř…‘ˆŜŽ‡˜‡ŽʰɥŜɰɬƀ


‡ƒ’Ž‡–Ş–‡•–

†ƒ–ƒśƒ…‡”‘ɛ…‘•—‘
–ʰŞɥŜɨɥɭɬř†ˆʰɨɨɭř’ޘƒŽ—‡ʰɥŜɫɬɮɮ
ƒŽ–‡”ƒ–‹˜‡Š›’‘–Š‡•‹•ś–”—‡‡ƒ‹•Ž‡••–Šƒɨɫɥ
ɰɬ’‡”…‡–…‘ˆ‹†‡…‡‹–‡”˜ƒŽś
Ş ˆɨɫɮŜɰɨɬɰ
•ƒ’Ž‡‡•–‹ƒ–‡•ś
‡ƒ‘ˆš
ɨɪɰŜɫɬɭɬ

Como el p­valor (0′4577) supera los valores habituales de α, no se rechaza la hipótesis nula, por lo que podemos concluir que estos datos no aportan evidencias
suficientes de que la media sea menor de 140. __

Vamos por último a analizar el caso de una variable en la que no se den las condiciones para aplicar el test t para una muestra.

Ejemplo 3.3. Durante los días que hubo averías, ¿la producción promedio de galvanizado 1 se sitúa en menos de 400 toneladas?

Solución:

http://uce.uniovi.es/cursolineal/Informese3.html 4/30
17/2/2016 Contrastes de hipotesis
Comenzaremos seleccionando los datos para quedarnos sólo con aquellos que corresponden a días en los que hubo averías. Para ello podemos seguir los
siguientes pasos:

Datos
➥Conjunto de datos activo
➥Filtrar el conjunto de datos...

Seleccionar averias
➥Expresión de… averias=="Sí"
➥Nombre del nuevo… acero2
➥Aceptar

Datos
➥Conjunto de datos activo
➥Actualizar conjunto de datos activo

Así, disponemos de un nuevo conjunto de datos activado, solamente con los datos relativos a las horas en las que hubo avería. Como son 28 datos, tal como
vimos en el ejemplo 2.1, no podemos aplicar sin más el test t para la media y debemos comprobar si se cumple la hipótesis de normalidad.

Realizaremos pues el test de normalidad a la variable pr.galv1.

Estadísticos
➥Resúmenes
➥Test de normalidad de Shapiro…

http://uce.uniovi.es/cursolineal/Informese3.html 5/30
17/2/2016 Contrastes de hipotesis

Seleccionar pr.galv1
➥Aceptar

Los resultados de dicho test son:

ʴ•Šƒ’‹”‘Ŝ–‡•–ſƒ…‡”‘ɩɛ’”Ŝ‰ƒŽ˜ɨƀ

Šƒ’‹”‘Ş‹Ž‘”ƒŽ‹–›–‡•–

†ƒ–ƒśƒ…‡”‘ɩɛ’”Ŝ‰ƒŽ˜ɨ
ʰɥŜɯɯɥɬř’ޘƒŽ—‡ʰɥŜɥɥɫɨɨɮ

Como el p­valor (0′004118) es menor que α = 0′05, se rechaza la hipótesis nula, por lo tanto no hay normalidad.

¿Cómo podemos hacer para contrastar la hipótesis sobre el valor promedio de la producción de galvanizado 1 en las horas con averías? Al no haber normalidad y
disponer de pocos datos, debemos realizar el test de Wilcoxon para una muestra. Para éste los distintos tipos de contrastes de hipótesis para la mediana son:

H0 : Me = 400 H0 : Me ≥ 400 H0 : Me ≤ 400


H1 : Me≠400 H1 : Me < 400 H1 : Me > 400
two.sided less greater

La hipótesis que nos interesa es:

¿La producción promedio es menor de 400?

H0 : Me ≥ 400 (la producción promedio es alta)
H1 : Me < 400 (la producción promedio es baja)

Para realizar este test escribimos en la ventana de instrucciones lo que sigue:

™‹Ž…‘šŜ–‡•–ſƒ…‡”‘ɩɛŜ
ɨřƒŽ–‡”ƒ–‹˜‡ʰɌŽ‡••Ɍř—ʰɫɥɥƀ

y pinchamos en Ejecutar.

 
Figura 6: Test de Wilcox para una muestra

Lo que da como resultado

ʴ™‹Ž…‘šŜ–‡•–ſƒ…‡”‘ɩɛ’”Ŝ‰ƒŽ˜ɨřƒŽ–‡”ƒ–‹˜‡ʰɌŽ‡••Ɍř—ʰɫɥɥƀ

http://uce.uniovi.es/cursolineal/Informese3.html 6/30
17/2/2016 Contrastes de hipotesis
‹Ž…‘š‘•‹‰‡†”ƒ–‡•–™‹–Š…‘–‹—‹–›…‘””‡…–‹‘

†ƒ–ƒśƒ…‡”‘ɩɛ’”Ŝ‰ƒŽ˜ɨ
ʰɩɮɮř’ޘƒŽ—‡ʰɥŜɰɬɬɩ
ƒŽ–‡”ƒ–‹˜‡Š›’‘–Š‡•‹•ś–”—‡Ž‘…ƒ–‹‘‹•Ž‡••–Šƒɫɥɥ

Como el p­valor (0′9552) es mayor que el nivel de significación α, no se rechaza la hipótesis nula, por lo tanto podemos suponer que la producción es alta, es
decir mayor o igual de 400. __

3.3. Comparación de dos promedios

La comparación de dos promedios consiste en comprobar si el promedio de una variable varía según determinadas características. Dependiendo de la situación
existen diversas posibilidades de contrastes. El cuadro 4 recoge los principales tests aplicados habitualmente.

Cuadro 4: Contrastes para igualdad de promedios.

¿Distribuciones ¿Independientes? Tipo de test


Contrastes para aproximadamente
comparar dos normales o tamaños
muestrales grandes?
Medias Sí Sí Test t para muestras independientes
Medias Sí No Test t para datos relacionados
Medianas No Sí Test de Wilcoxon para dos muestras
Medianas No No Test de Wilcoxon para muestras pareadas

Ejemplo 3.4. ¿Se puede afirmar que cuando se producen averías el consumo de energía se incrementa?

Solución: Lo primero de todo será volver a activar la base de datos acero. Para ello, pinchamos a la derecha de Conjunto de datos:, en el botón que pone acero2
y seleccionamos de nuevo la base de datos acero.

Una vez hecho esto, vamos a verificar la normalidad del consumo para cada uno de las dos situaciones (cuando haya averías y cuando no) mediante el test de
Shapiro­Wilk. Para esto ponemos en la línea de comandos:

 
Figura 7: Normalidad del consumo según las averías

Los resultados de ejecutar ambas líneas de comando son:

ʴ•Šƒ’‹”‘Ŝ–‡•–ſ•—„•‡–ſƒ…‡”‘ř•—„•‡–ʰƒ˜‡”‹ƒ•ʰʰɌ‘Ɍƀɛ…‘•—‘ƀ

Šƒ’‹”‘Ş‹Ž‘”ƒŽ‹–›–‡•–

†ƒ–ƒś•—„•‡–ſƒ…‡”‘ř•—„•‡–ʰƒ˜‡”‹ƒ•ʰʰɌ‘Ɍƀɛ…‘•—‘
ʰɥŜɰɯɭɰř’ޘƒŽ—‡ʰɥŜɬɨɪɮ

ʴ•Šƒ’‹”‘Ŝ–‡•–ſ•—„•‡–ſƒ…‡”‘ř•—„•‡–ʰƒ˜‡”‹ƒ•ʰʰɌÃɌƀɛ…‘•—‘ƀ

Šƒ’‹”‘Ş‹Ž‘”ƒŽ‹–›–‡•–

†ƒ–ƒś•—„•‡–ſƒ…‡”‘ř•—„•‡–ʰƒ˜‡”‹ƒ•ʰʰɌÃɌƀɛ…‘•—‘
ʰɥŜɰɭɫɫř’ޘƒŽ—‡ʰɥŜɫɫɥɯ

Los p­valores correspondientes superan el nivel α, por lo que podemos considerar normalidad en ambos casos.

Por la naturaleza del problema, es evidente que se puede trabajar con la hipótesis de que las poblaciones son independientes, con lo cual estamos en condiciones
de aplicar el test t para muestras independientes. Ahora bien, a la hora de realizar dicho test es necesario especificar si se supone que las varianzas son iguales o
no, puesto que el estadístico utilizado al obtener el p­valor y, por tanto, el valor de dicho p­valor, difiere según la opción elegida. En la sección 3.4 se puede ver
cómo contrastar la igualdad de varianzas. El contraste para este ejemplo en particular está realizado en el Ejemplo 3.6, donde se obtiene que no hay evidencias en
contra de suponer que las varianzas de ambas poblaciones sean iguales. En estas circunstancias, aplicamos el test t para muestras independientes, suponiendo las
varianzas iguales.

¿Quiénes son H0 y H1 en ese contraste?

Dependiendo de la hipótesis alternativa considerada, los tres contrastes que podemos realizar con el test t para muestras independientes para comparar las
medias de dos poblaciones son:

H0 : μ1 = μ2 H0 : μ1 ≥ μ2 H0 : μ1 ≤ μ2


H1 : μ1≠μ2 H1 : μ1 < μ2 H1 : μ1 > μ2

Ahora bien, antes de nada debemos tener claro a quien asigna R como primera clase (clase 1 con media μ1) y como segunda clase (clase 2 con media μ2). Por
defecto, el programa considera el orden alfabético, es decir, si como en este caso las clases son No y Sí, la primera clase corresponde al no (sin averías y la segunda
al sí (con avería). Que consuma más con avería se traduciría por lo tanto en μ2 > μ1, por lo que para este ejemplo vamos a considerar el contraste:

H0 : μ1 ≥ μ2 (consumo menor o igual con avería)
http://uce.uniovi.es/cursolineal/Informese3.html 7/30
17/2/2016 Contrastes de hipotesis
H1 : μ1 < μ2 (consumo mayor con avería)

y para calcularlo procedemos de la siguiente forma:

Estadísticos
➥Medias
➥Test t para muestras independientes

Seleccionar las variables averias y consumo
➥Marcar: Diferencias < 0
➥Marcar: Varianzas iguales
➥Aceptar

Los resultados de estos pasos son:

ʴ–Ŝ–‡•–ſ…‘•—‘Ɍƒ˜‡”‹ƒ•řƒŽ–‡”ƒ–‹˜‡ʰɌŽ‡••Ɍř…‘ˆŜŽ‡˜‡ŽʰɥŜɰɬř
ʫ˜ƒ”Ŝ‡“—ƒŽʰř†ƒ–ƒʰƒ…‡”‘ƀ

™‘ƒ’Ž‡–Ş–‡•–

†ƒ–ƒś…‘•—‘„›ƒ˜‡”‹ƒ•
–ʰŞɥŜɰɫɩɪř†ˆʰɨɨɬř’ޘƒŽ—‡ʰɥŜɨɮɫ
ƒŽ–‡”ƒ–‹˜‡Š›’‘–Š‡•‹•ś–”—‡†‹ˆˆ‡”‡…‡‹‡ƒ•‹•Ž‡••–Šƒɥ
ɰɬ’‡”…‡–…‘ˆ‹†‡…‡‹–‡”˜ƒŽś
Ş ˆɯŜɬɭɫɨɨɪ
•ƒ’Ž‡‡•–‹ƒ–‡•ś
‡ƒ‹‰”‘—’‘‡ƒ‹‰”‘—’Ã
ɨɪɭŜɮɬɯɬɨɫɯŜɥɪɩɨ

Como el p­valor (0′174) es mayor que el nivel de significación α, no se rechaza la hipótesis nula. Así pues, los datos no aportan evidencias de que el consumo
promedio sea mayor cuando haya avería. __

¿Qué ocurriría si las poblaciones no fueran independientes?

En tal caso, si suponemos normalidad, realizamos el test t para muestras relacionadas. Se elige la siguiente opción del menú:

Estadísticos
➥Medias
➥Test t para muestras relacionadas

http://uce.uniovi.es/cursolineal/Informese3.html 8/30
17/2/2016 Contrastes de hipotesis
Sería este el caso, por ejemplo, si comparamos la resistencia de una pieza antes y después de aplicarle un procedimiento en el horno, el nivel de glóbulos rojos de
una persona antes y después de recibir un determinado tratamiento o la producción de galvanizado tipo 1 y la producción de galvanizado tipo 2.

Cuando las poblaciones no son normales y no tienen suficiente número de datos (habitualmente se suele exigir al menos 30) se realiza el test de Wilcoxon para
dos muestras si las poblaciones son independientes, o el test de Wilcoxon para muestras pareadas si tal independencia no es supuesta. Realicemos unos
ejemplos para aclarar tales situaciones.

Ejemplo 3.5. Estudie el comportamiento de la producción de galvanizado 1 en función de las averías.

Solución:

Aunque ya sabemos que no podemos asegurar que la producción de galvanizado 1 siga una distribución normal, vamos a actuar como si aún no conociésemos
dicha información. Así, determinamos el tipo de test más apropiado. Para ello aplicamos el test de normalidad de Shapiro­Wilk a ambas poblaciones:

 
Figura 8: Test Shapiro de galvanizado por averias

y los resultados de los mismos se detallan a continuación:

ʴ•Šƒ’‹”‘Ŝ–‡•–ſ•—„•‡–ſƒ…‡”‘ř•—„•‡–ʰƒ˜‡”‹ƒ•ʰʰɌ‘Ɍƀɛ’”Ŝ‰ƒŽ˜ɨƀ


Šƒ’‹”‘Ş‹Ž‘”ƒŽ‹–›–‡•–

†ƒ–ƒś•—„•‡–ſƒ…‡”‘ř•—„•‡–ʰƒ˜‡”‹ƒ•ʰʰɌ‘Ɍƀɛ’”Ŝ‰ƒŽ˜ɨ
ʰɥŜɯɬɭɪř’ޘƒŽ—‡ʰɯŜɥɯɨ‡Şɥɯ

ʴ•Šƒ’‹”‘Ŝ–‡•–ſ•—„•‡–ſƒ…‡”‘ř•—„•‡–ʰƒ˜‡”‹ƒ•ʰʰɌÃɌƀɛ’”Ŝ‰ƒŽ˜ɨƀ


Šƒ’‹”‘Ş‹Ž‘”ƒŽ‹–›–‡•–

†ƒ–ƒś•—„•‡–ſƒ…‡”‘ř•—„•‡–ʰƒ˜‡”‹ƒ•ʰʰɌÃɌƀɛ’”Ŝ‰ƒŽ˜ɨ
ʰɥŜɯɯɥɬř’ޘƒŽ—‡ʰɥŜɥɥɫɨɨɮ

A la vista de los resultados (ambos p­valores son menores de 0′0042) podemos considerar la no normalidad de los datos y no disponemos de un número
suficiente de datos (para horas con avería sólo contamos con 28 observaciones, tal como vimos en el ejemplo 2.1). Por tanto vamos a abordar este problema
realizando un test para muestras sin normalidad, el test de Wilcoxon. En este caso, dada la naturaleza de los datos, se realizará el test de Wilcoxon para muestras
independientes.

Para este problema, puesto que el No representa la clase 1 y el Sí la clase 2, las hipótesis a contrastar son:

H0 : Me1 ≥ Me2 (producción menor o igual con avería)
H1 : Me1 < Me2 (producción mayor con avería)

aunque de nuevo se podría considerar de la misma forma la alternativa de mayor (>) o de distinto (≠), tal como ocurría con el test t de igualdad de medias.

Para realizar el test seguimos los siguientes pasos:

Estadísticos
➥Test no paramétricos
➥Test de Wilcoxon para dos muestras

Seleccionar las variables averias y pr.galv1
➥Marcar: Diferencia < 0

http://uce.uniovi.es/cursolineal/Informese3.html 9/30
17/2/2016 Contrastes de hipotesis
➥Aceptar

Los resultados obtenidos en este caso son:

ʴ–ƒ’’Ž›ſƒ…‡”‘ɛ…‘•—‘řƒ…‡”‘ɛƒ˜‡”‹ƒ•ř‡†‹ƒřƒŜ”ʰƀ

‘Ã
ɨɪɭŜɥɬɨɫɯŜɬɭ

ʴ™‹Ž…‘šŜ–‡•–ſ…‘•—‘Ɍƒ˜‡”‹ƒ•řƒŽ–‡”ƒ–‹˜‡ʰɌŽ‡••Ɍř†ƒ–ƒʰƒ…‡”‘ƀ

‹Ž…‘š‘”ƒ•—–‡•–™‹–Š…‘–‹—‹–›…‘””‡…–‹‘

†ƒ–ƒś…‘•—‘„›ƒ˜‡”‹ƒ•
ʰɨɥɯɯŜɬř’ޘƒŽ—‡ʰɥŜɨɬɮɰ
ƒŽ–‡”ƒ–‹˜‡Š›’‘–Š‡•‹•ś–”—‡Ž‘…ƒ–‹‘•Š‹ˆ–‹•Ž‡••–Šƒɥ

Como el p­valor (0′1579) es mayor que el nivel de significación considerado (α), no se rechaza la hipótesis nula y, por tanto, no podemos concluir que la
producción de galvanizado 1 sea mayor cuando haya averías. __

En el caso de que las muestras no fueran independientes se tendría que haber elegido, si no se supone normalidad, el test de Wilcoxon para muestras pareadas.
Dicho test se realiza eligiendo la siguiente opción del menú:

Estadísticos
➥Test no paramétricos
➥Test de Wilcoxon para muestras pareadas

3.4. Comparación de dos varianzas

Como ya comentamos, un paso previo al contraste t de igualdad de medias es determinar la igualdad de varianzas, lo cual supone la realización de un test previo de
igualdad de varianzas. Para este contraste de hipótesis vamos a considerar dos tipos de test, según la naturaleza de los datos, tal como se detalla en el cuadro 5

Cuadro 5: Contrastes para igualdad de varianzas.

Contrastes para ¿Normalidad? Tipo de test


comparar dos
Varianzas Sí Test F para dos varianzas
Varianzas No Test de Levene

En nuestro ejemplo comparamos el consumo con o sin averías y ya habíamos visto que se podían suponer ambas poblaciones normales. Por lo que realizaremos
el test F para dos varianzas.

¿Quiénes son H0 y H1 en ese contraste?

Los distintos tipos de contrastes de hipótesis para dos varianzas, según la hipótesis alternativa considerada, son:

H0 : σ12 = σ22 H0 : σ12 ≥ σ22 H0 : σ12 ≤ σ22


H1 : σ12≠σ22 H1 : σ12 < σ22 H1 : σ12 > σ22
two.sided less greater

En el contraste de igualdad de medias, la comprobación previa consiste precisamente en el primero de estos tres contrastes. Vamos a ver como se realiza
mediante el siguiente ejemplo.

http://uce.uniovi.es/cursolineal/Informese3.html 10/30
17/2/2016 Contrastes de hipotesis
Ejemplo 3.6. ¿Son iguales las varianzas del consumo con o sin averías?

Solución:

Las hipótesis para el test son las siguientes.

H0 : σ12 = σ22 (varianzas iguales)
H1 : σ12≠σ22 (varianzas distintas)

Los pasos a seguir para obtener el p­valor asociado a dicho contraste son:

Estadísticos
➥Varianzas
➥Test F para dos varianzas...

Seleccionar las variables averias y consumo
➥Señalar Bilateral
➥Aceptar

Los resultados que presenta el R al finalizar estos pasos son:

ʴ–ƒ’’Ž›ſƒ…‡”‘ɛ…‘•—‘řƒ…‡”‘ɛƒ˜‡”‹ƒ•ř˜ƒ”řƒŜ”ʰƀ

‘Ã
ɪɨɩɪŜɮɫɯɩɯɥɩŜɭɪɥ

ʴ˜ƒ”Ŝ–‡•–ſ…‘•—‘Ɍƒ˜‡”‹ƒ•řƒŽ–‡”ƒ–‹˜‡ʰɌ–™‘Ŝ•‹†‡†Ɍř…‘ˆŜŽ‡˜‡ŽʰɥŜɰɬř
ʫ†ƒ–ƒʰƒ…‡”‘ƀ


–‡•––‘…‘’ƒ”‡–™‘˜ƒ”‹ƒ…‡•

†ƒ–ƒś…‘•—‘„›ƒ˜‡”‹ƒ•
ʰɨŜɨɨɫɭř—†ˆʰɯɯř†‡‘†ˆʰɩɮř’ޘƒŽ—‡ʰɥŜɮɮɪɨ
ƒŽ–‡”ƒ–‹˜‡Š›’‘–Š‡•‹•ś–”—‡”ƒ–‹‘‘ˆ˜ƒ”‹ƒ…‡•‹•‘–‡“—ƒŽ–‘ɨ
ɰɬ’‡”…‡–…‘ˆ‹†‡…‡‹–‡”˜ƒŽś
ɥŜɬɭɰɭɫɩɮɨŜɰɭɯɭɮɫɯ
•ƒ’Ž‡‡•–‹ƒ–‡•ś
”ƒ–‹‘‘ˆ˜ƒ”‹ƒ…‡•
ɨŜɨɨɫɬɮɮ

Como el p­valor (0′7731) es mayor que el nivel de significación α, no se rechaza la hipótesis nula y, por tanto, podemos suponer que no existen diferencias
significativas entre las varianzas del consumo con o sin avería (tienen la misma varianza). __

Como ya hemos comentado, si quisiésemos comparar la varianza de dos poblaciones que no suponemos normales, se debería realizar el test de Levene. Vamos a
ver su funcionamiento mediante un ejemplo.

Ejemplo 3.7. ¿Es homocedástica la producción de galvanizado 1 (pr.galv1) según las averías?

Solución:

Para la variable pr.galv1 sabíamos que los datos se comportan sin normalidad. En este caso se realiza el test de Levene. Las hipótesis del test son:

H0 : σ12 = σ22 (varianzas iguales)

http://uce.uniovi.es/cursolineal/Informese3.html 11/30
17/2/2016 Contrastes de hipotesis
H1 : σ12≠σ22 (varianzas distintas)

La realización de este test se lleva acabo como sigue:

Estadísticos
➥Varianzas 
➥Test de Levene

Seleccionar las variables averias y pr.galv1
➥Aceptar

Los resultados del test de Levene para estos datos son:

ʴŽ‡˜‡‡Ŝ–‡•–ſƒ…‡”‘ɛ’”Ŝ‰ƒŽ˜ɨřƒ…‡”‘ɛƒ˜‡”‹ƒ•ƀ


‘Ã
ɨɨɫɭɪɫŜɪɥɰɨɭɰɫŜɩɮ

‡˜‡‡Ũ•‡•–ˆ‘” ‘‘‰‡‡‹–›‘ˆƒ”‹ƒ…‡
ˆ ˜ƒŽ—‡”ſʴ ƀ
‰”‘—’ɨɫŜɨɩɰɪɥŜɥɫɫɫɬƋ
ɨɨɬ
ŞŞŞ
‹‰‹ˆŜ…‘†‡•śɥŨƋƋƋŨɥŜɥɥɨŨƋƋŨɥŜɥɨŨƋŨɥŜɥɬŨŜŨɥŜɨŨŨɨ

Como el p­valor (0′04445) es menor que α se rechaza la hipótesis nula, podemos por tanto suponer que hay diferencias significativas entre las varianzas. Más
aún, podemos ver que la varianza sin avería es de 114634′30 mientras que cuando hay avería la varianza toma el valor de 91694′27. __

3.5. Test para la proporción

Es frecuente el interés por saber qué proporción o porcentaje de individuos de una población, presentan una característica A, frente a los que no la presentan. Dicha
proporción no será en general conocida, pero se pueden hacer contrastes de hipótesis sobre su valor, en función de los datos de una muestra. Para la realización de
dichos tests es necesario un tamaño suficiente de muestra. Habitualmente se exige que dicho tamaño (n) sea mayor o igual que 30.

Por ejemplo de aplicación de dichos tests sería si queremos saber si porcentaje de horas con avería es excesivo, considerándose excesivo si el porcentaje es
mayor del 10 %.

Para responder a esta pregunta un contraste de hipótesis adecuado es el test de proporciones para una muestra. Vamos a ver un ejemplo de aplicación de
dicho test.

Ejemplo 3.8. Siguiendo con los datos de nuestro ejemplo, ¿puede considerarse que el porcentaje de averías es mayor del 10 %?

Solución:

Tendríamos en cuenta que p es la primera clase por orden alfabético, en este caso No. Plantearse si el porcentaje de horas con averías es mayor del 10 % es lo
mismo que plantearse si el porcentaje de horas sin averías es menor del 90 %. Puesto que los distintos tipos de contrastes de hipótesis para la proporción son de la
forma:

H0 : p =  90 % H0 : p ≥ 90 % H0 : p ≤ 90 %


H1 : p≠ 90 % H1 : p <  90 % H1 : p >  90 %
two.sided less greater

las hipótesis a contrastar serían:

H0 : p ≥ 90 % (proporción razonable de averías)
H1 : p < 90 % (proporción excesiva de averías)

Ahora solo habría que hacer

http://uce.uniovi.es/cursolineal/Informese3.html 12/30
17/2/2016 Contrastes de hipotesis
Estadísticos
➥Proporciones
➥Test de proporciones para una muestra

Seleccionar la variable averias
➥Escribir 0.9 como hipótesis nula
➥Proporción de la población < p0
➥Aceptar

Las soluciones de este procedimiento son:

ʴ’”‘’Ŝ–‡•–ſ”„‹†ſš–ƒ„•ſɌƒ˜‡”‹ƒ•ř†ƒ–ƒʰƒ…‡”‘ƀƀřƒŽ–‡”ƒ–‹˜‡ʰɌŽ‡••Ɍř
ʫ’ʰɥŜɰř…‘ˆŜŽ‡˜‡ŽʰɥŜɰɬř…‘””‡…–ʰ ƀ


ɨŞ•ƒ’Ž‡’”‘’‘”–‹‘•–‡•–™‹–Š‘—–…‘–‹—‹–›…‘””‡…–‹‘

†ƒ–ƒś”„‹†ſš–ƒ„•ſɌƒ˜‡”‹ƒ•ř†ƒ–ƒʰƒ…‡”‘ƀƀř—ŽŽ’”‘„ƒ„‹Ž‹–›ɥŜɰ
Ş•“—ƒ”‡†ʰɩɬŜɩɪɨɮř†ˆʰɨř’ޘƒŽ—‡ʰɩŜɬɫɩ‡Şɥɮ
ƒŽ–‡”ƒ–‹˜‡Š›’‘–Š‡•‹•ś–”—‡’‹•Ž‡••–ŠƒɥŜɰ
ɰɬ’‡”…‡–…‘ˆ‹†‡…‡‹–‡”˜ƒŽś
ɥŜɥɥɥɥɥɥɥɥŜɯɨɰɩɥɭɩ
•ƒ’Ž‡‡•–‹ƒ–‡•ś
’
ɥŜɮɭɥɭɯɪɯ


Como el p­valor es tan pequeño (2′542 ‫ڄ‬ 10­7), se rechaza la hipótesis nula, por lo que se concluye que ha habido un porcentaje excesivo de averías. En la muestra
se ve que dicho porcentaje ha sido de alrededor del 24 %.

Otra manera de abordar el problema, sobre todo si hubiera más de 2 clases sería reordenar los niveles de factor y poner como primer factor de la variable averias
el factor Sí.

Datos
➥Modificar variables
➥Recodificar niveles de factor

http://uce.uniovi.es/cursolineal/Informese3.html 13/30
17/2/2016 Contrastes de hipotesis

Seleccionar la variable averias
➥Aceptar

Reordenar de la forma deseada
➥Aceptar

Las salidas obtenidas son:

ʴƒ…‡”‘ɛƒ˜‡”‹ƒ•ʳވƒ…–‘”ſƒ…‡”‘ɛƒ˜‡”‹ƒ•řŽ‡˜‡Ž•ʰ…ſɌÃɌřɌ‘Ɍƀƀ


De esta manera las nuevas hipótesis del test serán:

H0 : p ≤ 10 % (proporción razonable de averías)
H1 : p > 10 % (proporción excesiva de averías)

En estas condiciones el test se realizaría del siguiente modo:

Estadísticos
➥Proporciones
➥Test de proporciones para una muestra

Seleccionar la variable averias
➥Escribimos 0.1 como hipótesis nula
➥Proporción de la población > p0
➥Aceptar

http://uce.uniovi.es/cursolineal/Informese3.html 14/30
17/2/2016 Contrastes de hipotesis

Las salidas obtenidas son:

ʴ’”‘’Ŝ–‡•–ſ”„‹†ſš–ƒ„•ſɌƒ˜‡”‹ƒ•ř†ƒ–ƒʰƒ…‡”‘ƀƀřƒŽ–‡”ƒ–‹˜‡ʰɌ‰”‡ƒ–‡”Ɍř
ʫ’ʰɥŜɨř…‘ˆŜŽ‡˜‡ŽʰɥŜɰɬř…‘””‡…–ʰ ƀ


ɨŞ•ƒ’Ž‡’”‘’‘”–‹‘•–‡•–™‹–Š‘—–…‘–‹—‹–›…‘””‡…–‹‘

†ƒ–ƒś”„‹†ſš–ƒ„•ſɌƒ˜‡”‹ƒ•ř†ƒ–ƒʰƒ…‡”‘ƀƀř—ŽŽ’”‘„ƒ„‹Ž‹–›ɥŜɨ
Ş•“—ƒ”‡†ʰɩɬŜɩɪɨɮř†ˆʰɨř’ޘƒŽ—‡ʰɩŜɬɫɩ‡Şɥɮ
ƒŽ–‡”ƒ–‹˜‡Š›’‘–Š‡•‹•ś–”—‡’‹•‰”‡ƒ–‡”–ŠƒɥŜɨ
ɰɬ’‡”…‡–…‘ˆ‹†‡…‡‹–‡”˜ƒŽś
ɥŜɨɯɥɮɰɪɯɨŜɥɥɥɥɥɥɥ
•ƒ’Ž‡‡•–‹ƒ–‡•ś
’
ɥŜɩɪɰɪɨɭɩ


Como el p­valor (2′542e ­ 07) (que es el mismo para los dos contrastes) es menor que α se rechaza la hipótesis nula y se concluye que la proporción de averías es
excesiva.

De nuevo vemos que para estos datos el porcentaje de horas con averías es de aproximadamente el 24 %. __

3.6. Comparación de dos proporciones

Además de analizar el comportamiento de una proporción, se puede querer comparar la proporción de una determinada característica en dos poblaciones distintas. Al
igual que ocurría en la sección anterior, el número de datos en cada muestra debe ser suficientemente grande (habitualmente se exigen al menos 30 datos por
muestra).

Así, por ejemplo, para poder determinar si el porcentaje de horas con avería es mayor cuando estaba apagado el sistema que cuando no, deberíamos plantear un
test de proporciones para dos muestras.

Los distintos tipos de contrastes de hipótesis en este caso son:

H0 : p1 = p2 H0 : p1 ≥ p2 H0 : p1 ≤ p2


H1 : p1≠ p2 H1 : p1 <  p2 H1 : p1 >  p2
two.sided less greater

donde p1 representa la proporción en el primer grupo (por orden alfabético) y p2 en el segundo.

Vamos a ver el funcionamiento de este test a través de un ejemplo concreto.

Ejemplo 3.9. ¿El porcentaje de horas con avería es mayor cuando estaba encendido el sistema que cuando no?

Solución:

Hemos de tener en cuenta que p1 es siempre la primera clase por orden alfabético. Como en este caso trabajamos con las modalidades No y Sí, las hipótesis a
contrastar son:

H0 : pNO ≥ pSI (igual o mejor con el sistema encendido)
H1 : pNO < pSI (peor con el sistema encendido)

La obtención del p­valor asociado a este test se realizaría mediante los siguientes pasos en R:

Estadísticos
➥Proporciones
➥Test de proporciones para dos muestras...

http://uce.uniovi.es/cursolineal/Informese3.html 15/30
17/2/2016 Contrastes de hipotesis

Seleccionar las variables sistema y averias
➥Marcar: Diferencia < 0
➥Aceptar

Las salidas de este procedimiento son:

ʴ’”‘’Ŝ–‡•–ſš–ƒ„•ſɌ•‹•–‡ƒʫƒ˜‡”‹ƒ•ř†ƒ–ƒʰƒ…‡”‘ƀřƒŽ–‡”ƒ–‹˜‡ʰɌŽ‡••Ɍř
ʫ…‘ˆŜŽ‡˜‡ŽʰɥŜɰɬř…‘””‡…–ʰ ƀ


ɩŞ•ƒ’Ž‡–‡•–ˆ‘”‡“—ƒŽ‹–›‘ˆ’”‘’‘”–‹‘•™‹–Š‘—–…‘–‹—‹–›
…‘””‡…–‹‘

†ƒ–ƒśš–ƒ„•ſɌ•‹•–‡ƒʫƒ˜‡”‹ƒ•ř†ƒ–ƒʰƒ…‡”‘ƀ
Ş•“—ƒ”‡†ʰɥŜɭɭɫɨř†ˆʰɨř’ޘƒŽ—‡ʰɥŜɩɥɮɭ
ƒŽ–‡”ƒ–‹˜‡Š›’‘–Š‡•‹•śŽ‡••
ɰɬ’‡”…‡–…‘ˆ‹†‡…‡‹–‡”˜ƒŽś
ŞɨŜɥɥɥɥɥɥɥŜɥɭɬɥɥɮ
•ƒ’Ž‡‡•–‹ƒ–‡•ś
’”‘’ɨ’”‘’ɩ
ɥŜɮɩɯɯɨɪɭɥŜɮɰɪɨɥɪɫ


Como el p­valor (0′2076) es mayor que α no se rechaza la hipótesis nula, no hay evidencias de que vaya peor con el sistema encendido. __

3.7. Relaciones entre variables

Muchas veces nos podemos preguntar si tiene sentido estudiar dos variables de forma conjunta, si existe una relación entre ellas y en caso de existir como de fuerte
es esa relación.
Para contestar a estas preguntas se establece una serie de coeficientes:

Para estudiar la relación general, se puede estudiar, entre otros, el coeficiente Chi­cuadrado de Pearson.
Para estudiar la relación lineal, el más habitual es el coeficiente de correlación de Pearson.

Para seleccionar el contraste más adecuado a la muestra, tendremos en cuenta la naturaleza de nuestras variables.
Para variables Cuantitativas, Cuantitativas­Discretas o cuantitativas­Continuas Discretizadas, se utiliza el test Chi­cuadrado de Pearson de independencia.
Para variables Cuantitativas­Continuas, se usará el test de correlación de Pearson.

Las hipótesis a contrastar en este tipo de problemas son siempre del tipo:

H0: no existe relación entre las variables
H1: sí existe relación entre las variables

donde la relación será o no del tipo lineal dependiendo del coeficiente utilizado en el contraste.

Así pues, un p­valor claramente menor de 0′05 indicará que existe relación entre las variables. Si es mayor de 0′05, los datos no nos proporcionarán evidencias de
dicha relación.

Ejemplo 3.10. ¿Existe relación entre que haya habido o no averías y la línea utilizada?

Solución:

Como las variables son cualitativas vamos a utilizar el test chi­cuadrado. Para hacer esto vamos a

http://uce.uniovi.es/cursolineal/Informese3.html 16/30
17/2/2016 Contrastes de hipotesis
Estadísticos
➥Tablas de contingencias
➥Tabla de doble entrada…

Seleccionar las variables averias y linea
➥Aceptar

Las salidas de este procedimiento son:

ʴš–ƒ„•ſɌƒ˜‡”‹ƒ•ʫŽ‹‡ƒř†ƒ–ƒʰƒ…‡”‘ƀ


Ž‹‡ƒ
ƒ˜‡”‹ƒ•
‘ɪɨɩɯɪɥ
Ãɯɨɨɰ


ʴ…Š‹•“Ŝ–‡•–ſš–ƒ„•ſɌƒ˜‡”‹ƒ•ʫŽ‹‡ƒř†ƒ–ƒʰƒ…‡”‘ƀř…‘””‡…–ʰ ƀ


‡ƒ”•‘Ũ•Š‹Ş•“—ƒ”‡†–‡•–

†ƒ–ƒśš–ƒ„•ſɌƒ˜‡”‹ƒ•ʫŽ‹‡ƒř†ƒ–ƒʰƒ…‡”‘ƀ
Ş•“—ƒ”‡†ʰɥŜɭɬɮɪř†ˆʰɩř’ޘƒŽ—‡ʰɥŜɮɨɰɰ


Como el p­valor (0′7199) es mayor que α no se rechaza la hipótesis nula, es decir, no hay evidencias de que las líneas afecten en que haya o no averías.
__

Ejemplo 3.11. ¿Existe relación entre la producción de galv1 y de galv2?

Solución:

Como las variables son cuantitativas continuas, podemos utilizar el test de correlación de Pearson, para lo cual haremos:

Estadísticos
➥Resúmenes…
➥Matriz de correlaciones

http://uce.uniovi.es/cursolineal/Informese3.html 17/30
17/2/2016 Contrastes de hipotesis

Seleccionar las variables pr.galv1 y pr.galv2
➥Aceptar

Los resultados obtenidos son:

ʴ…‘”Ŝ–‡•–ſƒ…‡”‘ɛ’”Ŝ‰ƒŽ˜ɨřƒ…‡”‘ɛ’”Ŝ‰ƒŽ˜ɩřƒŽ–‡”ƒ–‹˜‡ʰɌ–™‘Ŝ•‹†‡†Ɍř
ʫ‡–Š‘†ʰɌ’‡ƒ”•‘Ɍƀ


‡ƒ”•‘Ũ•’”‘†—…–ޏ‘‡–…‘””‡Žƒ–‹‘

†ƒ–ƒśƒ…‡”‘ɛ’”Ŝ‰ƒŽ˜ɨƒ†ƒ…‡”‘ɛ’”Ŝ‰ƒŽ˜ɩ
–ʰɥŜɬɪɪɨř†ˆʰɨɨɬř’ޘƒŽ—‡ʰɥŜɬɰɬ
ƒŽ–‡”ƒ–‹˜‡Š›’‘–Š‡•‹•ś–”—‡…‘””‡Žƒ–‹‘‹•‘–‡“—ƒŽ–‘ɥ
ɰɬ’‡”…‡–…‘ˆ‹†‡…‡‹–‡”˜ƒŽś
ŞɥŜɨɪɪɥɯɬɰɥŜɩɩɰɨɨɫɭ
•ƒ’Ž‡‡•–‹ƒ–‡•ś
…‘”
ɥŜɥɫɰɭɫɭɬɬ


Como el p­valor (0′595) es mayor que α no se rechaza la hipótesis nula. Así pues, de nuevo no hay evidencias de relación lineal entre las dos producciones (al
aumentar una no tiene por qué aumentar o disminuir significativamente la otra).
__

3.8. Comparación de más de dos promedios

El análisis de varianza (ANOVA) de un factor sirve para comparar varios grupos en una variable cuantitativa. Se trata, por tanto, de una generalización del test t para
dos muestras independientes en el caso de diseños con más de dos factores de agrupación. Veremos aquí su utilización como simple generalización de dicho test,
aunque volveremos sobre este tema en más profundidad en los capítulos 5 y 6.

A la variable categórica (nominal u ordinal) que define los grupos que deseamos comparar, la llamamos independiente o factor. A la variable cuantitativa (de
intervalo o razón) en la que deseamos comparar los grupos, la llamamos dependiente.
Si queremos, por ejemplo, averiguar cuál de tres programas distintos de incentivos aumenta de forma más eficaz el rendimiento de un determinado colectivo,
podemos seleccionar tres muestras aleatorias de ese colectivo y aplicar a cada una de ellas uno de los tres programas. Después, podemos medir el rendimiento de
cada grupo y averiguar si existen o no diferencias entre ellos. Tendremos una variable independiente categórica (el tipo de programa de incentivos) cuyos niveles
deseamos comparar entre sí, y una variable dependiente cuantitativa (la medida del rendimiento), en la cual queremos comparar los tres programas. El ANOVA de
un factor permite obtener información sobre el resultado de esa comparación. Es decir, permite concluir si los sujetos sometidos a distintos programas difieren de la
medida de rendimiento utilizada.
La hipótesis que se pone a prueba en el ANOVA de un factor es que las medias poblacionales (las medias de la variable dependiente en cada nivel de la variable
independiente) son iguales. Si las medias poblacionales son iguales, eso significa que los grupos no difieren en la variable dependiente y que, en consecuencia, la
variable independiente o factor no influye en la variable dependiente.

Lo que habitualmente se conoce como Análisis de la varianza es una versión paramétrica del test de la F. Para poder aplicarse deben verificarse ciertas
condiciones previas (normalidad, independencia y homocedasticidad (igualdad de varianzas)). En caso contrario existen alternativas paramétricas y no paramétricas.

NORMALIDAD HOMOCEDASTICIDAD TEST RECOMENDADO


Sí Sí Test de la F
NO* Sí
Sí NO Test de Welch o
Test de Kruskal Wallis
NO Sí o NO Test de Kruskal Wallis
*No drástico, p­valores del test de normalidad entre 0’01 y 0’05.

Recordar que la normalidad la estudiábamos con el test de Shapiro­Wilk, mientras que la homocedasticidad se puede comprobar utilizando el test de Barlett.

http://uce.uniovi.es/cursolineal/Informese3.html 18/30
17/2/2016 Contrastes de hipotesis
En este tipo de tests de igualdad de más de dos promedios, las hipótesis a contrastar son:

H0: promedios iguales
H1: no todos los promedios son iguales

Si volvemos a mirar la regla de decisión, dicha decisión en este caso sería:

P­valor < α Rechazo H0 (no todos los promedios son iguales)
P­valor ≥ α No rechazo H0 (los promedios son iguales)

Vamos a ver varios ejemplos con algunos de los casos que se pueden presentar.

Ejemplo 3.12. Comparar el consumo promedio para las tres temperaturas.

Solución:

Lo primero que tenemos que estudiar es la normalidad de los datos para cada grupo de temperatura, para ello utilizábamos es test de Shapiro­Wilk, que tenía
como hipótesis:

H0: los datos provienen de una población normal
H1: los datos NO provienen de una población normal

La forma más rápida de realizar los tres tests (uno para cada modalidad de la temperatura) es escribir en la línea de comandos:

 
Figura 9: Test de Shapiro­Wilk para el consumo por temperatura

Cuyos resultados son:

ʴ•Šƒ’‹”‘Ŝ–‡•–ſ•—„•‡–ſƒ…‡”‘ř•—„•‡–ʰ–‡’‡”ƒ–—”ƒʰʰɌŽ–ƒɌƀɛ…‘•—‘ƀ


Šƒ’‹”‘Ş‹Ž‘”ƒŽ‹–›–‡•–

†ƒ–ƒś•—„•‡–ſƒ…‡”‘ř•—„•‡–ʰ–‡’‡”ƒ–—”ƒʰʰɌŽ–ƒɌƀɛ…‘•—‘
ʰɥŜɰɮɫɯř’ޘƒŽ—‡ʰɥŜɫɨɨɩ


ʴ•Šƒ’‹”‘Ŝ–‡•–ſ•—„•‡–ſƒ…‡”‘ř•—„•‡–ʰ–‡’‡”ƒ–—”ƒʰʰɌ‡†‹ƒɌƀɛ…‘•—‘ƀ


Šƒ’‹”‘Ş‹Ž‘”ƒŽ‹–›–‡•–

†ƒ–ƒś•—„•‡–ſƒ…‡”‘ř•—„•‡–ʰ–‡’‡”ƒ–—”ƒʰʰɌ‡†‹ƒɌƀɛ…‘•—‘
ʰɥŜɰɫɰɰř’ޘƒŽ—‡ʰɥŜɨɪɩɪ


ʴ•Šƒ’‹”‘Ŝ–‡•–ſ•—„•‡–ſƒ…‡”‘ř•—„•‡–ʰ–‡’‡”ƒ–—”ƒʰʰɌƒŒƒɌƀɛ…‘•—‘ƀ


Šƒ’‹”‘Ş‹Ž‘”ƒŽ‹–›–‡•–

†ƒ–ƒś•—„•‡–ſƒ…‡”‘ř•—„•‡–ʰ–‡’‡”ƒ–—”ƒʰʰɌƒŒƒɌƀɛ…‘•—‘
ʰɥŜɰɭɭɩř’ޘƒŽ—‡ʰɥŜɩɰɰɪ


Los p­valores obtenidos son, respectivamente, 0′4112, 0′1323 y 0′2993, con lo que en todos los casos es suficientemente grande como para no rechazar la
hipótesis nula (se puede admitir la normalidad).

Para contrastar la igualdad de varianzas en más de dos poblaciones, se utiliza el test de Barlett, que tiene como hipótesis:

H0: las varianzas son iguales
H1: las varianzas son distintas

Para realizar dicho test vamos a:

Estadísticos 

http://uce.uniovi.es/cursolineal/Informese3.html 19/30
17/2/2016 Contrastes de hipotesis
➥Varianzas 
➥Test de Bartlett

Seleccionar temperatura y consumo
➥Aceptar

Cuyas salidas son:

ʴ„ƒ”–Ž‡––Ŝ–‡•–ſ…‘•—‘Ɍ–‡’‡”ƒ–—”ƒř†ƒ–ƒʰƒ…‡”‘ƀ


ƒ”–Ž‡–––‡•–‘ˆŠ‘‘‰‡‡‹–›‘ˆ˜ƒ”‹ƒ…‡•

†ƒ–ƒś…‘•—‘„›–‡’‡”ƒ–—”ƒ
ƒ”–Ž‡––Ũ•Ş•“—ƒ”‡†ʰɨŜɫɥɬɩř†ˆʰɩř’ޘƒŽ—‡ʰɥŜɫɰɬɪ


Como el p­valor (0′4953) es mayor que α no se rechaza la hipótesis nula, con lo que se pueden suponer las varianzas iguales. Como hay normalidad y
homocedasticidad, el test que realizaremos es el test de la F para la igualdad de medias, es decir, el típico análisis de la varianza de un factor. A este modelo le
vamos a llamar Anova1. Los pasos a seguir para obtener el correspondiente p­valor son:

Estadísticos 
➥Medias
➥ANOVA de un factor

Introducimos el nombre Anova1
➥Seleccionar temperatura y consumo
➥Aceptamos

Cuyos resultados son:

ʴ‘˜ƒɨʳރ‘˜ſ…‘•—‘Ɍ–‡’‡”ƒ–—”ƒř†ƒ–ƒʰƒ…‡”‘ƀ

http://uce.uniovi.es/cursolineal/Informese3.html 20/30
17/2/2016 Contrastes de hipotesis
ʴ•—ƒ”›ſ‘˜ƒɨƀ


ˆ—“‡ƒ“ ˜ƒŽ—‡”ſʴ ƀ


–‡’‡”ƒ–—”ƒɩɨɥɨɬɭɮɬɥɮɯɪɩɪŜɥɥɨɫŜɥɭ‡ŞɥɰƋƋƋ
‡•‹†—ƒŽ•ɨɨɫɩɬɨɮɥɨɩɩɥɯ
ŞŞŞ
‹‰‹ˆŜ…‘†‡•śɥƋƋƋɥŜɥɥɨƋƋɥŜɥɨƋɥŜɥɬŜɥŜɨɨ


ʴ——ƒ”›ſƒ…‡”‘ɛ…‘•—‘ř‰”‘—’•ʰƒ…‡”‘ɛ–‡’‡”ƒ–—”ƒř•–ƒ–‹•–‹…•ʰ…ſɌ‡ƒɌř
ʫɌ•†Ɍƀƀ


‡ƒ•†
Ž–ƒɨɥɰŜɫɫɥɰɬɨŜɨɪɮɨɰɫɭ
‡†‹ƒɨɪɯŜɮɩɰɮɫɬŜɬɯɭɯɬɪɯ
ƒŒƒɨɯɩŜɨɪɪɪɫɩŜɩɬɫɪɮɪɪ


Como el p­valor (4′06 ‫ڄ‬ 10­9) es menor que α, se rechaza la hipótesis nula, con lo que se puede suponer que no todas las medias son iguales.

Gráficamente podríamos ver como se comporta cada grupo haciendo los correspondientes diagramas de cajas o gráficos de medias.

Comenzaremos con los diagramas de cajas:

Gráficas
➥Diagrama de cajas...

Seleccionar consumo
➥Gráfica según:temperatura
➥Aceptar

Con lo que se obtiene:

ʴ„‘š’Ž‘–ſ…‘•—‘Ɍ–‡’‡”ƒ–—”ƒř›Žƒ„ʰɌ‘•—‘ɌřšŽƒ„ʰɌ‡’‡”ƒ–—”ƒɌř
ʫ†ƒ–ƒʰƒ…‡”‘ƀ


http://uce.uniovi.es/cursolineal/Informese3.html 21/30
17/2/2016 Contrastes de hipotesis

Aunque el diagrama de cajas es muy utilizado, al estar comparando medias, un gráfico más adecuado podría ser el de medias. Para obtenerlo los pasos a seguir
son:

Gráficas
➥Gráficas de la media

Seleccionar las variables temperatura y consumo
➥Aceptar

Con el procedimiento anterior se obtendrían los gráficos de medias para los tres grupos de temperatura. Bien modificando las salidas en la ventana de
instrucciones o bien tecleando directamente, podemos cambiar las opciones del gráfico, como por ejemplo las etiquetas de los ejes o el título del gráfico. Para ello
deberíamos ejecutar la siguiente orden:

http://uce.uniovi.es/cursolineal/Informese3.html 22/30
17/2/2016 Contrastes de hipotesis

Cuyas salidas son:

ʴ’Ž‘–‡ƒ•ſƒ…‡”‘ɛ…‘•—‘řƒ…‡”‘ɛ–‡’‡”ƒ–—”ƒř‡””‘”Ŝ„ƒ”•ʰɌ…‘ˆŜ‹–Ɍř
ʫŽ‡˜‡ŽʰɥŜɰɬřšŽƒ„ʰɌ‡’‡”ƒ–—”ƒɌř›Žƒ„ʰɌ‘•—‘ɌřŜŽƒ„‡Žʰ ř
ʫƒ‹ʰɌ‹•–”‹„—…‹Ü†‡Ž…‘•—‘’‘”–‡’‡”ƒ–—”ƒɌř…‘ŽʰɌ„Žƒ…Ɍř
ʫ„ƒ”…‘ŽʰɌ„Ž—‡Ɍř…‘‡…–ʰƀ


Si se rechaza la hipótesis nula, es decir, si se concluye que las medias no son todas iguales, no ocurre como en el caso de dos poblaciones en el que claramente
una de ellas tendría media superior a la otra, sino que ahora habrá que evaluar las relaciones entre las distintas poblaciones. Existen una gran cantidad de test que
realizan comparaciones múltiples. Cabe destacar, por su uso más extendido, Duncan, Newman­Keuls, Bonferroni, Scheffé y HSD de Tukey.

Para realizar esta comparación solo hay que marcar la casilla: Comparación dos a dos de las medias, tal como puede verse a continuación:

Estadísticos 
➥Medias 
➥ANOVA de un factor

http://uce.uniovi.es/cursolineal/Informese3.html 23/30
17/2/2016 Contrastes de hipotesis

Introducimos el nombre Anova1
➥Seleccionanos temperatura y consumo
➥Comparación dos a dos de las medias
➥Aceptamos

Cuyas salidas son:

ʴ…‘’ƒ”ƒ…‹‘ʳމŽŠ–ſ‘˜ƒɨřŽ‹ˆ…–ʰ…’ſ–‡’‡”ƒ–—”ƒʰɌ—‡›Ɍƀƀ
ʴ•—ƒ”›ſ…‘’ƒ”ƒ…‹‘ƀ


‹—Ž–ƒ‡‘—•‡•–•ˆ‘”
‡‡”ƒŽ‹‡ƒ” ›’‘–Š‡•‡•

—Ž–‹’Ž‡‘’ƒ”‹•‘•‘ˆ‡ƒ•ś—‡›‘–”ƒ•–•


 ‹–śƒ‘˜ſˆ‘”—Žƒʰ…‘•—‘Ɍ–‡’‡”ƒ–—”ƒř†ƒ–ƒʰƒ…‡”‘ƀ

‹‡ƒ” ›’‘–Š‡•‡•ś
•–‹ƒ–‡–†Ŝ””‘”–˜ƒŽ—‡”ſʴŶ–Ŷƀ
ŞʰʰɥɮɩŜɭɰɨɥŜɮɩɭŜɮɯɨʳɥŜɥɥɨƋƋƋ
ŞʰʰɥɩɰŜɩɰɨɥŜɪɥɩŜɯɫɪɥŜɥɨɫɭƋ
ŞʰʰɥŞɫɪŜɫɥɨɨŜɨɯŞɪŜɯɯɩʳɥŜɥɥɨƋƋƋ
ŞŞŞ
‹‰‹ˆŜ…‘†‡•śɥƋƋƋɥŜɥɥɨƋƋɥŜɥɨƋɥŜɥɬŜɥŜɨɨ
ſ†Œ—•–‡†’˜ƒŽ—‡•”‡’‘”–‡†ŞŞ•‹‰Ž‡Ş•–‡’‡–Š‘†ƀ


‹—Ž–ƒ‡‘—•‘ˆ‹†‡…‡ –‡”˜ƒŽ•

—Ž–‹’Ž‡‘’ƒ”‹•‘•‘ˆ‡ƒ•ś—‡›‘–”ƒ•–•


 ‹–śƒ‘˜ſˆ‘”—Žƒʰ…‘•—‘Ɍ–‡’‡”ƒ–—”ƒř†ƒ–ƒʰƒ…‡”‘ƀ

—ƒ–‹Ž‡ʰɩŜɪɮɪɯ
ɰɬʩˆƒ‹Ž›Ş™‹•‡…‘ˆ‹†‡…‡Ž‡˜‡Ž


‹‡ƒ” ›’‘–Š‡•‡•ś
•–‹ƒ–‡Ž™”—’”
‡†‹ƒŞŽ–ƒʰʰɥɮɩŜɭɰɩɬɫɮŜɩɫɮɨɰɯŜɨɪɮɯ
ƒŒƒŞŽ–ƒʰʰɥɩɰŜɩɯɯɰɫŜɯɪɮɮɬɪŜɮɫɥɥ
ƒŒƒŞ‡†‹ƒʰʰɥŞɫɪŜɫɥɪɭŞɭɰŜɰɫɫɩŞɨɭŜɯɭɪɥ


ʴ’Ž‘–ſ…‘’ƒ”ƒ…‹‘ƀ


http://uce.uniovi.es/cursolineal/Informese3.html 24/30
17/2/2016 Contrastes de hipotesis

Para añadir la línea vertical tenemos que poner en la línea de comandos:

tal como puede verse a continuación:

ƒ„Ž‹‡ſ˜ʰɥř…‘ŽʰɌ”‡†Ɍƀ


y ejecutar la línea de comando.

A la vista del gráfico podemos concluir que el consumo a temperatura alta es mayor que a temperatura media o baja y el consumo a temperatura media es
significativamente mayor que el consumo a temperatura baja. __

Ejemplo 3.13. Comparar el consumo promedio para las tres líneas.

Solución:

Al igual que antes veamos si los datos están normalizados y hay homocedasticidad.
Para la normalidad aplicamos el test de Shapiro­Wilk, como lo hay que realizar por casos lo tenemos que implementar por comandos, para ello escribimos

http://uce.uniovi.es/cursolineal/Informese3.html 25/30
17/2/2016 Contrastes de hipotesis

y obtenemos:

ʴ•Šƒ’‹”‘Ŝ–‡•–ſ•—„•‡–ſƒ…‡”‘ř•—„•‡–ʰŽ‹‡ƒʰʰɌɌƀɛ…‘•—‘ƀ


Šƒ’‹”‘Ş‹Ž‘”ƒŽ‹–›–‡•–

†ƒ–ƒś•—„•‡–ſƒ…‡”‘ř•—„•‡–ʰŽ‹‡ƒʰʰɌɌƀɛ…‘•—‘
ʰɥŜɰɬɰɮř’ޘƒŽ—‡ʰɥŜɨɮɪɯ


ʴ•Šƒ’‹”‘Ŝ–‡•–ſ•—„•‡–ſƒ…‡”‘ř•—„•‡–ʰŽ‹‡ƒʰʰɌɌƀɛ…‘•—‘ƀ


Šƒ’‹”‘Ş‹Ž‘”ƒŽ‹–›–‡•–

†ƒ–ƒś•—„•‡–ſƒ…‡”‘ř•—„•‡–ʰŽ‹‡ƒʰʰɌɌƀɛ…‘•—‘
ʰɥŜɰɫɯɬř’ޘƒŽ—‡ʰɥŜɥɮɪɥɩ


ʴ•Šƒ’‹”‘Ŝ–‡•–ſ•—„•‡–ſƒ…‡”‘ř•—„•‡–ʰŽ‹‡ƒʰʰɌɌƀɛ…‘•—‘ƀ


Šƒ’‹”‘Ş‹Ž‘”ƒŽ‹–›–‡•–

†ƒ–ƒś•—„•‡–ſƒ…‡”‘ř•—„•‡–ʰŽ‹‡ƒʰʰɌɌƀɛ…‘•—‘
ʰɥŜɰɯɯɮř’ޘƒŽ—‡ʰɥŜɰɬɯɫ


Para los datos de la línea A el p­valor es 0′1738, para los de la línea B es 0′07302 y para los de la C es 0′9584. En los tres casos suficientemente grande como
para que no se rechace la hipótesis nula (se puede admitir la normalidad).

La homocedasticidad la estudiamos por medio del test de Bartlett:

Estadísticos
➥Varianzas
➥Test de Bartlett

Seleccionar las variables linea y consumo
➥Aceptar

Los resultados obtenidos son:

ʴ–ƒ’’Ž›ſƒ…‡”‘ɛ…‘•—‘řƒ…‡”‘ɛŽ‹‡ƒř˜ƒ”řƒŜ”ʰƀ


http://uce.uniovi.es/cursolineal/Informese3.html 26/30
17/2/2016 Contrastes de hipotesis

ɨɬɮɫŜɥɮɰɪɬɬɰŜɭɥɪɩɩɪɰŜɥɭɪ


ʴ„ƒ”–Ž‡––Ŝ–‡•–ſ…‘•—‘ɌŽ‹‡ƒř†ƒ–ƒʰƒ…‡”‘ƀ


ƒ”–Ž‡–––‡•–‘ˆŠ‘‘‰‡‡‹–›‘ˆ˜ƒ”‹ƒ…‡•

†ƒ–ƒś…‘•—‘„›Ž‹‡ƒ
ƒ”–Ž‡––Ũ•Ş•“—ƒ”‡†ʰɭŜɪɨɭɨř†ˆʰɩř’ޘƒŽ—‡ʰɥŜɥɫɩɬɨ


Dado que el p­valor (0′04251) es menor que α, se rechaza la hipótesis nula al nivel 0′05, con lo que no pueden suponerse las varianzas iguales. En este caso,
como no hay homocedasticidad, realizaremos el test de Kruskal­Wallis, donde las hipótesis a contrastar son:

H0 : promedios iguales para A, B y C
H1: no todas los promedios son iguales

Para realizar el test hacemos:

Estadísticos
➥Test no paramétricos
➥Test de Kruskal­Wallis

Seleccionar las variables linea y consumo
➥Aceptar

Obteniendo los siguientes resultados:

ʴ”—•ƒŽŜ–‡•–ſ…‘•—‘ɌŽ‹‡ƒř†ƒ–ƒʰƒ…‡”‘ƀ


”—•ƒŽŞƒŽŽ‹•”ƒ•—–‡•–

†ƒ–ƒś…‘•—‘„›Ž‹‡ƒ
”—•ƒŽŞƒŽŽ‹•…Š‹Ş•“—ƒ”‡†ʰɩɭŜɬɯɪɭř†ˆʰɩř’ޘƒŽ—‡ʰɨŜɭɯɯ‡Şɥɭ


Como el p­valor (1′688 ‫ڄ‬ 10­6) es menor que α se rechaza la hipótesis nula, no todas las medias son iguales. Gráficamente lo podemos ver mediante diagramas de
cajas:

Gráficas
➥Diagrama de cajas

http://uce.uniovi.es/cursolineal/Informese3.html 27/30
17/2/2016 Contrastes de hipotesis

Seleccionar consumo
➥Gráfica según:linea
➥Aceptar

Bien tecleando directamente el código o bien modificando las salidas del proceso anterior se pueden hacer modificaciones en el gráfico. Así, mediante la orden
por comandos

obtenemos el siguiente diagrama de cajas:

ʴ„‘š’Ž‘–ſ…‘•—‘ɌŽ‹‡ƒř›Žƒ„ʰɌ…‘•—‘ɌřšŽƒ„ʰɌŽ‹‡ƒɌř†ƒ–ƒʰƒ…‡”‘ƀ


http://uce.uniovi.es/cursolineal/Informese3.html 28/30
17/2/2016 Contrastes de hipotesis

Aunque en este caso sería menos aconsejable, también podríamos hacer un gráfico de medias. Los pasos a seguir son:

Gráficas
➥Gráficas de la media

Seleccionar las variables linea y consumo
➥Aceptar

Con el procedimiento anterior se obtendría el correspondiente gráfico de medias. No obstante, vamos a hacer modificaciones en la ventana de instrucciones a fin
de especificar ciertas opciones del gráfico. Así, ejecutaremos la siguiente orden de comandos:

http://uce.uniovi.es/cursolineal/Informese3.html 29/30
17/2/2016 Contrastes de hipotesis

Dicha ejecución da lugar a las siguientes salidas:

ʴ’Ž‘–‡ƒ•ſƒ…‡”‘ɛ…‘•—‘Ɍƒ…‡”‘ɛŽ‹‡ƒř‡””‘”Ŝ„ƒ”•ʰɌ…‘ˆŜ‹–Ɍř
ʫŽ‡˜‡ŽʰɥŜɰɬřšŽƒ„ʰɌ‹‡ƒɌř›Žƒ„ʰɌ‘•—‘ɌřŜŽƒ„‡Žʰ ř
ʫƒ‹ʰɌ‹•–”‹„—…‹Ü†‡Ž…‘•—‘’‘”Ž‹‡ƒɌř…‘ŽʰɌ„Žƒ…Ɍř
ʫ„ƒ”…‘ŽʰɌ„Ž—‡Ɍř…‘‡…–ʰƀ


__

http://uce.uniovi.es/cursolineal/Informese3.html 30/30

Potrebbero piacerti anche