Sei sulla pagina 1di 13

ANOVA (ANALYSIS OF

VARIANCE)
¿QUÉ SUCEDERÍA SI QUISIÉRAMOS COMPARAR LA MEDIA DE MÁS DE DOS
POBLACIONES (𝝁𝟏 𝒗𝒔𝝁𝟐 𝒗𝒔𝝁𝟑 𝒗𝒔 … 𝒗𝒔𝝁𝒌 )?

Para este tipo de comparaciones la técnica estadística para realizarlos es el


análisis de varianza (ANOVA por sus siglas en ingles), la cual consiste en una
prueba de hipótesis para determinar si todas las medias de una población son
iguales o por si el contrario alguna de las medias es diferente a las demás, por
tanto solo plantea dos tipos de hipótesis:

Hipotesis Nula: 𝝁𝟏 = 𝝁𝟐 = 𝝁𝟑 = ⋯ = 𝝁𝒌

Hipotesis Alterna: 𝐏𝐨𝐫 𝐥𝐨 𝐦𝐞𝐧𝐨𝐬 𝐮𝐧𝐚 𝛍 𝐞𝐬 𝐝𝐢𝐟𝐞𝐫𝐞𝐧𝐭𝐞.

Criterio de Decisión: Si el valor – p de la Tabla de ANOVA es menor de 0,05


(confianza del 95%) se rechaza la Ho, pero si es mayor o igual a 0,05 la Ho se
acepta.
Este tipo de análisis puede aplicarse cuando se cumple las siguientes
condiciones:

Todas las muestras siguen el comportamiento de una distribución normal.

Existe igualdad entre las varianzas poblacionales.

Existe independencia entre las muestras analizadas.

Para probar la igualdad de desviaciones estándares (o varianzas) se aplica el


Test de Levene’s el cual plantea la siguiente prueba de hipótesis:

Hipotesis Nula: 𝝈𝟏 = 𝝈𝟐 = 𝝈𝟑 = ⋯ = 𝝈𝒌 (va asociada a la condicion)

Hipotesis Alterna: 𝐏𝐨𝐫 𝐥𝐨 𝐦𝐞𝐧𝐨𝐬 𝐮𝐧𝐚 𝛔 𝐞𝐬 𝐝𝐢𝐟𝐞𝐫𝐞𝐧𝐭𝐞.

Para determinar que hipótesis será la aceptada se aplica el criterio del


valor - p
El ANOVA solo determina si las medias son iguales o por lo menos una de las
medias es diferente, si se quiere llegar a conocer cuál es la naturaleza de las
diferencias planteadas en la hipótesis alternativa, se hace necesario aplicar
alguna de las pruebas de múltiples rangos como la prueba LSD (Least
Significant Difference).
Por el contrario, si alguna de las condiciones del ANOVA no se cumplen, el
análisis se centrara en la comparación de las medianas por medio del Test de
Kruskal – Wallis, que plantea hipótesis similares que el ANOVA:

Hipotesis Nula: todas las medianas iguales

Hipotesis Alterna: por lo menos una de las medianas es diferente

Criterio de Decisión: Si el valor – p de la de la prueba de Kruskal - Wallis es


menor de 0,05 (confianza del 95%) se rechaza la Ho, pero si es mayor o igual a
0,05 la Ho se acepta. Para determinar que medianas serian diferentes (en el
caso que Ho se rechace) se aplicara un gráfico de cajas y de bigotes (con
muescas sobre la mediana) para determinar la naturaleza de las diferencias.
Modelo de Regresión Simple

Un modelo de regresión simple se aplica cuando se desea correlación una


variable dependiente cuantitativa continua y una variable independiente
también cuantitativa continua. A continuación se señalan los pasos para la
generación de un modelo de regresión simple en el software Statgraphics XVI:

- Se seleccionan las variables de la base de datos, identificandose la variable


dependiente y la independiente.

- Se selecciona el modelo lineal inicialmente, pero una vez identificado el


modelo con mayor R cuadrado, se selecciona este nuevo modelo.

- Se determina si la constante del modelo es significativa por medio del


criterio del valor p, en donde las hipotesis plantean:

Hipotesis Nula: La constante no es significativa para el modelo.


Hipotesis Alternativa: La constante es significativa para el modelo.
Modelo de Regresión Simple

- Se evalua el valor p del modelo de regresión, el cual coincide con el valor p


de la variable independiente (solo en el modelo de regresion simple).

- Se analiza el valor del R cuadrado ajustado, este estadistico nos señala que
porcentaje de la variabilidad de la variable dependiente es explicada por el
modelo, cuando es mayor o igual del 80% se considera que explica de
manera suficiente el comportamiento de la variable dependiente y se
procede a realizar el analisis de los residuos del modelo, pero si es menor
del 80%, se recomienda cambiar el modelo o aumentar el numero de
variables independientes.

- Por medio del grafico del modelo ajustado se analiza la relacion entre la
variable independiente y la variable dependiente.
Modelo de Regresión Simple

Si el valor del R cuadrado ajustado es mayor o igual del 80% se procede a


realizar el analisis de los residuos, se entiende por residuos como el error de
pronostico, la diferencia entre el valor real y el valor pronosticado. El analisis
de los residuos se divide en 2 partes, el analisis grafico y la prueba de
normalidad:

- Analisis grafico: se generan graficos de dispersion que relacionan los


residuos contra la variable independiente, los valores predichos y el
numero de fila en la base de datos, en los graficos se buscara identificar
que no exista tendencias o correlaciones, la idea es demostrar que los
errores de pronostico son aleatorios y cercanos al valor promedio (que
idealmente deberia ser cero o cercano este).

- Por ultimo se generaran los residuos del modelo y se probaran que los
mismos sigan una distribucion normal con una media igual a cero o muy
cercana a cero.
Modelo de Regresión Lineal Generalizado

Un modelo de regresión lineal generalizada se aplica cuando se desea


correlacionar una variable dependiente cuantitativa continua con una o mas
variables independientes que pueden ser tanto cuantitativas como cualitativas.
A continuación se señalan los pasos para la generación de un modelo de
regresión lineal generalizado en el software Statgraphics XVI:

- Se seleccionan las variables de la base de datos, identificandose la variable


dependiente y la(s) independiente(s) .

- Se determina si cada una de las variables son significativas para el modelo


generado por medio del criterio del valor p, en donde las hipotesis
plantean:

Hipotesis Nula: La variable no es significativa para el modelo.


Hipotesis Alternativa: La variable es significativa para el modelo.
Modelo de Regresión Lineal Generalizado

- Se analiza el valor del R cuadrado ajustado, este estadistico nos señala que
porcentaje de la variabilidad de la variable dependiente es explicada por el
modelo, cuando es mayor o igual del 80% se considera que explica de
manera suficiente el comportamiento de la variable dependiente y se
procede a realizar el analisis de los residuos del modelo, pero si es menor
del 80%, se recomienda cambiar el modelo o buscar mas variables
independientes.

- Por medio del grafico del modelo ajustado y la grafica de intervalo para la
prueba LSD se analiza la relacion entre las variables independientes
significativas y la variable dependiente.
Modelo de Regresión Lineal Generalizado

Si el valor del R cuadrado ajustado es mayor o igual del 80% se procede a


realizar el analisis de los residuos, se entiende por residuos como el error de
pronostico, la diferencia entre el valor real y el valor pronosticado. El analisis
de los residuos se divide en 2 partes, el analisis grafico y la prueba de
normalidad:

- Analisis grafico: se generan graficos de dispersion que relacionan los


residuos contra las variables independientes, los valores predichos y el
numero de fila en la base de datos, en los graficos se buscara identificar
que no exista tendencias o correlaciones, la idea es demostrar que los
errores de pronostico son aleatorios y cercanos al valor promedio.

- Por ultimo se generaran los residuos del modelo y se probaran que los
mismos sigan una distribucion normal con una media igual a cero o muy
cercana a cero.
Modelo de Regresión Logística

Un modelo de regresión logística se aplica cuando se desea correlacionar un


grupo de variables entre cualitativas y cuantitativas, con una variable
cualitativa que es dicotómica, es decir toma únicamente dos valores, se da o
no se da esa situación que se analiza. A continuación se señalan los pasos para
la generación de un modelo de regresión lineal generalizado en el software
Statgraphics XVI:

- Se seleccionan las variables de la base de datos, identificandose la variable


dependiente y la(s) independiente(s) .

- Se determina si cada una de las variables son significativas para el modelo


generado por medio del criterio del valor p, en donde las hipotesis
plantean:

Hipotesis Nula: La variable no es significativa para el modelo.


Hipotesis Alternativa: La variable es significativa para el modelo.
Modelo de Regresión Logística

- Se analiza el Porcentaje Ajustado, el cual es similar al R cuadrado ajustado,


este estadistico nos señala que porcentaje de la variabilidad de la variable
dependiente es explicada por el modelo, cuando es mayor o igual del 80%
se considera que explica de manera suficiente el comportamiento de la
variable dependiente y se procede a realizar el analisis de los residuos del
modelo, pero si es menor del 80%, se recomienda cambiar el modelo o
buscar mas variables independientes.

- Por medio del grafico del modelo ajustado y la grafica de intervalo para la
prueba LSD se analiza la relacion entre las variables independientes
significativas y la variable dependiente.
Modelo de Regresión Logística

Si el valor del Porcentaje Ajustado es mayor o igual del 80% se procede a


realizar el analisis de los residuos, se entiende por residuos como el error de
pronostico, la diferencia entre el valor real y el valor pronosticado. El analisis
de los residuos se divide en 2 partes, el analisis grafico y la prueba de
normalidad:

- Analisis grafico: se generan graficos de dispersion que relacionan los


residuos contra las variables independientes, los valores predichos y el
numero de fila en la base de datos, en los graficos se buscara identificar
que no exista tendencias o correlaciones, la idea es demostrar que los
errores de pronostico son aleatorios y cercanos al valor promedio.

- Por ultimo se generaran los residuos del modelo y se probaran que los
mismos sigan una distribucion normal con una media igual a cero o muy
cercana a cero.

Potrebbero piacerti anche