Sei sulla pagina 1di 13

Porcentaje de variación en la

variable dependiente y,
explicada por el conjunto de Características
Coeficiente de determinación variables independientes,
múltiple X1,X2,X3…., XK.

1)1. Se representa por un 2. Puede variar de o a 1. 3. No puede adoptar valores


letra R mayúscula al cuadrado. negativos.
• 0 indica poca asociación
• Es debido a que se entre el conjunto de • Ningún numero que se eleve
comporta con el cuadrado de variables independientes y la al cuadrado puede ser
coeficiente de correlación. variable independiente. 1 negativo
significa una asociación
fuerte.

4. Es fácil de interpretar.
• Como R2 es un valor entre 0
y 1 es fácil de comparar y 𝑅2 =
𝑆𝑢𝑚𝑎 𝑑𝑒 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑟𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛
=
SS𝑅
comprender 𝑠𝑢𝑚𝑎 𝑑𝑒 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑡𝑜𝑡𝑎𝑙 𝑆𝑆𝑇
Evaluación de las suposiciones de la regresión múltiple

Es importante saber la validez de las pruebas


estadísticas global e individual, parte de
varias suposiciones; suponiendo que no es
válida los resultados tenderán a ser sesgados
y a la vez confusos, por lo que las
suposiciones de una regresión múltiple son
similares a las suposiciones de la regresión
independiente.
1.Existe una relación lineal.
1.La variación en los residuos es la misma tanto para valores grandes como pequeños
1.Existe una de Ŷ.
relación directa 1.Los residuos siguen la distribución de la probabilidad normal.
entre la variable 1.(Y- Ŷ) no está
dependiente y el relacionada, ya sea 1.Las variables independientes no deberán
conjunto de grande o peque el 1.El termino (Y- Ŷ) estar correlacionadas.
variables valor estimado Ŷ. de estos residuos 1.Los residuos son
independientes. deberán seguir de independientes.
manera aproximada
una distribución de 1.Las observaciones
probabilidad sucesivas de la
normal, además variable
que la media de los dependiente no
residuos deberá ser están
0. correlacionadas
Relación lineal

La idea es que la relación entre el


Para evaluar esta
conjunto de variables independientes y
suposición se usa:
variable dependiente es lineal

Uso de diagrama de Uso de gráficas de


puntos residuos

Diagrama de dispersión
Se calcula con la
en el que se trace
ecuación de regresión
variable dependiente
múltiple
contra v. independiente
En este caso, aparece un número grande de observaciones arriba de la recta de
regresión (estos residuos tendrían un signo positivo), y un número grande de
observaciones debajo de la recta (estos residuos tendrían un signo negativo).
Además, las observaciones estarían dispersas arriba y debajo de la recta, sobre todo el
rango de la variable independiente.
La regresión múltiple, pero no se puede representar de manera gráfica la regresión múltiple.
Las gráficas de los residuos ayudan a evaluar la linealidad de la ecuación de regresión múltiple.
Para investigar esto, los residuos se trazan en el eje vertical frente a la variable del factor de predicción, Yˆ .
Observe lo siguiente:
• Los residuos se trazan en el eje vertical y están centrados respecto de cero. Hay residuos positivos y
negativos.
• Los trazos de los residuos muestran una distribución aleatoria de valores positivos y negativos a lo largo de
todo el rango de la variable trazada en el eje horizontal.
• Los puntos están dispersos y no hay un patrón obvio, por lo que no hay razón para dudar de la suposición de
linealidad. Esta gráfica confirma la suposición de linealidad
La variación en los
residuos es la misma • La variación respecto a los valores anticipados es constante,
tanto para valores sin importar si los valores anticipados sean grandes o
pequeños.
grandes como
pequeños de Ŷ.

• suponga que se utiliza la variable independiente


individual, antigüedad, para explicar la variación
Ejemplo en el ingreso. es probable que haya más variación
en el ingreso para una persona de 50 años de edad
que para una de 35 años de edad. El requisito para
una variación constante respecto de la recta de
regresión se denomina homocedasticidad

• Es la variación respecto de
la ecuación de regresión es
Homocedasticidad igual para todos los valores
de las variables
independientes
Distribución de residuos

Para tener la seguridad de que las inferencias en las pruebas


de hipótesis global e individual son válidas, se evalúa la
distribución de los residuos. En un caso ideal, los residuos
deberán seguir una distribución de probabilidad normal.

Para evaluar esta suposición, los residuos se organizan en


una distribución de frecuencias
MINITAB Y Excel ayuda a evaluar
suposiciones de residuos con
distribución normal. Denomina
gráfica de probabilidad normal,
esta confirma la suposición de
residuos normalmente
distribuidos.
Multicolinealidad Problemas con la
multicolinealidad

Existe cuando las variables


V.I anticipada resulta con coeficiente
independientes están correlacionadas
de regresión no significativa
lo cual dificulta las inferencias

Es casi imposible crear un conjunto de


variables independientes que no estén El C.R + = - o al contrario
correlacionadas

La multicolinealidad no afecta la Cuando se agrega o elimina una


capacidad de una ecuación de variable independiente, hay un cambio
regresión múltiple. drástico en los valores de C.R
Una aproximación para Una prueba más precisa
reducir los efectos de la es usar el factor de
multicolinealidad inflación de varianzas
• Es seleccionar con cuidados 1
las variables independientes. 𝑉𝐼𝐹 =
• Si la correlación entre dos 1−𝑅𝑗2
variables independientes se
encuentra entre -0,70 y 0,70
es probable que se puedan
usar las dos variables indep.
1
𝑉𝐼𝐹 =
1−𝑅𝑗2

𝑹𝟐𝑱 =coeficiente de determinación, donde la variable


independiente sirve como una variable dependiente, y las v.
independientes restantes, como variables independientes

Un VIF mayor que 10 se considera insatisfactorio, e


indica que la variable independiente se deberá eliminar
del análisis.