Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
REGRESIÓN
LOGÍSTICA
Integrantes:
Loayza Ramos, Carmen
Sánchez Pizarro, Eliana
Valencia Cáceres, Leslie
Profesor:
Rino Sotomayor Ruiz
Facultad:
Economía y Planificación
2018-I
INTRODUCCIÓN
Características:
LIMITACIONES
PUNTOS EXTREMOS
La Regresión Logística requiere mucho menos supuestos que el AD, por ello
cuando satisfacen los supuestos requeridos para el AD, la Regresión Logística
trabaja bien.
A continuación se describirá un paralelo entre la Regresión Lineal Múltiple y la
Regresión Logística, debido a que ambos tienen el mismo objetivo, predecir la
variable respuesta a partir de las variables regresoras.
ANÁLISIS DE REGRESIÓN LOGÍSTICA BINARIA
Es una técnica estadística que tiene como objetivo comprobar relaciones
causales cuando la variable dependiente (y) es una variable binaria decir tiene
dos categorías.
Ejm:
Y=1 COMPRA Y=1 VOTA
Componente Sistemático:
ηi = β0 + β1x1,i + ...βpxp,i = x¨ i β
Donde:
ηi es el predictor lineal.
X1,..., Xp son las variables regresoras.
Función de Enlace:
Si se sabe que:
Despejando:
Donde:
exp (βˆ 0) permite estudiar la relación entre la probabilidad de éxito y
fracaso cuando todas las regresoras son iguales a cero.
exp (βˆ j) indica el cambio (aumento si βj > 0, disminución si βj < 0) en la
chance de éxito cuando la j-ésima regresora se incrementa en una unidad.
REGRESIÓN LOGÍSTICA MÚLTIPLE
Para poder presentar las bases teóricas de esta técnica estadística, para ello
consideraremos un caso con dos regresores y una variable polinómica con tres
categorías.
(Y1, Y2)=
y que representaremos por: OC1 (X1) (ídem. Para OC1 (X2), OC2 (X1) y OC2 (X2)).
Donde las expresiones del miembro izquierdo se denominan ‘logits’ (al igual que
en la regresión logística binaria) y los parámetros representan las tasas de
cambio en los ‘logits’ cuando una de las variables explicativas se incrementa en
una unidad manteniéndose constante la otra.
- Estimación de parámetros
Dada una muestra de datos (Y1i, Y2i, X1i, X2i) con i=1,2,…., n podemos
definir, en funciones de los parámetros del modelo, las funciones Z 1i, Z2i, p1i, p2i
y abordar el problema de la estimación de los mismos mediante el método de
máxima verosimilitud, como se muestra a continuación.
I. C. para β11:
I. C. para OR1(X1):
I: C: para OR1(X*1):
I. C. para OC1(X1):
Siendo zα/2 el valor que, en una distribución normal (0,1), verifica p(Z>zα/2)=α/2
Calidad en la predicción
Si, a partir del modelo ajustado, clasificamos cada observación en la categoría
más probable, podemos construir una matriz de clasificación observados-
predichos y utilizar el porcentaje de clasificaciones correctas como una medida
de la calidad de predicción, del mismo modo que se hace en el análisis
discriminante.
CASO PRÁCTICO
En el SPSS
Significación de Chi-Cuadrado
Prueba se Hosmer y Lehesshow
HO: β1 = 0
H1: β1 ≠ 0
https://docplayer.es/23442349-La-regresion-logistica-una-aplicacion-a-la-
demanda-de-estudios-universitarios.html
https://documat.unirioja.es/descarga/articulo/2981898.pdf
1.
http://networkianos.com/regresion-logistica-binaria/