Sei sulla pagina 1di 16

Estadistica Inferencial II

Pruebas de hipótesis en regresión lineal múltiple


Al enfrentarse a la realidad de un estudio, el investigador
dispone habitualmente de muchas variables medidas u
observadas en una colección de individuos y pretende
estudiarlas conjuntamente, para lo cual suele acudir al análisis
estadístico de datos univariante y multivariante
Al observar muchas variables sobre una muestra es
presumible que una parte de la información recogida pueda
ser redundante o que sea excesiva, en cuyo caso los métodos
multivariantes de reducción de la dimensión (análisis en
componentes principales, factorial, correspondencias,
escalamiento óptimo, homogeneidades, análisis conjunto,
etc.) tratan de eliminarla
Por otro lado, los individuos pueden presentar ciertas
características comunes en sus respuestas, que permitan
intentar su clasificación en grupos de cierta homogeneidad.
Los métodos de clasificación (análisis cluster, análisis
discriminante, árboles de decisión, etc.) buscan analizar las
relaciones entre variables para ver si se pueden separar los
individuos en agrupaciones a posteriori.
Finalmente, podrá existir una variable cuya dependencia de
un conjunto de otras sea interesante detectar para analizar su
relación o, incluso, aventurar su predicción cuando las demás
sean conocidas. En este apartado cabe incluir la regresión
lineal simple y múltiple, regresión no lineal, regresión
logística, análisis de la varianza simple y múltiple, las técnicas
de análisis de series temporales, etc
Butler Trucking Company
Blutle Trucking Company se dedica al transporte de objetos y mercancías en
el sur de California. La actividad principal de esta empresa es hacer entregas
en su área local. Para mejorar el horario de trabajo, los gerentes deseaban
estimar el tiempo total de recorrido diario necesario para hacer las entregas.
Al principio, los gerentes creyeron que el tiempo total de recorrido diario
estaba estrechamente relacionado con el número de millas recorridas para
hacer las entregas. Partiendo de una muestra aleatoria simple de 10 entregas
se obtuvieron los datos que se presentan en la tabla.

.
Butler Trucking Company

.
Prueba de significancia
Prueba f
.
Multicolinealidad
En el análisis de regresión el término variable independiente se usa para
referirse a cualquier variable que se usa para predecir o explicar el valor de
la variable dependiente. Sin embargo, este término no significa que estas
variables independientes sean independientes entre ellas, en sentido
estadístico.
Para determinar si la multicolinealidad es lo suficientemente alta para
ocasionar problemas se han desarrollado diversas pruebas. De acuerdo con
la prueba de la regla práctica, la multicolinealidad es un problema
potencial si el valor absoluto del coeficiente de correlación muestral es
mayor a 0.7 para cualquier par de variables independientes.
Multicolinealidad
En el análisis de regresión el término variable independiente se usa para
referirse a cualquier variable que se usa para predecir o explicar el valor de
la variable dependiente. Sin embargo, este término no significa que estas
variables independientes sean independientes entre ellas, en sentido
estadístico.
Para determinar si la multicolinealidad es lo suficientemente alta para
ocasionar problemas se han desarrollado diversas pruebas. De acuerdo con
la prueba de la regla práctica, la multicolinealidad es un problema
potencial si el valor absoluto del coeficiente de correlación muestral es
mayor a 0.7 para cualquier par de variables independientes.
La Nacional Basketball Association (NBA) lleva un registro de diversos
datos estadísticos de cada equipo. Cuatro de estos datos estadísticos son la
proporción de juegos ganados (PCT), la proporción de anotaciones de
campo (FG%), la proporción de tiros de tres puntos hechos por el equipo
contrario (Opp 3 Pt%) y la cantidad de recuperaciones hechas por el
equipo contrario (OppTO).
Los siguientes datos muestran los valores de estas estadísticas para los 29
equipos de la NBA en una fracción de la temporada 2004 (www.nba.com,
enero 3, 2004)
En el inciso c) se obtuvo una ecuación de regresión estimada que proporcionaba la
proporción de juegos ganados dado el porcentaje de anotaciones de campo hechas
por el equipo, la proporción de tiros de tres puntos hechas por el equipo contrario y
la cantidad de recuperaciones (turnover) hechas por el equipo contrario. ¿Cuáles
son los valores de R2 y Ra2?

Potrebbero piacerti anche