Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Multivariado de Datos”
Flexibilidad Curricular
Universidad de Nariño
Medición: proceso por el que se asignan números a las observaciones de una variable.
Medidas debe ser válidas y fiables: Válida cuando mide lo que pretende medir, Fiable si al
repetir la medición en circunstancias similares se obtiene el mismo resultado.
Z = (X - 𝑋 )/ S
V = w1 X1 + w2 X2 + ... + w k X k
Las matrices proxidad pueden estar formadas por diferentes índices, según el nivel métrico
de las variables y el procedimiento de recogida de datos.
Un tipo especial de medida de proximidad (disimilaridad), del que se parte y/o al que se
llega en algunas técnicas multivariantes es la distancia, que da lugar a las denominadas
matrices de distancia entre objetos o unidades (de orden nxn) con elementos d i j que
representa la distancia entre un objeto i representado en la fila de la matriz y un objeto j
indicado en la columna.
Arsenio Hidalgo Troya
Análisis Multivariado de Datos
LOS RESIDUOS
Diferencia entre los valores reproducidos (estimados) y los valores observados, es
una medida de la mayor o menor eficacia del modelo. Cuanto menores sean los
residuos mejor ajuste proporcionará el modelo.
La suma de los residuos de toda la muestra generalmente es cero, se trabaja con los
valores de los residuos al cuadrado (residuos al cuadrado). Cuando los valores
observados son cercanos a los valores pronosticados, la predicción es buena y los
errores al cuadrado son pequeños.
Técnica:
Nube de puntos de residuos tipificados (ZRES) frente a observaciones tipificadas
(ZPRED). Si la varianza de los residuos fuera constante, la nube de puntos se
concentra en una banda (centrada en el cero y paralela al eje de abscisas).
Permite mejor entendimiento del fenómeno objeto de estudio obteniendo información que los
métodos estadísticos univariantes y bivariantes son incapaces de conseguir.
Los pasos que se han de dar para realizar un análisis multivariable son:
1. Establecer los objetivos del análisis
2. Diseñar el análisis
3. Evaluar las hipótesis subyacentes a la técnica a utilizar
4. Realizar el análisis
5. Interpretar los resultados obtenidos
6. Validar dichos resultados
Regresión Logística
Análisis Conjunto
TCA (si/no)
(TCA)
Permanencia de Estudiante universitario
Procedencia
Tipo Universidad
Acreditación Institucional
Métodos de dependencia:
Si la variable dependiente es cuantitativa o métrica algunas de las técnicas que
se pueden aplicar son las siguientes:
Métodos de dependencia:
El tamaño de la muestra se tomaría en función de la potencia que se quiera dar a la regresión múltiple. Así, por
ejemplo, con un tamaño muestral de 100 observaciones se podría detectar, en una regresión múltiple
lineal, las relaciones con un coeficiente de correlación múltiple (R2) de aproximadamente igual a 0.3 con
una potencia de 80% utilizando un nivel de confianza del 95%. Conviene, además, que la ratio ( razón o
cociente) del número de observaciones al número de parámetros a estimar sea lo suficientemente amplio
para estimar los parámetros del modelo con el menor error posible .
Arsenio Hidalgo Troya
Análisis Multivariado de Datos
3. Hipótesis del análisis
Hay que comprobar la linealidad de la relación, la normalidad y la homocedasticidad. No haya datos ausentes
(missing) y se deben estudiar la posible existencia de ouliers en cada una de las variables.
4. Realización del análisis
Se puede utilizar el estimador de mínimos cuadrados del que se conoce su distribución muestral bajo hipótesis
de normalidad. Se puede también utilizar el método de regresión paso a paso para determinar las variables
independientes a incluir en la regresión. Una vez estimada la ecuación de regresión se estudia la bondad de
ajuste mediante el cálculo de (R2) y el análisis de los residuos. Se estudia la homocedasticidad,
independencia, posible omisión de variables, existencia de outliers e influencia de observaciones
individuales
Se realiza un análisis bivariado para establecer la correlación entre las variables independientes y la
variable dependiente.
Análisis Multivariado de Datos
Bibiografia: