Sei sulla pagina 1di 30

TRABAJO DE CONSULTA

TEMA:

ANLISIS MULTIVARIADO

NOMBRE:

Martha Surez

ANLISIS MULTIVARIANTE

La realidad econmica circundante y la propia realidad empresarial participan de una complejidad notable que suele traducirse en la necesidad de manejar informacin sobre muchas entidades o individuos y sobre muchas de sus caractersticas ( variables).Lgicamente el anlisis emprico de esta realidad requiere la observacin de un gran nmero de fenmenos y la recoleccin de una gran cantidad de informacin que se traduce en grandes masas de datos sobre muchas variables y muchas unidades de desagregacin para esos datos. Este anlisis global de una realidad compleja (cifrada en trminos de realidad multi-dato/ multi-variante ) nos lleva a la necesidad de recurrir a tcnicas de tratamiento de informacin multivariante. Nos lleva a recurrir a las tcnicas estadsticas de Anlisis Multivariante. La expresin anlisis multivariante se emplea, en general, de forma "imprecisa para denotar el anlisis de datos que son multivariantes en el sentido de que cada miembro toma los valores de las p variantes"(Kendal y Buckland).Se comprende fcilmente que el anlisis cientfico de la realidad, (el de nuestra realidad socioeconmica, por ejemplo) exige, en numerosas ocasiones la descripcin, interpretacin, clasificacin, reduccin y explicacin de material estadstico que proviene de la observacin de ms de una variable. Esta necesidad, unida al impacto de las posibilidades informticas de tratamiento de grandes conjuntos de datos, ha hecho posible un desarrollo creciente y vertiginoso de todas las tcnicas de anlisis multivariante y una creciente diversificacin y ampliacin de sus campos de aplicacin. La informacin utilizada y elaborada por el anlisis multivariante es, por tanto, de carcter multidimensional, pudiendo ser de naturaleza cuantitativa, cualitativa o mezcla de ambas. Dependiendo de la naturaleza de las variables empleadas y de las finalidades del anlisis se abre un amplio abanico de tcnicas muy variadas, que aun cuando en muchos casos tengan fundamentos estadsticos comunes, se

distinguen por sus objetivos de investigacin que fundamentalmente puede agruparse en tres tipos de operaciones distintas: reducir los datos, clasificarlos, y explicarlos . "En general, las variables se asimilan a variables aleatorias con una cierta distribucin multivariante. Quizs la propiedad ms determinante del Anlisis Multivariante es que las n variables son dependientes (en sentido estadstico), de naturaleza similar y que ninguna de ellas tiene una importancia superior a las dems" (Cuadras) Al igual que la Estadstica Univariante, el Anlisis Multivariante pretende describir las variables mediante caractersticas muestrales y realizar inferencias basndose en la informacin muestral y en ciertas condiciones, pero trabajando a la vez con todas las variables, lo que exigir una metodologa ms compleja pero tambin ms potente que abundar en recursos del lgebra, el clculo numrico y la geometra. Los distintos mtodos de anlisis multivariante podemos clasificarlos de distintas maneras, de acuerdo con distintos criterios taxonmicos. De acuerdo con Cuadras, podemos diferenciar los distintos mtodos segn si su rea de aplicacin es una o varias poblaciones y segn si intervienen uno o dos grupos de variables. As tendremos: a) Mtodos que analizan una sola poblacin y un solo grupo de variables de naturaleza razonablemente homogenea: Anlisis Factorial y Anlisis de

Componentes Principales. b) Mtodos que analizan varias poblaciones y un solo grupo de variables: Anlisis Cannico, Anlisis Discriminante y Anlisis Multivariante de la Varianza. c) Mtodos que analizan una poblacin y dos grandes grupos de variables con naturaleza posiblemente diferente: Regresin mltiple y Anlisis de Correlacin Cannica.

En esta clasificacin de Cuadras, otros mtodos multivariantes como el Anlisis de Proximidades o el Anlisis Cluster no tendran una ubicacin clara en ninguna de estas categoras. Sin embargo, tambin podemos clasificar los distintos mtodos segn de dnde se parta a la hora de establecer las semejanzas entre las observaciones para realizar el anlisis .Habra entonces: a)Mtodos que parten de la semejanza o afinidad entre las variables o caractersticas, como la Regresin Mltiple, el Anlisis Factorial, el Anlisis Cannico, el Anlisis Discriminante y el Anlisis Multivariable de la Varianza. b) Mtodos que parten de la semejanza o afinidad entre las unidades objeto de estudio o individuos, como la Tipologa, el Anlisis Cluster o la Segmentacin. c) Mtodos que parten de la semejanza de entidades ms abstractas como el Anlisis Multidimensional no Mtrico .

Tambin podemos adoptar un criterio teleolgico para la clasificacin de las tcnicas multivariantes. As, de acuerdo con las tres finalidades bsicas del Anlisis Multivariante que propona Snchez Carrin (reduccin de datos, clasificacin de datos y explicacin de los datos de acuerdo a modelos) ,podemos distinguir entre: a)Tcnicas de reduccin de los datos como el Anlisis Factorial, el Anlisis de Componentes Principales, el Anlisis Factorial de Correspondencias y las Escalas Multidimensionales. b)Tcnicas de clasificacin de los datos como el Anlisis Cluster y el Anlisis Discriminante. c) Tcnicas de ajuste de modelos explicativos como la Regresin Mltiple.

Maurice Kendall, considerando tambin los objetivos del anlisis, establece otra clasificacin en la que pone el acento en si las tcnicas se basan en relaciones de dependencia entre las variables establecidas a priori, o bien, si se basan en relaciones de interdependencia no presupuestas a priori : a)Las tcnicas basadas en relaciones de dependencia establecen a priori una distincin entre una o ms variables dependientes, a explicar o endgenas y el resto de las variables que utilizaremos para explicar las primeras, llamadas independientes, exgenas o predictivas. Entre estas tcnicas destacan la Regresin Mltiple, con una variable dependiente cuantitativa, el Anlisis Discriminante, con una nica variable dependiente cualitativa, el Anlisis Multivariante de la Varianza, con varias variables dependientes cuantitativas o el Anlisis Cannico, con varias variables dependientes cualitativas. b) Las tcnicas basadas en relaciones de interdependencia no establecen ninguna distincin a priori entre variables y su objetivo principal es organizar los datos de forma que sean ms manejables y comprensibles. Entre ellas podemos destacar el Anlisis Factorial, el Anlisis Cluster o el Escalonamiento Mtrico . Por su parte Uriel propone una clasificacin de las tcnicas atendiendo a la existencia , tipologa y nmero de las variables dependendientes o a explicar y de las variables dependientes y a los objetivos de cada tcnica segn el siguiente cuadro: VARIABLES DEPENDIENTES 1 CONT/CATEGR. REGRESIN CONTINUAS CATEGRICA MANOVA DEPENDENCIA DEPENDENCIA VARIABLES INDEPENDIENTES CATEGRICA

MTODO ANOVA

OBJETIVOS DEPENDENCIA

VARIAS CONT/ CATEGR. REGRESIN MULTIPLE DEPENDENCIA CONT/ CATEGR. ANLISIS CANNICO INDEPENDENCIA

CONT/CATEGOR. A.DISCRIMINANTE 2 CAT. CONT/CATEGOR. A. LOGIT BINOMIAL CATEGRICAS > CAT. 2 CONT/CATEGOR. A.DISCRIMINANTE

CLASIFICACIN CLASIF/DEPENDENCIA CLASIFICACIN

CONT/CATEGOR. A. LOGIT POLINOMIAL CLASIF/DEPENDENCIA CONT/CATEGOR CONT/CATEGOR CONT/CATEGOR A. COMP.PRINCIPALES REDUCC. DIMENSIN A. FACTORIAL A. CORRESPONDENCIAS ESCALAS MULTIDIMENSIONALES ANLISIS CLUSTER REDUCC. DIMENSIN REDUCC. DIMENSIN

NINGUNA

CONT/CATEGOR CONT/CATEGOR

AGRUPACIN AGRUPACIN

Veamos brevemente las caractersticas fundamentales de cada Tcnica: Anlisis de la varianza (ANOVA): Tiene por objeto determinar en qu medida una variable dependiente de naturaleza continua est condicionada por los valores que toman variables independientes de naturaleza categrica , llamadas factores. Modelos de Regresin Lineal: Se trata de cuantificar la influencia que ejercen las variables explicativas sobre 1 variable dependiente de caracter continuo. Anlisis Multivariante de la Varianza (MANOVA) (ir a MANOVA):Es la generalizacin del ANOVA, para el caso en que el nmero de variables dependientes de naturaleza continua sea superior a uno. Regresin multivariante y anlisis cannico:Son generalizaciones del modelo de regresin: En la regresin mltiple se trata de cuantificar la influencia de las variables explicativas sobre un conjunto de variables dependientes. En el anlisis cannico, se trata de analizar la interdependencia entre dos conjuntos de variables.

Anlisis Discriminante: (ir anlisis discriminante) Se utiliza para caractizar mediante un conjunto de variables independientes, las diferencias existentes entre individuos de distintos grupos y tambin para clasificar nuevos casos en uno de esos grupos a partir de la informacin sobre las variables consideradas. Modelo logit binomial y multinomial: Son similares a los modelos

discriminantes.Si la variable independiente (categrica) ofrece slo dos posibles niveles hablamos de binomial y son ms los niveles de polinomial. Anlisis de Componentes Principales: Es una tcnica de reduccin de datos. Que trata de tranformar un conjunto de variables en otro conjunto, de menor dimensin ,de variables, con la particularidad de que las nuevas variables estn incorrelacionadas entre s. Anlisis Factorial: Su pretensin es similar al A.C.P. pero aqu se formula un modelo terico en el que se explica el comportamiento de las variables observables en funcin de unos factor (comunes) que se pretenden obtener y unos factores especficos. Anlisis de Correpondencias: Es similar al anterior , pero de aplicacin a variables categricas , empleandose las correspondencias entre niveles de las categrias, en lugar de las correlaciones. Escalas multidimensionales: Son un conjunto de tcnicas que utilizan las proximidades entre los objetos para realizar una representacin de los mismos. Anlisis Cluster: (ir anlisis cluster) El objetivo es la particin de un conjunto de individuos en grupos o subconjuntos coherentes, homgeneos internamente y bien diferenciados entre s Como puede observarse, existen innumerables tcnicas y mtodos de anlisis multivariante. El estudio de todos y cada una de ellos nos llevara a una labor inacabable que, por otro lado, no tiene sentido en estas pginas. Recordemos que

aqu nos interesa remarcar nicamente la base metodolgica que debe inspirar nuestro trabajo emprico. En este sentido, recordmoslo, necesitaremos, a menudo, procesar una gran cantidad de datos que debemos reducir y explicar. De una gran cantidad de variables observables deseamos obtener una pequea cantidad de categoras explicativas, operativas e interesantes, funciones de las primeras pero que no sern observables directamente. En esta lnea, necesitaremos utilizar tcnicas de reduccin de datos y el anlisis factorial y al anlisis de componentes principales como inmejorables instrumentos para ello. Por otro lado, nos interesar tambin clasificar y ordenar, conglomerar y agrupar los individuos de nuestro estudio: Las unidades vecinales, los barrios, los distritos, los municipios, las provincias, las comunidades autnomas,las empresas proveedoras, los clientes, los sectores econmicos, las ramas de actividad, etc. Estaremos interesados en poner orden en la configuracin interna del espacio complejo analizado. Deseamos, en consecuencia, agrupar los distintos individuos en conglomerados homogneos desde el punto de vista socioeconmico para descubrir la estructura de la realidad social y econmica . En este sentido, necesitaremos acudir a una tcnica potente de agrupacin como el anlisis cluster. Por ltimo, pretendemos confirmar la validez de nuestras conclusiones, llegando a ser capaces de ver si las caractersticas obtenidas como factores explicativos nos discriminan con suficiente exactitud los conglomerados homogneos obtenidos. Necesitaremos, pues, el anlisis discriminante para ello. 1.- QU ES EL ANLISIS MULTIVARIANTE? Es el conjunto de mtodos estadsticos cuya finalidad es analizar simultneamente conjuntos de datos multivariantes en el sentido de que hay varias variables medidas para cada individuo objeto estudiado.

Su razn de ser radica en un mejor entendimiento del fenmeno objeto de estudio obteniendo informacin que los mtodos estadsticos univariantes y bivariantes son incapaces de conseguir. As, como Hair et al. (1999) dicen: Las mujeres y hombres de negocios de hoy no pueden seguir aproximaciones ya pasadas en las que los consumidores eran considerados homogneos y caracterizados por un nmero pequeo de variables demogrficas. En su lugar, deben desarrollar estrategias que atraigan a numerosos segmentos de clientes con caractersticas demogrficas y psicogrficas diversas en un mercado con mltiples restricciones (legales, econmicas, competitivas,

tecnolgicas, etc). Slo a travs del anlisis multivariante las relaciones mltiples de este tipo podrn ser examinadas adecuadamente para obtener un entendimiento ms completo y real del entorno que permita tomar las decisines ms adecuadas. 1.1. 1.1. Objetivos del Anlisis Multivariante

Pueden sintetizarse en dos: 1) Proporcionar mtodos cuya finalidad es el estudio conjunto de datos multivariantes que el anlisis estadstico uni y bidimensional es incapaz de conseguir 2) Ayudar al analista o investigador a tomar decisiones ptimas en el contexto en el que se encuentre teniendo en cuenta la informacin disponible por el conjunto de datos analizado. 2.- TIPOS DE TECNICAS MULTIVARIANTES Se pueden clasificar en tres grandes grupos (ver esquema adjunto): 1) 1) Mtodos de dependencia

Suponen que las variables analizadas estn divididas en dos grupos: las variables dependientes y las variables independientes. El objetivo de los mtodos

de dependencia consiste en determinar si el conjunto de variables independientes afecta al conjunto de variables dependientes y de qu forma.

2) 2)

Mtodos de interdependencia

Estos mtodos no distinguen entre variables dependientes e independientes y su objetivo consiste en identificar qu variables estn relacionadas, cmo lo estn y por qu.

3) 3)

Mtodos estructurales

Suponen que las variables estn divididas en dos grupos: el de las variables dependientes y el de las independientes. El objetivo de estos mtodos es anlizar, no slo como las variables independientes afectan a las variables dependientes, sino tambin cmo estn relacionadas las variables de los dos grupos entre s.

Dependiente Mtrica Mtodos de Dependencia Dependiente No Mtrica

Anlisis de Regresin Anlisis de Supervivencia MANOVA Correlacin Cannica Anlisis Discriminante Regresin Logstica Anlisis Conjoint A. Comp. Principales Anlisis Factorial Escalas Multidimensionales Anlisis Cluster Anlisis de Correspondencias Modelos log-lineales Escalas Multidimensionales Anlisis Cluster

Tcnicas Multivariantes
Mtodos de Interdependencia

Datos Mtricos

Datos No Mtricos

Modelos estructurales

2.1 Mtodos de dependencia Se pueden clasificar en dos grandes subgrupos segn que la variable (s) dependiente (s) sea (n) cuantitativas o cualitativas. Si la variable dependiente es cuantitativa algunas de las tcnicas que se pueden aplicar son las siguientes: 1) Anlisis de Regresin Es la tcnica adecuada si en el anlisis hay una o varias variables dependientes mtricas cuyo valor depende de una o varias variables independientes mtricas. Por ejemplo, intentar predecir el gasto anual en cine de una persona a partir de su nivel de ingresos, nivel educativo, sexo y edad. 2) Anlisis de Supervivencia Es similar al anlisis de regresin pero con la diferencia de que la variable independiente es el tiempo de supervivencia de un individuo objeto. Por ejemplo, intentar predecir el tiempo de permanencia en el desempleo de un individuo a partir de su nivel de estudios y de su edad. 3) Anlisis de la varianza Se utilizan en situaciones en las que la muestra total est dividida en varios grupos basados en una o varias variables independientes no mtricas y las variables dependientes analizadas son mtricas. Su objetivo es averiguar si hay diferencias significativas entre dichos grupos en cuanto a las variables dependientes se refiere. Por ejemplo, hay diferencias en el nivel de colesterol por sexos? afecta, tambin, el tipo de ocupacin?. 4) Correlacin Cannica

Su objetivo es relacionar simultneamente varias variables mtricas dependientes e independientes calculando combinaciones lineales de cada conjunto de variables que maximicen la correlacin existente entre los dos conjuntos de variables. Por ejemplo, analizar cmo estn relacionadas el tiempo dedicado al trabajo y al ocio de una persona con su nivel de ingresos, su edad y su nivel de educacin Si la variable dependiente es cualitativa algunas de las tcnicas que se pueden aplicar son las siguientes:

1) Anlisis Discriminante Esta tcnica proporciona reglas de clasificacin ptimas de nuevas observaciones de las que se desconoce su grupo de procedencia basndose en la informacin proporcionada los valores que en ella toman las variables independientes. Por ejemplo, determinar los ratios financieros que mejor permiten discriminar entre empresas rentables y poco rentables.

2) Modelos de regresin logstica Son modelos de regresin en los que la variable dependiente es no mtrica. Se utilizan como una alternativa al anlisis discriminante cuando no hay normalidad

3) Anlisis Conjoint Es una tcnica que analiza el efecto de variables independientes no mtricas sobre variables mtricas o no mtricas. La diferencia con el Anlisis de la

Varianza radica en dos hechos: las variables dependientes pueden ser no mtricas y los valores de las variables independientes no mtricas son fijadas por el analista. En otras disciplinas se conoce con el nombre de Diseo de Experimentos. Por ejemplo, una empresa quiere disear un nuevo producto y para ello necesita especificar la forma del envase, su precio , el contenido por envase y su composicin qumica. Presenta diversas composiciones de estos cuatro factores. 100 clientes proporcionan un ranking de las combinaciones que se le presentan. Se quiere determinar los valores ptimos de estos 4 factores.

2.2 Mtodos de Interdependencia Se pueden clasificar en dos grandes grupos segn que el tipo de datos que analicen sean mtricos o no mtricos. Si los datos son mtricos se pueden utilizar, entre otras, las siguientes tcnicas:

1) Anlisis Factorial y Anlisis de Componentes Principales Se utiliza para analizar interrelaciones entre un nmero elevado de variables mtricas explicando dichas interrelaciones en trminos de un nmero menor de variables denominadas factores (si son inobservables) o componentes principales (si son observables). As, por ejemplo, si un analista financiero quiere determinar la cual es el estado de salud financiero de una empresa a partir del conocimiento de un nmero de ratios financieros, construyendo varios ndices numricos que definan su situacin, el problema se resolvera mediante un Anlisis de Componentes Principales.

Si un psiclogo quiere determinar los factores que caracterizan la inteligencia de un individuo a partir de sus respuestas a un test de inteligencia, utilizara para resolver este problema un Anlisis Factorial.

2) Escalas Multidimensionales Su objetivo es transformar juicios de semejanza o preferencia en distancias representadas en un espacio multidimensional. Como consecuencia se construye un mapa en el que se dibujan las posiciones de los objetos comparados de forma que aqullos percibidos como similares estn cercanos unos de otros y alejados de objetos percibidos como distintos. Por ejemplo, analizar, en el mercado de refrescos, las percepciones que un grupo de consumidores tiene acerca de una lista de refrescos y marcas con el fin de estudiar qu factores subjetivos utiliza un consumidor a la hora de clasificar dichos productos.

3) Anlisis Cluster Su objetivo es clasificar una muestra de entidades (individuos o variables) en un nmero pequeo de grupos de forma que las observaciones pertenecientes a un grupo sean muy similares entre s y muy disimilares del resto. A diferencia del Anlisis Discriminante se desconoce el nmero y la composicin de dichos grupos. Por ejemplo, clasificar grupos de alimentos (pescados, carnes, vegetales y leche) en funcin de sus valores nutritivos. Si los datos son no mtricos se pueden utilizar, adems de las Escalas Multidimensionales y el Anlisis Cluster, las siguientes tcnicas:

1) Anlisis de Correspondencias

Se aplica a tablas de contingencia multidimensionales y persigue un objetivo similar al de las escalas multidimensionales pero representando simultneamente las filas y columnas de las tablas de contingencia. Por ejemplo, analizar el paro en Aragn teniendo en cuenta la provincia, sexo, edad y nivel de estudios del parado

2) Modelos log-lineales Se aplican a tablas de contingencia multidimensionales y modelizan relaciones de dependencia multidimensional de las variables observadas que buscan explicar las frecuencias observadas.

2.3 Mtodos estructurales Analizan las relaciones existentes entre un grupo de variables

representadas por sistemas de ecuaciones simultneas en las que se suponen que algunas de ellas (denominadas constructos) se miden con error a partir de otras variables observables denominadas indicadores. Los modelos utilizados constan, por lo tanto, de dos partes: un modelo estructural que especifica las relaciones de dependencia existente entre las constructos latentes y un modelo de medida que especifica como los indicadores se relacionan con sus correspondientes constructos. Por ejemplo, analizar cmo se relacionan los niveles de utilizacin de los servicios de una empresa con las percepciones que sus clientes tienen de ella.

3.- ETAPAS DE UN ANALISIS MULTIVARIANTE Pueden sintetizarse en 6:

1) Objetivos del anlisis Se define el problema especificando los objetivos y las tcnicas multivariantes que se van a utilizar El investigador debe establecer el problema en trminos conceptuales definiendo los conceptos y las relaciones fundamentales que se van a investigar. Se deben establecer si dichas relaciones van a ser relaciones de dependencia o de interdependencia. Con todo esto se determinan las variables a observar.

2) Diseo del anlisis. Se determina el tamao muestral, las ecuaciones a estimar (si procede), las distancias a calcular (si procede) y las tcnicas de estimacin a emplear. Una vez determinado todo esto se proceden a observar los datos

3) Hiptesis del anlisis Se evaluan las hiptesis subyacentes a la tcnica multivariante. Dichas hiptesis pueden ser de normalidad, linealidad, independencia, homocedasticidad, etc. Tambin se debe decidir qu hacer con los datos missing

4) Realizacin del anlisis

Se estima el modelo y se evala el ajuste a los datos. En este paso pueden aparecer observaciones atpicas (outliers) o influyentes cuya influencia sobre las estimaciones y la bondad de ajuste se debe analizar.

5) Interpretacin de los resultados Dichas interpretaciones pueden llevar a reespecificaciones adicionales de las variables o del modelo con lo cual se puede volver de nuevo a los pasos 3) y 4)

6) Validacin del anlisis Consiste en establecer la validez de los resultados obtenidos analizando s los resultados obtenidos con la muestra se generalizar a la poblacin de la que procede. Para ello se puede dividir la muestra en varias partes en las que el model se vuelve a estimar y se compararn los resultados. Otras tcnicas que se pueden utilizar aqu son las tcnicas de remuestreo (jacknife y bootstrap)

En el ejemplo siguiente concretamos en qu consistiran dichas etapas para un Anlisis de Regresin Mltiple:

Ejemplo: Anlisis de Regresin Mltiple 1) Objetivos del anlisis Predecir el gasto en cine de una persona a partir de su nivel de ingresos, nivel educativo, sexo y edad lo cual nos permitira entender mejor cules son las pautas de comportamiento de la poblacin.

Para ello se propone un anlisis de regresin mltiple en el que la variable dependiente sera el gasto en cine y como variables independientes el resto.

2) Diseo del anlisis Se decidira cmo elegir la muestra, el tamao de la misma y cmo medir las variables implicadas en el anlisis. El gasto en cine podra medirse como el gasto anual en cine medido en pesetas. El nivel de ingresos podra medirse con una variable ordinal, dadas las reticencias a dar informacin precisa sobre este tipo de variables; el nivel educativo sera una variable ordinal; el sexo una variable binaria y la edad una variable cuantitativa medida en aos. El tamao de la muestra se eligira en funcin de la potencia que se quiera dar a la regresin mltiple. As, por ejemplo, con un tamao muestral de 100 observaciones se podra detectar, en una regresin mltiple lineal, las relaciones con un coeficiente de correlacin mltiple (R2) de aproximadamente igual a 0.3 con una potencia de 0.8% utilizando un nivel de significacin igual a 0.01. Conviene, adems, que el ratio del nmero de observaciones al nmero de parmetros a estimar sea lo suficientemente amplio para estimar los parmetros del modelo con el menor error posible

3) Hiptesis del anlisis Hay que comprobar la linealidad de la relacin, la normalidad y la homocedasticidad. No hay datos missing y se deben estudiar la posible existencia de ouliers en cada una de las variables.

4) Realizacin del anlisis Se puede utilizar el estimador de mnimos cuadrados del que se conoce su distribucin muestral bajo hiptesis de normalidad. Dicho estimador coincide con el mximo verosimil y es eficiente. Se puede tambin utilizar el mtodo de regresin paso a paso para determinar las variables independientes a incluir en la regresin. Una vez estimada la ecuacin de regresin se estudia la bondad de ajuste mediante el clculo de R2 y el anlisis de los resduos. Se estudiara la homocedasticidad, independencia, posible omisin de variables, existencia de outliers e influencia de observaciones individuales

5) Interpretacin de los resultados Se interpretara el valor de los coeficientes obtenidos as como su signo teniendo cuidado con la posible existencia de multicolinealidad

6) Validacin del anlisis Se divide la muestra en dos submuestras de tamao 50 y se vuelve a estimar la ecuacin de regresin en cada submuestra comparando los resultados.

ANLISIS MULTIVARIANTE El anlisis multivariable: su objetivo es analizar simultneamente tres o ms variables independientes mtricas (ratios) a travs de funciones lineales de dependencia como las siguientes:

Anlisis de Regresin Mltiple. Variable Dependiente Mtrica; Variables Independientes Mtricas, no Mtricas: Y1 = C1X1 + C2X2 +................CnXn Es decir: Fij = Fi1 Z1 + Fi2 Z2 + .........Fir Zr = ? Fim Zm Donde: Fij = Puntuacin factorial del individuo j en el factor i Zm= Puntuaciones individuales en cada variable con puntuaciones estandarizadas Cada Fim Zm = Es la ponderacin factorial de la variable m en el factor i Anlisis Discriminante Mltiple. Variable Dependiente No Mtrica; Variables Independientes Mtricas. Zscore = C1X1 + C2X2 +................CnXn Donde: Z = Punto de Corte Vn = Coefeficiente Discriminante Xn = Variables Independientes (Ratios Financieros) Anlisis de Correlacin Canonica. Variables Dependientes Mtricas y No Mtrica; Variables Independientes Mtricas y No Mtricas. Y1 +Y2 +Y3 .......+Yn= X1 +X2 +X3 .......+Xn

Anlisis Factorial o de Componentes Principales. Siendo el Modelo de la Matriz de datos como: Xij=F1i ai1 + F2i ai2 +..........+Fki aik + Ui Donde: Xij = Puntuacin del individuo i en la variable j Fij = Coeficientes factoriales a = Puntuaciones factoriales u = Factor nico Y siendo la frmula de la Comunalidad: h i= F
2 2 2 2 2 KJ

+F 1j
2

+........... + f 2J

As como el Factor Unico: 1 = h +U Donde: h = comunalidad U = factor nico Como podr observarse en todos estos modelos estadsticos, las variables independientes cumplen la condicin de ser mtricas, lo cual posibilita el utilizar a los ratios como base de datos y sustituir o complementar as el anlisis financiero tradicional.
2 2

2.

ANTECEDENTES DE LOS METODOS MULTIVARIABLES

El anlisis multivariable es un conjunto de tcnicas estadsticas que analizan simultneamente ms de dos variables en una muestra de observaciones (Kendall: 1975). Para Cuadras (1981: p.3) esta tcnica estudia, interpreta y elabora el material estadstico sobre la base de un conjunto de n >2 variables, las cuales pueden ser de tipo cuantitativo, cualitativo o una combinacin de ambas. Una de las aplicaciones principales del anlisis multivariable dentro del campo del anlisis financiero consiste en resumir, sintetizar, correlacionar o discriminar

grandes conjuntos de datos y variables en funcin de ciertos objetivos para obtener informacin vlida que logre una mejor comprensin del fenmeno objeto de estudio (Bizquerra:1989, p.1).

En general cualquier anlisis simultneo de ms de dos variables es parte del anlisis multivariable. Sin embargo, dentro del anlisis existen diversos mtodos que pueden ser empleados de diferentes formas (segn sean los datos de entrada y los resultados o salidas). Segn Ortega (1984: p. 406), el resultado de dichas aplicaciones da la posibilidad al usuario de clasificar las situaciones y variables. Esto mediante la obtencin de relaciones entre esas variables en trminos de influencia sobre los factores incontrolables por parte de la empresa. Es decir, este anlisis se establece a partir de numerosos datos, relaciones y leyes operativas; investiga estructuras latentes (ocultas), y ensaya diversas formas de organizar dichos datos en estructuras conocidas y fcilmente utilizables en dos sentidos: a) Transformndolos y presentndolos bajo una forma nueva. b) Reducindolos sin perder demasiada informacin inicial con el objetivo de construir un resumen relativamente exhaustivo del conjunto de partida que es habitualmente complejo y con informaciones redundantes.

Los orgenes del anlisis multivariable se encuentran en las primeras generalizaciones de la correlacin y regresin, en donde se establecieron las primeras ideas del anlisis de componentes principales (Pearson; 1901 y Spearman; 1904). Sin embargo, el establecimiento definitivo de la mayora del anlisis multivariable se ubica en los aos treinta con los estudios de Hotelling (1931, 1933); Willes (1932, 1935); Fisher (1935, 1936); Mahalanobis (1936) y Bartlett (1939). En cuanto a la maduracin de los fundamentos del anlisis multivariable, este se debe a los pioneros de la estadstica moderna que inicio en Inglaterra (Galton, Pearson, Fisher, Snecodor) Posteriormente, el centro de gravedad se desplaz hacia los Estados Unidos (Hotelling, Wilks, Bartlett), aunque sin dejar de considerar las aportaciones que se dieron con el nacimiento de otras escuelas tan importantes como la escuela india (Mahalanobis, Roy, Krishnaah), la

escuela francesa surgida en los aos sesenta (Benzecri, Lebart, Morineau, Fenelon, etc.) y la escuela sueca surgida en los aos setenta (Jreskog y Srborn).

A partir de Spearman (1904) se estableci el inicio del anlisis factorial cuando en su estudio sobre la inteligencia distingui un factor general con respecto a un cierto nmero de factores especficos. Este autor haba considerado como antecedentes tericos las tcnicas de regresin lineal propuestas por Galton (1888). Por otra parte, Pearson (1901) propuso el mtodo de componentes principales como un primer paso previo para llevar a cabo las estimaciones del anlisis factorial. Posteriormente, Hotelling (1933) aplic el mtodo de extraccin de factores mediante la tcnica de componentes principales, la cual hasta nuestros das se ha confirmado como una de las ms aceptadas entre los diversos trabajos multivariables. La relacin entre las correlaciones y las saturaciones de las variables en los factores fue expuesta por Thurstone (1947). Este autor introdujo la idea de la estructura simple, as como la teora y el mtodo de las rotaciones factoriales ortogonales y oblicuas con el objetivo de obtener una estructura factorial ms sencilla para facilitar la interpretacin de los factores. Otra aportacin importante relacionada con este tipo de anlisis fue la de Keiser (1958), quien desarroll una serie de procedimientos matemticos mediante el mtodo varimax para llevar a cabo las rotaciones ortogonales, pues antes de sus trabajos dichas rotaciones nicamente eran grficas.

Bizquerra (1989) y Prieto (1985) indican que el anlisis multivariable distingue entre mtodos predictivos y mtodos reductivos. Los primeros identifican a un grupo de variables independientes (predictoras), un criterio o variable dependiente, y en ocasiones a un grupo de variables aleatorias (intervinientes) cuyo efecto se desea mantener bajo control. Sin embargo, el problema radica en especificar las dependencias o correlaciones significativas entre los dos primeros tipos de variables, tal es el caso de la regresin mltiple. Con respecto a los mtodos reductivos, estos analizan las interdependencias entre todas las variables con el

objeto de reducir al mnimo el nmero de variables necesarias para describir la informacin relevante contenida en las observaciones.

Una clasificacin tambin utilizada para los modelos multivariables es la que los divide en: a) mtodos descriptivos o exploratorios (no se establece ninguna hiptesis previa); y b) mtodos explicativos o confirmatorios (se basan en un marco terico para fundamentar y validar empricamente una hiptesis). Otra importante clasificacin es la que divide a los mtodos en: a) mtodos reductivos (anlisis factorial, componentes principales, correlacin cannica, anlisis de clusters, anlisis de correspondencias); y b) mtodos de dependencia (anlisis de la varianza, anlisis de la covarianza, regresin mltiple, anlisis discriminante, anlisis de probabilidad condicional Logit y anlisis de probabilidad condicional Probit).

3.

DESARROLLO DEL ANALISIS FINANCIERO MULTIVARIABLE

Los estudios de Beaver fueron muy importantes como antecedente del anlisis financiero multivariable, ya que logr separar y analizar los componentes de los ratios mediante el uso de mtodos estadsticos univariables y determin la media de los valores de dichos componentes, tanto de empresas en quiebra como de empresas sanas. Este anlisis sobre las medias le llevaron a la conclusin de que la combinacin de datos dentro de la forma de ratio puede oscurecer la informacin contenida en los componentes individuales. Beaver sugiri que los ratios tienen que aplicarse con discrecin porque no todos tienen el mismo grado de capacidad explicativa y predictiva. Estos estudios dieron paso a la idea de los modelos multivariables llevados a cabo por primera vez por Altman (1968). Lo que si es definitivo es que a partir de los estudios univariables de Beaver se demostraron las mltiples limitaciones que presentaba el anlisis financiero tradicional basado nicamente en ratios.

Las ideas sobre el anlisis financiero basado en mtodos multivariables se comenzaron a divulgar de forma ms amplia a finales de la dcada de los sesenta y durante los setenta, y posteriormente se intensificaron en las dcadas de los ochenta en diversas partes del mundo industrializado (Pinches y Mingo: 1973; Libby: 1975; Pinches, Mingo y Caruthers: 1973, 1975; Largay y Stickney: 1980; Chen y Shimerda: 1981; Gombola y Ketz: 1983; Gahlon y Vigeland: 1988; Dambolena y Shulman: 1988; entre otros). A partir de entonces se ha continuado aplicando ininterrumpidamente una serie de herramientas cada vez ms eficientes, como es el caso del anlisis de regresin mltiple, el anlisis factorial comn, el anlisis de componentes principales, el anlisis discriminante, entre otros. Dentro del campo de estudio sobre el xito o fracaso empresarial, el trabajo de Libby (1975) represent una de las primeras investigaciones en donde se aplic el anlisis factorial antes de la aplicacin de una regresin o un anlisis discriminante.

Los metodologas utilizadas en las investigaciones que versan sobre nuevas formas de llevar a cabo el anlisis financiero de las empresas fueron incrementando su complejidad desde los trabajos pioneros de Beaver

(1966,1968). Los estudios univariables haban representado un camino mejor para la prediccin de quiebras al lograr el modelo de Beaver alcanzar una exactitud en las clasificaciones hasta del 87%. Sin embargo, los posteriores modelos multivariables fueron superando la exactitud de las clasificaciones univariables al ser ms precisos los ratios financieros y obtener porcentajes ms altos en modelos como los de Altman y Blum (95%), Edmister (93%), Ohlson (96%), Deakin (97%) y Rose y Giroux (92%).

Algunos de estos estudios, como los de Altman (1968), lograron reducir el nmero de ratios utilizados en las investigaciones univariantes al aplicar el mtodo Multiple Discriminant Analysis: MDA. Otros estudios se distinguieron por utilizar otras tcnicas de anlisis multivariable como: el anlisis discriminante lineal, el anlisis discriminante cuadrtico, el anlisis de regresin, el anlisis de componentes

principales, el anlisis factorial (para explicar la varianza de los ratios), el anlisis cluster (para reducir la colinealidad), el anlisis con redes neuronales, y el anlisis de probabilidad condicional Logit y Probit (los cuales constituyen una mejor variante de la regresin mltiple, ya que s permiten definir a la variable dependiente cualitativa como dicotmica o categrica).

Aunque los estudios pioneros de la dcada de los sesenta y setenta intentaron limitar este fenmeno y capturar al mismo tiempo la mayor cantidad de informacin til en los ratios financieros, tales mtodos actualmente se han cuestionado. Por ejemplo, Atlman (1968) analiz las intercorrelaciones entre las variables independientes antes de seleccionar las variables finales de su modelo. El mtodo que utiliz consisti slo en analizar al mismo tiempo las correlaciones entre dos pares de variables. Este anlisis bivariable de intercorrelaciones estaba muy lejos del actual concepto del anlisis mltiple de correlaciones. Por otra parte, Edmister (1972), y Rose-Giroux (1984) fueron ms lejos y utilizaron la tcnica de seleccin Stepwise para determinar la contribucin relativa de cada variable independiente y su correlacin con otras variables del modelo. Sin embargo, el anlisis Stepwise aunque limit la multicolinealidad, el nivel de correlacin aceptable se estableci arbitrariamente.

4.

LIMITACIONES DEL ANALISIS FINANCIERO MULTIVARIABLE

Algo que llama la atencin es el constatar que a la fecha muchas investigaciones continan sin aplicar nuevas variantes en los modelos de anlisis financiero multivariable y en la fase de diseo del trabajo emprico, pues se interesan ms en la aplicacin de las tcnicas estadsticas. Sin embargo, para el trabajo del analista financiero siempre es ms importante la exactitud del modelo de evaluacin con respecto a la contrastacin de una hiptesis o la validacin rigurosa de una teora que slo busca demostrar una compleja habilidad en el empleo de tcnicas informticas y estadsticas que se apartan de ambientes reales. Lizarraga (1993) tambin coincide con la idea anterior pues considera que la sofisticacin

metodolgica, aunque imprescindible en el avance de la tcnica, transforma en ocasiones a los investigadores en slo especuladores estadsticos, que fundamentados en buenos resultados tras largos procesos de contrastacin de variables, no tienen en cambio una base terica y carecen de interpretaciones econmicas convincentes.

Ya Lev (1978) afirm hace ms de dos dcadas que algunos modelos son inadecuados y cuando se emplean, presentan generalmente el sntoma de la falta de una teora base, desvirtuando en experimentos excesivos con gran nmero de variables y de modelos matemticos cuyos datos y resultados son difciles de generalizar. Con respecto a esto se vuelve a recomendar que en la interpretacin y validacin de los resultados exista una interpretacin econmica y financiera para dar un sentido lgico a las causas del xito

7. CONCLUSIONES

La conclusin principal a la que se ha llegado es que en general los modelos de anlisis financiero multivariable presentan dos fases para su desarrollo que son muy complejas y de igual importancia. Sin embargo, en la primera de ellas poco se ha trabajado en trminos de una estrecha relacin conceptual-emprica. La primera fase comprende el estudio y estructuracin detallada de la base de datos para evitar el efecto window dressing, mantener la utilidad y confiabilidad del sistema contable a travs de los aos para su comparabilidad, y llegar al mximo grado de armonizacin conceptual entre los diferentes estados financieros utilizados.

Continuando con esta fase, el siguiente paso consiste en que con la base de datos se debe proceder siempre a estimar un conjunto de ratios financieros previamente seleccionados y sustentados todos y cada uno de ellos dentro de un marco terico bien fundamentado, el cual tambin incluya la definicin conceptual de la variable dependiente. Si esto se ha cumplido, slo entonces se debera proceder a utilizar

un mtodo multivariable reductivo para determinar un conjunto de factores y eliminar al mismo tiempo aquellos ratios que presenten una alta multicolinealidad. Esto con el fin de llegar a obtener los ratios finales que representarn a los factores con base en su alta correlacin entre cada factor y cada ratio emparejado. Una vez llevado a cabo lo anterior, consideramos que es de suma importancia que al factor se le asigne un nombre clave de acuerdo al marco terico que present originalmente el ratio para su interpretacin financiera.

Para concluir con esta sntesis sobre la metodologa propuesta, se recomienda no pasar por alto la importancia que conlleva seleccionar adecuadamente el sector de la unidad de anlisis, la unidad temporal, la muestra y la unidad geogrfica. Sin embargo, de no ser posible llevar con xito el desarrollo de la primera fase en trminos generales, consideramos que definitivamente no se debera proceder al desarrollo de la segunda fase, pues el modelo de anlisis multivariable adolecera de partida de un sustento conceptual y emprico necesario.

En cuanto a la segunda fase del modelo, consiste en determinar la variable dependiente de forma categrica o numrica, e incorporar en una funcin lineal los ratios seleccionados como variables independientes, asignndoles una

ponderacin individual a cada uno de ellos con el fin de aplicar un mtodo multivariable clasificatorio para obtener porcentajes de exactitud y errores predictivos ex-ante o ex-post.

La combinacin adecuada y constante de nuevos estudios con base en flujos de efectivo, valores burstiles, valores de mercado y valores contables con base en el devengo, puede llevarnos a una mayor exactitud de diagnostico como predictiva. La descomposicin cada vez ms exacta de los elementos del cash flow total y la incorporacin de la informacin contenida en los componentes de los mltiplos de mercado puede proporcionar al modelo financiero multivariable nuevas variables independientes que incrementen la exactitud marginal, y por qu no, llegar tal vez a proponer un nuevo factor dentro de las funciones lineales. Para esto se debern

desarrollar nuevas propuestas de ratios financieros basados en una slida teora que habr nuevas oportunidades al investigador.

La nueva tendencia metodolgica parece indicar que hay que intentar sumar o restar variables o componentes a los actuales modelos financieros dentro del sistema del devengo para incrementar el poder explicativo y predictivo del modelo. As lo constatan un gran nmero de investigaciones que estn estableciendo nuevas bases. Por ejemplo, los trabajos de Dambolena y Khoury inciados en los ochenta han desarrollado modelos cuyo principal atributo es su estabilidad y dinamicidad a travs del tiempo y el mantenimiento del nivel explicativo de los razones financieras o ratios dentro de los diversos tipos de funciones lineales.

Fuente:
GRIM, L. and YARNOLD, P.R. (1994). Reading and understanding multivariate statistics. American Psycological Association. Washington D.C http://cashflow88.com/decisiones/5_PAPER_SOBRE_RATIOS_Y_SU_ANALISIS_ESTAD ISTICO_MULTIVARIABLE.pdf www.ine.gov.ar/.../PRESENCIAL.Estadistica%20Avanzada.pdf

Potrebbero piacerti anche