Apuntes Analisis Factorial

download Apuntes Analisis Factorial

of 64

description

Apuntes técnicas cuantitativas. El Análisis Factorial es el nombre genérico que se da a una clase de métodos estadísticos multivariantes cuyo propósito principal es sacar a la luz la estructura subyacente en una matriz de datos.

Transcript of Apuntes Analisis Factorial

Ttulo: ANLISIS FACTORIAL Presentacin: El Anlisis Factorial es el nombre genrico que se da a una clase de mtodos estadsticos multivariantes cuyo propsito principal es sacar a la luz la estructura subyacente en una matriz de datos. Analiza la estructura de las interrelaciones entre un gran nmero de variables no exigiendo ninguna distincin entre variables dependientes e independientes. Utilizando esta informacin calcula un conjunto de dimensiones latentes, conocidas como FACTORES, que buscan explicar dichas interrelaciones. Es, por lo tanto, una tcnica de reduccin de datos dado que si se cumplen sus hiptesis, la informacin contenida en la matriz de datos puede expresarse, sin mucha distorsin, en un nmero menor de dimensiones

representadas por dichos FACTORES. Un Anlisis Factorial tiene sentido si se cumplen dos condiciones: PARSIMONIA e INTERPRETABILIDAD. En esta leccin daremos una visin general de dicha tcnica y aprenderemos cules son los pasos a seguir a la hora de realizar un Anlisis Factorial ilustrndolos con ejemplos.

Introduccin

Qu factores tiene en cuenta una persona cundo va a comprarse un coche? Qu caractersticas distinguen unas marcas de pastas de dientes de otras ? Qu tipos de aptitudes hay que tener en cuenta para evaluar la labor de un vendedor? Cmo se pueden medir? Cules son los determinantes de la resistencia de los individuos a innovaciones tecnolgicas? Cmo medir el grado de inteligencia de una persona? Existe un nico tipo de inteligencia o hay varios? Si existen varios cmo medirlos? Qu factores conforman la personalidad de una persona? Cmo medirlos? Cmo medir el nivel de desarrollo de un pas? Qu ratios financieros deben tenerse en cuenta a la hora de evaluar la labor desarrollada por una empresa? QU TIENEN EN COMN TODOS ESTOS

PROBLEMAS? CMO RESOLVERLOS? En esta leccin trataremos de responder a estas cuestiones.

Objetivos 1) Definir qu es el Anlisis Factorial y cules son sus objetivos. 2) Indicar cules son las etapas a seguir en la realizacin de un Anlisis Factorial. 3) Formular el modelo del Anlisis Factorial e interpretar el significado de sus parmetros 4) Analizar el grado de deseabilidad de un Anlisis Factorial sobre un conjunto de datos a partir del anlisis de la matriz de correlacin de las variables observadas. 5) Seleccionar el mtodo apropiado para la extraccin de los factores. 6) Determinar el nmero de factores a extraer. 7) Aprender a interpretar el significado de un factor. 8) Conocer distintos mtodos de rotacin de factores 9) Conocer distintos mtodos de clculo de las puntuaciones factoriales y cmo usarlas para interpretar los resultados obtenidos 10) Validar el modelo resultante de un Anlisis Factorial

Apartados 1) Qu es un Anlisis Factorial? 2) Cmo realizar un Anlisis Factorial? 3) Formulacin del Problema. 4) Anlisis de la Matriz de Correlacin. 5) Extraccin de Factores. 6) Determinacin del Nmero de Factores. 7) Interpretacin de Factores. 8) Rotacin de Factores 9) Clculo de Puntuaciones Factoriales. 10) Validacin del Modelo

Contenidos 1.- QU ES UN ANLISIS FACTORIAL? El Anlisis Factorial es una tcnica estadstica multivariante cuyo principal propsito es sintetizar las interrelaciones observadas entre un conjunto de variables en una forma concisa y segura como una ayuda a la construccin de nuevos conceptos y teoras. Para ello utiliza un conjunto de variables aleatorias inobservables, que llamaremos factores comunes, de forma que todas las covarianzas o correlaciones son explicadas por dichos factores y cualquier porcin de la varianza inexplicada por los factores comunes se asigna a trminos de error residuales que llamaremos factores nicos o especficos. El Anlisis Factorial puede ser exploratorio o confirmatorio. El anlisis exploratorio se caracteriza porque no se conocen a priori el nmero de factores y es en la aplicacin emprica donde se determina este nmero. Por el contrario, en el anlisis de tipo confirmatorio los factores estn fijados a priori, utilizndose contrastes de hiptesis para su corroboracin. En esta leccin nos centraremos en el Anlisis Factorial Exploratorio dado que el Anlisis Factorial Confirmatorio se suele estudiar como un caso particular de los Modelos de Ecuaciones Estructurales. Remitimos al lector interesado en ste ltimo al libro de Kline (1998) en el que se hace una buena exposicin de dicho tipo de modelos.

2.- CMO REALIZAR UN ANLISIS FACTORIAL? En la siguiente figura se ilustran los pasos necesarios para la realizacin de un Anlisis Factorial:FORMULACIN DEL PROBLEMA

ANLISIS DE LA MATRIZ DE CORRELACIN

EXTRACCIN DE FACTORES

DETERMINACIN DEL NMERO DE FACTORES

ROTACIN DE FACTORES

INTERPRETACIN DE FACTORES

VALIDACIN DEL MODELO

CLCULO DE PUNTUACIONES FACTORIALES

SELECCIN DE LAS VARIABLES REPRESENTATIVAS

ANLISIS POSTERIORES: REGRESIN, CLUSTER,

En los puntos siguientes se presenta con detalle en qu consiste cada una de estas etapas. 3.- FORMULACIN DEL PROBLEMA.

En la formulacin del problema debe abordarse la seleccin de las variables a analizar as como la de los elementos de la poblacin en la que dichas variables van a ser observadas. Aunque pueden realizarse anlisis factoriales con variables discretas y/o ordinales lo habitual ser que las variables sean cuantitativas continuas y en lo que sigue nos ceiremos a este caso. Es importante, en todo caso, que dichas variables recojan los aspectos ms esenciales de la temtica que se desea investigar y su seleccin deber estar marcada por la teora subyacente al problema. No tiene sentido incluir variables que no vengan fundamentadas por los aspectos tericos del problema porque se corre el riesgo de que los resultados obtenidos ofrezcan una estructura factorial difcil de entender y con escaso contenido terico relevante. Es muy aconsejable en este paso que el analista tenga una idea ms o menos clara de cules son los factores comunes que quiere medir y que elija las variables de acuerdo con ellos y no al revs porque se corre el riesgo de encontrar factores espreos o que los factores queden mal estimados por una mala seleccin de las variables. As mismo, la muestra debe ser representativa de la poblacin objeto de estudio y del mayor tamao posible. Como regla general debern existir por lo menos cuatro o cinco veces ms observaciones (tamao de la muestra) que variables. Si el tamao de

la muestra es pequeo y esta relacin es menor, los resultados deben interpretarse con precaucin. Conviene hacer notar, finalmente, que los resultados del anlisis no tienen por qu ser invariantes a cambios de origen y escala por lo que se aconseja, si las unidades de medida de las variables no son comparables, estandarizar los datos antes de realizar el anlisis. 3.1.- El modelo del Anlisis Factorial Sean X1, X2,, Xp las p variables objeto de anlisis que supondremos en todo lo que sigue, que estn tipificadas. Si no lo estuvieran el anlisis se realizara de forma similar pero la matriz utilizada para calcular los factores no sera la matriz de correlacin sino la de varianzas y covarianzas. El investigador mide estas variables sobre n individuos, obtenindose la siguiente matriz de datos:

Sujetos

Variables X1 X2

Xp

1 2 n

x11 x21 xn1

x12 x22 xn2

x1p x2p xnp

..

El modelo del Anlisis Factorial viene dado habitualmente por las ecuaciones: X1 = a11F1 + a12F2 ++a1kFk + u1 X2 = a21F1 + a22F2 ++a2kFk + u2 Xp = ap1F1 + ap2F2 ++apkFk + up donde F1,,Fk (k 0,05. b. Comunalidades reproducidas

Si analizamos la matriz factorial estimada (en la que se han eliminado las cargas factoriales cuyo valor absoluto es menor que 0.5) no se observa una interpretacin clara de los factores dada la gran cantidad de cargas factoriales con valores intermedios y debido a que el primer factor est relacionado con muchas variables. Para obtener una solucin ms inteligible es necesario recurrir a mtodos de rotacin de factores que se explican a continuacin. 8.- ROTACIN DE FACTORES Como ya se ha visto en la seccin anterior, la matriz de cargas factoriales juega un papel destacado a la hora de interpretar el significado de los factores y, si stos son ortogonales, cuantifican el grado y tipo de la relacin entre stos y las variables originales. Sin embargo, rara vez los mtodos de extraccin de factores vistos en la

seccin 5 proporcionan matrices de cargas factoriales adecuadas para la interpretacin. Para resolver este problema estn los procedimientos de

Rotacin de Factores que, basndose en la falta de identificabilidaddel modelo por rotaciones vista en la seccin 5, buscan obtener, a partir de la solucin inicial, unos factores cuya matriz de cargas factoriales los haga ms fcilmente interpretables. Dichos mtodos intentan aproximar la solucin obtenida al

Principio de Estructura Simple (Thurstone, 1935) segn el cual lamatriz de cargas factoriales debe reunir las siguientes

caractersticas: 1) cada factor debe tener unos pocos pesos altos y los otros prximos a cero; 2) cada variable no debe estar saturada ms que en un factor; 3) no deben existir factores con la misma distribucin, es decir, dos factores distintos deben presentar distribuciones

diferentes de cargas altas y bajas. De esta forma, y dado que hay ms variables que factores comunes, cada factor tendr una correlacin alta con un grupo de variables y baja con el resto de variables. Examinando las caractersticas de las variables de un grupo asociado a un determinado factor se pueden encontrar rasgos comunes que permitan identificar el factor y darle una denominacin que responda a esos rasgos comunes.

Si se consiguen identificar claramente estos rasgos, se habr dado un paso importante, ya que con los factores comunes no slo se reducir la dimensin del problema, sino que tambin se conseguir desvelar la naturaleza de las interrelaciones existentes entre las variables originales. Existen dos formas bsicas de realizar la rotacin de factores:

la Rotacin Ortogonal y la Rotacin Oblicua segn que losfactores rotados sigan siendo ortogonales o no. Conviene advertir que tanto en la rotacin ortogonal, como en la rotacin oblicua la comunalidad de cada variable no se modifica, es decir, la rotacin no afecta a la bondad de ajuste de la solucin factorial: aunque cambie la matriz factorial, las especificidades no cambian y por tanto, las comunalidades permanecen inalteradas. Sin embargo, cambia la varianza explicada por cada factor, luego los nuevos factores rotados no estn ordenados de acuerdo con la informacin que contienen, cuantificada a travs de su varianza. 8.1.- Rotacin Ortogonal En la rotacin ortogonal, los ejes se rotan de forma que quede preservada la incorrelacin entre los factores. Dicho de otra forma, los nuevos ejes, o ejes rotados, son perpendiculares de igual forma que lo son los factores sin rotar. Como ya se ha dicho dicha rotacin se apoya en el problema de la falta de identificabilidad de los factores obtenidos por

rotaciones ortogonales de forma que si T es una matriz ortogonal con TT = TT = I, entonces: X = FA + U = FTTA + U = GB + U La matriz G geomtricamente es una rotacin de F y verifica las mismas hiptesis que sta. Lo que realmente se realiza es un giro de ejes, de manera que cambian las cargas factoriales y los factores. Se trata de buscar una matriz T tal que la nueva matriz de cargas factoriales B tenga muchos valores nulos o casi nulos, y unos pocos valores cercanos a la unidad de acuerdo con el principio de estructura simple descrito anteriormente. Ejemplo 1 (continuacin) Los factores F1' y F2' se han obtenido a partir de los factores F1 y F2 aplicando la rotacin ortogonal dibujada en la Figura 2. En dicha Figura se representan las variables originales en el espacio factorial definido por los ejes factoriales F1 y F2 y en el definido por los ejes F1' y F2' . En particular, se muestra cul es la relacin existente entre las cargas factoriales de la variable Qca en ambos espacios.

Figura 2: Rotacin ortogonal de los factores F1 y F2

En este caso la matriz de rotacin T =

1 2 1 2

1 2 y la 1 2

0.71 0.42 0.71 0.28 0.64 0.21 nueva matriz de cargas factoriales ser B = 0.71 0.42 0.69 0.47 0.78 0.42 La forma de calcular estas matrices da lugar a los distintos mtodos de rotacin ortogonales de los cules los ms utilizados son los siguientes:

8.1.1- Mtodo Varimax

Se trata de un mtodo de rotacin que minimiza el nmero de variables con cargas altas en un factor, mejorando as la capacidad de interpretacin de factores. Este mtodo considera que si se logra aumentar la varianza de las cargas factoriales al cuadrado de cada

factor consiguiendo que algunas de sus cargas factoriales tiendan aacercarse a uno mientras que otras se acerquen a cero, lo que se obtiene es una pertenencia ms clara e inteligible de cada variable a ese factor. Los nuevos ejes se obtienen maximizando la suma para los k factores retenidos de las varianzas de las cargas factoriales al cuadrado dentro de cada factor. Para evitar que las variables con mayores comunalidades tengan ms peso en la solucin final, suele efectuarse la normalizacin de Kaiser consistente en dividir cada carga factorial al cuadrado por la comunalidad de la variable correspondiente. En consecuencia, el mtodo varimax determina la matriz B de forma que se maximice la suma de las varianzas:2 k b ij p b ij V = p 2 j=1 h i =1 j=1 i =1 j hj k p 4 2

8.1.2- Mtodo Quartimax

El objetivo de este mtodo es que cada variable tenga correlaciones elevadas con un pequeo nmero de factores. Para ello busca maximizar la varianza de las cargas factoriales al

cuadrado de cada variable en los factores, es decir, el mtodo tratade maximizar la funcin:

S=

(bp k i =1 j=1

2 ij

bi

2 2

)

1 k 2 donde bi = b ij k j=12

Con ello, se logra que cada variable concentre su pertenencia en un determinado factor, es decir, presente una carga factorial alta mientras que, en los dems factores, sus cargas factoriales tiendan a ser bajas. La interpretacin as gana en claridad por cuanto la comunalidad total de cada variable permanece constante, quedando ms evidente de este modo hacia qu factor se inclina con ms fuerza cada variable. El mtodo es tanto ms clarificador cuanto mayor nmero de factores se hayan calculado. Este mtodo tiende a producir un primer factor general que se le suele dar el nombre de tamao y el resto de factores presentan ponderaciones menores que las dadas por el mtodo Varimax.8.1.3.- Mtodo Equamax

Este mtodo busca maximizar la media de los criterios anteriores. Suele tener un comportamiento similar a uno de lo dos mtodos anteriores.Ejemplo 2 (continuacin)

En la Tabla 7 se muestran los resultados de aplicar una rotacin Varimax (los resultados obtenidos al aplicar los otros dos mtodos son similares y no se muestran por brevedad). En primer lugar, se muestra la matriz B de cargas factoriales rotadas y, a continuacin, la matriz de rotacin T. Se observa que la interpretabilidad de los factores obtenidos ha mejorado

sustancialmente debido a que, en este caso, cada variable tiende a relacionarse con un solo factor. Se observa que el factor 1 rotado est muy relacionado con los ratios que reflejan el nivel de endeudamiento a largo plazo de la empresa estando relacionado directamente con aquellos ratios que tienen dicha partida en el numerador (DLP/AT y DLP/KP) e

inversamente con los que la tienen en el denomiador (PC/DT y CF/DLP). Es, por lo tanto, un factor que refleja el

ENDEUDAMIENTO A LARGO PLAZO. El factor 2 por su parte, est relacionado directamente con ratios que reflejan el nivel de beneficios de la empresa (BN/RP, CF/RP y BAIT/RP) por lo que puede interpretarse como un factor de RENTABILIDAD. Finalmente, el factor 3 est relacionado con ratios que reflejan el peso de los recursos ajenos en la gestin de las empresas (DT/RP y AT/RP) por lo que podra interpretarse como un factor de RECURSOS AJENOS.

Tabla 7 Matriz de cargas factoriales rotada y matriz de rotacina Matriz de factores rotados

DLP/AT PC/DT DLP/KP CF/DLP BN/RP CF/RP BAIT/RP DT/RP AT/RP

1 .967 -.953 .867 -.662

Factor 2

3

.956 .774 .753 .939 .916

Mtodo de extraccin: Mnimos cuadrados no ponderados. Mtodo de rotacin: Normalizacin Varimax con Kaiser. a. La rotacin ha convergido en 4 iteraciones.Matriz de transformacin de los factores Factor 1 2 3 1 .792 .264 -.550 2 -.319 .948 -.005 3 .520 .179 .835

Mtodo de extraccin: Mnimos cuadrados no ponderados. Mtodo de rotacin: Normalizacin Varimax con Kaiser.

8.2.- Rotacin oblicua

Se diferencia de la rotacin ortogonal en que a la matriz T de rotacin no se les exige ser ortogonal sino nicamente no singular. De esta forma los factores rotados no tienen por qu ser ortogonales y tener, por lo tanto, correlaciones distintas de cero entre s. La rotacin oblicua puede utilizarse cuando es probable que los factores en la poblacin tengan una correlacin muy fuerte. Insistimos en que hay que ir con mucho cuidado en la interpretacin de las rotaciones oblicuas, ya que la superposicin de factores puede confundir la significacin de los mismos. De esta forma el anlisis

gana ms flexibilidad y realismo pero a riesgo de perder robustez por lo que conviene aplicar estos mtodos si el nmero de observaciones por factor es elevada.Ejemplo 1 (continuacin)

Si definimos

F1" =

1 4 F2 F1 + 17 17

y

F2" =

4 1 F2 F1 + 17 17

entonces Corr (F1" , F2" ) =

8 = 0.47 0 por lo que los nuevos factores 17

estarn correlacionados. En la Figura 3 se muestra la rotacin geomtrica asociada a dicha transformacin que viene determinada por las variables Mat e Ing que tienen una carga factorial 0 en los nuevos factores. En este caso se tiene que la matriz de rotacin vendr dada por4 T= 17 15 17 15 17 15 y la matriz de cargas factoriales vendr dada 4 17 15

0.82 0.69 0.58 por B = 0.00 0.06 0.04de configuracin.

0.00 0.14 0.17 . Dicha matriz recibe el nombre de matriz 0.82 0.86 0.87

Figura 3: Rotacin oblicua de los factores F1 y F2

La matriz que contiene las correlaciones de las variables originales con los nuevos factores recibe el nombre de matriz deestructura y vendr dada en este caso por:

0.82 0.76 8 / 17 0.66 1 = B 8 / 17 1 0.39 0.34 0.45

0.39 0.46 0.44 0.82 0.83 0.89

Se observa que F1" puede interpretarse, de nuevo, como un factor de aptitud cientfica mientras que F2" como un factor de aptitud verbal pero, a diferencia de los factores F1 y F2 que son

incorrelados, en esta nueva estimacin ambos factores tienen una correlacin positiva significativa lo cual proporciona ms realismo al anlisis realizado.8.2.1.- Mtodo Oblimin

Busca minimizar la siguiente expresin:2 1 bis2 biq + (1 ) (bis2 bs2 )(bis2 bs2 ) i=1 s