Analisis Factorial Paquito

24
Manual de análisis factorial Jose F. Nieves Mendez Prof. Balbino Garcia ECONOMETRIA

Transcript of Analisis Factorial Paquito

Page 1: Analisis Factorial Paquito

Manual de análisis factorial

Jose F. Nieves MendezProf. Balbino Garcia

ECONOMETRIA

Page 2: Analisis Factorial Paquito

Indice Capitulo 3: Extracción de factores por el

método centroide› Ecuaciones para el método centroide› Un ejemplo de dos factores y cuatro variables› Un ejemplo de cuatro factores y doce variables› Interacción de las comunalidades

Capitulo 4: Los métodos de extracción factorial de factor principal y residuo mínimo.› El método del factor principal› El método del residuo mínimo

Page 3: Analisis Factorial Paquito

Capitulo 3: Extracción de factores por el método

centroide

Page 4: Analisis Factorial Paquito

El método centroide para extracción de factores es probablemente el mas conocido de todos los métodos de extracción factorial.

El método centroide resulta mas adecuado para fines didácticos, ya que es factible hacer un problema de suficiente tamaño.

Page 5: Analisis Factorial Paquito

Ecuaciones para el método centroide

En la fig. 2.1, el punto centroide fue localizado hallando la media do todas las coordenadas X del punto centroide y todas las coordenadas Y de los vectores de datos para obtener la coordenada Y del punto centroide. Si hubiera estado implicadas mas de dos dimensiones, se habría utilizado la media de la tercera, la cuarta y las otras coordenadas.

Page 6: Analisis Factorial Paquito
Page 7: Analisis Factorial Paquito

La Ec. (3.10) da la forma para un peso centroide para la variable j en el factor 1 (o I, si usamos numerales romanos. Para obtener el peso del factor centriode para la variable de datos 1, se requiere los siguientes pasos:

1. sumar las entradas de la primera columna de la matriz de correlaciones, incluyendo el elemento de la diagonal.

Dividir este numero por la raíz cuadrada (o multiplicarlo por la reciproca de la raíz cuadrada) de la suma de todas las entradas de la matriz de correlaciones entera, incluyendo los elementos diagonales.

Page 8: Analisis Factorial Paquito
Page 9: Analisis Factorial Paquito

Un ejemplo de dos factores y cuatro variables

La contribución del factor 1 debe eliminarse de la matriz de correlaciones mediante la operación R-A1A1’.

Las columnas en cada caso suman cero, dentro de los limites del error de redondeo. Como comprobación, las filas deben sumarse también para asegurar que el total de las filas es igual al total de las columnas, como se requiere en una matriz simétrica.

Page 10: Analisis Factorial Paquito
Page 11: Analisis Factorial Paquito

En la Ec. (3.1) se estableció que la suma de los pesos del segundo y los siguientes factores cancroides es cero, lo cual proporciona la base para una comprobación del calculo de los residuos del primer factor usados anteriormente. Sin embargo, puesto que las sumas de las columnas son cero, es claramente imposible aplicar los pasos utilizados para calcular el primer factor centroide a la matriz de residuos dada en la Tabla 3.2. Es necesario, primero llevar a cabo un proceso de reflexión de los residuos para eliminar tantos signos negativos como sea posible en la matriz de residuos del primer factor

Page 12: Analisis Factorial Paquito

Un ejemplo de cuatro factores y doce variables

Esta tabla de correlaciones de 44x44, proporciona una fuente de problemas de muestra para ejercicios de clase. Seleccionando cuatro de los ocho factores y tres variables con pesos factoriales altos que definan cada factor, puede servir como ejercicio para los estudiantes. Si se desea, cada estudiante puede tomar una muestra diferente de factores y/o variables de forma que no haya estudiantes que trabajen en el mismo ejercicio. Es importante tener al menos cuatro factores y, preferiblemente, tres variables que definan cada factor. De esta forma, el ejercicio proporcionara una apropiada experiencia de aprendizaje al estudiante, dándole oportunidad de desarrollar la destreza requerida tanto para extraer factores como para rotarlos.

Page 13: Analisis Factorial Paquito

Pasos en el calculo del primer factor centroide

1. Sumar algebraicamente cada columna de la matriz de correlaciones omitiendo del total el elemento diagonal, el valor h^2.

2. Sumar las filas calculando cada total de fila de R, omitiendo de nuevo los elementos diagonales. Comparar los totales de fila con los totales de columnas para asegurarse de que son idénticos.

3. Si alguno de estos totales de fila-columna es negativo, debe aplicarse el proceso de reflexión, como se explica en los pasos para el calculo del segundo factor centroide.

4. Colocar los valores de comunalidad estimados en las entradas de la diagonal. Lo mas común es usar como estimaciones los valores absolutos de las correlaciones mas altas en las columnas

5. Sumar las comunalidades estimadas a los totales de columna y colocar estas sumas en la fila t.

6. Como comprobación, restar las nominalidades de los totales de la fila t, para ver si se recuperan los totales de columna sin nominalidades.

Page 14: Analisis Factorial Paquito

Pasos en el calculo del primer factor centroide

7. Sumar los totales de columna con comunalidades, es decir los elementos de la fila t, para obtener T, la suma de todas las entradas de la tabla.

8. Calcular la raíz cuadrada de T hasta al menos cinco cifras decimales.9. Calcular el reciproco de la raíz cuadrada de T hasta el menos cinco

cifras decimales.10. Multiplicar los totales de columna con comunalidades, es decir las

entradas de la fila t, por 1/ √T e introducir los productos en la fila a. Estos son los pesos centroides previos al anadido de cualquier signo.

11. Si alguna variable ha sido reflejada previamente a estos cálculos, los pesos centroides deben tener los signos apropiados antes de ser introducidos como la primera columna en la matriz A, la tabla de pesos factoriales.

12. Sumar los pesos factoriales de la fila ai y comprobar que la suma es igual a √T dentro de los limites del error de redondeo, como se requiere en la Ec. (3.7)

Page 15: Analisis Factorial Paquito

Calculo del segundo factor centroide

Se repiten los pasos 1 y 2 del procedimiento de extracción del primer factor centroide, es decir, se suman las filas y columnas de la matriz de residuos, omitiendo los elementos diagonales, y las sumas de filas se cotejan con las sumas de columna.

Page 16: Analisis Factorial Paquito

Reflexión de variables Algunas veces en el primer factor, y siempre en el segundo y los subsiguientes, las sumas de

algunas de las columnas, sin contar las diagonales, son negativas. Esto requiere la reflexión de las variables con sumas de columnas negativas (sin sumar las comunalidades) de modo que todas las sumas de columna sean positivas. Los pasos a seguir en este proceso de reflexión son los siguientes:

1. Localizar la variable que tiene el mayor total negativo sin haberle sumado la comunalidad, como primera variable a reflejar.

2. Etiquetar la fila inmediatamente inferior a la fila ∑0 con el numero de la variable que va a ser reflejada.

3. Bajar la suma de columna de la fila ∑0 , para esta variable, cambiando su signo de negativo a positivo, y colocarla en la fila siguiente, subrayando el numero.

4. Los totales de columna para las otras variables deben ser ajustados para tomar en consideración el hecho de que la variable 3 esta siendo reflejada. Antes de la reflexión, estos valores fueron sumados al total con un signo contrario. Por eso, para ajustar el total correctamente, la entrada debe ser doblada, su signo cambiado y el resultado sumado al total de columna previo.

5. Como comprobación, los nuevos totales de columna son sumados. Este valor deberá ser igual a la anterior suma de totales de columna mas cuatro veces la suma de columna positiva para la variable que se esta reflejando.

6. Si alguno de los totales de columna es todavía negativo después de la primera reflexión, y generalmente así ocurre, se selecciona la variable con el mayor total negativo. Su total se baja con un signo positivo y se subraya como el nuevo total para esa columna. Se continua como antes, doblando los valores de fila, cambiando sus signos y sumándolos a los totales de columna previos.

7. Este proceso de reflexión de variables se continua hasta que no quede ningún total de columna negativo. En ocasiones, puede ser necesario volver a reflejar una variable que había sido reflejada anteriormente

Page 17: Analisis Factorial Paquito

Calculo de pesos del segundo factor

Este procedimiento se usa cuando se dispone de buenas estimaciones de las comunalidades al principio del analisis o cuando se desea una solución con estas estimaciones de las comunalidades particulares. En este problema de muestra, y en la practica común, se introducen nuevas estimaciones de las nominalidades para cada factor extraido.

Para estimar las comunalidades, se localiza el mayor residuo de cada columna, se le pone signo positivo y se coloca sobre el valor de la comunalidad residual.

Los pesos del segundo factor son calculados del mismo modo que para el primer factor, y los resultados pasan a la fila ai .

Page 18: Analisis Factorial Paquito

Calculo de los residuos del segundo factor

Cuando los residuos del segundo factor con calculados mediante la fórmula R2=R1-A2A2’, R1 es una matriz de residuos reflejados del primer factor y A2 es una sola columna con todos los signos positivos.

Al llevar a cabo las reflexiones para una variable dada, tanto los signos de la fila como los de columna para esta variable deben ser cambiados a menos que el residuo afecte a otra variable que también esta reflejada, en cuyo caso el signo no se cambia.

Page 19: Analisis Factorial Paquito

Cálculos de los pesos del tercer factor

Los pesos del tercer factor se obtienen esencialmente mediante los mismos pasos usados para el calculo de los pesos del segundo factor, excepto que debe reflejarse un conjunto diferente de variables.

Cada nuevo proceso de reflexión para calcular otro factor comienza sin asteriscos en la tabla. Sin embargo, cuando los pesos del tercer factor son incluidos en la matriz A, es mas complicado adjuntar los signos apropiados que en el caso del segundo factor. El signo de cada variable que ha sido reflejada durante el calculo del tercer factor debe ser invertido, pero no es solo cuestión de poner signos negativos en los pesos para esas variables en el factor III. Mas bien, es una cuestión de cambio de signo de lo que era en el factor II inmediatamente precedente. Si una variable no ha sido reflejada al calcular cualquier factor previo, los signos de todos los pesos factoriales previos serán positivos, así, una reflexión en el factor actual simplemente hará que su signo se vuelva negativo.

Page 20: Analisis Factorial Paquito

Calculo de los pesos del cuarto factor

Una vez extraido el tercer factor, es necesario llevar a cabo las reflexiones de los residuos antes de eliminar la contribución del tercer factor mediante la formula R3=R2-A3A3. La matriz reflejada R2 no se muestra, pero se obtiene mediante el mismo método que se uso para obtener la matriz reflejase R1. Los residuos del tercer factor (matriz R3), derivados de los residuos del segundo factor reflejados, se muestran en la Tabla 3.10, junto con el calculo de los pesos del cuarto factor. Al introducir los pesos del cuarto factor en la matriz A, los signos para estas variables recién reflejadas deben hacerse opuestas a lo que eran para el factor III. Los restantes pesos del cuarto factor tendrán los mismos signos que estaban presentes para estas variables en el tercer factor, puesto que no fueron reflejados al obtener los pesos del cuarto factor. Los residuos del cuarto factor, calculados mediante la formula R4=R3-A4A. De nuevo, R3 es una matriz de residuos reflejados y todos los signos de A4 son positivos; R4, es una matriz de residuos no reflejados. Si se calculan un quinto factor y se aplicara la ecuación matricial R5=R4-A5A5’ para obtener los residuos del quinto factor, seria importante darse cuenta de que, aunque R4 aparece en ambas ecuaciones, en el primer caso no esta reflejada y en el segundo si lo esta.

Page 21: Analisis Factorial Paquito

Reducción de la matriz de correlaciones

Si los cálculos han sido llevados a cabo correctamente, debe valer la siguiente ecuación:

R=AA’ + R4 Es decir, si la matriz factorial, consistente en cuatro

factores, es multiplicada por su traspuesta y sumada a la matriz de los residuos del cuarto factor, debe reproducirse la matriz de correlaciones original dentro de los limites del error de redondeo. Antes de que R4 pueda ser sumada a AA’, los residuos individuales deben volver a su estado original no reflejado. De otro modo, algunos elementos residuales deberían ser sumados al producto interno de los pesos factoriales de AA’ para reproducir la correlación original, y otros deberían ser sustraídos.

Page 22: Analisis Factorial Paquito

Interaccion de las comunalidades

En una matriz grande, los errores al estimar las comunalidades generalmente no afectan mucho a la solución, puesto que estas discrepancias son pequeñas comparadas con las sumas de columna después de la reflexión. Con matrices mas pequeñas, estos errores pueden ser de mayor significación. Es necesario a veces calcular las comunalidades derivadas de la primera solución sumando los cuadrados de los pesos factoriales extraídos y usar estos valores como estimaciones de las nominalidades para una segunda solución.

La comunalidad residual del primer factor es usada como la estimación de la comunalidad para el segundo factor. El residuo del segundo factor se usa como estimación para el tercer factor, y asi sucesivamente. EL mismo numero de factores es extraido en cada solución.

En la practica real, la mayoría de los problemas empíricos con datos reales no requieren un alto grado de precisión en los valores estimados de las nominalidades para obtener resultados útiles.

Page 23: Analisis Factorial Paquito

Capitulo 4: Los métodos de extracción factorial de factor principal y residuo

mínimo.

Page 24: Analisis Factorial Paquito

El método del factor principal

Una serie de pasos que podría producir una solución de factor principal son los siguientes:

Constrúyase la matriz de correlaciones R de n x n, con los valores apropiados seleccionados para las casillas diagonales como estimaciones de las nominalidades.

Descúbrase una matriz ortogonal B de n x n, tal que cuando R es pre multiplicada por B y pos multiplicada por B’, el resultado es una matriz diagonal D, de n x n, con elementos diagonales ℓ1, ℓ2, ℓ3,….., ℓn

Multiplíquese cada elemento de la columna 1 de B’ por √ℓ1, cada electo de la columna 2 de B’ por √ℓ2 y así sucesivamente para las restantes columnas hasta que cada elemento de la ultima columna B’ sea multiplicado por √ℓn. Las operaciones de este paso 3 equivalen a multiplicar la matriz B’ por la derecha por una matriz diagonal con elementos diagonales √ℓ1, √ℓ2, √ℓ3,….., √ℓn

La matriz que se obtiene en el paso 3, es una matriz factorial A, tal que R = AA’. La suma de los cuadrados de la columna n de A, que es igual a ℓ1.