af-spss

10

Click here to load reader

Transcript of af-spss

Page 1: af-spss

NOTAS PARA REALIZAR UN AF EN SPSS Los datos están tomados de Manley ( 1986) pp. 11. Contienen el país de referencia y el % de empleados en 9 sectores productivos. Hay que decidir previamente el número de factores a considerar. Para decidir cuántos habría que analizar los valores de los autovalores de la matriz de correlaciones. Secuencia en SPSS: Analizar + Reducción de datos + Factorial + Extracción + rellenar cuadro de diálogo.

Analizando Salida, se observa que hay 3 autovalores mayores que 1, y el cuarto al borde de 1. Manley decide usar 4 factores. Se repite el análisis factorial indicando el número de factores (4). Además en Descriptivos se rellena el cuadro de diálogo.

1

Page 2: af-spss

Se le puede pedir que guarde las puntuaciones como variables. En la salida habrá que analizar: Matriz de correlaciones (entre qué variables y qué magnitud). Hay que comprobar que un gran número de ellas tenga correlaciones superiores a 0,5. El determinante de la matriz es un indicador del grado de intercorrelación. Determinantes muy bajo indican altas correlaciones. En este caso: 0,00000187 La inversa de la matriz de correlaciones no se interpreta. KMO y prueba de Bartlett Medida de adecuación muestral de Kaiser-Meyer-Olkin. ,133

Chi-cuadrado aproximado 279,129

gl 36

Prueba de esfericidad de Bartlett

Sig. ,000

Estadístico KMO Indica que no es aceptable, Muy bajo. Algunos autores (Vinacua, pp. 225) indican que: 1≥KMO≥0,9 Excelentes 0,9≥KMO≥0,8 Buenos 0,8≥KMO≥0,7 Aceptables 0,7≥KMO≥0,6 Mediocres 0,6≥KMO≥0,5 Malos KMO<0,5 Inaceptables

2

Page 3: af-spss

Matrices anti-imagen

5,54E-005 ,001 ,000 ,002 ,001 ,000 ,000 ,000 ,001,001 ,015 ,002 ,030 ,009 ,003 ,005 ,002 ,010

,000 ,002 ,000 ,004 ,001 ,000 ,001 ,000 ,001

,002 ,030 ,004 ,081 ,019 ,006 ,011 ,004 ,021

,001 ,009 ,001 ,019 ,005 ,002 ,003 ,001 ,006

,000 ,003 ,000 ,006 ,002 ,001 ,001 ,000 ,002

,000 ,005 ,001 ,011 ,003 ,001 ,002 ,001 ,003,000 ,002 ,000 ,004 ,001 ,000 ,001 ,000 ,001

,001 ,010 ,001 ,021 ,006 ,002 ,003 ,001 ,007

,234a ,980 1,000 ,910 ,995 ,999 ,999 1,000 ,990,980 ,099a ,978 ,856 ,977 ,982 ,982 ,980 ,970

1,000 ,978 ,139a

,908 ,993 ,999 ,998 ,999 ,990

,910 ,856 ,908 ,096a

,919 ,903 ,899 ,913 ,873

,995 ,977 ,993 ,919 ,099a

,992 ,992 ,995 ,977

,999 ,982 ,999 ,903 ,992 ,154a

,998 ,998 ,991

,999 ,982 ,998 ,899 ,992 ,998 ,059a ,998 ,9911,000 ,980 ,999 ,913 ,995 ,998 ,998 ,150a ,987

,990 ,970 ,990 ,873 ,977 ,991 ,991 ,987 ,135a

%empleados agricultura%empleados mineria% empleadosmanufacturas% empleados s.energético% empleados s.construcción% empleados sectorservicios% empleados finanzas% empleados servicos% empleadostransportes ycomunicaciones%empleados agricultura%empleados mineria% empleadosmanufacturas% empleados s.energético% empleados s.construcción% empleados sectorservicios% empleados finanzas% empleados servicos% empleadostransportes ycomunicaciones

Covarianza anti-imagen

Correlación anti-imagen

%empleadosagricultura

%empleadosmineria

% empleadosmanufacturas

% empleadoss. energético

% empleadoss.

construcción

% empleadossector

servicios% empleados

finanzas% empleados

servicos

% empleadostransportes ycomunicacion

es

Medida de adecuación muestrala.

Las matrices anti-imagen de covarianzas y correlaciones entre todas las variables. Serán los negativos de los coeficientes de correlación parcial entre cada par de variables neutralizando el efecto de todas las restantes. Interesan coeficientes, cuanto más pequeños mejor. En la diagonal de esta última, tenemos los coeficientes MSA (Measures of Sampling Adequacy) que vienen a ser los KMO pero en este caso de cada variable por separado. El contraste de esfericidad de Bartlett Se Rechaza Ho. Hay correlaciones, tiene sentido el AF. (Ojo que requiere Normalidad multivariante). A continuación se procede a extraer factores para lo que se puede usar diversos métodos, habrá que rellenar el siguiente cuadro de diálogo.

3

Page 4: af-spss

En la salida aparecen estimadas la comunalidad:

222

21

2

2222

21

21

21

212

211

2

22

21

21

22212

12111

21

22221

11211

21

221

112

..

..1

..1

..00............0..00..0

..............

..

..

..............

..

..

1..............

..1

..1

'

jmjjj

jjmjj

m

ppmmm

p

p

pmpp

m

m

pp

p

p

p

lllh

wlll

wlll

w

ww

lll

llllll

lll

llllll

LLR

+++=

++++=

++++=

⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢

+

⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢

=

⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢

Ω+=

ρρ

ρρρρ

Comunalidades Inicial Extracción %empleados agricultura 1,000 ,966%empleados mineria 1,000 ,862% empleados manufacturas 1,000 ,834

% empleados s. energético 1,000 ,873

% empleados s. construcción 1,000 ,845

% empleados sector servicios 1,000 ,779

% empleados finanzas 1,000 ,840% empleados servicos 1,000 ,904% empleados transportes y comunicaciones 1,000 ,809

Método de extracción: Análisis de Componentes principales. Varianza total explicada

Autovalores iniciales Sumas de las saturaciones al cuadrado

de la extracción

Componente Total % de la varianza % acumulado Total

% de la varianza % acumulado

1 3,488 38,761 38,761 3,488 38,761 38,7612 2,130 23,661 62,422 2,130 23,661 62,4223 1,099 12,208 74,630 1,099 12,208 74,6304 ,995 11,051 85,682 ,995 11,051 85,6825 ,543 6,038 91,719 6 ,383 4,256 95,975 7 ,226 2,507 98,483 8 ,137 1,517 100,000 9 3,60E-005 ,000 100,000

4

Page 5: af-spss

Método de extracción: Análisis de Componentes principales. Matriz de componentes(a)

Componente 1 2 3 4 %empleados agricultura -,978 ,079 -,051 ,029%empleados mineria -,002 ,902 ,211 ,063% empleados manufacturas ,649 ,518 ,158 -,345

% empleados s. energético ,478 ,381 ,589 ,392

% empleados s. construcción ,607 ,075 -,161 -,667

% empleados sector servicios ,708 -,512 ,120 -,050

% empleados finanzas ,139 -,662 ,616 -,052% empleados servicos ,724 -,322 -,326 ,411% empleados transportes y comunicaciones ,685 ,296 -,393 ,313

Método de extracción: Análisis de componentes principales. a 4 componentes extraídos La matriz de componentes, da las cargas factoriales. X1=-0,978F1+0,079F2-0,051F3+0,029F4+e1 … Los factores se podrían interpretar viendo en qué variables tiene pesos altos (marcamos con rojo los mayores de 0,5). Se observa que algunas variables estarían representadas en más de un factor, por lo que quizá la interpretación se mejore rotando. Se observa además que hay 4 autovalores y se explica un 85,6% de varianza total. A partir de la comunalidad, por ejemplo en la primera variable se puede decir que el 96% de la variabilidad de esa variable está recogida con los 4 factores, y sólo queda un 4% por explicar. Esa sería la unicidad o factor único de esa variable. (se obtiene como diferencia entre 1 y la comunalidad). Los valores obtenidos en la matriz de cargas factoriales pueden utilizarse para reproducir la matriz de correlaciones: matriz de correlaciones reproducida.

srllm

fsfrfrs ≠=∑

=

1

ρ

Se puede comprobar en Excel, copiando la matriz de cargas factoriales, transponiendo y multiplicando LL’ Las correlaciones residuales (diferencia entre observadas y reproducidas), deberá ser lo más pequeña posible, para que el modelo reproduzca adecuadamente las matriz de correlaciones. Hay que señalar que distintos procedimientos de estimación darán lugar a diferentes resultados.

5

Page 6: af-spss

Correlaciones reproducidas

,966b ,064 -,612 -,456 -,599 -,740 -,220 -,705 -,618,064 ,862b ,477 ,491 -,010 -,441 -,471 -,335 ,202

-,612 ,477 ,834b

,465 ,638 ,230 -,138 ,110 ,428

-,456 ,491 ,465 ,873b

-,038 ,195 ,156 ,192 ,331

-,599 -,010 ,638 -,038 ,845b

,405 -,030 ,194 ,292

-,740 -,441 ,230 ,195 ,405 ,779b

,513 ,618 ,271

-,220 -,471 -,138 ,156 -,030 ,513 ,840b ,091 -,359-,705 -,335 ,110 ,192 ,194 ,618 ,091 ,904b ,658

-,618 ,202 ,428 ,331 ,292 ,271 -,359 ,658 ,809b

-,028 -,059 ,056 ,061 ,003 ,001 -,042 ,053-,028 -,032 -,086 -,015 ,044 ,028 ,055 -,045

-,059 -,032 -,079 -,143 -,027 -,018 ,046 -,077

,056 -,086 -,079 ,097 ,007 -,046 -,059 ,044

,061 -,015 -,143 ,097 -,049 ,046 -,036 ,095

,003 ,044 -,027 ,007 -,049 -,148 -,045 -,083

,001 ,028 -,018 -,046 ,046 -,148 ,015 ,113-,042 ,055 ,046 -,059 -,036 -,045 ,015 -,089

,053 -,045 -,077 ,044 ,095 -,083 ,113 -,089

%empleados agricultura%empleados mineria% empleadosmanufacturas% empleados s.energético% empleados s.construcción% empleados sectorservicios% empleados finanzas% empleados servicos% empleadostransportes ycomunicaciones%empleados agricultura%empleados mineria% empleadosmanufacturas% empleados s.energético% empleados s.construcción% empleados sectorservicios% empleados finanzas% empleados servicos% empleadostransportes ycomunicaciones

Correlación reproducida

Residuala

%empleadosagricultura

%empleadosmineria

% empleadosmanufacturas

% empleadoss. energético

% empleadoss.

construcción

% empleadossector

servicios% empleados

finanzas% empleados

servicos

% empleadostransportes ycomunicacion

es

Método de extracción: Análisis de Componentes principales.Los residuos se calculan entre las correlaciones observadas y reproducidas. Hay 16 (44,0%) residuales no redundantes con valores absolutos mayores que 0,05.a.

Comunalidades reproducidasb.

Usando otros métodos cambia:

- La comunalidad inicial, que será la correlación múltiple al cuadrado entre cada variable y el resto. Se usa luego en los algoritmos iterativos para lograr la solución final.

- Valores propios iguales, % de varianza explicada pueden ser diferentes. Los diferentes métodos difieren según el criterio que utilizan para definir el mejor ajuste. Cuando los factores son extraídos usando GLS ó ML y se supone normalidad multivariante, es posible obtener un test de ajuste que nos mida la adecuación del modelo a los k factores datos. En muestras grandes sigue una X2, que varía según el número de factores y el número de variable. Cuando no es fácil interpretar los factores, se puede rotar para obtener una mejor interpretación.

Se puede rotar para facilita la interpretación de los factores. Existen diversos procedimientos, pero en general pretenden:

- Cada factor debe tener unos pocos pesos altos y el resto próximos a cero. - Cada variable no debe estar saturada más que en un solo factor. - No deben existir factores con la misma distribución.

Se puede pedir un gráfico de saturaciones, en los que representa los factores con las cargas factoriales, para facilitar su interpretación.

6

Page 7: af-spss

También se pueden solicitar puntuaciones factoriales, valores para cada individuo de los factores seleccionados. No se pueden obtener puntuaciones exactas, excepto para CP, y por eso se realiza una estimación de las mismas. A veces SPSS da los pesos a utilizar para la estimación de los valores para cada individuo de los factores. Y por último se puede representar cada individuo en el espacio de los factores. En el ejemplo si se solicita una rotación Varimax, se obtienen los siguientes pesos: Matriz de componentes rotados(a)

Componente 1 2 3 4 %empleados agricultura -,688 -,569 -,314 -,267%empleados mineria -,224 ,133 -,550 ,701% empleados manufacturas ,134 ,750 -,117 ,489

% empleados s. energético ,227 ,022 ,158 ,892

% empleados s. construcción ,156 ,898 ,032 -,110

% empleados sector servicios ,531 ,332 ,621 -,035

% empleados finanzas -,067 -,050 ,912 ,032% empleados servicos ,933 ,041 ,173 -,053% empleados transportes y comunicaciones ,770 ,232 -,333 ,229

Método de extracción: Análisis de componentes principales. Método de rotación: Normalización Varimax con Kaiser. a La rotación ha convergido en 6 iteraciones. Las comunalidades, calculadas como suma de cuadrados de las cargas factoriales para cada variable, son prácticamente las mismas.

V1 0,97 V2 0,86 V3 0,83 V4 0,87 V5 0,84 V6 0,78 V7 0,84 V8 0,90 V9 0,81

Y la interpretación mejora porque sólo quedan las variables 1, 2, y 6 que tienen cargas altas en más de un factor. La interpretación de Manley (pp. 81)1

- F1 Peso alto negativo en agricultura y alto positivo en servicios, transportes y comunicaciones. Énfasis en servicios y defecto en agricultura. - F2 pesos altos y positivos en manufacturas y construcción y negativo en agricultura. Énfasis en industrialización, frente a agricultura. - F3 pesos altos y positivos en comunicaciones y finanzas, y bajas en minería.

1 En algunos factores cambian los signos, pero el sentido de la interpretación es parecido. El programa utilizado para su cálculo es BMDP.

7

Page 8: af-spss

- F4 Pesos altos en minería y sector energético. La matriz de transformación para hacer la rotación ortogonal, viene dada por: Matriz de transformación de las componentes Componente 1 2 3 4 1 ,726 ,578 ,227 ,2972 -,182 ,215 -,749 ,6003 -,425 -,047 ,618 ,6604 ,509 -,786 -,075 ,342

Método de extracción: Análisis de componentes principales. Método de rotación: Normalización Varimax con Kaiser. Se puede solicitar el gráfico de saturaciones, que facilita la interpretación, aunque a veces cuesta verlo, sobre todo en tres dimensiones.

Componente 10,90,60,30,0-0,3-0,6

Componente 3

0,9 0,6 0,3 0,0 -0,3

-0,6

Com

pone

nte

2

0,9

0,6

0,3

0,0

-0,3

-0,6

-0,9

-0,9

-0,9

serv

finanzsspp

const

energtranspc

indu

mine

agric

Gráfico de componentes en espacio rotado

8

Page 9: af-spss

Tras interpretar los factores, suele interesar calcular las puntuaciones de cada individuo en los factores. Excepto en el método de CP, se calculan de manera aproximada, y SPSS da la matriz que sirve para calcular dichos valores. Matriz de coeficientes para el cálculo de las puntuaciones en las componentes2

Componente

1 2 3 4 %empleados agricultura -,176 -,175 -,122 -,082%empleados mineria -,127 ,031 -,203 ,402% empleados manufacturas -,147 ,426 -,025 ,177

% empleados s. energético ,040 -,217 ,199 ,636

% empleados s. construcción -,159 ,642 -,027 -,254

% empleados sector servicios ,119 ,100 ,297 -,029

% empleados finanzas -,179 -,029 ,592 ,177% empleados servicos ,515 -,224 -,054 -,083% empleados transportes y comunicaciones ,430 -,088 -,304 ,014

Método de extracción: Análisis de componentes principales. Método de rotación: Normalización Varimax con Kaiser. Puntuaciones de componentes. F1=-0,176X1-0,127X2+..+0,430X9 F2=-0,175X1+0,031X2+..-0,088x9 Y así sucesivamente. Y por último se obtiene Matriz de covarianza de las puntuaciones de las componentes Componente 1 2 3 4 1 1,000 ,000 ,000 ,0002 ,000 1,000 ,000 ,0003 ,000 ,000 1,000 ,0004 ,000 ,000 ,000 1,000

Método de extracción: Análisis de componentes principales. Método de rotación: Normalización Varimax con Kaiser. Puntuaciones de componentes. Se observa, que efectivamente, al ser una rotación ortogonal, los factores siguen manteniendo la ortogonalidad. En análisis se completaría tratando de representar gráficamente los países según los valores de los factores comunes. Manley observa: Yugoslavia, España y Rumanía, destacan por el peso del sector agrícola. Hungría y Alemania del este destacan por tener muchas personas empleadas en minería y el sector energético. Italia y Turquia están en situación contraria. Uno de los factores indica diferencias entre el bloque comunista y otros países. Otro de los factores señala a Turquía como diferente del resto de países por su déficit en trabajadores en construcción e industria, y el gran número de trabajadores en agricultura.

2 Aquí de nuevo, cambian los signos respecto a los resultados de Manley

9

Page 10: af-spss

Otros ejemplos de Análisis Factorial: Sharma; Pág. 90. Analiza las calificaciones en diversos estudiantes en Matemáticas (M), Física (P), Química (C), Ingles (E), Historia (H) y Francés (F). 2 factores, autovalores 2,25 y 1,616 Comunalidades Especificidad M .680 .320 P .580 .420 C .450 .550 E .680 .320 H .695 .305 F .786 .214 Cargas factoriales F1 F2 M .800 .200 P .700 .300 C .600 .300 E .200 .800 H .150 .820 F .250 .850 Interpretación de los factores: F1: Habilidades cuantitativas F2: Habilidades verbales Sharma pág 121. Un directivo quiere identificar los factores subyacentes que los consumidores consideran para evaluar detergente para lavar. El estudio se hizo sobre 143 personas, que tenías que responder en una escala de 1 a 5 a 12 atributos del producto. Levy, pp. 352 Todos los países del mundo medidos en el año 1996 en 19 variables relativas a demografía, cultura, ejército, economía y comercio. Lo resume en 5 factores comunes, que tras la rotación ve que tienen que ver con: F1: índice de fecundidad, mortalidad infantil, escolarización de segundo grado, receptores Tv, número médios, PIB por habitante, gastos públicos en educación. F2: libros publicados, ejército de tierra, marina, aviación, importaciones y exportaciones. F3: gastos públicos en defensa, consumo de energía por habitante F4: inflación F5: densidad de población, escolarización de tercer grado. Uriel: p. 423 y ss. Análisis factorial sobre 4 variables, ratios financieros, que luego amplia a más variables. En el ejemplo se pone de manifiesto cómo cambian resultados según el método de estimación y la rotación elegidas. En el caso de elegir el método GLS, calcula el estadístico para constrastar hipótesis sobre el número de factores. Otro ejemplo en Uriel, pp. 435 y ss. Datos de 1986, 37 variables para analizar la competencia de las Cajas de Ahorro. Se trata de reducir la dimensionalidad, y tiene interés por la interpretación de los factores que hacen los autores del estudio. F1: Estrategia de eficienca, F2: estrategia de negocio, F3: estrategia de crecimiento, F4 estrategia de innovación de procesos, etc…

10