Análisis Multivariante Indicadores de Desarrollo
-
Upload
uc3m-madrid-spain -
Category
Documents
-
view
1.898 -
download
2
description
Transcript of Análisis Multivariante Indicadores de Desarrollo
Técnicas de InvestigaciónMorvyn Ruiz-McOmish
Relación de contenidos
• Descripción de los datos • Análisis Univariante• Análisis Bivariante• Análisis Multivariante – Análisis de Componentes
Principales• Resumen y limitaciones
2Análisis Multivariante
Datosn=91 observaciones que corresponden a 91 países p=6 variables son indicadores de desarrollo:
• TASA.NATALIDAD: Ratio de natalidad por 1000 habitantes (Número de nacimientos por cada mil habitantes)
• TASA.MORTALIDAD: Ratio de mortalidad por 1000 habitantes(Número de defunciones por cada mil habitantes)
• MORT.INFANTIL: Mortalidad infantil (por debajo de un año) (Número de defunciones de niños menores de un año por cada 1000 nacimientos vivos)
• ESPER.VIDA.HOM.: Esperanza de vida en hombres (expresado en años)• ESPER.VIDA.MUJ: Esperanza de vida en mujeres (expresado en años)• PNB: Producto Nacional Bruto per cápita (expresado en $)
Fuente: Análisis de datos multivariantes, Daniel Peña "UNESCO 1990 Demographic Year Book" y de "The Annual Register 1992".
Análisis Multivariante 3
Análisis Multivariante 4
Análisis Univariante - Tasa.Natalidad
•El 50% de la muestra se encuentra entre los valores 14,50 y 42,60.
• Media de 29,46 nacimientos por cada 1000 habitantes.• Tasa de natalidad mínima: Italia.• Tasa de natalidad máxima: Uganda.• CAs ≈ 0 → Distribución simétrica.• CAp < 0 → Menos apuntada que la normal.
Análisis Multivariante 5
Análisis Univariante - Tasa. Mortalidad (I)
• Media de 10,73 defunciones por cada 1000 habitantes.• Tasa de mortalidad mínima: Kuwait.• Tasa de mortalidad máxima: Malawi.• CAs > 0 → Distribución asimétrica a la derecha.• CAp > 0 → Más apuntada que la normal.
• Esta variable presenta valores atípicos.• Los cinco valores más extremos corresponden a los siguientes países: Malawi, Sierra Leona, México, Gambia y Etiopía. • En el diagrama de caja observamos otros dos datos atípicos que se corresponden con Somalia y Angola.
13/04/23 Análisis Multivariante 6
• El 50% de la muestra se encuentra entre los valores 7,70 y 12,50.
Análisis Univariante - Tasa. Mortalidad (II)
6Análisis Multivariante
Análisis Multivariante 7
Análisis Univariante - Mort.Infantil
• Media de 55,28 defunciones de niños menores de un año por cada 1000 nacimientos vivos• Tasa de mortalidad infantil mínima: Japón• Tasa de mortalidad infantil máxima: Afganistán• CAs > 0 → Distribución asimétrica a la derecha• CAp < 0 → Menos apuntada que la normal
•El 50% de la muestra se encuentra entre los valores 13,00 y 90,00.
Análisis Multivariante 8
Análisis Univariante - Esper.Vida.Hom
• Media de 61,38 años de esperanza de vida para hombres.• Esperanza de vida mínima para hombres: Malawi.• Esperanza de vida máxima para hombres: Japón.• CAs < 0 → Distribución asimétrica a la izquierda.• CAp < 0 → Menos apuntada que la normal.
•El 50% de la muestra se encuentra entre los valores 55,00 y 68,60 .
Análisis Multivariante 9
Análisis Univariante - Esper.Vida.Muj
• Media de 66,03 años de esperanza de vida para mujeres• Esperanza de vida mínima para mujeres: Malawi.• Esperanza de vida máxima para mujeres: Japón.• CAs < 0 → Distribución asimétrica a la izquierda• CAp < 0 → Menos apuntada que la normal
•El 50% de la muestra se encuentra entre los valores 56,00 y 75,50.
Análisis Multivariante 10
Análisis Univariante – PNB (I)
• Media de PNB per cápita es de 5.741,25$.• PNB mínimo per cápita: Mozambique .• PNB máximo per cápita: Suiza• CAs > 0 → Distribución asimétrica a la derecha• CAp > 0 → Más apuntada que la normal
• Esta variable presenta valores atípicos.• Los cinco valores más extremos corresponden a los siguientes países: Suiza, Finlandia, Japón, Suecia y Noruega. • En el diagrama de caja observamos otros seis datos atípicos que se corresponden con Alemania, Dinamarca, EEUU, Canadá, Emiratos Árabes Unidos y Francia.
13/04/23 Análisis Multivariante 11
• El 50% de la muestra se encuentra entre los valores 470,00 y 7600,00 .
Análisis Univariante – PNB (II)
11Análisis Multivariante
12Análisis Multivariante
Análisis Bivariante
• Alta correlación entre la mayoría de nuestras variables.
Matriz de dispersión
13Análisis Multivariante
Análisis Multivariante 14
Análisis Multivariante - ACP
Como p-valor<0,05 rechazamos H0
Variables correlacionadas
ANÁLISIS DE COMPONENTES PRINCIPALES
Prueba de Bartlett contrasta:
Variables incorreladas
Variables correladas
* Como las variables tienen distintas unidades de medida basamos el ACP en la matriz de correlaciones.
Análisis Multivariante 15
Análisis Multivariante – ACP (II)
SPSS extrae una componente principal:
• Varianza total explicada por 1ª CP = 78, 796 % > 75%
• Al basar el análisis en la matriz de correlaciones:
Selecciona las CP los
Análisis Multivariante 16
Análisis Multivariante – ACP (III)
Tasa.Natalidad, Mort.Infantil, Esper.Vida.Hom y Esper.Vida.Muj están muy bien explicadas por la 1ª Componente Principal
Tasa. Mortalidad y PNB no están tan bien explicadas por la CP.
•ESPER.VIDA.HOM = 0,983 C₁•ESPER.VIDA.MUJ = 0,987 C₁•PNB = 0,709 C₁
Relacionadas positivamente
Relacionadas negativamente
•TASA.NATALIDAD = -0,905 C₁•TASA.MORTALIDAD = -0,742 C₁•MORT.INFANTIL = -0,957 C₁
C₁ = NIVEL DE DESARROLLOC₁ = NIVEL DE DESARROLLO
Análisis Multivariante 17
Resumen y limitaciones• Todas las variables están correlacionadas a excepción de TASA.NATALIDAD y TASA.MORTALIDAD y TASA.MORTALIDAD Y PNB. Esto implica que tiene sentido realizar un Análisis de Componentes Principales.
• ACP: Seleccionamos una componente principal que explica el 78% de la variabilidad total.
• Tasa.Natalidad, Tasa. Mortalidad y Mort.Infantil están relacionadas negativamente con la primera componente principal. Y, Esper.Vida.Hom, Esper.Vida.Muj y PNB están relacionadas de forma positiva con la primera componente.
• Con la primera componente principal podemos medir el nivel de desarrollo de un país.
LIMITACIONES: • Para las variables Tasa. Mortalidad y PNB, la proporción de variabilidad explicada por la primera componente principal es mucho menor que para las demás variables.
Si pudiéramos seleccionar una segunda componente principal, tal vez podríamos explicar mejor estas dos variables.
• En la parte de Análisis Bivariante, observamos que las relaciones de algunas variables no parecen lineales, con lo que también podríamos plantearnos transformar las variables para realizar el análisis.