Taller Análisis de Datos...

40
Taller Análisis de Datos Multinivel Sergio R. Muñoz, Ph.D. CIGES & Departamento Salud Publica Facultad de Medicina Universidad de La Frontera [email protected] 12-25 de Mayo, 2012

Transcript of Taller Análisis de Datos...

Page 1: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

Taller Análisis de Datos Multinivel

Sergio R. Muñoz, Ph.D. CIGES & Departamento Salud Publica

Facultad de Medicina Universidad de La Frontera

[email protected] 12-25 de Mayo, 2012

Page 2: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

Ejemplos

• Datos

– Pacientes en clínicas

– Familias en vecindarios

– Individuos en familias en vecindarios

• Estructura jerárquica o anidada

– Niveles

• Inferencia

– Pérdida de independencia

– Ignorar jerarquía Consecuencias segun sea la pregunta a responder

Page 3: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

Se desea determinar si la adherencia a un programa de salud depende de los años de

educación formal de las personas

• Evaluaciónón a nivel de:

– Individuos (2000)

– Familias (600)

– Comunidades (12)

• Análisis: en que nivel?

• Análisis estadístico tradicional focalizado en un nivel

Page 4: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

• Comunidades

– Datos: Promedio de años de educación y porcentaje de adherencia al programa para cada comunidad.

– Regresión con 12 observaciones

– Pérdida de información

Page 5: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

• Familias – Datos: Promedio de años de educación y

porcentaje de adherencia al programa para cada familia

– Regresión con 600 datos

– La variación entre comunidades puede ser modelada incorporando términos para cada comunidad

– Pérdida de información

– Procedimiento de estimación ineficiente (incorpora muchos parámetros en el modelo, IA)

Page 6: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

• Individuos – Datos individuales de años de educación y de

adherencia al programa

– Regresión con 2000 datos

– La variación entre familias puede ser modelada incorporando términos para cada comunidad. Alternativamente puede pensarse en ajustar por efecto de diseño si se piensa en que la muestra fue por conglomerados

– La variación entre comunidades puede ser modelada incorporando términos para cada comunidad

– No hay pérdida de información

– Procedimiento de estimación ineficiente (incorpora demasiados parámetros en el modelo, IA)

Page 7: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

Definición de Niveles y Análisis Estadístico

• Macro niveles

• Micro niveles

• Factores composicionales (individuales)

• Factores de Contexto (grupales)

• Modelos Multinivel

• Modelos de efectos aleatorios

• Modelos de coeficientes aleatorios

• Modelos jerárquicos

• Modelos de componentes de varianza

• Inferencia acerca de la variación entre contextos en la población usando una muestra al azar de contextos

Page 8: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

Análisis Multinivel

• Permite estudiar el efecto simultáneo de características individuales como colectivas, y sus interacciones, sobre una respuesta en individuos

Page 9: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

Datos

j i Yij Xij

1 1 5 1

1 2 7 3

2 1 4 2

2 2 6 4

3 1 3 3

3 2 5 5

4 1 2 4

4 2 4 6

5 1 1 5

5 2 3 7

Page 10: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

Gráfico de puntos

Page 11: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

Regresión a nivel micro (total) Yij=5.33 - .33*Xij + eij

Page 12: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

Regresión entre grupos eX*0.10.8Y j.j.

Xij

Fitted values

0 1 2 3 4 5 6 7 8

0

1

2

3

4

5

6

7

8

Page 13: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

Regresión dentro de los grupos e)XX(0.1YY j.ijj.ij

Xij

Fitted values

0 1 2 3 4 5 6 7 8

0

1

2

3

4

5

6

7

8

Page 14: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

Xij

Fitted values

0 1 2 3 4 5 6 7 8

0

1

2

3

4

5

6

7

8

Total

Entre

Dentro

Resumen

Page 15: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis
Page 16: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

Modelo Multinivel (MMn)

• Respuesta puede expresarse como una función de la relación entre y dentro de los grupos

eXX

eXXX

eXXYY

ijj

ijijij

ijijjij

*0.1*0.20.8

)(*0.1)*0.10.8(

)(*0.1

.

.

Page 17: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

Caso: Individuos anidados en conglomerados

• Opcion 1: Ignorar pertenencia a los grupos

• Enfasis: Variabilidad entre los individuos y/o en los atributos a nivel de individuos

• Problema: – Violación del supuesto de independencia entre

las observaciones

– EE incorrectos

– Estimadores ineficientes

Page 18: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

Caso: Individuos anidados en conglomerados (2)

• Opcion 2: Usar datos a nivel de grupo

• Enfasis: Variabilidad entre grupos

• Problema:

– Ignora la estructura jerárquica de los datos

– Pérdida de informacion

– Ignora el papel del nivel individual en el estudio de la variable de respuesta

• Opciones 1 y 2 usan solo variables de un nivel ignorando la estructura de los datos

Page 19: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

Caso: Individuos anidados en conglomerados (3)

• Opcion 3: Definir distintos modelos para cada grupo

• Enfasis: Coeficientes difieren de grupo en grupo

• Problema: – No examina el efecto grupal en la respuesta de

nivel individual

– No es factible cuando hay un gran número de grupos o una pequeña cantidad de observaciones en los grupos

Page 20: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

Caso: Individuos anidados en conglomerados (4)

• Opcion 4: Incluir variables indicadoras de grupo en el nivel individual

• Enfasis: Ajustar diferentes modelos a cada grupo

• Problema:

– No permite examinar el efecto de la variable grupal en la respuesta

– Asume que los grupos no estan relacionados

– Ignora el hecho de que los grupos pueden provenir de una poblacion mas grande de grupos

Page 21: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

MMn

• Permite la evaluación simultánea de los efectos a nivel individual y grupal

• Considera la no independencia de las observaciones al interior de los grupos

• Los grupos no se tratan como no relacionados, pero son vistos como provenientes de una gran población de grupos

• Se puede examinar simultáneamente la variabilidad entre individuos y entre grupos

Page 22: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

Ejemplo 2 niveles

• Estructura anidada de dos niveles

Page 23: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

Ejemplo 3 niveles

Page 24: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

Preguntas de Investigación

1. Hay diferencia en el progreso de los estudiantes hombres comparado con el de las mujeres?

2. Hay variación entre las escuelas en la brecha de progreso entre hombres y mujeres?

3. La variabilidad del progreso es distinta entre hombres y mujeres?

4. Cual es la variabilidad en el progreso entre las escuelas?

5. El efecto en la escuela X es distinto que el de las otras escuelas en la muestra?

6. Hay mayor variabilidad en el progreso entre las escuelas en estudiantes con bajo puntaje inicial?

7. Hay mas progreso en estudiantes de escuelas privadas comparado con las publicas?

8. El progreso de los estudiantes de escuelas publicas es menos variable?

9. Las mujeres presentan mayor progreso en las escuelas estatales?

Page 25: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

Ejemplo 3 niveles: Diseño de corte transversal en el tiempo (estudiantes dentro de cohortes dentro de

escuelas)

Page 26: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

4 niveles

Page 27: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

Que se modela?

1. Hay diferencia en el progreso de los estudiantes hombres comparado con el de las mujeres?

2. Hay variación entre las escuelas en la brecha de progreso entre hombres y mujeres?

3. La variabilidad del progreso es distinta entre hombres y mujeres?

4. Cual es la variabilidad en el progreso entre las escuelas?

5. El efecto en la escuela X es distinto que el de las otras escuelas en la muestra?

6. Hay mayor variabilidad en el progreso entre las escuelas en estudiantes con bajo puntaje inicial?

7. Hay mas progreso en estudiantes de escuelas privadas comparado con las publicas?

8. El progreso de los estudiantes de escuelas publicas es menos variable?

9. Las mujeres presentan mayor progreso en las escuelas estatales?

Page 28: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

Otros ejemplos de 2 niveles

• Medidas repetidas en el tiempo

• Datos de panel

• Encuestas multietapicas

• Estudios de intervención donde la intervención es a nivel grupal.

Page 29: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

Medidas repetidas en el tiempo

Page 30: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

Estudio experimental por grupo

Page 31: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

Estrategia de Modelamiento

• Modelo a 1 nivel para la media

),0(

,.....,3,2,1

2

0

0

0

Ne

residuoYe

nieY

i

ii

Y

ii

Page 32: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

MMN para 2+ promedios

gruponivelresiduoY

YjgrupomedialaesYSi

individualresiduoYe

globalmedia

donde

gruponivelJj

sujetonivelnieY

jj

jjj

jijij

jijjij

0

0

0

0

0

)(

:

,...2,1

,...2,1

),0(

),0(

2

2

N

Ne

j

eij

Modelo de componentes de varianza: Varianza dentro y varianza entre grupos

Page 33: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

Coeficiente de partición de varianza

• CPV equivale al coeficiente de correlación intraclase en el caso de un MMN simple.

• Si el CPV es 0.2, podríamos decir que el 20% de la variación es entre grupos y que el 80% es dentro de los grupos.

• La correlación entre pares de individuos seleccionados al azar de un mismo grupo es de 0.2.

22

2

e

CPV

Page 34: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

Prueba para efecto de grupo

• La hipótesis de nulidad es H0: σ2µ=0

• LRT (prueba de razón de verosimilitud) LRT=-2{log(L1) – log(L2)} ~ χ2(p)

Page 35: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

MMn para 2 niveles

• Modelo:

– Sistema de ecuaciones bi-etápico

– La variabilidad dentro del grupo es explicada por una ecuación a nivel individual

– La variabilidad entre grupos en los coeficientes especificos de grupo es explicada por una ecuación a nivel de grupo

Page 36: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

Planteamiento del Modelo

• J grupos con Nj individuos en cada grupo

• Yij variable de respuesta en el individuo i del grupo j (j= 1,…, J; i= 1, Nj)

• Xij variable explicatoria a nivel individuo

• Zj variable explicatoria a nivel de grupo

• Para cada grupo tenemos una regresión

• Los son modelados por la var expl del grupo

ijijj1j0ij X*Y

j1j1110j1

j0j0100j0

Z*

Z*

Page 37: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

Ilustración

2

ijijijj1ojij ,0N~X*Y

1 predictor a nivel individual y 1 predictor a nivel grupal

1era Etapa

Respuesta individuo i

en grupo j

Var explicatoria nivel

individual en individuo i

en grupo j

Independientes

dentro de cada grupo

2da Etapa: Coef de regresión especifico para cada grupo es modelado

Como una función de la variable de nivel grupal

10j1j0

11j1j1j1110j1

00j0j0j0100j0

,Cov

,0N~Z*

,0N~Z*

Var explicatoria nivel grupal

Page 38: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

Interpretación

• 0j mide la desviación del intercepto del grupo en relación al intercepto global 00 ajustado por el efecto de la variable grupal

• 1j mide la desviación de la pendiente del grupo en relación a la pendiente global 11 ajustado por el efecto de la variable grupal

• 01 representa la covarianza entre interceptos y pendientes

Page 39: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

Resumen

• MMn resume la distribución de los coeficientes específicos de grupo en:

– Una parte fija que es constante a traves de los grupos ([00 ,01] para interceptos y [10 ,11] para pendientes)

– Una parte aleatoria (0j para intercepto y ij para pendiente) que puede variar de grupo en grupo

– Supuesto: macro-errores 0j y ij son independientes del nivel de error individual ij

Page 40: Taller Análisis de Datos Multinivelupchmed.pe/red_cochrane_peru/wp-content/uploads/2012/09/Taller_3... · demasiados parámetros en el modelo, IA) Definición de Niveles y Análisis

Taller Análisis de Datos Multinivel

Sergio R. Muñoz, Ph.D. CIGES & Departamento Salud Publica

Facultad de Medicina Universidad de La Frontera

[email protected] 12-25 de Mayo, 2012