1
Índices basados en la noción de entropía (Theil y Kullback-Liebler): mortalidad neonatal en Colombia
Introducción
El estudio de las desigualdades sociales en salud ha planteado una
serie de retos a los analistas que han visto la necesidad de adoptar y adap-
tar técnicas utilizadas en otras ciencias como la economía. Dentro de ellas,
las que miden el efecto de la proporcionalidad basadas en la noción de en-
tropía, como el índice de Theil y el índice de Kullback-Liebler resultan espe-
cialmente atractivas.
La entropía es una medida de desorden: en el caso en que la salud, el in-
greso, u otra variable, se encuentren equitativamente distribuidos, la entro-
pía es máxima (no hay desigualdades, ni margen de acción para la redistri-
bución de las condiciones de salud o del bienestar económico). Si por el
contrario, hay un incremento de las desigualdades, la entropía disminuye y
aumenta la redundancia. La redundancia expresa una alta concentración y
una distribución desigual de las condiciones. Estos principio pueden aplicar-
se a la medición de las desigualdades sociales en salud1.
El objetivo de este boletín es ilustrar el uso de los índices de Theil y de Kull-
back-Liebler, y su aplicación para medir desigualdades sociales en salud,
empleando como ejemplo las cifras de mortalidad neonatal en Colombia.
Metodología
Los índices de Theil y de Kullback-Liebler, se basan en la compara-
ción de dos distribuciones empíricas de probabilidad con respecto a un
mismo dominio de clases sociales o unidades geodemográficas. Las distri-
buciones corresponden a la distribución proporcional de la población de ca-
da una de las unidades sobre la población total; y a la distribución propor-
cional de casos en cada una de las unidades sobre el total de casos. Así
cada distribución proporcional puede considerarse distribuciones de proba-
bilidad dado que los sumandos son positivos y se cumple que2:
Los índices se obtienen como variante de la comparación entre las dos dis-
tribuciones de probabilidad2.
El índice de Theil permite evaluar la magnitud de la desigualdad total que
puede atribuirse a los grupos y cual es residual (que se explica por otros
factores diferentes), dado que puede descomponerse en un Theil dentro de
grupos y un Theil entre grupos. Es decir, si la unidad geodemográficas son
los municipios, estos pueden agruparse en departamentos o regiones, la
desigualdad total entre municipios puede descomponerse como la suma de
la desigualdad entre los departamentos o las regiones y la desigualdad
dentro de dichos departamentos o regiones2. Se calcula a partir de la si-
guiente formula1:
Donde:
Si: Carga relativa de la enfermedad en el grupo i
ni: Fracción poblacional en el grupo i
El índice de Kullback-Liebler tiene la propiedad de ponderar cada diferencia
entre las dos distribuciones del logaritmo de la tasa (en base 1) de la clase
o unidad geodemográfica correspondiente haciendo que las unidades don-
de las tasas son más altas contribuyan más a la desigualdad2. Esta propie-
dad responde al principio de aversión a la desigualdad propuesta por
Wagstaff1,2. Se calcula a partir de la siguiente formula1:
Donde:
Si: Carga relativa de la enfermedad en el grupo i
ni: Fracción poblacional en el grupo i
Para cada índice existen versiones estandarizadas (Z-Theil, Z-Kullback-
Liebler) que hacen que tomen valores entre 0 y 1. Entre más se acerca a 1
mayor es la desigualdad2.
“El valor mínimo de 0 corresponde al caso en que si = ni para todo i, o sea
cuando, para todos los grupos, la carga de enfermedad en relación con la
carga total es igual a la proporción poblacional. El valor máximo de 1 se
alcanza sólo como valor límite cuando las medidas no transformadas de los
índices tienden a +∞”1.
Septiembre a octubre de 2014 Vol. 2, No. 5
Boletín Epidemiológico / MSPS, Vol. 2, No. 5 (2014)
Boletín ASIS
Análisis de Situación de Salud
Ministerio de Salud y Protección Social
2
Como propiedades estos índices no establecen directamente un vínculo
entre la condición socioeconómica y el estado de salud, por lo tanto un or-
denamiento de las unidades geodemográficas por cierto atributo socioeco-
nómico no influye en el cálculo del índice, su relevancia en la medición de
desigualdades sociales consiste en la aplicación a grupos poblacionales
socialmente definidos y su estratificación (género, pertenencia étnica, ocu-
pación, etcétera)2.
Son invariantes por cambios de escala: si se incrementa la población pro-
porcionalmente en todos los grupos, o hay un cambio en la prevalencia que
no altera sus tasas relativas, la medida de la desigualdad se mantiene
constante1.
Para hacer comparaciones entre diferentes escenario importa el número y
el tamaño de los grupos pues afectan el valor máximo que pueden tomar
los índices2.
Son fáciles de interpretar, aunque los índices basados en comparaciones
de dos distribuciones no vienen expresados en unidades de medición cono-
cidas, ni tienen interpretación inmediata, dado que no hay un referente de
normalidad de la desigualdad que indique si es grande o pequeña, la trans-
formación al intervalo 0-1 hace posible utilizarlos para hacer comparaciones
en el tiempo en escenarios similares, o para hacer comparaciones entre
diferentes variables de salud con respecto a los mismos estratos en un úni-
co escenario1.
Así mismo, en ambos casos es posible aplicar “la transformación de
“equivalencia de entropía” que permite homologar cuantitativamente la de-
sigualdad medida con cualquiera de estos índices con la de una población
dividida en dos clases. Si el “equivalente de entropía” es p, esto significa
que en tal sociedad equivalente dividida en dos clases, una de las clases,
que representa el 100×p% de la población, padece el 100×(1-p)% de la car-
ga de enfermedad, en tanto que la otra, que representa el 100×(1-p)% sólo
sufre el 100×p% de la carga”2.
Un sistema de k clases socioeconómicas con un nivel de desigualdad dado
por Z puede homologarse con un sistema de dos clases tal que1:
Donde:
Esta función es aproximadamente la inversa de:
La tabla 1 muestra varios ejemplos de esta relación de equivalencia en el
sentido de la entropía, donde Z simboliza la versión estandarizada de cual-
quiera de los tres índices2.
A medida que aumenta el valor de Z, la distribución se hace más desigual y
su potencial de redistribución se incrementa. Por ejemplo, si Z=0, entonces
p=0,50 y ello equivale a la completa igualdad de una sociedad de dos cla-
ses de igual tamaño en la que cada una sufre el 50% de la carga de enfer-
medad o muerte o posee el 50% de los recursos2.
Sin embargo, si Z=0,75, entonces p=0,13, que corresponde a una partición
en dos clases en la que el 13% de la sociedad acumula el 87% de la carga
de enfermedad o muerte (o el 87% de los recursos en salud), mientras que
el 87% restante acumula el 13% de la carga de enfermedad o muerte (o el
13% de los recursos en salud)2.
El potencial de redistribución es el porcentaje necesario para redistribuir y
alcanzar el 50% en cada clase.
Tabla 1. Equivalencia en entropía y potencial de redistribución para eliminar
la desigualdad2.
Fuente: Tomado Epidat 4.1: Ayuda de Medición de desigualdades en salud. Octu-
bre 2014.
Como se puede observar, a medida que aumenta el valor de Z la distribu-
ción es más desigual y el potencial del redistribución crece
Como se mencionó previamente, otra propiedad importante de estos índi-
ces es la capacidad de descomposición de la desigualdad intra e inter-
grupos, pero dada su densidad este aspecto se abordará en otro boletín.
Por ahora, se ilustrará el calculo de la desigualdad usando las posibilidades
que ofrece el software de distribución gratuita Epidat versión 4.1.
Boletín Epidemiológico / MSPS, Vol. 2, No. 5 (2014)
Boletín ASIS
Análisis de Situación de Salud
Ministerio de Salud y Protección Social
3
Ejemplificación
En principio es necesario contar con los datos a analizar, estos
pueden ser introducidos al programa de forma manual o automáti-
ca, para hacerlo de la segunda manera se deben disponer en una
hoja de cálculo de Excel teniendo especial atención en incluir la variable
que representa la unidad geodemográfica, la variable que representa el ta-
maño de las clases (corresponde al denominador del indicador), y las varia-
bles de salud (deben estar expresadas en tasas).
Para este ejemplo se dispusieron los datos de mortalidad neonatal para los
años 2005 a 2012 por departamento. El número de nacidos vivos, que re-
presenta el tamaño de las clases corresponde al promedio anual para los
años incluidos en el análisis.
En el modulo de medición de desigualdades incluido en Epidat 4.1,
seleccionar índices para categorías no ordenadas y posteriormente
índices basados en la comparación de distribuciones de probabili-
dad:
Aparecerá la siguiente ventana, haga clic en abrir datos para cargar
el archivo de Excel previamente organizado.
Seleccione el archivo, donde se encuentran los datos, y haga clic
en abrir:
Se cargarán las variables contenidas en el archivo, trasladelas del
campo de variables contenidas al campo de variables requeridas.
Posteriormente haga clic en aceptar:
1
2
3
5
Boletín Epidemiológico / MSPS, Vol. 2, No. 5 (2014)
Boletín ASIS
Análisis de Situación de Salud
Ministerio de Salud y Protección Social
PROVINCIA NV NEO2005 NEO2006 NEO2007 NEO2008 NEO2009 NEO2010 NEO2011 NEO2012
Antioquia 85643 9,18 8,34 8,38 8,41 7,09 7,07 7,01 6,49
Atlantico 38956 11,18 11,98 10,55 9,49 9,05 7,78 9,75 7,85
Bogota 105430 9,27 8,50 8,85 8,39 7,82 7,52 7,79 7,69
Bolivar 37295 11,12 7,95 8,20 9,50 8,11 6,17 6,88 8,34
Boyaca 17221 10,38 9,91 8,42 9,33 6,63 7,72 6,64 6,85
Caldas 10527 8,95 10,13 9,36 8,56 8,71 9,28 8,14 8,72
Caqueta 7223 13,11 11,96 11,65 15,40 10,10 8,19 9,13 6,64
Cauca 17590 11,72 9,60 10,10 10,16 11,24 9,10 8,10 9,22
Cesar 20886 10,48 10,77 10,91 11,35 10,00 9,70 8,21 9,99
Cordoba 28139 13,19 11,51 13,35 11,29 12,83 10,45 9,76 9,95
Cundinamarca 34237 9,86 8,42 8,64 8,08 7,73 6,34 7,35 8,24
Choco 6155 20,27 21,03 16,46 20,29 20,48 16,97 13,99 16,52
Huila 20759 9,29 9,06 8,77 8,95 8,33 6,79 6,20 7,35
La guajira 13230 14,94 8,98 11,57 10,45 12,91 10,44 12,31 11,02
Magdalena 23509 13,39 13,64 14,04 11,82 10,75 9,11 8,49 8,72
Meta 15613 7,98 9,81 9,17 8,69 9,20 6,55 8,09 6,85
Narino 17588 8,13 10,54 10,66 8,48 9,97 8,32 9,90 7,83
Norte de santander 20390 9,55 8,38 9,56 11,24 8,58 7,68 8,08 7,19
Quindio 5955 9,60 9,87 11,86 10,55 11,01 9,75 8,74 8,55
Risaralda 11463 10,04 8,87 10,61 8,55 6,59 6,60 6,34 5,88
Santander 31229 7,74 6,86 7,95 6,44 6,88 6,58 5,72 5,63
Sucre 15451 6,18 8,70 7,98 8,30 6,82 5,23 5,10 5,81
Tolima 19240 7,25 8,34 9,59 7,76 5,79 7,46 6,45 5,83
Valle del cauca 55874 8,17 8,32 8,22 8,68 7,11 7,09 7,11 7,35
Arauca 4135 9,64 8,55 7,35 6,62 5,74 4,90 7,01 7,37
Casanare 7108 7,24 8,07 8,33 7,97 8,80 6,96 8,14 5,02
Putumayo 4266 9,79 10,36 11,39 10,38 7,15 11,14 8,72 6,05
San andres 830 11,25 11,93 11,84 16,59 9,16 18,18 4,61 20,48
Amazonas 1453 12,64 15,07 19,85 13,55 13,32 12,68 10,23 10,24
Guainia 506 27,03 11,17 20,00 10,54 14,66 13,56 9,82 9,86
Guaviare 1239 14,27 11,20 12,16 11,31 8,33 10,37 8,53 5,65
Vaupes 575 3,58 19,20 13,21 21,04 17,80 7,92 21,90 12,89
Vichada 759 7,24 19,26 16,69 8,03 21,20 17,75 11,43 4,71
4
4
:
Seleccione las transformaciones con las que desea que aparezcan
los resultados, para el ejemplo se seleccionó la estandarización a
escala 0-1 y la transformación de equivalencia de entropía.
Seleccione también los índices a calcular, en este caso índice de Kullback-
Liebler e índice de Theil. Posteriormente haga clic en calcular:
Los resultados aparecerán en la pantalla de resultados así:
La primera parte informa sobre la estructura del archivo de daos incluido.
En este caso el las variables utilizadas,
Posteriormente se ubican los resultados:
Nótese que en los resultados de los índices estandarizados a escala 0-1 se
observa que entre 2005 y 2008 hubo una disminución de la desigualdad
medida por ambos índices. En 2009 hubo un repunte y posteriormente un
decline; aunque la disminución es pequeña en la escala estandarizada de
estos índices para ambos tramos.
Transformados a la equivalencia de entropía la distribución en el 2012 co-
rresponde a la de una sociedad de dos clases en la que el 45% de la pobla-
ción experimenta el 55% de la carga de mortalidad y el 55% de la población
experimenta el 45% de la carga de mortalidad.
El potencial de redistribución de la desigualdad es del 5%, y llama la aten-
ción que aunque las tasas de mortalidad han tendido al descenso la de-
sigualdad se ha mantenido constante.
Conclusión
El principal defecto de los índices de Theil y de Kullback-Liebler con-
siste en que no incorporan explícitamente la dimensión socioeconómi-
ca y son invariantes a ordenamientos de este tipo.
Comunicar el potencial de distribución de la desigualdad en los resul-
tados del Análisis de Situación de Salud lo constituye como herra-
mienta valiosa para la toma de decisiones en salud.
6
Boletín Epidemiológico / MSPS, Vol. 2, No. 5 (2014)
Boletín ASIS
Análisis de Situación de Salud
Ministerio de Salud y Protección Social
7
Unidades geodemográficas: 32 departamentos y el distrito capital de Bogotá
8 variables que corresponden a las tasas de mortalidad neo-natal para los años 2005 a 2012
Transformaciones indicadas
5
Bibliografía
1 Jorge Bacallao Gallestey. Indicadores basados en la noción de entropía
para la medición de las desigualdades sociales en salud. Centro de Investi-
gaciones y Referencia de Aterosclerosis de La Habana. Consultado el 4 de
noviembre de 2014. Disponible en: http://www.bvs.sld.cu/revistas/spu/
vol33_4_07/spu07407.html
2 Xunta de Galicia, Consellería de Sanidade. Servizo Galego de Saúde. Or-
ganización Panamericana de la Salud. Epidat 4.0. Ayuda de desigualdades.
Preparado por Claudia Marcela Moreno Segura.
Grupo de Análisis de Situación de Salud (ASIS).
Dirección de Epidemiología y Demografía.
Ministerio de Salud y Protección Social.
Contacto: [email protected].
Tel. 330 5000 Ext: 1742 .
Boletín Epidemiológico / MSPS, Vol. 2, No. 5 (2014)
Boletín ASIS
Análisis de Situación de Salud
Ministerio de Salud y Protección Social
Top Related