Post on 07-Mar-2015
Bioestadística Aplicada I
NMRCD – Programa GEISUPCH – FASPA
ABE Perú
Variables tiempo-para-evento: Justificación
Estudios de cohortes
Tasas de incidencia
Observaciones “censuradas” y cambio en el riesgo a través del tiempo
Kaplan-Meier y tablas actuariales
Justificación:
Que concluimos sobre el riesgo de comenzar a fumar si observamos que la proporcion de sujetos mayores de 40 años que fumaron alguna vez es igual en Lima e Iquitos?
Y que concluimos si la edad promedio al comenzar a fumar es igual entre dos muestras de personas mayores de 40 que alguna vez fumaron de Lima e Iquitos?
En general, que NO podemos concluir al analizar estos dos datos por separado?
Usando gráficas:
0 40
0 40 0 40
0 40
Que nos dice esto?
Comúnmente es importante estudiar en forma combinada tanto la frecuencia de la
ocurrencia de un evento, así como el tiempo en que el evento ocurre (aunque esto se mide sólo en algunos sujetos,
particularmente en aquellos en los cuales el evento ocurrió)
Cohorte: Un grupo de individuos con una característica
común seguido en el tiempo para observar la ocurrencia de un evento o condición
Al inicio del periodo de observación los sujetos deberán estar libres de la condición que se espera observar
0 40
Limeños mayores de 40 años han fumado alguna vez o no?
La situación mas general:
Tiempo calendario01/02 04/02 07/02 10/02 01/03 04/03
Sujetos
A
B
C
D
E
Sano
Con enfermedad
Duracióndel estudio
Estudio de Cohortes: Comparación de la ocurrencia del evento en
dos o mas “cohortes” definidas por características mutuamente excluyentes
Esta característica usualmente es la exposición (si/no) a un factor que incrementa o reduce el riesgo de la condición
Llamados también estudios longitudinales
Estudio de cohorte (esquema):
TiempoPoblación
InicialPoblación
Final
Eventos
Fin del seguimiento
Tasa o densidad de incidencia: Numero de eventos / Tiempo en riesgo, varía de
0 a infinito
Expresa “velocidad” de ocurrencia, no la probabilidad de ocurrencia
Resume el riesgo en un sólo indicador
Unidades de tiempo definidas por el analista
Supuestos:- exposición no tiene efecto acumulativo- riesgo es uniforme en el tiempo
¿Cuando se cumplen estos supuestos?
Eventos “aleatorios” a través del tiempo, el riesgo no cambia en el tiempo
El riesgo no tiene “memoria”, no depende de la última vez que hubo un evento
Algunos ejemplos: Picaduras de animales ponzoñosos
Accidentes de tránsito
Algunas enfermedades infecciosas en las que el riesgo no se acumula en el tiempo (TB, HIV)
No se aplica a la mayoría de enfermedades crónicas o degenerativas
Ejemplo:
0 10 20 30 0 10 20 30
Lima Iquitos
1530+15+2520+20
20+1020+20+15+15
(1+1+1) / (15+30+15+25+20+20)3 / 125 = 0.024 (riesgo anual 2.4%)
(1+1) / (20+10+20+20+15+15)2 / 100 = 0.020 (riesgo anual 2.0%)
Cuando llega a haber un evento, el tiempo en riesgo (denominador) sólo se cuenta hasta que ocurre el evento
Describiendo las tasas:
. cii 125 3, poisson
-- Poisson Exact --
Variable | Exposure Mean Std. Err. [95% Conf. Interval]
-------------+-------------------------------------------------------------
| 125 .024 .0138564 .0049501 .070122
. cii 100 2, poisson
-- Poisson Exact --
Variable | Exposure Mean Std. Err. [95% Conf. Interval]
-------------+-------------------------------------------------------------
| 100 .02 .0141421 .0024267 .0722176
Comparando las tasas:. iri 3 2 125 100
| Exposed Unexposed | Total
-----------------+------------------------+----------
Cases | 3 2 | 5
Person-time | 125 100 | 225
-----------------+------------------------+----------
| |
Incidence Rate | .024 .02 | .0222222
| |
| Point estimate | [95% Conf. Interval]
|------------------------+----------------------
Inc. rate diff. | .004 | -.0348053 .0428053
Inc. rate ratio | 1.2 | .1374607 14.37037 (exact)
Attr. frac. ex. | .1666667 | -6.274809 .9304124 (exact)
Attr. frac. pop | .1 |
+-----------------------------------------------
(midp) Pr(k>=3) = 0.4340 (exact)
(midp) 2*Pr(k>=3) = 0.8679 (exact)
Preparando los datos:tiempoevento es una variable que es igual a la edad a la que fumó por primer vez (si fumó) o a la edad actual si es que nunca fumo. Hay que tener cuidado con los valores perdidos
generate tiempoevento= p59 if p59!=88replace tiempoevento= inf_edad if (p58==4)
fumo es una variable que toma el valor 0 si la persona nunca fumó en su vida ó 1 si fumó alguna vez
generate fumo= (p58!=4) if p58!=.
Aplicando a nuestro ejemplo:
Tasas de incidencia estratificadas:
Calculando riesgos relativos:Primero codifique el sexo como 1=hombre y 0=mujer
generate sexo=(inf_sexo==1) if inf_sexo!=.
Evaluemos si el inicio del consumo de cigarrillos difiere
entre regiones
Porqué no usamos tasas siempre?
Porque el riesgo no siempre es uniforme en el tiempo: cancer, divorcio, SIDA
Las tasas no consideran cuando ocurren los eventos, pero con frecuencia nos interesa analizar (“modelar”) en que momento ocurren los eventos o hay mas riesgo
Cuando el riesgo no es uniforme en el tiempo, la existencia de datos censurados afecta nuestras estimaciones
Análisis de sobrevivencia: Calcula la proporción (rango 0-1) de sujetos que
“sobreviven” sin presentar el evento en intervalos de tiempo sucesivos. El complemento de esta proporción es la incidencia acumulada del evento
El análisis de sobrevida permite analizar como cambia el riesgo en el tiempo
Va excluyendo del análisis a las observaciones (datos/sujetos) censuradas
Puede ser usando el momento exacto en que ocurren los eventos (método de Kaplan-Meier) o por intervalos (método actuarial)
Kaplan-Meier (método exacto): Calcula la proporción o frecuencia de
ocurrencia cada vez que hay un evento. No usa intervalos predefinidos
Aplicable si se conoce el momento exacto en que ocurren los eventos
Método mas eficiente, útil en muestras pequeñas y eventos poco frecuentes
Al no usar intervalos no hace supuestos sobre la uniformidad de los eventos
Ejemplo: Primer consumo de cigarrillos en Lima e Iquitos:
0 10 20 30 0 10 20 30
Lima Iquitos
1530+15+2520+20
20+1020+20+15+15
+: Observación incompleta, o dato “censurado”
Cálculos (solo para describir):Tmp Sujetos Eventos Prop con
eventoProp sin evento
Pro. acum sin evento
15 6 1 1/6 = 0.17 5/6 = 0.83 0.83
20 4 1 1/4 = 0.25 3/4 = 0.75 0.83*0.75
= 0.63
25 2 1 1/2 = 0.50 1/2 = 0.50 0.63*0.50
= 0.31
0 10 20 30
1530+15+2520+20
ABCDEF
Después del tiempo 15 se eliminan del análisis A y CDespués de t(20) se eliminan E/FAnálisis acaba en 25 (último evento)
Cálculos (solo para describir):Tmp Sujetos Eventos Prop con
eventoProp sin evento
Pro. acum sin evento
10 6 1 1/6 = 0.17 5/6 = 0.83 0.83
15 5 1 1/5 = 0.20 4/5 = 0.80 0.83*0.80
= 0.67
Después del tiempo 10 se elimina a B del análisisAnálisis acaba en t(15), el último evento
0 10 20 30
20+1020+20+15+15
ABCDEF
Curva de sobrevida:
Proporción que no fuma aún
0.0
0.2
0.4
0.6
0.8
1.0
1.2
0 5 10 15 20 25 30
Años
Pro
po
rció
n
Lima Iquitos
Lo primero es indicar que los datos son de tipo tiempo de sobrevivencia (survival time/st):
stset tiempoevento, failure(fumo)
Configurando los datos:
Describiendo los datos:
Proporción que aún no fuma (sobrevientes): sts graph
0.0
00.2
50.5
00.7
51.0
0
0 20 40 60analysis time
Kaplan-Meier survival estimate
0.0
00.2
50.5
00.7
51.0
0
0 20 40 60analysis time
Kaplan-Meier survival estimate
Incidencia acumulada de inicio a fumar: sts graph, failure
0.0
2.0
4.0
6
0 20 40 60analysis time
Smoothed hazard estimate
Calculando el riesgo instantáneo (hazard): sts graph, hazard
???
Riesgo instantáneo:
No es una incidencia acumulativa
Mide el riesgo sólo en quienes han sobrevivido hasta ese momento
Riesgo instantáneo = (Inc2 – Inc1) / (1 – Inc1)
Si la incidencia acumulada es grande se hace difícil de interpretar y su uso es complicado
Función de sobrevivencia (K-M):
Comparando por género:sts graph, failure by(inf_sexo)
0.0
00.2
50.5
00.7
51.0
0
0 20 40 60analysis time
inf_sexo = masculino inf_sexo = femenino
Kaplan-Meier survival estimates, by inf_sexo
Pruebas estadísticas:
Evaluemos mediante el método de Kaplan-Meier si el inicio del consumo de cigarrillos difiere
entre regiones
Tablas actuariales (intervalos): Se usa cuando no se conoce el momento exacto
en que ocurren los eventos
Calcula la proporción de ocurrencia cada cierto intervalo definido durante el análisis
Método menos eficiente y comparable a Kaplan-Meier principalmente en muestras grandes o cuando los eventos son frecuentes
Asume que los eventos ocurren dentro del intervalo uniformemente
En Stata:
El gráfico es menos continuo:ltable tiempoevento fumo, interval(5) graph failure notab
0.2
.4.6
.8P
roport
ion F
aile
d
0 20 40 60tiempoevento
Comparando por género:0
.51
0 20 40 60 0 20 40 60
0 1
95% CI Proportion Failed
Pro
port
ion F
aile
d
tiempoevento
Graphs by s exo
Pruebas estadísticas:
Datos censurados: No se observa la ocurrencia del evento
Fin del seguimiento sin evento
Pérdidas en el seguimiento: Muerte debido a otras causas
Abandona el estudio
Sale del área o no retorna a la sede
Pérdida de elegibilidad
La incidencia acumulada simple no es útil
Análisis de datos con censura:
Ni la incidencia acumulada ni la densidad (tasa) de incidencia describen adecuadamente el riesgo
Asume que datos censurados son comparables a datos observados (censura es independiente del evento, o censura “no informativa”)