Download - Dr. Luis Carlos Silva Ayçaguer Investigador Titular

TALLER DE ESTADÍSTICA BAYESIANA Y SUS APLICACIONES EN LA EVALUACIÓN DE MEDICAMENTOS: HACIA UN NUEVO PARADIGMA INFERENCIAL

Dr. Luis Carlos Silva AyçaguerInvestigador Titular

Aumentar los conocimientos de los Farmacéuticos de Atención Primaria acerca de la Estadística Bayesiana, y como consecuencia de ello, mejorar los conocimientos a la hora de interpretar el análisis estadístico de ensayos clínicos y otros tipos de estudio

OBJETIVO GENERAL

1.Fundamentar la conveniencia de contar con un nuevo paradigma para la inferencia estadística.

2.Introducir las líneas fundamentales del razonamiento bayesiano.

3.Ilustrar el empleo del enfoque bayesiano como alternativa al clásico para encarar algunos problemas prácticos de la evaluación de fármacos.

OBJETIVOS

• Métodos de inferencia estadística. Valoración crítica

• Fundamentos de la Estadística Bayesiana. Estimación y ensayos clínicos

• Aplicabilidad de la estadística Bayesiana a los estudios con medicamentos. Dos ilustraciones.

TEMAS

Valores p y pruebas de significación

Si comenzamos con certezas terminaremos con dudas; pero

si comenzamos con dudas y somos pacientes con ellas, terminaremos con certezas.

Francis Bacon

INFERENCIA ESTADÍSTICA

A principios de siglo los anécdotas clínicas poblaban las revistas médicas

¿Qué significaban los resultados?EDITORES

¿Cómo cuantificar la evidenciay complementar los razonamientos

verbales?

Ronald Fisher

(Londres, 1890-Australia, 1962)

Aportes a la estadística:

• análisis de la varianza

• principio de la aleatorización

• idea de la replicación

INFERENCIA ESTADÍSTICA

Fisher (década de los 20) Ho: d=0

Se observa 0d

Medida de la discrepancia de los datos con la hipótesis, llamada a tener un papel informal (no especificado), junto con el resto de la información, en el flujo inferencial

)( 00 HddPp

Deconstrucción : “Desmontaje de un concepto o de una construcción intelectual por medio de su análisis, mostrando así contradicciones y ambigüedades”.

Diccionario de la Real Academia Española

Valoración crítica de los valores “p” y

las pruebas de significación

Rozeboom WW (1997) Good science is abductive, not Rozeboom WW (1997) Good science is abductive, not hypothetico-deductive. En LL Harlow, SA Mulaik, & JH hypothetico-deductive. En LL Harlow, SA Mulaik, & JH Steiger (Eds.), What if there were no significance tests? Steiger (Eds.), What if there were no significance tests? (pp. 335–391). Hillsdale, NJ: Erlbaum.(pp. 335–391). Hillsdale, NJ: Erlbaum.

“Las PSE constituyen con toda seguridad Las PSE constituyen con toda seguridad el más idiota proceder jamás el más idiota proceder jamás institucionalizado en el entrenamiento institucionalizado en el entrenamiento maquinal de los estudiantes de cienciamaquinal de los estudiantes de ciencia”

Transposición de condicionantesTransposición de condicionantes

P(H|D) = P(D|H)

)Pr( 00 HdDp

FalaciaFalacia

“Normas para la presentación de comunicaciones libres a premio al mejor trabajo” del XIII CONGRESO NACIONAL DE MEDICINA en Argentina del año 2003

Las abreviaturas y siglas en tablas y figuras, deben aclararse en las leyendas respectivas, pero NS (no significativo), ES (error estándar), DS (desvío estándar), IC95 (intervalo de confianza del 95 %) y p (probabilidad de que la hipótesis nula sea cierta) no requieren aclararse.

Es importante que los investigadores sean precavidos con la potencia de sus experimentos; no solo han de poder detectarse los efectos buscados, sino que también debe evitarse la detección de pequeños efectos triviales.

Rossi JS (1997) A case study in the failure of psychology as a cumulative science: The spontaneous recovery of verbal learning. En L. L. Harlow, S. A. Mulaik, & J. H. Steiger (Eds.), What if there were no significance tests? (pp. 175–197). Hillsdale, NJ: Erlbaum.

Sacket (1979)

Las muestras demasiado pequeñas pueden servir para no probar nada, las muestras demasiado grandes pueden servir para no probar nada.

“En lo que concierne al tamaño muestral, es concebible que las diferencias en homeostasis de la glucosa y en la distribución de tejido adiposo entre los grupos pudiera haber sido detectadas con un tamaño de muestra mayor”. (Bitnun, 2003)

“Se tomaron mediciones de la RVIP, pero no mostraron efectos de la ingestión de agua; sin embargo, no podemos descartar la posibilidad de que se hubieran detectado cambios con un tamaño de muestra mayor”. (Neave, Scholey, Emmett, Moss, Kennedy y Wesnes, 2001)

En la medida de lo posible, cuantifique los hallazgos y presente los mismos con los indicadores apropiados de error o de incertidumbre de la medición (como los intervalos de confianza).

Se evitará la dependencia exclusiva de las pruebas estadísticas de verificación de hipótesis, tal como el uso de los valores P, que no aportan ninguna información cuantitativa importante sobre la magnitud del efecto.

Comité Internacional de Directores de Revistas Comité Internacional de Directores de Revistas

Médicas Médicas (Grupo de Vancouver) oct (Grupo de Vancouver) oct 20082008

Es natural que se aspire a contar con un procedimiento inferencial que tenga los siguientes rasgos (ninguno de los cuales, como se ha dicho, está presente en la teoría frecuentista de las pruebas de hipótesis):

Que cuanto mayor sea el tamaño muestral, con más elementos se cuente para valorar adecuadamente la realidad que esa muestra representa.

Que valore la credibilidad o verosimilitud de las hipótesis en lugar de obligarnos a adoptar decisiones dicotómicas sobre ellas.

Que no parta de una supuesta orfandad total de información; que el modelo de análisis contemple de manera formal el conocimiento previo y la experiencia precedente

Que no desdeñe nunca el resultado de un estudio y otorgue a los datos la importancia que tienen, cualquiera sea el tamaño muestral

Que contemple las hipótesis rivales a la luz de los datos y no éstos a la luz de una única hipótesis

Estimación de un porcentaje P por MSA

n

a

n

ap

N

npq

e )96.1(

n=400 a=38

],[ epep

A

P= A/N = ?

p=16,8% e=3,7

Intervalo de confianza

(13,1 – 27,0)

http://dxsp.sergas.es/

http://dxsp.sergas.es/

EPIDAT 4EPIDAT 4

http://lcsilva.sbhac.net

Poblaciónde adictos

Muestra

Met

Her

No mej

Mejoran

No mej

Mejoran

tiempo

Ensayo controlado aleatorizadoEnsayo controlado aleatorizado

azar

50

23

27

8

19

HOLANDA Metadona Heroína

Éxito 24 55

Fracaso 52 43

Total 76 98

% éxito 31% 56%

I de Conf 21- 41 46 - 66

a=24, b=52 a=55,b=43

ANDALUCÍA Metadona Heroína

Éxito 8 19

Fracaso 15 8

Total 23 27

% de éxito 35% 74%

Int de Conf 15 - 54 53 - 88

Andalusian trial:

Dutch information

θ1 θ2

a b a b

No use 1 1 1 1

Partial use 11,0 8,6 4,8 10,4

Full use 55,0 43,0 24,0 52,0

Non parametric distribution of success rates differences between the experimental and control groups for the three possible scenarios (without using the Dutch data in order to determine the priors with partial and total use)

0

500

1000

1500

2000

2500

3000

3500

4000

4500

-0,10

0

-0,05

0

0,00

00,

050

0,10

00,

150

0,20

00,

250

0,30

00,

350

0,40

00,

450

0,50

00,

550

0,60

0

Class

Fre

qu

en

cy

Jeffrey

Partial

Full

the probability of success in the experimental group is higher than in the control group. In the last two cases, the whole distributions are located to the right of the zero, above the 6% level; in the first one, the distribution includes a very small fraction of the negative semi axis. The 95% probability intervals for the difference and probabilities of Δ >0 and Δ >0,15 are:

Dutch information

P(Δ>0) P(Δ>0.15) Probability Interval (95%)

No use 0.994 0.926 8.0 - 57.6

Partial use 0.998 0.934 9.9 - 50.4

Full use 1.000 0.965 13.9 - 39.3

Asignación aleatoria adaptativa en un ECC

Tratamiento A

N= número total de sujetos

Tratamiento B

1/2 1/2

Sra Pérez, tengo 2 posibles tratamientos para su cáncer: A y B, pero yo no sé cuál es mejor. Yo podría incluirla en un ensayo clínico concebido para evaluar cuál de dichos tratamientos es mejor. Si Ud está de acuerdo en participar, el que le apliquemos a Ud. será seleccionado mediante el lanzamiento de una moneda.

N= número máximo de sujetos

kAB

kAB

kAB

B PP

P

)()(

)(Pr

donde

N

nk

2

modulador

BA Pr1Pr

Y donde n es el número de sujetos ya asignados

Sujeto n+1

Asignación aleatoria adaptativa en un ECC

BPr

Tratamiento A Tratamiento B

Tratamiento A

Por ejemplo, si n=42 y hasta ese momento se tiene que

Tratamiento B

62,0)23,0()77,0(

)77,0(

)()(

)(Pr

42,042,0

42,0

k

ABk

AB

kAB

B PP

P

42,0200

84kEl modulador será:

Asignados=14

Exitos=4

Asignados=28

Exitos=11

y 77.0ABP

De modo que:

38,0Pr A

N=200

Paciente

Pro

bab

de

reci

bir

un t

to s

uper

ior

Ilustración de las probabilidades de asignación aleatoria adaptativa a lo largo de un ECC usando modulador n/2N

A:16/62B:36/82

Sra Pérez, tengo 2 posibles tratamientos para su cáncer: A y B, pero yo no sé cuál es mejor. Yo podría incluirla en un ensayo clínico concebido para evaluar cuál de dichos tratamientos es mejor. Si Ud está de acuerdo en participar, el que le apliquemos a Ud. será seleccionado al azar a través de un programa informático que se basa en los datos que nosotros tengamos hasta el momento acerca de cuán bien estos 2 tratamientos hayan funcionado con pacientes anteriormente tratados en este estudio.

Tratamiento A Tratamiento B

Editorial Díaz de Santos

Madrid, 2008

Luis Carlos Silva AyçaguerInvestigador Titular

Centro Nacional de Información de Ciencias Médicas (INFOMED)

[email protected]:http://lcsilva.sbhac.net