Visió general del disseny d’experiments

35
Departament d’Estadística Divisió de Ciències Experimentals i Matemàtiques Visió general del disseny d’experiments Llicenciatura de Biologia Disseny d’Experiments i Anàlisi de Dades Jordi Ocaña Rebull

description

Visió general del disseny d’experiments. Llicenciatura de Biologia Disseny d’Experiments i Anàlisi de Dades Jordi Ocaña Rebull. Contingut. Estudis de camp i estudis experimentals Planificació d’estudis en Biologia Principis de disseny estadístic - PowerPoint PPT Presentation

Transcript of Visió general del disseny d’experiments

Page 1: Visió general del disseny d’experiments

Departament d’EstadísticaDivisió de Ciències Experimentals i

Matemàtiques

Visió general del disseny d’experiments

Llicenciatura de Biologia

Disseny d’Experiments i Anàlisi de Dades

Jordi Ocaña Rebull

Page 2: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Contingut

Estudis de camp i estudis experimentals Planificació d’estudis en Biologia Principis de disseny estadístic Dissenys més habituals en l’experimentació

biològica Determinació de la grandària mostral

Page 3: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Estudis de camp i estudis experimentals

Proveu de comparar aquests dos estudis:– Agafem sengles mostres aleatòries, la primera de fumadors

passius habituals i la segona de persones que normalment estan lliures de fum de tabac. Posteriorment, mesurem el nivell de CO2 en sang de cada un d’aquests individus.

– Dividim a l’atzar una mostra uniforme de voluntaris no fumadors passius (ni actius) en dos grups. Seguidament el primer grup passa una temporada en un ambient ric en fum de tabac i l’altre no. Posteriorment, mesurem el nivell de CO2 en sang de cada un d’aquests individus.

Page 4: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Estudis de camp i estudis experimentals

1er cas: estudi de camp, 2on cas estudi exp. Des del punt de vista del disseny

d’experiments i l’anàlisi estadística: major control al segon cas, al qual:Podem assignar veritables “tractaments”

d’acord a determinat criteri (aleatòriament) Diferències d’interpretació: més fàcil parlar

de causalitat, anàlisi estadística la mateixa

Page 5: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Planificació d’estudis en BiologiaFases principals

Definició dels objectius Consideració de dissenys experimentals

alternatius i tria del més adequat Determinació de les mides mostrals

Recordeu la taula d’errors tipus I i II Generació d’un pla d’aleatorització Redacció del protocol experimental

… experimentació i anàlisi de resultats

Page 6: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Planificació d’estudis en Biologia Caràcter iteratiu d’un estudi experimental

C on c lu s ion srecom an ac ion s

A n à lis i d e ls resu lta ts

E xp erim en tac ióam b reco llid a d e resu lta ts

D issen y exp erim en ta l

A n à lis is p rè viesd ec is ió d e rea litza r l'es tu d i

Page 7: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Principis de disseny estadísticLes “peces” que formen un disseny

“Grups experimentals”:– Població de destí– Població experimental– Mostra

El pas de cada un d’aquests nivells al seu superior implica un problema d’inferència diferent

Page 8: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Principis de disseny estadísticLes “peces” que formen un disseny

M os tra

P ob lac ió exp erim en ta l

P ob lac ió d e d es tí

Inferència no estadística

Inferència estadísticaRepresentativitat:mostra aleatòria

Validesa del disseny:assignació aleatòria

de tractaments

Page 9: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Principis de disseny estadísticLes “peces” que formen un disseny

Unitat experimental: més petita unitat a la qual podem aplicar els diversos tractaments

Variable de resposta: variable aleatòria a mesurar a partir dels experiments

Factor: variable qualitativa que representa un dels tractaments o condicions experimentals que volem estudiar (o que poden influir en la resposta)– Nivells: els possibles valors d’un factor

Variable covariant o concomitant: variable quantitativa de la qual pot dependre la resposta

Page 10: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Principis de disseny estadísticConcepte de biaix i de variabilitat

biaix: desviació sistemàtica de les mesures respecte del veritable valor ( mesures acurades: no tenen biaix -o en tenen poc)

variabilitat: fluctuació aleatòria al voltant d’un valor central ( mesures precises: baixa variabilitat)

… és “pitjor” el biaix que la variabilitat

Page 11: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Principis de disseny estadísticFonts de biaix i de variabilitat

Identificació i quantificació– Revisió acurada del procés de mostratge:

població de destí i població experimental, representativitat de la mostra, …

– Revisió del procés experimental i dels criteris de mesura. El problema dels avaluadorsconveniència de dissenys “cecs”

– Proves d’uniformitat: estudis sense tractaments però tot reproduint les altres condicions

Page 12: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Principis de disseny estadísticMètodes de control del biaix i la variabilitat

Un factor del qual “sospitem”:– Pot no ser controlable ni mesurable

Aleatorització: assignació aleatòria d’unitats experimentals a condicions experimentals (tractaments)

– Pot ser controlable, es pot fer participar del disseny experimental Blocs: comparació entre tractaments solament dins grups homogenis respecte de condicions que es sospita que poden influir

– Pot ser mesurable, juntament amb la variable de resposta Fer-lo intervenir a l’anàlisi estadística

Page 13: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Principis de disseny estadísticMètodes de control del biaix i la variabilitat

“Encegament”: els “agents” (pacient, metge, estadístic, ...) que intervenen a l’experiment desconeixen el tractament aplicat a cada unitat experimental– Simple cec: p.e. pacient desconeix tractament rebut

– Doble cec: ni metge, ni pacient coneixen tractament

– Triple cec: ni metge, ni pacient, ni estadístic

Necessitat d’un “controlador”: dipositari d’informació “encegada” (també per raons de seguretat)

Page 14: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Dissenys més habituals en l’experimentació biològica

Principals dissenys:– Dissenys totalment aleatoritzats– Dissenys estratificats/blocs aleatoritzats

• Dissenys creuats (crossover)

– Dissenys jeràrquics (mal anomenats “niats”)• Dissenys split plot • Dissenys de mesures repetides

Altres qüestions: grups control, selecció dels nivells d’un factor, estudis multicentre, ...

Page 15: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Dissenys més habitualsDissenys totalment aleatoritzats

Cada unitat experimental s’assigna, a l’atzar, a exactament una condició experimental o tractament– Com a conseqüència, el “factor” individu està

niat dins cada grup de tractament– Diversos noms segons el nombre de factors:

• disseny d’un sol factor: “una via” (one-way layout)

• disseny factorial (dos o més factors) (two-way, …)– moltes condicions experimentals– replicació oculta (hidden replication)

Page 16: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Dissenys més habitualsDissenys totalment aleatoritzats

Avantatges Simplicitat Optimització del

temps de durada de l’experiment

Mínim perill de pèrdua de casos

Inconvenients Creixement multiplicatiu

del nombre de condicions Comparació entre

subjectes, no dins dels subjectes

Mobilització de molts recursos en poc temps

Page 17: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Dissenys més habitualsDissenys estratificats/blocs aleatoritzats

Primer definim blocs o estrats (col·leccions d’unitats experimentals similars)– Els “factors de bloc” sovint no interessen per

ells mateixos

Els diversos tractaments s’apliquen dins cada bloc

El procediment d’aleatorització s’aplica per separat dins cada bloc

Page 18: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Dissenys més habitualsDissenys estratificats/blocs aleatoritzats

Avantatges Més control

experimental Si bloc = individu, les

comparacions són dins dels individus

Com a conseqüència, menors mides mostrals

Inconvenients Més condicions

experimentals Dependència de les

respostes dins cada bloc

Page 19: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Dissenys més habitualsDissenys creuats (crossover)

Cas especial de blocs aleatoritzats: – els propis individus són blocs– tots els tractaments s’apliquen a cada individu,

de forma seqüencial en el temps– totes les possibles seqüències de tractaments

balancejades (totes amb el mateix nombre de casos) i individus assignats a l’atzar a cada seqüència

– període de “neteja” entre tractaments

Page 20: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Dissenys més habitualsDissenys creuats (crossover)

SeqüènciaPeríode 1 2 3 4 5 61 A B C A C B2 B C A C B A3 C A B B A C

Exemple: suposem que tenim tres tractaments A, B i C.Ens caldran 3 períodes de temps i tindrem 3!=6 seqüènciesde possibles tractaments. Si tenim 30 individus assignarema l’atzar 5 individus a cada seqüència.

Page 21: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Dissenys més habitualsDissenys creuats (crossover)

Avantatges Comparacions dins els

individus Menors grandàries

mostrals necessàries Menys recursos

utilitzats simultàniament

Inconvenients Poden resultar de més

llarga durada Major perill de dades

faltants (abandons) Perill de biaix a causa

d’efectes acumulats o interaccions entre tractaments

Page 22: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Dissenys més habitualsDissenys niats o jeràrquics

Reflecteixen la natura jeràrquica de molts sistemes biològics (i no biològics), formats per subsistemes a diversos nivells

Mostratge a diversos nivells, com ara:– Individus

• Lòbuls del fetge (dret i esquerre)– Petits lòbuls

» Cèl·lules (hepatòcits)

Cal distingir factors fixos i aleatoris

Page 23: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Dissenys més habitualsDissenys split plot

S’assignen camps, finques, ... (“plots”) a l’atzar als nivells d’un factor “primari”

S’assignen a l’atzar àrees menors (“subplots”) dins de cada camp als nivells d’un factor “secundari”

Possibles nivells inferiors de divisió (“sub-subplots”) si són àrees molt grans

Page 24: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Dissenys més habitualsDissenys split plot

bloc 1 bloc 2“Plot” (p.e.localitat)

“Subplot” 1 2 3 4 5 61 G A A A G A2 A G G G A G

Factor primari: “adob” amb tres nivells (sac groc, sac verd-oliva, sac fúcsia).Factor secundari: “tipus de rec: G=gota a gota, A=aspersió.

Page 25: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Dissenys més habitualsDissenys en mesures repetides

A partir d’un cert nivell (“individu”, “plot”) el factor niat és el temps, tenim observacions per aquell “individu” en diversos instants consecutius (això no és aleatoritzable!)

En lloc d’instants de temps podríem tenir, per exemple, diverses concentracions, dosis, etc. (no aleatoritzades)

Page 26: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Dissenys més habitualsDissenys en mesures repetides

individuinstant 1 2 3 4 5 6

12345

Dos tractaments (groc, verd oliva) assignats a l’atzar

Page 27: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Dissenys més habitualsDissenys niats

Avantatges Permeten estudiar la

variabilitat associada a cada nivell jeràrquic

Factor secundari estudiat amb més precisió que el primari (en disseny split plot)

Inconvenients Anàlisi més complexa

que, per exemple, en un disseny totalment aleatoritzat

Factor primari estudiat amb menys precisió que el secundari (en split plot)

Page 28: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Altres qüestionsGrups o tractaments control

Condició de referència (en algun sentit) Històric: dades prèvies Concurrent: obtingut al mateix estudi

– Control negatiu: manca de tractament real• Propi subjecte abans del tractament

• No tractat

• Placebo: substància inòqua que sembla tractament

– Control actiu: autèntic tractament • habitual –vs. nous tractaments estudiats

• habitual –vs. habitual + nous tractaments estudiats (càncer)

Page 29: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Altres qüestions

Selecció dels nivells d’un factor, depèn de:• objectius de l’estudi

– determinar existència d’un efecte: sovint millor 2 i prou– determinar la dinàmica d’efecte

• dinàmica subjacent (lineal, quadràtica, sigmoidea...)

Estudis multicentre– Menys durada– Dificultats de coordinació: cal protocol clar– Sovint cal fer correspondre blocs a centres, ...

Page 30: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Determinació de la grandària mostral

Sovint prevalen criteris econòmics Enfoc estadístic, dues famílies de mètodes:

– Grandària fixa, determinada abans d’iniciar l’estudi, a partir de cert criteri d’optimalitat

– Seqüencial: repetidament, una nova dada (o un grup de dades) seguida d’una anàlisi que:

• és concloent i condueix a una decisió estadística final (i parem el mostratge)

• o bé a la necessitat d’obtenir una nova dada.

Page 31: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Determinació de la g. mostralDisseny al qual aplicaríem la t de Student

Situació: disseny totalment aleatoritzat, estudi d’un factor amb solament dos nivells.– (p.e. Volem comparar dos tractaments respecte

de certa variable fisiològica, assignem a l’atzar individus a cada tractament, posteriorment farem una prova t de comparació de mitjanes.)

Quants individus hem d’assignar a cada grup?

Page 32: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Determinació de la g. mostralDisseny al qual aplicaríem la t de Student

Suposem per un moment que és veritat que les mitjanes són diferents (H1 és certa).

En aquest cas la decisió correcta és rebutjar H0. Si no ho fem s’ha produït un error de tipus II.

La probabilitat que es produeixi aquest error depèn de les grandàries mostrals, de la veritable diferència de mitjanes, de ,...

Page 33: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Determinació de la g. mostralCorba característica d’operació del test t

Una corba per cada n*=2n-1 (suposem n1=n2=n)

Ordenades: probabilitat d’error de tipus II

Abscisses: valor d amb:

2221

d

Page 34: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Determinació de la g. mostralUtilització de la corba característica d’op.

Decidim el valor a partir del qual “val la pena” detectar diferències amb “seguretat”– p.e. suposem que és =0.5 a l’exemple

Decidim què vol dir “seguretat”– p.e. suposem que és 5% de prob. d’error II

Com que és desconegut, procurem proposar-ne un valor (p.e. estimació)– p.e. de prova pilot prèvia 25.0ˆ

Page 35: Visió general del disseny d’experiments

Visió general del disseny d’experiments

Departament

d’Estadística

Determinació de la g. mostralUtilització de la corba característica d’op.

Tot això ens porta a

Si observem les corbes c.o., n*=16 permet un 5% de prob. d’error de tipus II,

Per tant 16=2n-1 n=9: caldria assignar 9 individus a cada grup experimental (tractament).

125.02

5.0

d