Post on 24-Feb-2016
description
1
Departament d’EstadísticaDivisió de Ciències Experimentals i
Matemàtiques
Dissenys factorialsdos o més factors creuats
Llicenciatura de BiologiaDisseny d’Experiments i Anàlisi de Dades
Jordi Ocaña Rebull
Dissenys factorials creuats 2
Departament
d’Estadística
Dissenys factorials creuatsContingut:
Dos factors fixos creuats– Model, mitjanes i estimació dels paràmetres– Sumes de quadrats i ANOVA– Cas d’una rèplica per casella– Blocs en dissenys multifactorials
Models o dissenys amb factors aleatoris– 2 factors aleatoris
• components de la variància, correlació intraclàssica• Sumes de quadrats i ANOVA
– Models mixtos: 1 factor fix, 1 factor aleatori
Dissenys factorials creuats 3
Departament
d’Estadística
Disseny de dos factors creuats: estructura de les dades
Disseny no balancejat de dos factors, A i B, amb a i b nivells respectivament):
Si és balancejat,
11 1
1
1
1 111 11 1 1 1
11 1 1
, , , ,
, , , ,
b
a ab
b
n b bn
a a a n ab abn
B BA y y y y
A y y y y
per tot 1, , i 1, , ijn n i a j b
Dissenys factorials creuats 4
Departament
d’Estadística
Disseny de dos factors creuats: model lineal
1 1
1 1
2
per 1, , , 1, , i 1,
0, 0,
0 per 1, i 0 per 1, ,
0, var
ijk i j ij ijk
ij
a b
i ji j
b a
ij ijj i
ijk ijk
Y e
i a j b k n
i a j b
E e e
Dissenys factorials creuats 5
Departament
d’Estadística
Fertilitzant*VarietatDades de l’exercici 13 de dissenys multifactorials
Varietat Fertilitzant
A B C D
1 35 26 38 20
45 39 39 43
24 23 36 29
55 48 39 49
2 55 44 68 64
64 57 62 61
58 74 49 69
68 61 60 75
3 97 89 92 99
93 91 82 98
89 98 85 87
82 78 89 92
Dissenys factorials creuats 6
Departament
d’Estadística
Disseny de dos factors creuatsSumes, mitjanes i estimació de paràmetres
........
.............
......
1 1 1...
..
1.
....
1 1..
....
1 1..
ˆ
ˆˆˆ
,,1,,1
,,1
,,1
YYYY
YYYYY
abnYYYY
bjai
nY
YYY
bjanY
YYY
aibnYYYY
jiijij
jjii
a
i
b
j
n
kijk
ijij
n
kijkij
jj
a
i
n
kijkj
ii
b
j
n
kijki
Dissenys factorials creuats 7
Departament
d’Estadística
Disseny de dos factors creuatsDescomposició de la suma de quadrats
...)1(
...)1)(1(
...1
...1
...1
2
1 1 1.
2
1 1........
2
1.....
2
1.....
2
1 1 1...
lldgnabYYSS
lldgbaYYYYnSS
lldgbYYanSS
lldgaYYbnSS
lldgabnSSSSSSSSYYSS
a
i
b
j
n
kijijkE
a
i
b
jjiijAB
b
jjB
a
iiA
EABBA
a
i
b
j
n
kijkT
Dissenys factorials creuats 8
Departament
d’Estadística
Disseny de dos factors creuatsQuadrats mitjans i esperances
2
1 1
2
2
1
2
2
1
2
2
)1(
)1)(1()1)(1(
11
11
EE
E
a
i
b
jij
ABAB
AB
b
jj
BB
B
a
ii
AA
A
MSEnab
SSMS
ba
nMSE
baSSMS
b
anMSE
bSSMS
a
bnMSE
aSSMS
Dissenys factorials creuats 9
Departament
d’Estadística
Disseny de dos factors creuatsContrastos sobre els paràmetres del model
És significatiu l’efecte del factor A?
És significatiu l’efecte del factor B?
És significativa la interacció?
0:0:
0:0:
0:0:
1
12110
1
210
1
210
ij
ab
j
b
i
a
HH
HH
HH
Dissenys factorials creuats 10
Departament
d’Estadística
Disseny de dos factors creuatsTaula ANOVA
Font de variació
Suma de quadrats
Graus de llibertat
Quadrats mitjans
Estadístic F
Tractament A
SSA a-1 MSA MSA/MSE
Tractament B
SSB b-1 MSB MSB/MSE
Interacció SSAB (a-1)(b-1) MSAB MSAB/MSE
Residu SSE ab(n-1) MSE
Total SST abn-1
Dissenys factorials creuats 11
Departament
d’Estadística
Disseny de dos factors creuatsEstadístics F sota normalitat dels errors
Si els residus són iid, tots : – Significació del factor A:
– Significació del factor B:
– Significació de la interacció:
Per tant, els valors crítics o els p-valors s’obtindran d’una simple consulta de la taula F.
)1(,1~ nabaF F),0(~ Neij
)1(,1~ nabbF F
)1(),1)(1(~ nabbaF F
Dissenys factorials creuats 12
Departament
d’Estadística
Fertilitzant*VarietatSegons Statgraphics 7.0
El factor fertilitzant i la interacció són clarament significatius.
Analysis of Variance for BLAT.Produccio - Type III Sums of SquaresSource of variation Sum of Squares d.f. Mean square F-ratio Sig. levelMAIN EFFECTS A:BLAT,Fertilitza 22764,875 2 11382,438 230,660 ,0000 B:BLAT,Varietat 331,750 3 110,583 2,241 ,1002INTERACTIONS AB 1052,1250 6 175,35417 3,553 ,0072
RESIDUAL 1776,5000 36 49,347222--------------------------------------------------------------------------------TOTAL (CORRECTED)25925,250 47--------------------------------------------------------------------------------0 missing values have been excluded.All F-ratios are based on the residual mean square error.
Dissenys factorials creuats 13
Departament
d’Estadística
Fertilitzant*Varietatdiagrames de dispersió de residus (programa S-Plus 4.5)
parti
al fo
r Var
ieta
t
-40
-20
020
Varietat
1 2 3 4
Dissenys factorials creuats 14
Departament
d’Estadística
Fertilitzant*VarietatNormalitat dels residus (S-Plus 4.5)
Quantiles of Standard Normal
Res
idua
ls
-2 -1 0 1 2
-10
-50
510
26
2718
Dissenys factorials creuats 15
Departament
d’Estadística
És preferible un disseny multifactorial que anàlisis separades factor a factor
Més eficient: rèpliques ocultes (hidden replication). Possibles conclusions absurdes si factors per separat:
20 11 12 10
1 -10 1 -10 21 0 2 10 2 10 22 -20
Valors de E(Y i jk ) en un disseny de dos factors creuats
1 21 10 30 El millor tractament és2 20 20 la combinació d'A1 amb B2
Valors de E(Y ik ) en un disseny unifactoral per A (escala possiblement incorrecta)1 10 Conclusió correcta per A sol:2 30 Tractament A2 és preferible
Valors de E(Y jk ) en un disseny unifactoral per B (escala possiblement incorrecta)1 10 Conclusió correcta per B sol:2 30 Tractament B2 és preferible
Conclusió incorrecta en no considerar la interacció:
La millor estratègia és combinar els tractaments A2 i B2
B
B
A
A
Dissenys factorials creuats 16
Departament
d’Estadística
Cas d’una rèplica per casella
La discussió anterior fa pensar en la importància de les interaccions.
Si n=1, SSE té 0 g.d.ll. i 2 no és estimable a no ser que suposem que no hi ha interacció. En aquest cas utilitzarem SSE = SST - (SSA+ SSB) amb (a-1)(b-1) g.d.ll. i sense possibilitat de separar el residu de les possibles interaccions.
F = MSA /{(SST - (SSA+ SSB))/((a-1)(b-1))} amb distribució F(a-1, (a-1)(b-1)) permet aleshores provar la significació d’A (i similarment de B).
Dissenys factorials creuats 17
Departament
d’Estadística
Cas d’una rèplica per casella:és significativa la interacció?
És un problema difícil pel cas n = 1. Hi ha la prova de Tukey, solament vàlida sota un model restrictiu de la interacció: ij = i j.
En aquest cas, si H0 = 0 és certa,
NBATError
BA
a
i
b
jBAjiij
N
Error
N
SSSSSSSSSSSSSSab
abYSSSSYYYY
SS
babaSS
SSF
2
1 1
2..
....
1)1)(1(,1~1)1)(1(/
F
Dissenys factorials creuats 18
Departament
d’Estadística
Blocs en dissenys multifactorials
Sovint no és possible aleatoritzar totalment, volem controlar factors addicionals no directament interessants o tenim restriccions experimentals.
El disseny de l’exemple Fertilitzant*Varietat no és, en realitat, totalment aleatoritzat:
“Es considera una àrea de sembra molt gran que es divideix en 12 zones igual de grans. Les 12 combinacions de fertilitzant i varietat s’assignen a l’atzar a les zones. Per a mesurar l’error experimental, cada zona es divideix en quatre subzones que reben totes el mateix tractament.”
Dissenys factorials creuats 19
Departament
d’Estadística
Blocs en dissenys multifactorials
Fixem-nos que no és totalment aleatoritzat, cada zona i,j és un bloc que pot tenir el seu efecte, descrit per un paràmetre ij. Un model més realista seria:
En dependre dels mateixos índexs, ij no es pot estimar separadament de la interacció. Si ij no és constant i nul (cosa que no podem provar) tenim una font de biaix i/o variabilitat no mesurable, confosa amb la interacció.
ijkijijjiijk eY
Dissenys factorials creuats 20
Departament
d’Estadística
Blocs en dissenys multifactorials
Un disseny també amb blocs, més adequat, seria: “Es considera una àrea de sembra molt gran que es divideix en 4 zones igual de grans. Cada zona es divideix en 12 subzones. Per cada una de les 4 zones, els 12 tractaments s’assignen a l’atzar a les 12 subzones”
Cada una de les 4 “rèpliques” s’associa a un “bloc zona”. El model és ara:
Interaccions amb el factor bloc s’han de suposar inexistents o confoses amb l’error (1 sola rèplica), però l’efecte principal k és analitzable.
ijkkijjiijk eY
Dissenys factorials creuats 21
Departament
d’Estadística
Experiments factorials amb factors aleatoris
Suposem que A i B són factors aleatoris, és a dir els seus nivells són mostres aleatòries de mida a i b, respectivament, de poblacions més grans. Ara el model és:
amb Ai, Bj, Iij i eijk v.a. independents.
,0~
,0~,0~,0~,,1
,,1,,1
Ne
NINBNAnk
bjaieIBAY
ijk
ABijBjAi
ijkijjiijk
Dissenys factorials creuats 22
Departament
d’Estadística
Factors aleatoriscomponents de la variància i correlació intraclàssica
La independència de les v.a. dels factors i del residu fa que la variància de les observacions es descomposi en les components de la variància:
Per altra banda hi ha dependència entre observacions:
2222)var( ABBAijkY
','0','','
','',
,cov 2
2
222
'''
jjiisijjiisijjiisi
kkjjiisi
YYB
A
ABBA
kjiijk
Dissenys factorials creuats 23
Departament
d’Estadística
Dos factors aleatorissignificació dels factors i de la interacció
Ara els contrastos de més interès són:
Iguals sumes de quadrats i quadrats mitjans, però:
I els estadístics F adients són, respectivament:
0:0:
0:0:
0:0:
21
20
21
20
21
20
AB
AB
B
B
A
A
HH
HH
HH
222
222222
)(
EABAB
BABBAABA
MSEnMSE
annMSEbnnMSE
)1(),1)(1(~
)1)(1(,1~)1)(1(,1~
nabbaMSMSF
babMSMSFbaa
MSMSF
E
AB
AB
B
AB
A
F
FF
Dissenys factorials creuats 24
Departament
d’Estadística
Dos factors aleatorisexemple
Producció de suc, 4 tarongers i 5 dies, tots agafats a l’atzar (els tarongers són, però, els mateixos tots els dies). Per cada taronger i dia s’agafen a l’atzar tres taronges. És significatiu el factor “taronger”? I el factor “dia”? Hi ha interacció?Dia 1 2 3 4 1 24 26 26 28 20 27 28 18 21 27 24 20 2 18 25 19 21 24 23 27 19 17 25 23 22 3 16 21 15 24 20 21 22 25 24 29 27 27 4 21 24 22 23 20 26 24 24 23 20 21 27 5 23 24 28 27 21 28 26 25 27 25 27 28
Dissenys factorials creuats 25
Departament
d’Estadística
Taula ANOVA per producció de sucsegons Statgraphics 7.0
Analysis of Variance for TARONGER.suc - Type III Sums of SquaresSource of variation Sum of Squares d.f. Mean square F-ratio Sig. levelMAIN EFFECTS A:TARONGER.dia 108.93333 4 27.233333 2.14(1) .1374 B:TARONGER.taronger 53.65000 3 17.883333 1.40(1) .2881INTERACTIONS AB 152.26667 12 12.688889 1.45(0) .1843
RESIDUAL 350.00000 40 8.7500000--------------------------------------------------------------------------------TOTAL (CORRECTED) 664.85000 59--------------------------------------------------------------------------------0 missing values have been excluded.F-ratios are based on the following mean squares: (0)RESIDUAL (1)AB
Cap factor significatiu. Si anàlisi pròpia de factors fixos: conclusió errònia, “dia” significatiu.
Dissenys factorials creuats 26
Departament
d’Estadística
Dos factors aleatorisestimació de components de la variància
Estimadors puntuals:
A l’exemple (i valors amb validesa dubtosa):
i la covariància entre taronges del mateix arbre i dia:
EEAB
AB
ABBB
ABAA
MSn
MSMSan
MSMSbn
MSMS
22
22
ˆˆ
ˆˆ
31,1ˆˆ
34,0ˆˆ21,134
86,1232,27ˆˆ2
,2
2222
tarongerdiaAB
tarongerBdiaA
86,2ˆˆˆˆ 2,
22', diatarongerdiatarongerijkijk
Dissenys factorials creuats 27
Departament
d’Estadística
Dissenys o models mixtosun factor aleatori i un factor fix
Suposem que A és fix i B aleatori i el model:
Tota interacció amb un terme aleatori sempre és aleatòria. (1) i (2) fan que algunes expressions siguin més senzilles; a causa de (2) es coneix com model restringit.
( ) ( )1
1
.1
1, , 1, , 1, ,
0
~ 0, ~ 0, (1)
0 1, , (2)
i j ij ijijka
ii
aaj ijB AB
a
ij ji
Y B I e i a j b k n
B N I N
I I j b
m a
a
s s=
-
=
= + + + + = = =
=
= = =
å
å
K K K
K
Dissenys factorials creuats 28
Departament
d’Estadística
Un factor fix, un factor aleatoricontrastos sobre els paràmetres
Contrastos:
Esperances dels quadrats mitjans:
Estadístics F:
0:0:
0:0:
0:0:
21
20
21
20
1
10
AB
AB
B
B
i
a
HH
HH
HH
222
2212
22
)(1
EABAB
BB
a
i iABA
MSEnMSE
anMSEa
bnnMSE
)1(),1)(1(~
)1(,1~)1)(1(,1~
nabbaMSMSF
nabbMSMSFbaa
MSMSF
E
AB
E
B
AB
A
F
FF
Dissenys factorials creuats 29
Departament
d’Estadística
Producció de sucdia: factor fix; taronger: factor aleatori
Analysis of Variance for TARONGER.suc - Type III Sums of SquaresSource of variation Sum of Squares d.f. Mean square F-ratio Sig. levelMAIN EFFECTS A:TARONGER.dia 108,93333 4 27,233333 2,14(1) ,1374 B:TARONGER.taronger 53,65000 3 17,883333 2,04(0) ,1231INTERACTIONS AB 152,26667 12 12,688889 1,45(0) ,1843
RESIDUAL 350,00000 40 8,7500000--------------------------------------------------------------------------------TOTAL (CORRECTED) 664,85000 59--------------------------------------------------------------------------------0 missing values have been excluded.F-ratios are based on the following mean squares: (0)RESIDUAL (1)AB
Si “dia” és fix, el factor “taronger” s’acosta més a la significació (i “dia” igualment no significatiu):
Dissenys factorials creuats 30
Departament
d’Estadística
Tres o més factors
Teoria anterior generalitzable a tres o més factors, p.e. tres factors fixos amb totes les interaccions:
( ) ( ) ( ) ( )
( ) ( ) ( )
( )
1 1 1
1 1 1
1 1
1, , 1, , 1, , 1,
0 0 0
0, 0, 0, etc.
0, etc.
ijkl i j k ijklij ik jk ijk
a b d
i j ki j kb a d
ij ij ikj i kb d
ijkj k
Y ei a j b k d l n
m a b d ab ad bd abd
a b d
ab ab ad
abd
= = =
= = =
= =
= + + + + + + + += = = =
= = =
= = =
=
å å åå å åå å
K K K K
Dissenys factorials creuats 31
Departament
d’Estadística
Fertilitzant*VarietatSegons Statgraphics 7.0
El factor fertilitzant i la interacció són clarament significatius.
Analysis of Variance for BLAT.Produccio - Type III Sums of SquaresSource of variation Sum of Squares d.f. Mean square F-ratio Sig. levelMAIN EFFECTS A:BLAT,Fertilitza 22764,875 2 11382,438 230,660 ,0000 B:BLAT,Varietat 331,750 3 110,583 2,241 ,1002INTERACTIONS AB 1052,1250 6 175,35417 3,553 ,0072
RESIDUAL 1776,5000 36 49,347222--------------------------------------------------------------------------------TOTAL (CORRECTED)25925,250 47--------------------------------------------------------------------------------0 missing values have been excluded.All F-ratios are based on the residual mean square error.
Dissenys factorials creuats 32
Departament
d’Estadística
Taula ANOVA per producció de sucsegons Statgraphics 7.0
Analysis of Variance for TARONGER.suc - Type III Sums of SquaresSource of variation Sum of Squares d.f. Mean square F-ratio Sig. levelMAIN EFFECTS A:TARONGER.dia 108.93333 4 27.233333 2.14(1) .1374 B:TARONGER.taronger 53.65000 3 17.883333 1.40(1) .2881INTERACTIONS AB 152.26667 12 12.688889 1.45(0) .1843
RESIDUAL 350.00000 40 8.7500000--------------------------------------------------------------------------------TOTAL (CORRECTED) 664.85000 59--------------------------------------------------------------------------------0 missing values have been excluded.F-ratios are based on the following mean squares: (0)RESIDUAL (1)AB
Cap factor significatiu. Si anàlisi propi de factors fixos: conclusió errònia, “dia” significatiu.
Dissenys factorials creuats 33
Departament
d’Estadística
Producció de sucdia: factor fix; taronger: factor aleatori
Si “dia” és fix, el factor “taronger” s’acosta més a la significació (i “dia” igualment no significatiu):
Analysis of Variance for TARONGER.suc - Type III Sums of SquaresSource of variation Sum of Squares d.f. Mean square F-ratio Sig. levelMAIN EFFECTS A:TARONGER.dia 108,93333 4 27,233333 2,14(1) ,1374 B:TARONGER.taronger 53,65000 3 17,883333 2,04(0) ,1231INTERACTIONS AB 152,26667 12 12,688889 1,45(0) ,1843
RESIDUAL 350,00000 40 8,7500000--------------------------------------------------------------------------------TOTAL (CORRECTED) 664,85000 59--------------------------------------------------------------------------------0 missing values have been excluded.F-ratios are based on the following mean squares: (0)RESIDUAL (1)AB