5 - Diseño Factorial

33

description

Curso de Diseño experimental. Diseño Factorial. Para estudiantes de Ciencias Agrarias y Forestales.

Transcript of 5 - Diseño Factorial

Page 1: 5 - Diseño Factorial

Diseño Factorial: Análisis de Varianza Factorial

Marcelo Rodríguez G.Ingeniero Estadístico - Magister en Estadística

Universidad Católica del Maule

Facultad de Ciencias Básicas

Ingeniería en Agronomía

Diseño Experimental

21 de marzo de 2011

[email protected] (UCM) Diseño Factorial 21/03/2011 1 / 33

Page 2: 5 - Diseño Factorial

Introducción

De�nición (Análisis de Varianza Factorial)

El objetivo es investigar, en forma simultánea, los efectos que tienen variosfactores (variables independientes) sobre la variable dependiente. Todos losniveles de un factor se combinan con todos los niveles de cualquier otropara formar los tratamientos. Es posible evaluar los efectos individuales delos factores sobre la variable dependiente y determinar el efecto causadopor sus interacciones. El modelo matemático sería

yijk = µ+ αi + βj + (αβ)ij + εijk

Ejemplo

Suponga un diseño con dos factores el A y el B. El factor A tiene 2 niveles(a = 2) y el factor B tiene 3 niveles (b = 3). Entonces existirían 6tratamientos, cada uno formado por las combinaciones de estos niveles.

[email protected] (UCM) Diseño Factorial 21/03/2011 2 / 33

Page 3: 5 - Diseño Factorial

Características de los datos

(Los datos)

La variable dependiente es cuantitativa.

Los factores son categóricos; pueden tener valores numéricos o valoresde cadena de hasta ocho caracteres.

(Supuestos)

Los datos son una muestra aleatoria de una población normal; en lapoblación, todas las varianzas de las casillas son iguales.

El análisis de varianza es robusto a las desviaciones de la normalidad,aunque los datos deberán ser simétricos.

Para comprobar los supuestos, puede utilizar la prueba dehomogeneidad de varianzas y los grá�cos de dispersión por nivel.También puede examinar los residuos y los grá�cos de residuos.

[email protected] (UCM) Diseño Factorial 21/03/2011 3 / 33

Page 4: 5 - Diseño Factorial

Ejemplo: Cantidad de trigo cosechado

El objetivo es determinar si existen diferenciasapreciables en la cantidad de trigo cosechado,de entre 3 variedades y 2 tipos de fertilizantes.Para el experimento se encontró una área muygrande de siembra en la que las condiciones delsuelo eran, prácticamente, homogéneas.

Variedad de trigo

Fertilizante 1 2 3

1 35 45 2426 39 2338 39 3620 43 29

2 55 64 5844 57 7468 62 4964 61 69

El área fue dividida en 6 zonas de igual tamaño para las 6 combinacionesde variedad de trigo y tipo de fertilizante. Para medir el error experimental,cada zona se dividió a su vez en cuatro y cada una de éstas recibió elmismo tratamiento. En el momento de la cosecha se observaron los datosque aparecen en la tabla siguiente.

[email protected] (UCM) Diseño Factorial 21/03/2011 4 / 33

Page 5: 5 - Diseño Factorial

Notación y Arreglo de los datos

B

A 1 2 · · · b Media

1 y111 y121 · · · y1b1y112 y122 · · · y1b2...

......

...y11r y12r · · · y1bry11� y12� · · · y1a� y1��

2 y211 y221 · · · y2b1y212 y222 · · · y2b2...

......

...y21r y22r · · · y2bry21� y22� · · · y2b� y2��

......

......

......

a ya11 ya21 · · · yab1ya12 ya22 · · · yab2...

......

...ya1r ya2r · · · yabr

ya1� ya2�... yab� ya��

Media y �1� y �2� · · · y �b� y

t = a · b (n◦ de tratamientos)

n = t · r (tamaño de muestra)

y =1

n

a∑i=1

b∑j=1

r∑k=1

yijk

y ij � =1

r

r∑k=1

yijk

y i �� =1

b

b∑j=1

y ij �

y �j � =1

a

a∑i=1

y ij �

[email protected] (UCM) Diseño Factorial 21/03/2011 5 / 33

Page 6: 5 - Diseño Factorial

Descomposición de la suma de cuadrados

(Suma de cuadrados total)

SCT =a∑

i=1

b∑j=1

r∑k=1

(yijk − y)2

(Suma de cuadrados de los tratamientos)

SCTR =a∑

i=1

b∑j=1

r∑k=1

(y ij � − y)2

(Suma de cuadrados del error)

SCE = SCT− SCTR

[email protected] (UCM) Diseño Factorial 21/03/2011 6 / 33

Page 7: 5 - Diseño Factorial

Descomposición de la suma de cuadrados

(Suma de cuadrados del factor A)

SCA =a∑

i=1

b∑j=1

r∑k=1

(y i �� − y)2

(Suma de cuadrados del factor B)

SCB =a∑

i=1

b∑j=1

r∑k=1

(y �j � − y)2

(Suma de cuadrados del factor A y B)

SCAB = SCTR− SCA− SCB

[email protected] (UCM) Diseño Factorial 21/03/2011 7 / 33

Page 8: 5 - Diseño Factorial

Ejemplo: Cantidad de trigo cosechado

Variedad de trigo (B)

Fertilizante (A) 1 2 3 Media

1 35 45 2426 39 2338 39 3620 43 29

y11�=29,75 y12�=41,50 y13�=28,00 y1��=33,083

2 55 64 5844 57 7468 62 4964 61 69

y21�=57,75 y22�=61,00 y23�=62,50 y2��=60,416

Media y �1�=43,75 y �2�=51,25 y �3�=45,25 y=46,75

SCT =2∑

i=1

3∑j=1

4∑k=1

(yijk − 46, 75)2 = (35− 46, 75)2 + (26− 46, 75)2 + · · ·+ (69− 46, 75)2 = 6042, 5

SCTR =2∑

i=1

3∑j=1

4∑k=1

(y ij � − 46, 75)2 = 4[(29, 75− 46, 75)2 + (57, 75− 46, 75)2 + · · ·+ (62, 50− 46, 75)2] = 4961

SCE = 6042, 5− 4961 = 1081, 5

SCA =2∑

i=1

3∑j=1

4∑k=1

(y i �� − 46, 75)2 = 12[(33, 083− 46, 75)2 + (60, 416− 46, 75)2] = 4482, 6

SCB =2∑

i=1

3∑j=1

4∑k=1

(y �j � − 46, 75)2 = 8[(43, 753− 46, 75)2 + (51, 25− 46, 75)2 + (45, 25− 46, 75)2] = 252

SCAB = 4961− 4482, 6− 252 = 226, 3

[email protected] (UCM) Diseño Factorial 21/03/2011 8 / 33

Page 9: 5 - Diseño Factorial

Prueba de hipótesis

(Tabla de ANOVA)

Modelo Suma de Grados de Media Fc

cuadrados libertad cuadrática

Factor A SCA a − 1 MCA=SCA

(a − 1)FA =

MCA

MCE

Factor B SCB b − 1 MCB=SCB

(b − 1)FB =

MCB

MCE

Interacción A y B SCAB (a − 1)(b − 1) MCAB=SCAB

(a − 1)(b − 1)FAB =

MCAB

MCE

Error SCE n − ab MCE=SCE

(n − ab)Total SCT n − 1

(Hipótesis: Efecto atribuible al factor A)

H0 : µ1�� = µ2�� = · · · = µa�� v/s H1 : µi �� 6= µj ��, para algún i , jReglas para el rechazo de H0:

Fijar α y Rechace H0 si FA > F1−α(a − 1, n − ab)

Rechace H0 si valor-p < 0, 05, donde valor-p= 1− P(F < FA).

[email protected] (UCM) Diseño Factorial 21/03/2011 9 / 33

Page 10: 5 - Diseño Factorial

Prueba de hipótesis

(Hipótesis: Efecto atribuible al factor B)

H0 : µ�1� = µ�2� = · · · = µ�b� v/s H1 : µ�i � 6= µ�j �, para algún i , jReglas para el rechazo de H0:

Fijar α y Rechace H0 si FB > F1−α(b − 1, n − ab)

Rechace H0 si valor-p < 0, 05, donde valor-p= 1− P(F < FB).

(Hipótesis: Efecto atribuible a la interacción entre A y B)

H0 : µij �+µ = µ�j �+µi �� v/s H1 : µij �+µ 6= µ�j �+µi ��, para todo i , jReglas para el rechazo de H0:

Fijar α y Rechace H0 si FAB > F1−α((a − 1)(b − 1), n − ab)

Rechace H0 si valor-p < 0, 05, donde valor-p= 1− P(F < FAB).

[email protected] (UCM) Diseño Factorial 21/03/2011 10 / 33

Page 11: 5 - Diseño Factorial

Prueba de hipótesis

(Tabla de ANOVA)

Modelo Suma de Grados de Media Fc Valor−pcuadrados libertad cuadrática

Fertilizante (A) 4482,667 1 4482,667 74,607 < 0, 01Variedad (B) 252 2 126 2,097 [0, 10; 0, 25]

Interacción (A y B) 226,333 2 113,167 1,883 [0, 10; 0, 25]Error 1081,5 18 60,083Total 6042,5 23

Si α = 0, 05, entonces existen diferencias atribuibles al fertilizante,pues FA = 74, 607 > F0,95(1, 18) = 4, 41

Si α = 0, 05, entonces NO existen diferencias atribuibles a la variedad,pues FB = 2, 097 < F0,95(2, 18) = 3, 55

Si α = 0, 05, entonces NO existen diferencias atribuibles al fertilizantey variedad, pues FAB = 1, 883 < F0,95(2, 18) = 3, 55

Note que sólo en el caso del fertilizante, el valor−p es menor que 0,05.Esto indicaría que solo existiría un efecto atribuible a los fertilizantes.

[email protected] (UCM) Diseño Factorial 21/03/2011 11 / 33

Page 12: 5 - Diseño Factorial

Ejemplo de un ANOVA factorial en SPSS

(Ejemplo de un ANOVA factorial en SPSS)

En SPSS, Analizar -> Modelo lineal general -> Univariante.

1 Seleccionar la variable dependiente y trasladarla al cuadro Variable

dependiente.

2 Seleccionar tanto las variables-factores y trasladarlas a la listaFactores �jos.

3 Luego, Aceptar.

[email protected] (UCM) Diseño Factorial 21/03/2011 12 / 33

Page 13: 5 - Diseño Factorial

Ejemplo de un ANOVA factorial en SPSS

Puede descargar los datos desde http://bit.ly/trigo_factorial.

[email protected] (UCM) Diseño Factorial 21/03/2011 13 / 33

Page 14: 5 - Diseño Factorial

Ejemplo de un ANOVA factorial en SPSS

[email protected] (UCM) Diseño Factorial 21/03/2011 14 / 33

Page 15: 5 - Diseño Factorial

Ejemplo de un ANOVA factorial en SPSS

[email protected] (UCM) Diseño Factorial 21/03/2011 15 / 33

Page 16: 5 - Diseño Factorial

Ejemplo de un ANOVA factorial en SPSS

[email protected] (UCM) Diseño Factorial 21/03/2011 16 / 33

Page 17: 5 - Diseño Factorial

Ejemplo de un ANOVA factorial en SPSS

[email protected] (UCM) Diseño Factorial 21/03/2011 17 / 33

Page 18: 5 - Diseño Factorial

Ejemplo de un ANOVA factorial en SPSS

[email protected] (UCM) Diseño Factorial 21/03/2011 18 / 33

Page 19: 5 - Diseño Factorial

Ejemplo de un ANOVA factorial en SPSS

[email protected] (UCM) Diseño Factorial 21/03/2011 19 / 33

Page 20: 5 - Diseño Factorial

Ejemplo de un ANOVA factorial en SPSS

NDesviación

típicaMedia

1

2

3

Total

1

2

3

Total

1

2

3

Total

1

2

Total

2416,20946,75

820,22645,25

810,78051,25

817,37643,75

128,47960,42

411,21062,50

42,94461,00

410,65857,75

128,36133,08

45,94428,00

43,00041,50

48,26129,75

Fertilizante Variedad de trigoFertilizante Variedad de trigo

Estadísticos descriptivos

Variable dependiente:Cantidad

Sig.gl2gl1F

,0231853,471

Contraste de Levene sobre la igualdad de las varianzas error

a

Contrasta la hipótesis nula de que la varianza error de la variable dependiente es igual a lo largo de todos los grupos.

a. Diseño: Intersección + Fertilizante + Variedad + Fertilizante * Variedad

Variable dependiente:Cantidad

Página 26

Se entregarán los promedios y desviaciones estándar para cada tratamiento(combinaciones de los niveles de los factores), estos indicadores, nospermiten tener una visión general de la comparación de las medias.

[email protected] (UCM) Diseño Factorial 21/03/2011 20 / 33

Page 21: 5 - Diseño Factorial

Ejemplo de un ANOVA factorial en SPSS

NDesviación

típicaMedia

1

2

3

Total

1

2

3

Total

1

2

3

Total

1

2

Total

2416,20946,75

820,22645,25

810,78051,25

817,37643,75

128,47960,42

411,21062,50

42,94461,00

410,65857,75

128,36133,08

45,94428,00

43,00041,50

48,26129,75

Fertilizante Variedad de trigoFertilizante Variedad de trigo

Estadísticos descriptivos

Variable dependiente:Cantidad

Sig.gl2gl1F

,0231853,471

Contraste de Levene sobre la igualdad de las varianzas error

a

Contrasta la hipótesis nula de que la varianza error de la variable dependiente es igual a lo largo de todos los grupos.

a. Diseño: Intersección + Fertilizante + Variedad + Fertilizante * Variedad

Variable dependiente:Cantidad

Página 26

Este método prueba la hipótesis de homogeneidad de varianzas, se deberíarechazar la hipótesis de que las varianzas (entre los grupos), son iguales, siel valor−p es menor que 0,05. En este caso el valor−p = 0, 023, lo queindicaría es que no se está cumpliendo el supuesto de homogeneidad.

[email protected] (UCM) Diseño Factorial 21/03/2011 21 / 33

Page 22: 5 - Diseño Factorial

Ejemplo de un ANOVA factorial en SPSS

Sig.FMedia

cuadráticagl

Suma de cuadrados

tipo III

Modelo corregido

Intersección

Fertilizante

Variedad

Fertilizante * Variedad

Error

Total

Total corregida 236042,500

2458496,000

60,083181081,500

,1811,883113,1672226,333

,1522,097126,0002252,000

,00074,6074482,66714482,667

,000873,01252453,500152453,500

,00016,514992,20054961,000a

OrigenOrigen

Pruebas de los efectos inter-sujetos

Variable dependiente:Cantidad

a. R cuadrado = ,821 (R cuadrado corregida = ,771)

Pruebas post hoc

Variedad de trigo

Página 27

Esta tabla de ANOVA es la misma que encontramos anteriormente, noteque sólo en el caso del fertilizante, el valor−p = 0, 000 es menor que 0,05.Lo que indicaría que existe un efecto atribuible al fertilizante, en lacantidad de trigo cosechado (se rechaza H0 : µ1 = µ2).

[email protected] (UCM) Diseño Factorial 21/03/2011 22 / 33

Page 23: 5 - Diseño Factorial

Ejemplo de un ANOVA factorial en SPSS

También se han solicitado las comparaciones múltiples, entre las variedades,no se pide la comparación de los fertilizantes, pues son sólo dos y elmétodo anterior ya se concluyó que di�eren. El método de Tukey utilizacomo MCE la MCE del ANOVA Factorial y no la del ANOVA un Factor.

Sig.Error típ.Diferencia de medias (I-J)

Límite superiorLímite inferior

Intervalo de confianza 95%

2

3

1

3

1

2

1

2

3

3,89-15,89,2933,876-6,00

11,39-8,39,9213,8761,50

15,89-3,89,2933,8766,00

17,39-2,39,1583,8767,50

8,39-11,39,9213,876-1,50

2,39-17,39,1583,876-7,50

(I)Variedad de trigo (J)Variedad de trigo(I)Variedad de trigo (J)Variedad de trigo

Comparaciones múltiples

Basadas en las medias observadas. El término de error es la media cuadrática(Error) = 60,083.

CantidadDHS de Tukey

Subconjuntos homogéneos

Página 28

El método indicaría que cuando se hacen las comparaciones de a pares enlas variedades, no existirían diferencias signi�cativas (valores−p >0,05).Esto es lógico, pues la ANOVA nos había dicho lo mismo.

[email protected] (UCM) Diseño Factorial 21/03/2011 23 / 33

Page 24: 5 - Diseño Factorial

Ejemplo de un ANOVA factorial en SPSS

Estos grá�cos de medias son útiles para detectar efectos de interacción,cuando la interacción es signi�cativa, las líneas tienden a cruzarse, demanera muy marcada (en forma de X), en este caso existe una interacción,pero no es signi�cativa (según el ANOVA, pues el valor−p = 0, 181).

Fertilizante

21

Med

ias

mar

gin

ales

est

imad

as

60

50

40

30

Medias marginales estimadas de Cantidad

321

Variedad de trigo

Página 33

Variedad de trigo

321

Med

ias

mar

gin

ales

est

imad

as

60

50

40

30

Medias marginales estimadas de Cantidad

21

Fertilizante

Página 34

[email protected] (UCM) Diseño Factorial 21/03/2011 24 / 33

Page 25: 5 - Diseño Factorial

Ejemplo de un ANOVA factorial en SPSS: Veri�cación de

los supuestos de los residuos

Se ha solicitado que SPSS entregue los valores pronosticados

(PRED1=promedio del tratamiento) por el modelo y los Residuos

(RES1=distancia entre el valor real y el valor pronosticado).

[email protected] (UCM) Diseño Factorial 21/03/2011 25 / 33

Page 26: 5 - Diseño Factorial

Ejemplo de un ANOVA factorial en SPSS: Veri�cación de

los supuestos de los residuos

Existen 6 tratamiento, se ha creado una nueva columna con lostratamientos.

[email protected] (UCM) Diseño Factorial 21/03/2011 26 / 33

Page 27: 5 - Diseño Factorial

Ejemplo de un ANOVA factorial en SPSS: Veri�cación de

los supuestos de los residuos

[email protected] (UCM) Diseño Factorial 21/03/2011 27 / 33

Page 28: 5 - Diseño Factorial

Ejemplo de un ANOVA factorial en SPSS: Veri�cación de

los supuestos de los residuos

[email protected] (UCM) Diseño Factorial 21/03/2011 28 / 33

Page 29: 5 - Diseño Factorial

Ejemplo de un ANOVA factorial en SPSS: Veri�cación de

los supuestos de los residuos

[email protected] (UCM) Diseño Factorial 21/03/2011 29 / 33

Page 30: 5 - Diseño Factorial

Ejemplo de un ANOVA factorial en SPSS: Veri�cación de

los supuestos de los residuos

[email protected] (UCM) Diseño Factorial 21/03/2011 30 / 33

Page 31: 5 - Diseño Factorial

Ejemplo de un ANOVA factorial en SPSS: Veri�cación de

los supuestos de los residuos

SPSS entrega la prueba de Kolmogorov-Smirnov y la prueba deShapiro-Wilk, la cual se utiliza cuando n ≤ 50, en caso contrario seutiliza la prueba de Kolmogorov-Smirnov. Ambos métodos son paraveri�car el supuesto de normalidad.Utilizando la prueba de Shapiro-Wilk, para cada tratamiento elvalor−p (sig.) es mayor que 0,05. Entonces, no se puede rechazar lahipótesis de normalidad.

[Conjunto_de_datos1] C:\Users\13865271\Desktop\trigo factorial2.sav

tratamientos

PorcentajeN PorcentajeN PorcentajeN

TotalPerdidosVálidos

Casos

1

2

3

4

5

6

Residuo para Cantidad

100,0%4,0%0100,0%4

100,0%4,0%0100,0%4

100,0%4,0%0100,0%4

100,0%4,0%0100,0%4

100,0%4,0%0100,0%4

100,0%4,0%0100,0%4

tratamientostratamientos

Resumen del procesamiento de los casos

Sig.glEstadístico Sig.glEstadístico

Shapiro-WilkKolmogorov-Smirnova

1

2

3

4

5

6

Residuo para Cantidad

,7714,959.4,219

,7344,953.4,250

,7164,950.4,221

,4304,900.4,250

,2244,849.4,298

,6504,939.4,237

tratamientostratamientos

Pruebas de normalidad

a. Corrección de la significación de Lilliefors

Página 93

[email protected] (UCM) Diseño Factorial 21/03/2011 31 / 33

Page 32: 5 - Diseño Factorial

Ejemplo de un ANOVA factorial en SPSS: Veri�cación de

los supuestos de los residuos

Esta prueba de hipótesis ya fue entregada por SPSS, es la misma prueba dehipótesis de homogeneidad de varianza (Prueba de Levene basado en lamedia) entregada anteriormente y la conclusión sería la misma: Rechazar elsupuesto de homogeneidad (valor−p = 0, 023 < 0, 05).

Sig.gl2gl1Estadístico de

Levene

Basándose en la media

Basándose en la mediana.

Basándose en la mediana y con gl corregido

Basándose en la media recortada

Residuo para Cantidad

,0231853,464

,05911,39352,984

,0391852,984

,0231853,471

Prueba de homogeneidad de la varianza

Residuo para Cantidad

Gráficos Q-Q normales

Página 94

tratamiento

654321

Res

idu

o p

ara

RE

S_1

15,00

10,00

5,00

0,00

-5,00

-10,00

-15,00

Página 1

Hay que ser cautelosos con el supuesto de homogeneidad, pues si utilizamosel estadístico de Levene basado en la mediana con gl corregido , podríamosasumir el supuesto de homogeneidad (valores−p = 0, 059 > 0, 05).

[email protected] (UCM) Diseño Factorial 21/03/2011 32 / 33

Page 33: 5 - Diseño Factorial

¾Qué hacer si no se cumplen los supuestos de normalidad u

homogeneidad?

Cuando no se cumplen los supuestos de normalidad u homogeneidad, serecomienda transformar la variable dependiente, algunas transformacionesclásicas son: Logarítmica (y = ln(x)), Exponencial (y = exp(x)), Inversa(y = 1/x), etc.

[email protected] (UCM) Diseño Factorial 21/03/2011 33 / 33