problemes ANOVA 2009 resolts

43
PROBLEMAS: MODELOS ANOVA Y REGRESIÓN MÚLTIPLE 1.-Se quiere saber si existen diferencias respecto al peso entre tres poblaciones del insecto Tribolium Castaneum de diferentes localidades geográficas de las que se recogen muestras , obteniéndose los siguientes resultados: Localidad 1 : 198,186,201,190 Localidad 2: 200,203,205,187 Localidad 3: 215,187,212,190 (El peso es expresado en mg.) Analizar las diferencias entre localidades . ( Resolver las comparaciones múltiples por el método de Scheffe). Realizar el apartado mediante un paquete estadístico y también utilizando únicamente la calculadora. Comprobar que los resultados coinciden. Ver si se puede aceptar la hipótesis de normalidad de residuos y homogeneidad de varianzas. Realizar también el análisis mediante el test de Kruskal-Wallis Resolt amb STATGRAPHICS. 2.- Un ecólogo está interesado en averiguar si el tamaño de la hoja de una determinada especie vegetal depende del tipo de suelo. Para ello recogió muestras de seis hojas en cuatro tipos diferentes de suelos. Los resultados fueron: Tipo A: 3.3, 3.6, 3.5, 3.4, 3.5, 3.3 Tipo B: 3.1, 3.0, 3.5, 3.2, 3.2, 3.3 Tipo C: 3.1, 3.6, 3.5, 3.5, 3.4, 3.6 Tipo D: 3.2, 3.4, 3.8, 3.6, 3.7, 3.6 (longitudes en centímetros) Analizar las diferencias entre tipos de suelo Ver si se puede aceptar la hipótesis de normalidad de residuos y homogeneidad de varianzas. Realizar también el análisis mediante el test de Kruskal-Wallis Resolt amb STATGRAPHICS. 3.- Comprobar que la comparación de medias de dos poblaciones independientes mediante el test t Student coincide exactamente con el test ANOVA 1 factor a 2 niveles. 4.-Al realizar un análisis de la varianza a 1 factor con 4 niveles, una vez se han analizado las comparaciones dos a dos entre las medias, obtenemos las siguientes diferencias significativas: Grupo 3 y grupo 1; grupo 2 y grupo 1 . 1

Transcript of problemes ANOVA 2009 resolts

Page 1: problemes ANOVA  2009 resolts

PROBLEMAS: MODELOS ANOVA Y REGRESIÓN MÚLTIPLE

1.-Se quiere saber si existen diferencias respecto al peso entre tres poblaciones del insecto Tribolium Castaneum de diferentes localidades geográficas de las que se recogen muestras , obteniéndose los siguientes resultados:

Localidad 1 : 198,186,201,190Localidad 2: 200,203,205,187Localidad 3: 215,187,212,190(El peso es expresado en mg.)

Analizar las diferencias entre localidades . ( Resolver las comparaciones múltiples por el método de Scheffe). Realizar el apartado mediante un paquete estadístico y también utilizando únicamente la calculadora. Comprobar que los resultados coinciden.

Ver si se puede aceptar la hipótesis de normalidad de residuos y homogeneidad de varianzas.

Realizar también el análisis mediante el test de Kruskal-Wallis

Resolt amb STATGRAPHICS.

2.- Un ecólogo está interesado en averiguar si el tamaño de la hoja de una determinada especie vegetal depende del tipo de suelo. Para ello recogió muestras de seis hojas en cuatro tipos diferentes de suelos. Los resultados fueron:

Tipo A: 3.3, 3.6, 3.5, 3.4, 3.5, 3.3Tipo B: 3.1, 3.0, 3.5, 3.2, 3.2, 3.3Tipo C: 3.1, 3.6, 3.5, 3.5, 3.4, 3.6Tipo D: 3.2, 3.4, 3.8, 3.6, 3.7, 3.6(longitudes en centímetros)

Analizar las diferencias entre tipos de suelo Ver si se puede aceptar la hipótesis de normalidad de residuos y homogeneidad de

varianzas. Realizar también el análisis mediante el test de Kruskal-Wallis

Resolt amb STATGRAPHICS.

3.- Comprobar que la comparación de medias de dos poblaciones independientes mediante el test t Student coincide exactamente con el test ANOVA 1 factor a 2 niveles.

4.-Al realizar un análisis de la varianza a 1 factor con 4 niveles, una vez se han analizado las comparaciones dos a dos entre las medias, obtenemos las siguientes diferencias significativas: Grupo 3 y grupo 1; grupo 2 y grupo 1 .

¿Qué posibles ordenaciones de las medias muestrales se podrían dar? ¿Crees posible que si se hubieran realizado las comparaciones dos a dos

separadamente mediante el test t Student , se podría haber encontrado como resultado alguna nueva diferencia significativa ? Razonar las respuestas.

* 1-2, * 1-3

y1.>y4.>y2.>y3. // y1.>y4.>y3.>y2. // y3.>y2.>y4.>y1. // y2.>y3.>y4.>y1.

1 X2 X3 X

1

Page 2: problemes ANOVA  2009 resolts

4 X

Qualsevol altre mètode comparat amb la t-student és més conservador que aquest per tant podríem trobar-ne més. Això és degut a que amb t-student tenim més error de tipus I.

Podríem posar més grans o iguals, encara que és molt difícil que es doni la igualtat. Caldria que les dades fossin molt discretes (amb pocs decimals).

5.- Supongamos que realizamos un ANOVA a 1 factor con 6 niveles . Si el número de réplicas por condición experimental es de 4, las medias por niveles son respectivamente 20.2, 20.5, 23, 18.5, 25, 17, y las variancias muestrales corregidas por condición experimental 1,1.1,1.2,1,0.9,1.3 , se pide:

Obtener la tabla ANOVA y decidir si existen diferencias a nivel 0.05. ¿Cambia el resultado si rebajamos el nivel de significación a 0.01. ? Realizar las comparaciones múltiples entre los pares de medias por el método de

Scheffé. Nota: Se supone normalidad e igualdad de varianzas.

SSbet=4[(20.2-20.7)^2+(20.5-20.7)^2+(23-20.7)^2+(18.5-20.7)^2+(25-20.7)^2+(17-20.7)^2]= 170.4

SSwit=(4-1)*((1)+(1.1)+(1.2)+(1)+(0.9)+(1.3))= 19.5

MSbet=170.4/(6-1)= 34.08

MSwit=19.5/(6(4-1))= 1.083* MSwit en un disseny balancejat acaba siguent el promig de les variàncies de cada nivell.

F=MSbet/MSwit=34.08/1.083= 31.47* A partir de F=4 les diferències ja solen ser significatives.

Mirar a les taules de la FF 5 18= 2.77 F>2.77F 1 18=4.25 F>4.25

p-valor és de 2.7 10^-8No canvia per cap alfa més gran que p-valor. Per tant, rebutjem Ho.

Falta Scheffé

6.- Un investigador desea comprobar una hipótesis y para ello construye un contraste situando su hipótesis de interés como hipótesis nula. Como sea que al realizar los cálculos utiliza un test ANOVA 1 factor y observa que a nivel 0.05 obtiene diferencias significativas (p valor = 0.0234) decide considerar un nivel se significación más bajo (0.01) y de este modo cuando redacta resultados indica que en "su estudio ha comprobado la hipótesis nula con un nivel de significación muy bajo, lo cual le da mucha credibilidad al resultado".

¿Es falsa tal conclusión? Discutirlo con propiedad.

Sí, és fals perquè el reduir l’error de tipus alfa fa que augmenti el beta.

7.- Se plantea comparar la longitud de las ramas de coral de 4 zonas de las Islas Medas. Para ello se toman 400 muestras de cada zona obteniendo los siguientes resultados:Zona 1: Media : 3.77 Desviación típica: 0.92Zona 2: Media : 3.20 Desviación típica: 0.89Zona 3: Media : 3.17 Desviación típica: 0.76

2

Page 3: problemes ANOVA  2009 resolts

Zona 4: Media : 3.53 Desviación típica: 0.89(Datos en cm)

Estudiar las diferencias entre las 4 zonas(Las zonas 2 y 3 son zonas habituales de buceo) ( Se supone normalidad e igualdad de varianzas.

¿Qué problemas encuentras en el diseño de la experiencia para afirmar que existe un impacto significativo de la práctica del buceo en el normal crecimiento de las ramas de coral.?.

Tenir en compte que la variància és el quadrat de la desviació típica.

Caldria assegurar-se que les zones són comparables. No són dissenys experimentals són mostratges observacionals, no hi ha cel·les al atzar a les que se’ls assigni un tractament. Si ara veiéssim diferències no podrirem discriminar si estem veient diferències entre les zones o diferències degudes a la immersió. Perquè fos un disseny experimental hauríem de prendre diferents zones i llavors assigna’ls-hi la immersió.

8.- Un investigador desea comparar 4 tratamientos, considerando cierta variable farmacocinética AUC. Para ello, toma 6 ratas por tratamiento.

Explica que diseño se utiliza. ¿ Existen diferencias entre tratamientos ?Es tracta d’un disseny d’un factor. Sí, hi ha diferències (F elevada, p<0,05) ¿Se cumplen las condiciones de regularidad para poder utililizar el test F?Sí, ha sortit no significatius els test de homocedasticitat i normalitat. ¿Por qué no es aconsejable comparar utilizando el test t-Student de poblaciones

independientes para cada par de tratamientos en vez de utilizar el test F?Perquè el test de la F té en compte tots els tractaments a l’hora de fer les comparacions per veure si hi ha diferències, mentre que amb la t-student hauriem de fer les comparacions de dos en dos arrastrant cada vegada l’error associat a la comparació (95*95...) en 16 combincions possibles de comparació. La probabilitat d’esquivocar-nos augmenta molt. ¿Qué diseño resulta si se toman medidas de AUC en 4 tiempos concretos: 1hora, 3

horas, 8 horas, 20 horas. ? Señalar únicamente :los factores, tipo de los factores, y parametrización del diseño .

Disseny de dos factors (tractament i temps, els 2 efectes fixos). Yij=µ+αi+βj+eij

One-Way ANOVA - auc by tratamientoAnalysis SummaryDependent variable: aucFactor: tratamientoNumber of observations: 24Number of levels: 4ANOVA Table for auc by tratamiento Analysis of Variance-----------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value-----------------------------------------------------------------------------Between groups 20488,0 3 6829,33 Within groups 4700,62 20 235,031-----------------------------------------------------------------------------Total (Corr.) 25188,6 23Table of Means for auc by tratamientowith 95,0 percent LSD intervals-------------------------------------------------------------------------------- Stnd. errortratamiento Count Mean (pooled s) Lower limit Upper limit--------------------------------------------------------------------------------1 6 384,326 6,25874 375,095 393,5582 6 403,096 6,25874 393,864 412,3283 6 454,433 6,25874 445,202 463,6654 6 446,209 6,25874 436,978 455,441--------------------------------------------------------------------------------Total 24 422,016Variance CheckCochran's C test: 0,342406 P-Value = 0,921317Bartlett's test: 1,03379 P-Value = 0,893351Hartley's test: 1,81469Kruskal-Wallis Test for auc by tratamiento

3

Page 4: problemes ANOVA  2009 resolts

tratamiento Sample Size Average Rank------------------------------------------------------------1 6 4,5 2 6 8,83333 3 6 19,6667 4 6 17,0 ------------------------------------------------------------Uncensored Data - RESIDUALS

Tests for Normality for RESIDUALS

Shapiro-Wilks W statistic = 0,97256P-Value = 0,727046

Normal Probability Plot for RESIDUALS

-30 -20 -10 0 10 20 30

RESIDUALS

0,1

1

5

20

50

80

95

99

99,9

perc

enta

ge

9.- a) Generar 4 muestras correspondientes respectivamente a modelos Normales con medias 20, 20, 23, 24 y desviación típica 2. Comparar posteriormente los grupos mediante el test F (modelo paramétrico) y mediante el test de Kruskal-Wallis (modelo no paramétrico). Realizar el ejercicio para tamaños de muestra por grupo : n=4; n=10; n=30.

b) Idem. con modelos exponenciales de medias respectivas 20, 20, 23 y 24.

10.- Se estudia la variabilidad del consumo de bebida en condiciones basales de un grupo de ratas que se van a utilizar en un experimento. Para ello se consideran 5 ratas y para cada rata se eligen 4 días al azar ( no son los mismos para cada rata) y se mide el consumo. Los datos obtenidos son:

Rata 1: 22,4 , 23,8, 25,2, 22,8Rata 2: 24,5, 23,9, 24,8, 22,9Rata 3: 26,7, 22,3, 26,2, 24,2Rata 4: 24,8, 25,3, 22,6, 21,8Rata 5: 27, 24,3, 23,2, 26,1

Decidir si la variabilidad debida al animal es significativa. Estimar la variabilidad debida a cada factor.

11.- Los cigarrillos producen cantidades apreciables de monóxido de carbono. Cuando se inhala el humo del cigarrillo, el monóxido de carbono se combina con la hemoglobina para formar carboxihemoglobina. En un estudio reciente ( Carbon monoxide and exercise tolerance in chronic bronchitis and emphysema, Brit.Med.J. 283(1981) 877-880, Calvery,M.A. y otros) los investigadores deseaban determinar si una concentración apreciable de carboxihemoglobina reduce la tolerancia al ejercicio en aquellos pacientes que sufren de bronquitis crónica y enfisema. Se seleccionaron 7 pacientes y en un ambiente controlado, se les pidió que caminaran durante 12 minutos respirando cada una de las siguientes combinaciones gaseosas: aire, oxígeno,aire más monóxido de carbono y oxígeno más monóxido de carbono (respectivamente A,B,C,D). La cantidad de monóxido de carbono respirado fue suficiente para elevar la concentración de carboxihemoglobina de cada sujeto en 9%. Para controlar el consumo de monóxido de carbono, se pidió a los siete fumadores que dejaran de fumar 12 horas antes del experimento. Los datos representan las distancias caminadas por los sujetos (en m.) en los 12 minutos para cada condición experimental.

Sujeto A B C D1 835 874 750 854

4

Page 5: problemes ANOVA  2009 resolts

2 787 827 755 8293 724 738 698 7264 336 378 210 2795 252 315 168 3366 560 672 558 6427 336 341 260 336

Escribir el modelo para la situación descrita. Estudiar si podemos encontrar diferencias entre las mezclas gaseosas. ¿Podemos aceptar normalidad de los residuos?

12.- Se desean comparar la producción de 3 variedades de avena en una finca. La finca se divide en 4 bloques, probando en cada bloque las 3 variedades. Los resultados obtenidos son :

Variedad 1 Variedad 2 Variedad 3Bloque 1 123 110 145Bloque 2 132 111 156Bloque 3 134 100 167Bloque 4 122 99 175

Escribir el modelo para la situación descrita. Comparar las variedades . ¿Podemos aceptar normalidad de los residuos?

13.- El asma bronquial es una enfermedad alérgica cuya virulencia depende de la estación. Se desean comparar tres fármacos antihistamínicos A, B, C en las cuatro estaciones del año. Se toma una muestra de 48 personas con asma crónico de intensidad análoga, que se divide en 12 grupos, uno para cada fármaco y estación, a razón de 4 enfermos por grupo. Los resultados se evaluaron en una escala objetiva que iba de 0 a 100 y fueron los siguientes :

FármacoEstación A B CPrimavera 23,28,32,12 56,58,53,56 42,41,36,37Verano 32,41,43,48 64,58,67,72 51,53,55,60Otoño 18,16,21,10 48,50,47,47 28,31,23,33Invierno 30,40,33,47 60,61,63,59 56,60,61,55

Determinar si hay diferencias entre los fármacos A, B, y C y entre las estaciones. ¿Es significativa la interacción? Valorar la eficacia media de los fármacos y determinar intervalos de confianza para

las mismas.

14.- En un experimento de agricultura se trata de determinar si existen diferencias con especto la cantidad de trigo cosechado debido a 4 variedades consideradas y a la aplicación de tres fertilizantes. Se considera un área de siembra muy grande y se dividen en 12 zonas de igual tamaño para las 12 combinaciones de variedad de trigo y tipo de fertilizante. Para medir el error experimental, cada zona se dividió a su vez en cuatro y cada una de estas recibió el mismo tratamiento.

Resultados obtenidos : (toneladas por acre)

Fertilizante Variedad A B C D

1 35263820

45393943

24233629

55483949

5

Page 6: problemes ANOVA  2009 resolts

2 55446864

64576261

58744969

68616075

3 97899299

93918298

89988587

82788992

Escribir el modelo estadístico correspondiente al diseño experimental utilizado Estudiar las diferencias entre variedades y fertilizantes. ¿Se puede aceptar normalidad de los residuos?

15.- Una fábrica productora de cerveza está estudiando el efecto que tiene sobre el sabor el tipo de levadura y de malta empleados en la fermentación. En el estudio se utilizan "a" tipos de levadura y "b" tipos de malta . Tras el periodo de fermentación, un catador procede a evaluar el sabor de "r" muestras de cerveza de cada una de las combinaciones experimentales. A cada muestra se asigna un valor de sabor de una escala numérica previamente establecida y validada. Un mayor valor en dicha escala significa un mejor sabor. La tabla ANOVA obtenida es :

Factor Suma cuadrados Grados libertad Cuadrado medio FLevadura 201.04 2

Malta 580.8 3Interacción 6

Error 1787.04 48Total 3259.26 59

Escribir el diseño que se utiliza (Factores, parametrización), indicando número de niveles de cada factor y número de réplicas.

Completar la tabla ANOVA y resolver el diseño. Interpretar qué significaría en este problema la existencia de interacción.

16.- Estudiamos el tiempo de supervivencia (unidad=10 horas) de grupos de cuatro animales a los que se asignó 4 venenos y 3 terapias.

TABLA DE DATOS

TerapiaVeneno A B C D

I 0.310.450.460.43

0.821.100.880.72

0.430.450.630.76

0.450.710.660.62

II 0.360.290.400.23

0.920.610.491.24

0.440.350.310.40

0.561.020.710.38

III 0.220.210.180.23

0.300.370.380.29

0.230.250.240.22

0.300.360.310.33

Ver si hay diferencias respecto venenos,terapias y interacción.

6

Page 7: problemes ANOVA  2009 resolts

Hem fet una modificación consistent en veure que passaria si en cada cel·la experimental hi hagués un sol valor a part de perdre robustesa en l’experiment. Residu per k=2 sigui 0. Cal fet k=1, que és un model de 2 factors sense interacció (suposem la no interacció).

17.- Deseamos estimar las causas de la variabilidad del nivel basal de testosterona en ratas. Para ello se toman 5 ratas, realizando 2 técnicos de laboratorio los análisis, replicando cada uno los mismos.Las sumas de cuadrados obtenidas son :

Debida a rata : 302.5Debida a técnico: 102.4Interacción: 25Residuo: 102.2

Resolver el diseño, y obtener el porcentaje de variabilidad debida al técnico.

18.- En un experimento en pollos se estudia el consumo de agua después de un tratamiento. Para ello se dispone de seis animales dentro del grupo control y 6 animales dentro del grupo tratado. Para cada animal se eligen 3 días al azar en los que se mide la cantidad de agua consumida. El objetivo del estudio es ver si el tratamiento afecta el consumo de agua, y estudiar la variabilidad de dicho consumo. Se pregunta:

Escribir el diseño experimental utilizado ( factores, parametrización) Resolver el diseño eligiendo uno de los listados que se presentan a continuación

(Trabajar con nivel de significación de 0.10).

LISTADO 1 Analysis of Variance for consumo - Type III Sums of Squares--------------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value--------------------------------------------------------------------------------MAIN EFFECTS A:dia 2956,81 2 1478,41 0,33 0,7295 B:grup 10199,9 1 10199,9 2,25 0,1649 C:animal1 9134,6 5 1826,92 0,40 0,8367

INTERACTIONS AB 518,889 2 259,445 0,06 0,9448 AC 23127,7 10 2312,77 0,51 0,8488 BC 25634,4 5 5126,87 1,13 0,4053

RESIDUAL 45419,5 10 4541,95--------------------------------------------------------------------------------TOTAL (CORRECTED) 116992,0 35--------------------------------------------------------------------------------

Multiple Range Tests for consumo by grup

--------------------------------------------------------------------------------Method: 95,0 percent Tukey HSDgrup Count LS Mean Homogeneous Groups--------------------------------------------------------------------------------2 18 267,436 X1 18 301,101 X--------------------------------------------------------------------------------Contrast Difference +/- Limits--------------------------------------------------------------------------------1 - 2 33,6648 50,0545 --------------------------------------------------------------------------------* denotes a statistically significant difference.LISTADO 2

Analysis of Variance for consumo - Type III Sums of Squares--------------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value--------------------------------------------------------------------------------MAIN EFFECTS A:grup 10199,9 1 10199,9 3,40 0,0776 B:animal1 9134,6 5 1826,92 0,61 0,6940

7

Page 8: problemes ANOVA  2009 resolts

INTERACTIONS AB 25634,4 5 5126,87 1,71 0,1710

RESIDUAL 72022,9 24 3000,96--------------------------------------------------------------------------------TOTAL (CORRECTED) 116992,0 35--------------------------------------------------------------------------------All F-ratios are based on the residual mean square error.

Multiple Range Tests for consumo by animal1

--------------------------------------------------------------------------------Method: 95,0 percent Tukey HSDanimal1 Count LS Mean Homogeneous Groups--------------------------------------------------------------------------------1 6 264,613 X6 6 268,694 X2 6 274,12 X3 6 291,085 X5 6 303,004 X4 6 304,094 X--------------------------------------------------------------------------------Contrast Difference +/- Limits--------------------------------------------------------------------------------1 - 2 -9,5075 97,8124 1 - 3 -26,472 97,8124 1 - 4 -39,4812 97,8124 1 - 5 -38,3913 97,8124 1 - 6 -4,08117 97,8124 2 - 3 -16,9645 97,8124 2 - 4 -29,9737 97,8124 2 - 5 -28,8838 97,8124 2 - 6 5,42633 97,8124 3 - 4 -13,0092 97,8124 3 - 5 -11,9193 97,8124 3 - 1,08983 97,8124 4 - 6 35,4 97,8124 5 - 6 34,3102 97,8124 6 22,3908 97,8124 4 - 5 --------------------------------------------------------------------------------* denotes a statistically significant difference.LISTADO 3

Dependent variable: consumoFactors: grup animal2

Number of complete cases: 36

Analysis of Variance for consumo--------------------------------------------------------------------------------Source Sum of Squares Df Mean Square Var. Comp. Percent--------------------------------------------------------------------------------TOTAL (CORRECTED) 116992,0 35--------------------------------------------------------------------------------grup 10199,9 1 10199,9 373,5 10,57animal2 34769,0 10 3476,9 158,647 4,49ERROR 72022,9 24 3000,96 3000,96 84,94--------------------------------------------------------------------------------

19.- En una fábrica de galletas , se desea estudiar la influencia que sobre la viscosidad de la masa pueden tener los siguientes factores:A: Harina en función del proveedor (considera harinas de sus tres proveedores, que serán los únicos tres tipos de harina que utiliza la empresa) B: Tipo de agua utilizada (considera 4 tipos de agua fijados previamente)

Para ello produce en un día concreto 24 masas, obteniendo las siguientes medidas de viscosidad:

Agua 1 Agua 2 Agua 3 Agua 4

Harina 1 19 , 22 22 , 23 24 , 22 18 , 21

8

Page 9: problemes ANOVA  2009 resolts

Harina 2 20 , 23 20 , 22 23 , 22 21 , 22Harina 3 25 , 24 26 , 28 24 , 29 28 , 29

Analizar los resultados estadísticos del experimento. Decidir qué diseño se tiene y resolverlo (Descripción de los factores, parametrización del diseño, planteo y resolución de los tests de interés , comparaciones múltiples si es necesario)

2 Factors d’efectes fixos (aigua i farina). Podem evaluar l’interacció dels dos factors.

Si de las dos medidas que tenemos para cada combinación de harina y agua tenemos que la primera se ha realizado con un método A y la segunda con un método B, volver a definir el diseño que se tiene (factores, tipo de los factores, parametrización) y plantear y resolver los tests de interés y comparaciones múltiples si es necesario.

Suponer normalidad de los residuos y homogeneidad de varianzas. Considerar el nivel de significación igual a 0.05 .

Análisis de la Varianza paraViscositat - Sumas de Cuadrados de Tipo III--------------------------------------------------------------------------------Fuente Suma de cuadrados GL Cuadrado Medio Cociente-F P-Valor--------------------------------------------------------------------------------EFECTOS PRINCIPALES A:Aigua 10.7917 3 3.59722 1.25 0.3347 B:Farina 140.333 2 70.1667 24.41 0.0001

INTERACCIONES AB 24.3333 6 4.05556 1.41 0.2876

RESIDUOS 34.5 12 2.875--------------------------------------------------------------------------------TOTAL (CORREGIDO) 209.958 23--------------------------------------------------------------------------------

L’únic factor que presenta un efecte significatiu és el tipus de farina. La farina de tipus 3 presenta una viscositat més elevada. Tenim evidències per rebutjar la hipòtesi nul·la de la interacció (no significativa), llavors els dos factors es comporten de forma additiva (independent entre ells).

Llavors, prodecim a mirar les diferències entre els tipus de farines amb comparacions múltiples:

- Bonferroni (1,2/3)- Newman-Keuls (1,2/3)- Scheffe (1,2/3)- LSD (encara que no és adequada fer la comparació per aquest mètode) (1,2/3)

Si replantejem el problema podem fer les consideracions de:

- Considerar que no hi ha interacció. La suma de quadrats de la interacció i els graus de llibertat es summen als residurs. (58.8 i 18). L’augment de graus de llibertat augmenta la robustesa del model. El p-valor es fa encara més significatiu (0.0000).

- Considerar que com que l’aigua no té diferències significatives no la fem intervenir i tenim més replicats de cada cel·la experimental pel que fa a les farines utilitzades.

9

Medias y 95.0 Porcentajes Intervalos de Confianza

Farina

Vis

cosi

tat

1 2 320

22

24

26

28

Page 10: problemes ANOVA  2009 resolts

*** Si repetim l’anàlisi considerant que es tractés de 2 factors d’efectes aleatoris canvien els F-ratio i graus de llibertat (farina: gl:2,6). Tanmateix, en aquest cas no canvia el resultat qualitatiu (p-valor: 0.0032).

20 . - Un zoólogo está interesado en el efecto que tiene la temperatura (A), las horas de luz (B) y la abundancia de nutrientes (C) sobre el tiempo de vida (Y) de un arácnido. Se eligen dos niveles (1 y 2) de cada factor y se toman 3 réplicas de cada condición experimental: Los resultados han sido:

A B C Y1 1 1 22 31 252 1 1 32 43 301 2 1 35 34 482 2 1 55 48 471 1 2 45 45 392 1 2 40 37 371 2 2 61 50 542 2 2 39 41 46

Describir el diseño ( factores, de qué tipo son, parametrización )

Es tracta d’un disseny de tres factors (A,B, C) on la variable resposta és Y. Es tracta de dos factors d’efectes fixos ja que els ha triat per unes determinades raons, no són triades a l’atzar entre un conjunt més gran.

Cal dir-li al STATGRAPHICS que l’ordre màxim d’interacció és 3.

Contrastar con qué efectos (factores e interacciones) son significativos.

Análisis de la Varianza paraY - Sumas de Cuadrados de Tipo III--------------------------------------------------------------------------------Fuente Suma de cuadrados GL Cuadrado Medio Cociente-F P-Valor--------------------------------------------------------------------------------EFECTOS PRINCIPALES A:A 1.5 1 1.5 0.06 0.8137 B:B 726.0 1 726.0 27.79 0.0001 C:C 294.0 1 294.0 11.25 0.0040

INTERACCIONES AB 13.5 1 13.5 0.52 0.4826 AC 541.5 1 541.5 20.73 0.0003 BC 54.0 1 54.0 2.07 0.1698 ABC 37.5 1 37.5 1.44 0.2483

RESIDUOS 418.0 16 26.125--------------------------------------------------------------------------------TOTAL (CORREGIDO) 2086.0 23

Decidir, si es posible, en qué condición el tiempo de vida medio es más alto.

Només cal mirar per cada factor en el gràfic corresponent quin dels dos nivells dóna una vida més elevada. El resultat és A1 B2 C2.

21.- Una fábrica productora de cerveza está estudiando el efecto que tiene sobre el sabor el tipo de levadura empleada en la fermentación. En el estudio se utilizan tres tipos de levadura. Tras el periodo de fermentación, dos catadores proceden a evaluar el sabor de tres muestras de cerveza de cada una de las levaduras . A cada muestra se asigna un valor de sabor de una escala numérica previamente establecida y validada. Un mayor valor en dicha escala significa un mejor sabor.

Se pide:

10

Page 11: problemes ANOVA  2009 resolts

Resolver el diseño ( Descripción de los factores, parametrización del diseño, resolución de la tabla ANOVA , etc.. ) utilizando el listado correcto de entre los que se adjuntan.

Disseny de 2 factors (llevat i catadors). Els efectes dels factors és fix per el llevat ja que sempre són els mateixos, i pel que fa als catadors podrien ser fixos o aleatoris depenent de si es tracta dels dos catadors de l’empresa o dos de seleccionats a l’atzar.

També podem evaluar la interacció ja que tenim tres rèpliques de cada tipus de cervesa.

* Cal pensar que en el disseny experimental s’hauria d’aleatorietzar l’administració de les mostres de cervesa.

Si consideramos que la presencia o no de cierto aditivo A puede alterar el sabor, y deseamos experimentar también con este factor, ¿cuál sería el diseño resultante? Escribir ahora los factores (indicando su naturaleza) y la parametrización del diseño .

Això afegiria un factor més de tipus fix (catador, llevat i presència del aditiu).

LISTADO 1

Interactions and 95,0 Percent Confidence Intervals

levadura

cali

tat

catador12

2,9

3,9

4,9

5,9

6,9

7,9

1 2 3

Analysis of Variance for calitat - Type III Sums of Squares--------------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value--------------------------------------------------------------------------------MAIN EFFECTS A:levadura 10,7778 2 5,38889 B:catador 0,142222 1 0,142222 INTERACTIONS AB 0,351111 2 0,175556 RESIDUAL 13,4667 12 1,12222--------------------------------------------------------------------------------TOTAL (CORRECTED) 24,7378 17----------------------------------------------------------------------------------------------------------------------------------------------------------------Method: 95,0 percent LSDlevadura Count LS Mean Homogeneous Groups--------------------------------------------------------------------------------3 6 4,53333 X 1 6 5,03333 X 2 6 6,36667 X--------------------------------------------------------------------------------

LISTADO 2Factors:

11

Page 12: problemes ANOVA  2009 resolts

levadura catadorrNumber of complete cases: 18Analysis of Variance for calitat--------------------------------------------------------------------------------Source Sum of Squares Df Mean Square Var. Comp. Percent--------------------------------------------------------------------------------TOTAL (CORRECTED) 24,7378 17--------------------------------------------------------------------------------levadura 10,7778 2 5,38889 0,742593 44,37catadorr 5,6 6 0,933333 0,00222222 0,13ERROR 8,36 9 0,928889 0,928889 55,50--------------------------------------------------------------------------------LISTADO 3Variance Components AnalysisDependent variable: calitatFactors: levadura catadorNumber of complete cases: 18Analysis of Variance for calitat--------------------------------------------------------------------------------Source Sum of Squares Df Mean Square Var. Comp. Percent--------------------------------------------------------------------------------levadura 10,7778 2 5,38889 0,711111 38,79catador 0,493333 3 0,164444 0,0 0,00ERROR 13,4667 12 1,12222 1,12222 61,21

22.- Se ha medido la longitud del ala en dos especies de Drosophila : Melanogaster y Simulans, mantenidas en condiciones de laboratorio. Las mediciones se hicieron en poblaciones capturadas en dos áreas de interés especial . Los resultados fueron los siguientes :

Area A Area BMelanog. Machos

Hembras1.7 1.8 2.22.3 2.0 2.4

1.8 2.0 2.01.9 2.2 2.2

Simulans MachosHembras

1.8 1.9 2.02.2 2.3 2.1

1.7 1.8 1.92.3 2.4 2.2

Escribir el modelo estadístico correspondiente a la situación experimental anterior.

Disseny de dos factors. El sexe és un factor d’efectes fixos ja que no hi possibilitat de triar gèneres a l’atzar; les àrees són dos d’interès, per tant també fix.

Analizar si se pueden detectar diferencias entre especies, sexos y años y las interacciones.

23.- Se desea estudiar la alimentación de erizos de mar en relación a distintos tipos de alimentos ingeridos (se consideran 3 tipos A,B,C), al tipo de hábitat en que se recogen las muestras (2 tipos de fondos) y la época del año( 4 estaciones). La variable que se analiza es la ingesta.Las sumas de cuadrados debidas a cada uno de los factores son las siguientes :

Debido alimentación 14035Debido hábitat 408.3Debido estación 181.2Aliment*hábitat 238.2Aliment*estación 75.02hábitat*estación 6822.5Alim.*habitat*estac. 228.1Residuo 293

Obtener la parametrización del diseño describiendo los factores y su naturaleza. Decidir qué factores son significativos, sabiendo que el número de grados de libertad

del residuo es de 24.

Disseny de 3 factors:- Alimentació: efectes fixos (clarament fixos tal com s’ha explicat a l’enunciat)

12

Page 13: problemes ANOVA  2009 resolts

- Estacions: efectes fixos (bàsicament són les 4 que hi ha)- Fons: efectes fixos (els hem triat en base a coneixements no són a l’atzar)

24.- Se compara la producción obtenida mediante 4 fertilizantes distintos, utilizando un diseño de cuadrado latino a partir de dos factores en que se han descompuesto las parcelas en que se va a investigar . Los valores de producción obtenidos (junto con el fertilizante utilizado) son :

FACTOR IIFACTOR I 1 2 3 4

1 A 263 B 380 C 290 D 3882 D 340 A 290 B 400 C 3983 C 330 D 300 A 270 B 2704 B 320 C 280 D 340 A 280

¿Pueden aceptarse diferencias entre fertilizantes?

25.- En un intento de mejorar nuestra capacidad culinaria como elemento básico de equilibrio psico-físico en el duro intento de mantener una producción científica eficiente, supongamos que hemos decidido optimizar nuestra ya de por si depurada técnica en la elaboración de la fideua. Sin embargo, pensamos que existen diversos factores que pueden afectar la calidad de la misma ; por ejemplo Factor A: Cuecen más o menos de 12 minutos; Factor B: Escucho música o no mientras los hago; Factor C: Los complementos son del mercado o son un congelado cualquiera del super ; Factor D: La pasta es Saula o La Familia; Factor F: Hago más cosas mientras cocino o "sólo" cocino; Factor G: Me llaman mientras cocino o no me interrumpen mientras cocino. Contrastar tantos factores sería infactible. Sin embargo decido invitar 8 veces a mis amigos intentando mediante un diseño fraccionado, averiguar cuales de los factores anteriores son significativos, y cual de las contrastadas es la condición óptima. (la medida que se toma es una medida de calidad que me proporcionan los amigos). A partir de los datos que se adjuntan : (La condición primera enunciada es la –1 y la segunda la +1).

A B C D E F G VAR-1 -1 -1 1 1 1 -1 10.4

1 -1 -1 -1 -1 1 1 7.8

-1 1 -1 -1 1 -1 1 9.4

1 1 -1 1 -1 -1 -1 7.4

-1 -1 1 1 -1 -1 1 13.1

1 -1 1 -1 1 -1 -1 18.2

-1 1 1 -1 -1 1 -1 19.1

1 1 1 1 1 1 1 12.7

Explicar el modelo utilizado y los factores confundidos. Resolver el diseño, analizando qué factores resultan significativos. ¿Qué condición

crees que es la òptima? Interpreta los resultados obtenidos en este apartado.

Exemple de disseny 2^k. Aquest consisteix en reduïr els nivells dels k factors a 2 per facilitar el treball. Existeixen variacions d’aquest que s’anomenen fraccions de 2^k. En aquest cas si seguissim com està el experiment tindriem 2^7 (128) cel·les experimentals. Tan mateix només

13

Page 14: problemes ANOVA  2009 resolts

ens donen 8 cel·les 2^(7-4) (8); per tant hi ha una fracció de 1/16. Això s’utilitza sovint en experiments exploratoris.

No entra en el curs perquè no es donarà aquest tema.

26.-Medimos el tiempo en recorrer un circuito de Mountain-Bike de 15Km. fijo. Deseamos el efecto que diversos factores pueden tener. Factor A: Ha llovido fuerte el dia antes o no ; Factor B: Hace sol o no;Factor C: Vas sólo o con tu compañero habitual de ruta; Factor D: Mañana o Tarde; Factor E: Relajado o con ganas de "quemar". Analizar el efecto de dichos factores si los datos obtenidos son : : (La condición primera enunciada es la –1 y la segunda la +1)

A B C D E VAR-1 -1 -1 -1 1 53

1 -1 -1 -1 -1 38

-1 1 -1 -1 -1 40

1 1 -1 -1 1 47

-1 -1 1 -1 -1 42

1 -1 1 -1 1 42

-1 1 1 -1 1 48

1 1 1 -1 -1 49

-1 -1 -1 1 -1 33

1 -1 -1 1 1 37

-1 1 -1 1 1 45

1 1 -1 1 -1 43

-1 -1 1 1 1 40

1 -1 1 1 -1 37

-1 1 1 1 -1 43

1 1 1 1 1 50

Explica qué diseño se ha utilizado y los factores confundidos que se han considerado.Resuelve el diseño indicando los factores significativos, condición óptima, interpretando los resultados.

No entra en el curs perquè no es donarà aquest tema.

27.-Sea un diseño factorial con 6 factores en el cual se realizan 8 experimentos como se indica en la tabla adjunta:

A B C D E F Y

14

Page 15: problemes ANOVA  2009 resolts

- - - + + + 95+ - - - - + 65- + - - + - 90+ + - + - - 87- - + + - - 96+ - + - + - 57- + + - - + 92+ + + + + + 88

Indicar a que fracción corresponde este diseño fraccionado respecto del completo. Si los generadores del diseño vienen dados por las ecuaciones D = AB, E = AC y F = BC

resolver el diseño.

No entra en el curs perquè no es donarà aquest tema.

28.- Se realiza un experimento para detectar la influencia de 5 factores sobre el peso de una especie marina

A: Temperatura (- baja, + alta),B: Suplemento de minerales (-no, +si),C: Nutrientes enriquecidos (-no, +si),D: Densidad población (-baja, +alta),E: Salinidad (- baja, + alta).

El diseño realizado es

A B C D E Y- - - + + 85+ - - - - 77- + - - + 103+ + - + - 95- - + + - 101+ - + - + 117- + + - - 198+ + + + + 184

Identificar el tipo de diseño. Indicar la resolución, y los efectos confundidos o estructura alias.

Estimar los efectos. Indicar qué efectos son significativos. Eliminando los efectos no significativos, reescribir la ecuación del nuevo modelo. ¿ Cuál es el incremento medio esperado cuando el factor C cambia de nivel – a nivel +.

Obtener las condiciones en que se obtiene un peso máximo.

No entra en el curs perquè no es donarà aquest tema.

29.- Se desea investigar el contenido de humedad de la pintura que produce determinada fábrica. Se toman dos muestras de cada uno de 15 depósitos de pintura producida. Se ejecutan dos medidas en cada muestra , a fin de evaluar la variabilidad del aparato de medida. Se tratará de evaluar la variabilidad de la medida obtenida a partir de un diseño anidado .Para ello se deberán calcular las componentes de la varianza debida a cada una de las causas de variación consideradas ( depósito, muestra y aparato de medida ) .Los datos obtenidos son los siguientes :

Muestra 1 Muestra 1 Muestra 2 Muestra 2Depositos Medida 1 Medida2 Medida1 Medida21 40 39 30 302 26 28 25 263 29 28 14 154 30 31 24 24

15

Page 16: problemes ANOVA  2009 resolts

5 19 20 17 176 33 32 26 247 23 24 32 338 34 34 29 299 27 27 31 3110 13 16 27 2411 25 23 25 2712 29 29 31 3213 19 20 29 3014 23 24 25 2515 39 37 26 28

Calcular las componentes de la varianza.

Disseny de 2 factors (dipòsit=f.ef.al·leatòris, mostra=f.ef.al·leatòris). Estructura jeràrquica on la mostra està niuada al dipòsit ja que no són 2 mostres totals sinó 30. La mesura es podria entendre com un factor niuat però suposaria quedar-nos sense rèpliques. El dipòsit és un factor d’efectes al·leatòris perquè són 15 (molt possiblement iguals) d’un mateix model.

Si imaginem que treiem 2 mostres, una de la part de dalt i l’altra de baix. La mostra passa a ser un factor d’efectes fixos, i el disseny deixa de ser niuat per ser creuat, perquè ara el nostre interès se centrarà en veure diferències entre superfície i profunditat, i no pas en diferència entre dipòsits. 30.- En un estudio sobre la heredabilidad de las cualidades anaeróbicas se consideran 4 parejas de hermanos gemelos monocigotos y 4 parejas dicigotos . Entre otras variables se mide la potencia anaeróbica desarrollada en 15"(W/Kg), obteniendo dos medidas para cada individuo. Los datos obtenidos son los siguientes :

Monocigotos:

P.1 Ind.1 20.6, 20.62P.1.Ind.2 20.3, 20.7P.2.Ind.1 22.1 ,22.4P.2.Ind.2 22.3, 23P.3.Ind.1 21.4, 23.4P.3.Ind2. 24.0, 23.2P.4.Ind.1 24.0, 23.1P.4.Ind.2 23.5, 22.0

Dicigotos

P.1 Ind.1 21.6, 22.62P.1.Ind.2 20.5, 21.7P.2.Ind.1 22.2, 24.4P.2.Ind.2 23.3, 25P.3.Ind.1 24.4, 22.4P.3.Ind2. 21.0, 21.2P.4.Ind.1 20.0, 21.1P.4.Ind.2 22.1, 22

¿Hay diferencias entre monocigotos y dicigotos? Obtener las componentes de la varianza.

31.- Se compara el efecto de tres fertilizantes en la producción de peras. Para ello una finca de una gran extensión y aparentemente homogénea se divide en tres zonas y en cada zona se aplica un fertilizante distinto. De cada zona se seleccionan 4 árboles

16

Page 17: problemes ANOVA  2009 resolts

aleatoriamente y de cada árbol 3 ramas, midiendo finalmente la producción de cada rama (en Kg.) Los resultados obtenidos son:

Fertilizante Arbol Produccion1 1 21

21.52324

1 2 23242323.2

1 3 24232425.2

1 4 21232225

2 1 24262627

2 2 23.424.325.328

2 3 2123.42724

2 4 21.272922

3 1 19.2212321

3 2 232323.422

3 3 17.2232122

3 4 18.323.32221

Escribir el modelo estadístico para la situación experimental anterior.Model de dos factors jerarquitzat Ver si existen diferencias entre fertilizantes. Analizar la variabilidad que aportan árbol y rama. ¿Que modelo resultaría si en vez de medir la producción, se hubieran tomado 3

peras por rama y se hubiera medido el calibre?

Tindriem un model jerarquitzat amb tres factors l’arbre subordinat al fertilitzant, la branca a l’arbre i les peres a la branca. Yijkl

32.- Se desea comparar el efecto de dos fármacos antidepresivos . Se eligen 4 hospitales, de forma que cada hospital ensaya sólo un fármaco. Dentro de cada hospital se eligen 5 pacientes al azar. Se mide el grado de efectividad del fármaco de acuerdo a una variable que recoge la

17

Page 18: problemes ANOVA  2009 resolts

mejoría del estado después de la administración del fármaco. Se considera normalidad para la variable observada. Los datos obtenidos son :

Hospital 1 - Fármaco 1 : 15,12,18,13,14.Hospital 2 - Fármaco 1 . 18,16,20,17,19.Hospital 3 - Fármaco 2 . 30,28,32,31,29.Hospital 4 - Fármaco 2 . 35,33,37,34,36.

Describir el modelo ANOVA utilizado Decidir la significación estadística de los factores

Disseny de 2 factors niuats, hospital (ef. al·leatòris) a fàrmac (ef. fixos). Si tots els hospitals passesin a provar tots els fàrmac, llavors estariem davant d’un disseny de factors creuats.

33.- Se toman 5 exámenes de una misma materia de las PAAU y 3 correctores para cada examen. De cada examen se realizan 2 copias y se mezclan junto con 200 examenes más, de modo que cada corrector habrá corregido dos veces cada examen. Los datos obtenidos relativos a las calificaciones han sido:

Ex.1 Ex.2 Ex.3 Ex.4 Ex.5

C1 7.2, 7.3 6.3, 6.5 7.5, 7 7.4, 7.2 8 ,8.5C2 7, 7.1 6.1, 6.4 7.2, 8 7, 7.2 8, 8.2C3 7, 6 6, 7 7, 8 6, 6 8, 7

Obtener la descomposición de la variabilidad. ¿Qué ocurriría si se hubiesen elegido 3 correctores únicamente y cada uno hubiese

corregido los 5 exámenes? Passariem a un disseny creuat.

Si deseas obtener la variabilidad debida al proceso de corrección de la prueba, ¿qué experimento propondrías?.

Disseny de factors niuats, corrector (f. ef. al·leatòris) niuat a examen (f. ef. al·leatòris) (“3 correctores para cada examen”).

Si consideresim les dos correccions separades per 200 exàmens, tindirem un nou factor d’efectes fixos (correcció). Disseny creuat si tots els correctors són sempre els mateixos. Això portaria a no tenir rèpliques (no podem mirar si hi ha interacció triple, perquè és el residu). Tindriem un residu amb 8 graus de llibertat. Disseny mixt entre jerarquitzat i creuat si tenim 15 correctors diferents niats a cada examen i el factor creuat posició perquè ho està a corrector i exàmen. Yijk=µ+Ai+Bj(i)+ γk+Aγik+eijk. Si considerem Examen-Posició si que podem mirar la interacció perquè hi ha les rèpliques que suposa cada corrector.

El disseny niuat ens ofereix la possibilitat de estimar la variabilitat entre correctors (dóna més graus de llibertat, (15-1)*(5-1)). En el cas de disseny creuat tenim gl=(3-1)*(5-1).

Si només poguéssim fer una correcció per cada corrector, seria un disseny de dos factors amb una rèplica per cèl·la.

Si agafessim examens en intervals de 2 en 2 punts (0-2, 2-4, 4-6, 6-8, 8-10). Llavors l’examen serien un factor d’efectes fixos.

Si agrupessim els exàmens per nota, n’agafessim 3 a l’atzar de cada interval i els assignessim a un corrector, tindriem un disseny niat i creuat amb qualificació (fix), examen (al·leatori) i corrector (al·leatori). Ens permetria valorar la interacció entre qualificació i corrector.

Se soluciona amb general linear models.

18

Page 19: problemes ANOVA  2009 resolts

34.-Averigua a qué tipo de diseño se corresponde, completa la siguiente tabla ANOVA y resuelve el diseño.

C.V. S.Q. g.l.. Q.M. FexpA 21.4 2B 14 6Residuo 18 36

35.- En una zona que ha padecido recientemente una fuerte contaminación se desea estudiar la concentración de determinado elemento. Después de ciertos análisis se supone una media de 30 unidades. Sin embargo, una concentración superior a 34 unidades supondría un tóxico letal para la fauna que entrara en contacto . Algún científico desplazado para el estudio opina que sólo un 1% de la zona puede presentar tal concentración. No contentos con dicha afirmación , deseamos realizar un experimento con el fin de contrastar las opiniones del científico. Para ello se toman muestras de 3 zonas tomadas aleatoriamente en la zona global afectada . De cada zona se toman muestras de 2 subzonas y se realiza análisis y contraanálisis, puesto que sospecha de una cierta variabilidad en la toma de la medida. Los datos obtenidos son:

Zona 1: Subzona 1 30.2, 30.3Subzona 2 29.8, 29.5

Zona 2: Subzona 1 31.4, 30.4Subzona 2 32.3, 32.5

Zona 3: Subzona 1 30.9, 31.6Subzona 2 32.5, 32.7

Obtener conclusiones del análisis de datos efectuado.

Disseny de 2 factors al·leatòris niuats, subzona (al·leatori) niat a zona (al·leatori). La anàlisi i contraanàlisi són les 2 rèpliques.

36.- Con el fin de evaluar la fiabilidad en la determinación de cierta medida biométrica de una especie por la observación a partir de una fotografía, se propone el siguiente experimento:Se consideran 4 fotografías del mismo individuo, y dos investigadores por fotografía ( en total 10 investigadores) tomando la medida 2 veces por foto. Los datos obtenidos han sido :

Fotografía 1: Inv.1: 12, 12.1;Inv.2:12.2, 12.3Fotografía 2: Inv.1: 11.9,11.8;Inv.2:12.2,12.2Fotografía 3: Inv.1:11.8, 11.8;Inv.2:13,12.8Fotografía 4: Inv.1:12.3;12.1;Inv.2:13.2,13.2

Analizar la variabilidad observada y extraer conclusiones. Idem. en el caso de que sólo tenemos 2 investigadores que miran todas las fotos.

37.-Se desea comparar determinado paràmetro sanguíneo después de someter a los pacientes (voluntarios) a dos dietas distintas. Se consideran 4 voluntarios para cada dieta , y se realizan 3 análisis a cada voluntario. Los resultados obtenidos son :

Dieta 1:Voluntario 1 : 12.2, 13.3, 14Voluntario 2 : 12.4, 13.4, 13.3Voluntario 3 : 12, 13.5, 13.4Voluntario 4: 12.5, 12.6, 11

Dieta 2 :Voluntario 1 : 13, 13.5, 13

19

Page 20: problemes ANOVA  2009 resolts

Voluntario 2: 12, 13.6, 14Voluntario 3: 13, 13.8, 14Voluntario 4: 14, 14.6, 15.5

Describir el modelo ANOVA utilizado. Resolver el modelo

38.- Se ensayan 2 metodos docentes para desarrollar una asignatura (método A y método B). Para ello se consideran 3 profesores elegidos al azar de entre los profesores del centro que desarrollan el procedimiento A y 3 profesores también elegidos al azar de entre los que desarrollan el procedimiento B, disponiendo en la clase de alumnos con un grado de conocimientos muy homogéneo . Para evaluar los resultados se consideran 4 alumnos elegidos aleatoriamente de cada profesor a los que se aplica un test muy preciso del que se da la valoración :

Método A Método BProfesor 1 Profesor 2 Profesor 3 Profesor 4 Profesor 5 Profesor 6

6,24 6,54 7,06 7,32 5,45 7,097,27 7,00 8,08 7,32 6,57 4,375,27 8,03 7,09 8,37 8,90 7,906,34 6,04 4,02 6,38 6,89 9,0

Estudiar la diferencia entre métodos y la significación de los demás factores implicados. Obtener las componentes de la varianza de la variable respuesta.

Resolver el mismo problema si los profesores que ensayan los métodos A y B son los mismos ( es decir se eligen 3 profesores que ensayan ambos métodos).

Nivel de significación : 0.05 . Suponer Normalidad de los residuos y homogeneidad de varianzas.

39.- En un experimento sobre Posidonia Oceánica se mide una característica continua X . Se desean comparar 2 zonas prefijadas ( Zona 1: Llafranch , Zona 2 : Cadaqués) . Para ello se eligen al azar 3 transectos de cada zona de los que habitualmente se controlan, de los cuales se toman también al azar 4 muestras. Los resultados obtenidos son :

Llafranch CadaquésTransecto 1 Transecto 2 Transecto 3 Transecto 4 Transecto 5 Transecto 66,24 6,54 7,06 9,32 6,45 7,097,27 7,00 8,08 8,32 9,57 9,376,40 7,02 8,01 8,1 9,5 10,95,27 8,03 7,09 8,37 8,90 10,90

Estudiar la diferencia entre poblaciones y la significación de los demás factores implicados. Obtener las componentes de la varianza de la variable respuesta.

Supongamos que el experimentador en un día concreto sólo podía realizar 2 inmersiones. Los dos primeros datos de cada transecto se corresponden a un día y los dos segundos a otro día. En total se han seleccionado al azar 12 días para llevar a término el programa experimental.( Por ejemplo, los datos 6,24 y 7,27 del transecto 1 se corresponden al día 1, los datos 6,40 y 5,27 del transecto 1 al día 2, los datos 6,54 y 7 del transecto 2 al día 3, los datos 7,02 y 8,03 del transecto 2 al día 4 , etc... Plantear y resolver el diseño , obteniendo también las componentes de la varianza en este caso.

Suponer normalidad de residuos y homogeneidad de varianzas .Nivel de significación 0.05.

20

Page 21: problemes ANOVA  2009 resolts

40.- A fin de evaluar la variabilidad de cierta medida experimental, se consideran 3 muestras aleatorias de terreno, 2 experimentadores realizando cada experimentador 2 medidas. Las sumas de cuadrados obtenidas son :Debida a muestra: 0.213Debida a experimentador 0.128Debida a interacción 0.81

Ver si los factores considerados son significativos, y obtener una estimación del la variabilidad de la medida.

41. Los datos de este ejercicio se corresponden con un estudio en que se pretendía analizar la relación entre la biomasa de Spartina alterniflora (una alga de humedales) i cinco variables ambientales:

X1 = Salinidad (%0)X2 = Acidez (pH)X3 = Potasio (ppm)X4 = Sodio (ppm)X5 = Zinc (ppm)

Y = Biomasa (g/m2)Dato Salinidad Ph Potasio Sodio Zinc Biomasa1 33 5.00 1441.67 35184.5 16.4524 6762 35 4.75 1299.19 28170.4 13.9852 5163 32 4.20 1154.27 26455.0 15.3276 10524 30 4.40 1045.15 25072.9 17.3128 8685 33 5.55 521.62 31664.2 22.3312 10086 33 5.05 1273.02 25491.7 12.2778 4367 36 4.25 1346.35 20877.3 17.8225 5448 30 4.45 1253.88 25621.3 14.3516 6809 38 4.75 1242.65 27587.3 13.6826 64010 30 4.60 1282.95 26511.7 11.7566 49211 30 4.10 553.69 7886.5 9.8820 98412 37 3.45 494.74 14596.0 16.6752 140013 33 3.45 526.97 9826.8 12.3730 127614 36 4.10 571.14 11978.4 9.4058 173615 30 3.50 408.64 10368.6 14.9302 100416 30 3.25 646.65 17307.4 31.2865 39617 27 3.35 514.03 12822.0 30.1652 35218 29 3.20 350.73 8582.6 28.5901 32819 34 3.35 496.29 12369.5 19.8795 39220 36 3.30 580.92 14731.9 18.5056 23621 30 3.25 535.82 15060.6 22.1344 39222 28 3.25 490.34 11056.3 28.6101 26823 31 3.20 552.39 8118.9 23.1908 25224 31 3.20 661.32 13009.5 24.6917 23625 35 3.35 672.15 15003.7 22.6758 34026 29 7.10 525.65 10225.0 0.3729 243627 35 7.35 563.13 8024.2 0.2703 221628 35 7.45 497.96 10393.0 0.3205 209629 30 7.45 458.38 8711.6 0.2648 166030 30 7.40 498.25 10239.6 0.2105 227231 26 4.85 936.26 20436.0 18.9875 82432 29 4.60 894.79 12519.9 20.9687 119633 25 5.20 941.36 18979.0 23.9841 196034 26 4.75 1038.79 22986.1 19.9727 208035 26 5.20 898.05 11704.5 31.3864 176436 25 4.55 989.87 17721.0 23.7063 41237 26 3.95 951.28 16485.2 30.5589 41638 26 3.70 939.83 17101.3 26.8415 50439 27 3.75 925.42 17849.0 27.7292 49240 27 4.15 954.11 16949.6 21.5699 63641 24 5.60 720.72 11344.6 19.6531 175642 27 5.35 782.09 14752.4 20.3295 123243 26 5.50 773.30 13649.8 19.5880 140044 28 5.50 829.26 14533.0 20.1328 1620

21

Page 22: problemes ANOVA  2009 resolts

45 28 5.40 856.96 16892.2 19.2420 1560

Fuente: Rawlings, J.O., Applied Regression Analysis. A research tool. (Cap. 5). Wadsworth & Brooks.

Obtener el modelo de regresión lineal múltiple. Estudiar la significación de los coeficientes de regresión y la significación global del

modelo. Obtener intervalos de confianza para los coeficientes de regresión.

42. Un paleontólogo encontró gasterópodos de la especie Sphaeronasa mutabilis, y midió la altura (H), la altura de la última vuelta de la espiral de caracol (Hv), la altura de la boca (Hb), y la anchura (A) con los siguientes resultados:

H Hv Hb A1.803 1.433 0.967 1.2221.752 1.380 1.000 1.1161.571 1.242 0.883 1.0431.436 1.085 0.753 0.8791.513 1.168 0.792 0.9751.160 0.860 0.615 0.722

Calcular la matriz de correlaciones. Estudiar el modelo de regresión lineal múltiple que relaciona la altura con las

demás variables. Estudiar el mismo modelo, pero transformando logarítmicamente todas las

variables. ¿Ajusta mejor que el modelo anterior? c)Estimar la altura de un individuo de la especie con Hv= 1.3, Hb=0.88 y A= 1.10.

43.- Se está realizando un estudio de la humedad (variable Y) a partir de tres variables : X1 (Precipitación) , X2 ( Temperatura) y X3 (Radiación solar) tomando como muestras 30 puntos de un terreno . Los valores obtenidos son:

Y X1 X2 X30,423706 47,3689 8,29664 12,23010,333395 47,8523 5,59504 11,45480,409335 48,2628 6,96189 8,933420,26389 51,6151 8,57216 9,300660,328044 45,3012 6,62817 12,44160,486616 47,4757 5,99793 7,042540,476886 53,9646 8,15508 5,026470,353055 47,3996 5,41461 12,75340,536757 47,545 6,52899 6,284830,467588 51,0577 6,30277 11,47720,332912 51,9796 5,96299 8,094050,509049 49,8372 7,21348 11,08450,509549 51,4885 6,02034 6,62320,340709 51,7351 7,29101 8,189770,515985 49,9217 7,77814 10,94010,798432 72,1021 5,94264 10,98530,705284 69,2545 6,69062 8,344110,46625 67,4253 8,3321 13,43670,664003 68,3324 6,73515 9,9070,577383 72,1269 7,36008 8,382680,35695 71,2108 7,95648 11,5750,539982 70,847 6,49689 7,60880,658418 69,0672 6,30676 11,16140,808942 69,482 7,88436 7,882760,586561 71,4977 6,06656 9,802960,830898 68,4082 8,15641 7,932750,665214 72,5873 8,88434 6,0410,601256 68,9339 7,00749 7,404960,585335 71,7464 6,99639 9,638590,682558 72,7294 6,22989 10,8868

22

Page 23: problemes ANOVA  2009 resolts

El objetivo del estudio consiste en el análisis del modelo de regresión múltiple lineal de la variable Y respecto las demás. Se pide:

Determinar el modelo de regresión múltiple. Determinar la significación de los coeficientes del modelo. Determinar el coeficiente de correlación múltiple. Determinar intervalos de confianza para los coeficientes del modelo. Obtener coeficientes de correlación 2 a 2 entre todas las variables. Obtener coeficientes de correlación parcial. Estimar la predicción de humedad según el modelo en un punto donde X1= 71,2 X2=5,9

X3=10,8.

44.- Se está estudiando cierta característica de una zona a través de una imagen. La característica en cuestión viene como variable Y. Se sospecha que tres variables denominadas A, B y C pueden influir sobre la variable Y.Se han tomado 50 puntos de la imagen para los que se han determinado las 4 variables.Viendo el listado que se proporciona, se pregunta:

Obtener el modelo de regresión lineal múltiple. Estudiar la significación de los coeficientes de regresión y la significación del modelo. Obtener intervalos de confianza de los coeficientes de regresión. ¿Cual será el valor de Y estimado en el modelo para A=4 , B=15 y C=5,30 con nivel de

significación del 5% es:

One-Variable Analysis - YAnalysis SummaryData variable: Y50 values ranging from 25,88 to 36,03Confidence Intervals for Y

95,0% confidence interval for mean: 31,2544 +/- 0,633433 [30,621;31,8878]

95,0% confidence interval for standard deviation: [1,86183;2,77744]

Multiple Regression - Y

Multiple Regression Analysis-----------------------------------------------------------------------------Dependent variable: Y----------------------------------------------------------------------------- Standard TParameter Estimate Error Statistic P-Value-----------------------------------------------------------------------------CONSTANT -31,0092 0,230237 -134,684 0,0000A -0,0133954 0,00706048 -1,89723 0,0641B -0,0117966 0,00765441 -1,54116 0,1301C 11,1898 0,0527448 212,149 0,0000-----------------------------------------------------------------------------

Analysis of Variance-----------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value-----------------------------------------------------------------------------Model 243,294 3 81,098 29396,03 0,0000Residual 0,126905 46 0,00275881-----------------------------------------------------------------------------Total (Corr.) 243,421 49

R-squared = 99,9479 percentR-squared (adjusted for d.f.) = 99,9445 percentStandard Error of Est. = 0,0525243Mean absolute error = 0,0359784Durbin-Watson statistic = 1,97366

95,0% confidence intervals for coefficient estimates----------------------------------------------------------------------------- StandardParameter Estimate Error Lower Limit Upper Limit-----------------------------------------------------------------------------

23

Page 24: problemes ANOVA  2009 resolts

CONSTANT -31,0092 0,230237 -31,4727 -30,5458A -0,0133954 0,00706048 -0,0276074 0,000816656B -0,0117966 0,00765441 -0,0272042 0,00361092C 11,1898 0,0527448 11,0836 11,2959-----------------------------------------------------------------------------

Regression Results for Y------------------------------------------------------------------------------------------------------Fitted Stnd. Error Lower 95,0% CL Upper 95,0% CL Lower 95,0% CL Upper 95,0% CLRow for Forecast for Forecast for Forecast for Mean for Mean------------------------------------------------------------------------------------------------------28,0659 0,0550974 27,955 28,1768 28,0324 28,0994

45.- En un assaig clínic es varen estudiar dues formulacions de la droga Furosemida, un potent diurètic. Una corresponia a una formulació “innovadora” (el laboratori que la comercialitzava havia realitzat fortes inversions “d’innovació”, per a demostrar l’efectivitat de la droga) mentre que l’altra corresponia a un “genèric”, una formulació de la qual, per aconseguir la seva aprovació, només calia demostrar la seva “bioequivalencia” amb la innovadora –que és un procés molt més econòmic.Una de les variables més importants en aquesta mena d’estudis és Y = log(Cmax), el logaritme natural de la concentració màxima assolida al lloc d’acció. S’escolliren 6 voluntaris sans a l’atzar. Cada un d’aquests individus rebé la formulació innovadora (I) i la formulació genèrica (G) en ordre aleatori (per exemple, el primer individu podia haver estat tractat en l’ordre GI, el segon IG, etc) i amb un descans o “temps de neteja” apropiat entre administracions. Els valors de Y obtinguts foren els següents:

FormulacióIndividu

1 2 3 4 5 6Innovadora 0,22 0,34 0,54 0,59 0,48 0,34Genèrica 0,24 0,38 0,62 0,87 0,49 0,37

1. Indica el tipus de disseny utilitzat, tot indicant clarament la variable de resposta, els factors implicats, el seu caràcter (fix o aleatori) i els nivells de cada factor. Especifica el model lineal associat, amb la seva parametrització i condicions.

2. Determina si hi ha diferències significatives entre les mitjanes de Y segons els tipus de formulació administrada. Indica clarament les hipòtesis plantejades, el valor de l’estadístic de test, el p-valor i la decisió final.

3. Estima tots el paràmetres del model. 4. Estima la probabilitat de que un individu que ha rebut la formulació innovadora presenti un valor de

Y superior a 0,60.

En tot moment pots suposar normalitat i utilitzar un nivell de significació de 0,05.

2.- Es vol estudiar les diferències en quant a temperatura de l’aigua del mar de les tres darreres dècades. Per això, es prenen a l’atzar 3 anys de cada dècada, i es consideren les mesures d’un dia concret ( 20/3 )en una lectura feta en el mateix lloc i a la mateixa profunditat. En aquest punt , l’experimentador ha repetit la mesura dues vegades. Els resultats obtinguts són:

Any Mesura Temperatura1972 1 13,21972 2 131976 1 13,51976 2 13,51977 1 13,81977 2 141985 1 13,51985 2 13,61987 1 13,81987 2 13,91989 1 13,51989 2 13,81993 1 14,21993 2 14,11995 1 13,61995 2 13,2

24

Page 25: problemes ANOVA  2009 resolts

1997 1 14,61997 2 14,3

Es demana:

1. Es pot afirmar que hi ha diferències entre les tres dècades ? Descriure el model, plantejar les hipòtesis

i resoldre el disseny en base a la Taula ANOVA –resoldre els test d’hipòtesis. (nivell de significació

0.05). Estimar els paràmetres del model: efectes –si s’escau– i/o components de la variància –si

s’escau.

2. Suposem que s’han fet servir dos sistemes diferents per prendre les mesures 1 i 2. En aquest cas, de

les següents afirmacions cal dir quines són certes i quines falses:

a. El factor sistema de mesura està creuat a dècada

b. El factor sistema de mesura està jerarquitzat a dècada

c. Hi ha dues rèpliques per condició experimental

d. Hi ha una única rèplica per condició experimental

e. Factor any i factor sistema de mesura estan creuats

f. El factor any està jerarquitzat a dècada

g. El factor dècada està creuat al factor any

(NOTA: Es pot suposar normalitat de residus i homogeneïtat de variàncies)

3.- Volem estudiar les diferències per a certa mesura de resistència física en funció de l’esport . Per això

es seleccionen dos esportistes de quatre esports diferents en un centre d’alt rendiment (esportistes d’un

nivell similar i d’una edat similar), i es passa el test a cada esportista . Els resultats són els següents

Esportista Esport Mesura1 1 10,31 1 10,52 1 10,82 1 10,93 2 10,73 2 10,54 2 10,44 2 10,95 3 11,75 3 11,66 3 11,76 3 10,87 4 11,47 4 11,78 4 11,58 4 11,7

Es demana:

1. Descriure el model, plantejar les hipòtesis i resoldre el disseny en base a la Taula (nivell de

significació 0.10). Estimar els paràmetres del model: efectes –si s’escau– i/o components de la

variància –si s’escau–.

2. Decideix si hi ha diferències entre esports si tenim 4 esportistes per a cada esport de manera

que 2 són homes i 2 són dones.

Esportista Sexe Esport Mesura1 H 1 10,32 D 1 10,53 H 1 10,84 D 1 10,95 H 2 10,7

25

Page 26: problemes ANOVA  2009 resolts

6 D 2 10,57 H 2 10,48 D 2 10,99 H 3 11,710 D 3 11,611 H 3 11,712 D 3 10,813 H 4 11,414 D 4 11,715 H 4 11,516 D 4 11,7

4.- Es considera que amb l’exercici físic el pH de la sang tendeix a baixar, a causa de l’acumulació de CO2 i d’ions H+ a la musculatura. Que el pH sanguini baixi per sota de 6,8 (o que pugi per sobre de 7,4) pot provocar una crisi greu, amb possibilitat de mort. Sortosament hi ha mecanismes de regulació que tendeixen a mantenir el pH en nivells adequats. En un estudi es volia estudiar la relació entre el pH mitjà de la sang i l’exercici físic. Per aquesta raó es triaren 6 individus a l’atzar, d’una població molt més gran. Cada un d’aquests individus fou sotmès consecutivament a tres règims d’exercici intens (A, B i C), en ordre aleatori (de manera que, per exemple, el primer individu podia haver fet la seqüència CAB mentre que el segon la seqüència ACB, etc) sempre deixant un temps de repòs i recuperació entre cada una de les tres fases d’exercici.Els pH sanguinis mesurats a l’experiment foren els següents:

Règim d'exercici

Individu1 2 3 4 5 6

A 7,29 7,20 7,15 7,23 7,50 7,20B 7,26 7,16 7,08 7,11 7,16 6,89C 7,18 7,13 6,99 7,03 7,11 6,90

1. Indica el tipus de disseny utilitzat, tot indicant clarament la variable de resposta, els factors implicats, el seu caràcter (fix o aleatori) i els nivells de cada factor. Especifica el model lineal associat, amb la seva parametrització i condicions.

2. Determina si hi ha diferències significatives entre les mitjanes de pH segons els diferents règims d’exercici. Indica clarament les hipòtesis plantejades, el valor de l’estadístic de test, el p-valor i la decisió final.

3. Estima tots el paràmetres del model lineal. 4. Estima la probabilitat que un individu sotmès al règim C tingui una crisi deguda a una excessiva

acidificació de la sang.

En tot moment pots suposar normalitat i utilitzar un nivell de significació de 0,05.

5.- Es vol determinar la fiabilitat en la mesura del contingut de H2L en platges properes a zones industrials que disposen de depuradora. Per aquest motiu, s’escullen 3 poblacions de característiques fixades i per cada una d’elles es consideren a l’atzar dos punts del seu litoral. Els resultats de dues determinacions de cada mostra realitzades per el mateix operari es recullen a la taula

Punt 1 Punt 2

Població 1 42

41

43

42

Població 2 44

45

46

45

Població 3 47

46

49

48

Suposant normalitat de residus, homogeneïtat de variàncies per condició experimental i nivell

de significació 0.05, es demana: (triar d’entre els llistats que s’adjunten)

a. Descriure els factors (fix/aleatori, creuat/jerarquitzat, nivells, rèpliques) i la parametrització del model:

26

Page 27: problemes ANOVA  2009 resolts

b. Resoldre el disseny: plantejar els test d’hipòtesis, obtenir la taula ANOVA, estimar paràmetres i fixar les conclusions.

c. Definir el disseny si la mostra corresponent als punts de mostratge 1 s’han pres a 50 metres litoral de l’emissor i les mostres corresponents als punts de mostratge 2 s’han pres a 500 metres litoral de l’emissor

LLISTAT 1. Multifactor ANOVA - H2L

--------------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value--------------------------------------------------------------------------------MAIN EFFECTS A:Població 60,6667 2 30,3333 B:Punt 5,33333 1 5,33333 INTERACTIONS AB 0,666667 2 0,333333

RESIDUAL 3,0 6 0,5--------------------------------------------------------------------------------TOTAL (CORRECTED) 69,6667 11--------------------------------------------------------------------------------Multiple Range Tests for H2L by Població--------------------------------------------------------------------------------Method: 95,0 percent LSDPoblació Count LS Mean LS Sigma Homogeneous Groups--------------------------------------------------------------------------------1 4 42,0 0,353553 X 2 4 45,0 0,353553 X 3 4 47,5 0,353553 X--------------------------------------------------------------------------------Contrast Difference +/- Limits--------------------------------------------------------------------------------1 - 2 *-3,0 1,22346 1 - 3 *-5,5 1,22346 2 - 3 *-2,5 1,22346 --------------------------------------------------------------------------------Multiple Range Tests for H2L by Punt--------------------------------------------------------------------------------Method: 95,0 percent LSDPunt Count LS Mean LS Sigma Homogeneous Groups--------------------------------------------------------------------------------1 6 44,1667 0,288675 X 2 6 45,5 0,288675 X--------------------------------------------------------------------------------Contrast Difference +/- Limits--------------------------------------------------------------------------------1 - 2 *-1,33333 0,99895 --------------------------------------------------------------------------------

LLISTAT 2. Multifactor ANOVA - H2L

ANOVA Table for H2L by Població-----------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value-----------------------------------------------------------------------------Between groups 60,6667 2 30,3333 Within groups 9,0 9 1,0-----------------------------------------------------------------------------Total (Corr.) 69,6667 11

LLISTAT 3. Variance Components Analysis

Analysis of Variance for H2L--------------------------------------------------------------------------------Source Sum of Squares Df Mean Square Var. Comp. Percent--------------------------------------------------------------------------------TOTAL (CORRECTED) 69,6667 11--------------------------------------------------------------------------------Població 60,6667 2 30,3333 Punt 6,0 3 2,0 ERROR 3,0 6 0,5 --------------------------------------------------------------------------------

LLISTAT 4.

Table of Least Squares Means for H2L

27

Page 28: problemes ANOVA  2009 resolts

with 95,0 Percent Confidence Intervals-------------------------------------------------------------------------------- Stnd. Lower UpperLevel Count Mean Error Limit Limit--------------------------------------------------------------------------------GRAND MEAN 12 44,8333Població1 4 42,0 0,353553 41,1349 42,8651 2 4 45,0 0,353553 44,1349 45,8651 3 4 47,5 0,353553 46,6349 48,3651 Punt1 6 44,1667 0,288675 43,4603 44,873 2 6 45,5 0,288675 44,7936 46,2064 Població by Punt1 1 2 41,5 0,5 40,2765 42,7235 1 2 2 42,5 0,5 41,2765 43,7235 2 1 2 44,5 0,5 43,2765 45,7235 2 2 2 45,5 0,5 44,2765 46,7235 3 1 2 46,5 0,5 45,2765 47,7235 3 2 2 48,5 0,5 47,2765 49,7235 --------------------------------------------------------------------------------

6.- TRIA NOMÉS UNA RESPOSTA D’ENTRE LES QUATRE RESPOSTES

1.- Quant es considera el model de dos factors: on A és fix i B aleatori,

a. L’acceptació de la hipòtesi nul·la Ho: ϭB=0 comporta que l’estimació de ϭB també serà 0.b. L’acceptació de la hipòtesi nul·la Ho: ϭB=0 s’ha d’interpretar com que ϭB es sempre força

més petit que ϭresidu

c. Si el nivell de significació fixat per l’experimentador és 0.05, l’acceptació de la hipòtesi nul·la vol dir que la probabilitat d’error en l’acceptació es de l’ordre de 0.05

d. Cap de les anteriors es certa.

2.- Estem analitzant les dades provinents d’un disseny creuat amb dos factors , mitjançant ANOVA i utilitzant un programa com ara Statgraphics. Suposem que es pot considerar cert que hi ha homogeneitat de variàncies i normalitat de residus. Suposem també que la prova de significació per un dels factors ens ha proporcionat un p-valor de 0,1565. Estem treballant amb un nivell de significació, prefixat, de 0,05. Marca l’opció correcta:

a. Hem de rebutjar la hipòtesi nul·la (la que diu que no hi ha efecte del factor) ja que, si no ho féssim, la probabilitat de cometre l’error de tipus II seria 1 – 0,1565

b. Hem de rebutjar la hipòtesi nul·la però pot ser que estiguem equivocats i cometem l’error de tipus I, amb probabilitat 0,1565

c. No podem rebutjar la hipòtesi nul·la ja que la probabilitat de cometre l’error de tipus I seria massa gran, de 0,1565

d. No podem rebutjar la hipòtesi nul·la, encara que és possible que cometem l’error de tipus II

3.- Per analitzar l’efecte de dos factors creuats A (fix) i B (aleatori) sobre una variable dependent Y, de la que tenim 5 rèpliques per condició experimental. De les següents afirmacions digues quina és la correcte:

a. Si almenys dues mitjanes mostrals corresponents al Factor A són diferents és que hi ha efecte del factor A..

b. Si hi ha dos mitjanes poblacionals, corresponents a dos nivells del factor B, diferents és que hi ha efecte del factor B.

c. No es pot contrastar l’efecte de la interacció donat que B és aleatorid. Totes les anteriors són falses.

4.- Una reconeguda pizzeria vol avaluar dos sistemes diferents per elaborar massa de pizza. Per això, realitza 2 masses amb el sistema A dos masses amb el sistema B. De cada massa en fa 8 pizzes, de manera que cada pizza és avaluada per 3 catadors, donant cada catador una puntuació de 0 a 20. (Cada pizza es cou de la mateixa manera, i cada catador només avalua una pizza) .

Siguin els següents enunciats:1.-Tenim tres factors respecte els quals podem contrastar el seu efecte : Factor sistema, Factor massa ( a 2 nivells jerarquitzar a sistema), factor pizza(a 8 nivells jerarquitzat a massa).

28

Page 29: problemes ANOVA  2009 resolts

2.- Tenim quatre factors respecte els quals podem contrastar el seu efecte : Factor sistema, Factor massa ( a 2 nivells jerarquitzar a sistema), factor pizza(a 8 nivells jerarquitzat a massa) i factor catador jerarquizat a pizza.3.-Cada sistema defineix una població que segueix un model normal (la parametrització ofereix dues poblacions normals)4.-Suposem que el sistema A és l’actual i que només es passarà al sistema B si la mitjana poblacional amb el sistema B supera en 3 unitats a la mitjana poblacional amb el sistema A. Caldria ajustar el nombre de nivells dels factors jerarquitzats i el nombre de rèpliques a fi efecte que s’assolís una potència de test adient5.- El factor sistema és fix i els altres aleatoris.. Són certs els enunciats

a. 1,3,4 5b. 2,3,,4,5c. 1,2,3,4,5d. 2,4,5

7.- En una facultat una assignatura té 6 grups. Els grups A,B i C els dona el professor 1 i els grups D,E i F els dona el professor 2 (els alumnes han estat matriculats a l’atzar als 6 grups). Els dos professors apliquen metodologies diferents. Hem triat a l’atzar 10 alumnes de cada grup als que s’ha fet un mateix test per avaluar els coneixements de l’assignatura. Considerant normalitat i homogeneïtat de variàncies dels residus:

Escriure els factors que intervenen en el model, tipus de cada factor (fix o aleatori) , estructura (factors creuats, jerarquitzats,….) i parametrització:

Triant d’entre els llistats del full annex, decidir sobre la significació dels factors i estima els paràmetres del model:(nivell significació 0.05)

Si els dos professors comparteixen els grups (tots 2 donen classes a tots els grups repartint-se els temes), quin seria el model si s’avaluen els coneixements al final del periode docent? Resol el model triant el llistat adient.

LLISTAT 1

Analysis of Variance for notes - Type III Sums of Squares--------------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value--------------------------------------------------------------------------------MAIN EFFECTS A:profesor 0,00206965 1 0,00206965 B:grup 17,0568 5 3,41136 AB 13,7772 5 2,75544

RESIDUAL 60,1251 48 1,25261

LLISTAT 2

Analysis of Variance for notes - Type III Sums of Squares--------------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value--------------------------------------------------------------------------------MAIN EFFECTS A:profesor 0,00206965 1 0,00206965 B:grup 17,0568 5 3,41136

RESIDUAL 63,88 53 1,25261LLISTAT 3

Type III Sums of Squares------------------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value------------------------------------------------------------------------------------professor 9,50387 1 9,50387 grup(professor) 7,55294 4 1,88824 Residual 73,9044 54 1,3686------------------------------------------------------------------------------------Total (corrected) 90,9612 59LLISTAT 4 Analysis of Variance-----------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value

29

Page 30: problemes ANOVA  2009 resolts

-----------------------------------------------------------------------------Between groups 17,0568 5 3,41136 Within groups 73,9044 54 1,3686-----------------------------------------------------------------------------Total (Corr.) 90,9612 59

--------------------------------------------------------------------------------Method: 95,0 percent LSDgrup Count Mean Homogeneous Groups--------------------------------------------------------------------------------c 10 4,96657 X a 10 5,61707 XXd 10 5,69191 XXb 10 5,7026 XXf 10 6,43922 Xe 10 6,54306 X--------------------------------------------------------------------------LLISTAT 5

Type III Sums of Squares------------------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value------------------------------------------------------------------------------------grup 17,0568 5 3,41136 2,49 0,0420professor(grup) 0,0 0 *********** 1,0000Residual 73,9044 54 1,3686------------------------------------------------------------------------------------Total (corrected) 90,9612 59

8.- En un laboratori de biotecnologia es vol comparar l’efecte de dos productes en la conservació d’un preparat. En aquest preparat es pot triar també entre dos colorants (A i B) , el contingut de sal (alt, baix) i dos additius (AD1, AD2). Es fan 3 rèpliques per a cada una de totes les possibles condicions experimentals. La variable resposta és una mesura de l’estat de conservació (considerem normalitat i homogeneïtat de les variàncies dels residus)

a) Contesta a les segúents qüestions:

Factors que intervenen dient si són fixos o aleatoris:

Estructura dels factors : Creuats , jerarquitzats,..?

Parametrització:

Triant d’entre els llistats del full adjunt, decideix si hi ha diferència entre conservants, entre colorants i si hi ha efecte de la interacció entre conservant i contingut de sal: (nivell significació 0.05)

FACTOR Quadrat mig Fexp(Estadístic F) Ftaules o pvalor Decisió

b) Si no es poden fer tots els experiments i només es fan els següents:

Mesura Conservació

Conservant Colorant Contingut Sal Additiu

21.2 1 A Baix AD122 2 A Baix AD223.4 1 B Baix AD224 2 B Baix AD123.5 1 A Alt AD225 2 A Alt AD126.7 1 B Alt AD1

30

Page 31: problemes ANOVA  2009 resolts

28 2 B Alt AD2

Quin disseny tenim ? Estima els paràmetres del mateix.Decideix quins factors són significatius.

LLISTAT 1

Multifactor ANOVA - mesura_conserv

Analysis of Variance for mesura_conserv - Type III Sums of Squares--------------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value--------------------------------------------------------------------------------MAIN EFFECTS A:conservant 93,2173 1 93,2173 54,68 0,0000 B:colorant 0,0761295 1 0,0761295 0,04 0,8340 C:aditiu 0,655716 1 0,655716 0,38 0,5395 D:sal 53,6005 1 53,6005 31,44 0,0000

INTERACTIONS AB 0,250332 1 0,250332 0,15 0,7041 AC 5,22496 1 5,22496 3,07 0,0896 AD 31,9203 1 31,9203 18,72 0,0001 BC 2,88914 1 2,88914 1,69 0,2023 BD 0,610158 1 0,610158 0,36 0,5539 CD 1,56371 1 1,56371 0,92 0,3454 ABC 3,31559 1 3,31559 1,94 0,1727 ABD 7,886 1 7,886 4,63 0,0391 ACD 0,000850083 1 0,000850083 0,00 0,9823 BCD 0,00459425 1 0,00459425 0,00 0,9589 ABCD 0,60696 1 0,60696 0,36 0,5549

RESIDUAL 54,5509 32 1,70471

Interactions and 95,0 Percent Confidence Intervals

conservant

mes

ura_

cons

erv

salaltbaix

18

20

22

24

26

1 2

LLISTAT 2

Analysis of Variance for mesura_conserv - Type III Sums of Squares--------------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value--------------------------------------------------------------------------------MAIN EFFECTS A:conservant 93,2173 1 93,2173 36,83 0,0000 B:colorant 0,0761295 1 0,0761295 0,03 0,8631 C:aditiu 0,655716 1 0,655716 0,26 0,6133 D:sal 53,6005 1 53,6005 21,18 0,0000

RESIDUAL 108,823 43 2,53078--------------------------------------------------------------------------------TOTAL (CORRECTED) 256,373 47--------------------------------------------------------------------------------LLISTAT 3Type III Sums of Squares------------------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value------------------------------------------------------------------------------------conservant 93,2173 1 93,2173 35,04 0,0000colorant(conservant) 0,326461 2 0,163231 0,06 0,9406sal(colorant) 54,2106 2 27,1053 10,19 0,0003aditiu(sal) 2,21942 2 1,10971 0,42 0,6617Residual 106,399 40 2,65998------------------------------------------------------------------------------------Total (corrected) 256,373 47

31

Page 32: problemes ANOVA  2009 resolts

9.- TRIA NOMÉS UNA RESPOSTA D’ENTRE LES QUATRE RESPOSTES

1.- Suposem que tenim un model ANOVA 1 factor :

amb k=4 grups que compleix les condicions de regularitat i amb les que valen respectivament 0.01, -0.02, 0.03, -0.02

a) Prenem la mostra que prenem sempre acceptarem la hipòtesi alternativa(alguna diferència entre mitjanes) donat que les presenten diferències.

b) Al ser petites les diferències, s’acceptarà la hipòtesi nul.la c) Tot i haver diferències entre els 4 grups, no es pot predir a priori el resultat del test .d) Al ser grups diferents cal fer servir el test de Kruskal Wallis

2.- Una mesura de l’efecte d’un fàrmac és AUC. Estem comparant l’efecte de tres dosis, i per això triem a l’atzar 4 voluntaris diferents per a cada dosi prenent 2 rèpliques per voluntari. Suposem normalitat de residus i homogeneitat de variàncies

Siguin els següents enunciats:

1.- La variabilitat de la resposta és la suma de les variabilitats de dosi, voluntari i residual.2.- La variabilitat de la resposta és la suma de les variabilitats de voluntari i residual.3.- Els factors voluntari i dosi estan creuats4.- Els factor voluntari està jerarquitzat a dosi5.- Els voluntaris són rèpliques6.- No es pot estimar la variabilitat residual donat que tenim molt poques rèpliques7.- Amb aquest disseny es pot contrastar l’efecte de la interacció voluntari-dosi8.- Amb aquest disseny no es pot contrastar l’efecte de la interacció voluntari-dosi

Dels 8 enunciats, exactament tres enunciats són certs . Digues quins son:

ENUNCIATS CERTS:

3- En un model ANOVA de dos factors aleatoris creuats amb rèpliques, si el nombre de rèpliques que prenem és molt baix, pot ser que :

a) El nivell de significació sigui massa alt.b) No es puguin detectar diferencies de mitjanes que realment hi sónc) No es pugui detectar la significació d’alguna variabilitat important.d) La significació dels factors és independent del nombre de rèpliques.

4.-Estem llegint un article científic, en que hi ha dades refererides a un model ANOVA 1 factor a 3 nivells:

Grup 1: 102, 100, 98, 97Grup 2: 80, 82, 86, 80Grup 3: 78, 80, 81, 85

Prenent totes les dades la desviació típica és 9.08 . Prenent dades per grup, les desviacions típiques són: 2.22 , 2.83, 2.94 .La dada referida a la desviació típica residual no es llegeix molt bé i tenim dubtes entre:

a) 9.08b) 2.68c) 2.66 (mitjana de 2.22, 2.83, 2.94)d) 9.08/12=0.76

32

Page 33: problemes ANOVA  2009 resolts

(Hi ha una única resposta correcta, i no cal fer cap càlcul per deduir-la)

5.- Veient el següent gràfic d’interaccions:

Interactions and 95,0 Percent Confidence Intervals

FACTOR _B

Col

_1FACTOR_A

123

74

84

94

104

114

1 2

a) Podem pensar que A significatiu, B significatiu b) Podem pensar que A significatiu , B no significatiuc) Podem pensar que A no significatiu , B significatiud) Podem pensar que A no significatiu, B no significatiu

33