Tar 2 Araceli Sandoval Rodríguez UG
Transcript of Tar 2 Araceli Sandoval Rodríguez UG
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez
1.- Explique en qué consiste y cuándo se debe aplicar el diseño completamente al azar
con un solo criterio de clasificación.
Se concentra básicamente en comparar los tratamientos con respecto a sus medias
poblacionales y se utiliza cuando el objetivo es comparar más de dos tratamientos.
2.- A continuación se muestra parte del ANOVA para comparar cinco tratamientos con
cuatro réplicas cada uno.
Fuente de variación
Suma de cuadrados
Grados de libertad
C. medio Razón F F tablas
Tratamiento 800 4 200 7.5 P(3.06<7.5)
Error 400 15 26.66
Total 1200 19
a) Agregar en esta tabla los grados de libertad, el cuadrado medio y la razón F para cada
una de las fuentes de variación.
SCT = ∑K i=1∑
ni j=1Y
2 ij – y../N; 800+400= 1, 200
Total de tratamientos – 1= 5-1= 4
Total de réplicas -1= 5*4=20-1=19
Error= Total- tratamiento= 19-4= 15
Fo= CMTRAT/ CMF; 200/26.66= 7.50
CMTRAT= SCTRAT/ k-1; 800/4= 200
CME= SCE/N-k; 400/15= 26.66
b) Explique de manera esquemática cómo calcularía el valor-p o la significancia
observada, para ver si hay diferencia entre tratamientos.
El Valor-p es el área bajo la curva con distribución Fk-1,N-k del estadístico Fα, entonces el
valor –p= P(F>F0)
c) ¿Con la información disponible se pueden hacer conjeturas sobre si hay diferencias
significativas entre tratamientos? Argumente su respuesta.
Considero que es posible diferenciar entre los tratamientos por medio de los datos
presentados en la tabla ANOVA (grados de libertad y valor de tablas) probando una
hipótesis de igualdad de los tratamientos con respecto a la media correspondiente de la
variable de respuesta. En el supuesto de que se rechazara la hipótesis (igualdad de
medias) se estaría asumiendo que las medias de los tratamientos son distintas.
d) Anote el modelo estadístico y formule la hipótesis pertinente.
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez
HO= μ1=μ2=…= μk = μ
HA = μi ≠μi para algún i ≠ j
3.- Se desea investigar el efecto del pH en el crecimiento de cierto microorganismo en un
medio específico. Para ello se realiza un experimento, teniendo como punto de partida la
misma cantidad de microorganismos. Se hacen cuatro repeticiones y se obtienen los
resultados mostrados en la siguiente tabla. ¿Estos datos son evidencia suficiente para
afirmar que los niveles de pH donde se logra menor y mayor crecimiento son el 3 y el 2,
respectivamente? Explique su respuesta.
Nivel de Ph Crecimiento promedio (en %)
1 80
2 105
3 75
No es posible afirmar que el nivel de pH influye en el crecimiento promedio, dado que
existen más factores que pueden afectar, aunado a esto, el problema carece de datos
para tomar una decisión objetiva.
4.- Se desea investigar la influencia de la temperatura en el rendimiento de un proceso
químico, en particular interesa investigar un rango de temperatura entre 60 y 120ºC. Se
tienen recursos para realizar 20 corridas experimentales.
a) Los niveles de temperatura con los que se experimenta son: 60, 65, 70 y 120; se hacen
cinco repeticiones con cada nivel. ¿Considera que es adecuado el diseño experimental
usado? Argumente su respuesta, y de ser necesario proponga alternativas.
No considero esté adecuado, ya que los datos de temperatura no presentan un rango
uniforme entre sí (75 hasta 120), pese a que se tienen 5 réplicas. La recomendación sería
60, 80, 100, y 120 por lo menos.
b) El orden en que decidieron hacer las corridas experimentales para facilitar el trabajo
experimental fue: primero las cinco del nivel bajo de temperatura, luego las cinco del
siguiente y así hasta finalizar. ¿Es correcto con lo que hicieron? Argumente su respuesta.
No es lo más adecuado para obtener un resultado objetivo, ya que las pruebas deben ser
aleatorias y así no violar los supuestos del modelo.
c) Para hacer el análisis estadístico se comparan, mediante una prueba T-student, de dos
en dos niveles de temperatura, y con base en esto obtuvieron conclusiones. ¿Es
adecuado tal análisis?, argumente, y en su caso proponga alternativas.
No objetivo ya que, hay un aumento en el error del tipo I, es decir, rechazar una Ho
cuando es verdadera.
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez 5.- Describa en qué consiste cada uno de los supuestos del modelo en un análisis de
varianza, y explique la forma típica en que estos supuestos se verifican.
Normalidad: Un procedimiento gráfico para verificar el cumplimiento del supuesto de
normalidad de los residuos consiste en graficar los residuos en papel o en la gráfica de
probabilidad normal que se incluye casi en todos los paquetes estadísticos. Esta gráfica
del tipo X-Y tiene las escalas de tal manera que si los residuos siguen una distribución
normal, al graficarlos tienden a quedar alineados en una línea recta; por lo tanto, si
claramente no se alinean se concluye que el supuesto de normalidad no es correcto.
Varianza constante: Una forma de verificar el supuesto de varianza constante (o que los
tratamientos tienen la misma varianza) es graficando los predichos contra los residuos
(Yˆij vs. ei), por lo general Yˆ ij va en el eje horizontal y los residuos en el eje vertical. Si
los puntos en esta gráfica se distribuyen de manera aleatoria en una banda horizontal (sin
ningún patrón claro y contundente), entonces es señal de que se cumple el supuesto de
que los tratamientos tienen igual varianza.
Independencia: La suposición de independencia en los residuos puede verificarse si se
grafica el orden en que se colectó un dato contra el residuo correspondiente. De esta
manera, si al graficar en el eje horizontal el tiempo (orden de corrida) y en el eje vertical
los residuos, se detecta una tendencia o patrón no aleatorio claramente definido, esto es
evidencia de que existe una correlación entre los errores y, por lo tanto, el supuesto de
independencia no se cumple.
6.- ¿Qué son y cuándo se aplican las pruebas para comparar medias?
Son métodos por los cuales es posible hacer comparaciones entre todos los posibles
pares de medias dependiendo de la cantidad de tratamientos que deban identificarse
como diferentes. Es generalmente utilizada cuando es rechazada la Ho (todas las μ son
iguales)
7.- En una industria química se prueban diferentes mezclas para ver si difieren en cuanto
al peso molecular final. Se prueban cuatro diferentes mezclas, con cinco repeticiones
cada una (α=0.05). A continuación se muestra una parte de la tabla de análisis de
varianza y los promedios obtenidos para cada mezcla.
Fuente de variación Valor p
Mezcla 0.01
Error
Mezcla Peso medio
A 10000
B 7000
C 8000
D 7500
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez
a) ¿Las mezclas difieren de manera significativa en cuanto a su peso molecular? Sí, se
puede observar en los datos, una diferencia significativa entre el peso molecular.
b) Con el análisis de varianza de acuerdo al promedio, ¿se puede asegurar que con la
mezcla B se logra un menor peso molecular? Argumente su respuesta. No, dado que es
necesario saber qué condiciones influyeron en cada uno de los experimentos.
c) Si al verificar los supuestos de varianza constante (igual varianza entre las mezclas),
éstos no se cumplen, ¿qué significa eso? ¿Se puede seguir apoyando la conclusión del
inciso (a)? Sí, ya que al inicio se especificó que hay una gran diferencia entre los
tratamientos, esto se debe a una diferencia notable entre las varianzas.
8.- Se hace un estudio sobre la efectividad de tres marcas de spray para matar moscas.
Para ello, cada producto se aplica a un grupo de 100 moscas, y se cuenta el número de
moscas muertas expresado en porcentajes.
Número de replica
Marca 1 2 3 4 5 6
1 72 65 67 75 62 73
2 55 59 68 70 53 50
3 64 74 61 58 51 69
a) Formule la hipótesis adecuada y el modelo estadístico.
Hipótesis nula:
Ho= µ1 = µ2
Ho= µ1 = µ3
Ho= µ2= µ3
Hipótesis alternativa:
HA= µ1 ≠ µ2
HA= µ1 ≠ µ3
HA= µ2 ≠ µ3
b) ¿Existe diferencia significativa entre la efectividad promedio de los productos en
spray? La media de cada uno de los productos fueron los siguientes:
Marca 1: 69
Marca 2: 59.16
Marca 3: 62.83
A simple vista se puede deducir con esto, que la marca 1 es la que presenta mayor
efectividad, mientras que el producto 2 y 3 no tienen mucha diferencia, sin embargo, es
prudente analizar la varianza de estos datos más a fondo.
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez
c) ¿Hay algún spray mejor? Argumente la respuesta
ANOVA
Fuentes de variación
Suma de cuadrados
Grados de
libertad
Cuadrados medios
Fo F tablas
Tratamiento 281.33 5 56.26 0.8328 < 3.1058
Error 810.636 12 67.55
Total 1092 17
Considerablemente el spray de la marca 1, dado que la tabla ANOVA indica que existe diferencia
entre las medias de los datos, sin embargo el método LSD puede ser de utilidad para comprobar la
HA que indica que al menos una de las medias es diferente con respecto al método utilizado.
Comparaciones= (3 (3-1))/2= (3(3-1))/2=6/2=3 LSD= tα/2, GL error √CM error (1/nm+ 1/nn)
LSD= t 0.05/2, 17 √67.55 (1/6+1/3)
LSD= 0.025, 18 √67.55 (3/6)
LSD= 2.1315 (4.22)=8.99
Ho |yi-yj| LSD ni nj
μ1- μ2 | 69-59.16 | 9.84 > 8.99 3 7
μ1- μ3 | 69-62.83 | 6.17< 8.99 3 7
μ2- μT3 | 59.16 -62.83 | 3.67< 8.99 3 7
μ2 ˂ μ3 ˂ μ1
d) Dé un intervalo al 95% de confianza para la efectividad promedio (porcentaje) de cada
una de las marcas.
e) Dibuje las gráficas de medias y los diagramas de cajas simultáneos, después
interprételos.
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez
f) Verifique los supuestos de normalidad y de igual varianza entre las marcas.
1.- NORMALIDAD
Los datos de efectividad de cada spray presentan una distribución normal con respecto,
esto se puede comprobar gracias a la correlación entre sí que es de 0.98 (0.9735).
0
10
20
30
40
50
60
70
80
0 1 2 3 4 5 6 7
Diagrama de puntos
datos orig.
yi.(media)
R² = 0.988
-10
0
10
20
30
40
50
60
70
80
90
0 5 10 15 20
Normalidad
Datos ord.
Zi
Lineal (Datos ord.)
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez
2.- HOMOGENEIDAD
Los datos cumplen con el supuesto de homogeneidad al presentarse en una distribución similar entre sí.
3-INDEPENDENCIA
Aunado a lo anterior, los datos presentan independencia, lo que indica que la probabilidad de cada uno de ellos no está influida porque el otro suceso, es decir, que los sucesos no están relacionados.
0
0.6
1.2
40 90
Homogeneidad
eij (e. residual)
R² = 0.0037
0
0.2
0.4
0.6
0.8
1
1.2
0 5 10 15 20
Independencia
eij (e. residual)
Lineal (eij (e. residual))
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez 9.- En un centro de investigación se realiza un estudio para comparar varios tratamientos
que, al aplicarse a los frijoles crudos, reducen su tiempo de cocción. Estos tratamientos
son a base de bicarbonato de sodio (NaHCO3) y cloruro de sodio o sal común (NaCl). El
primer tratamiento es el del control, que consiste en no aplicar ningún tratamiento. El
tratamiento T2 es el remojo en agua con bicarbonato de sodio, el T3 es el remojar en
agua con sal común y el T4 es remojar en agua con una combinación de ambos
ingredientes en proporciones iguales. La variable de respuesta es el tiempo de cocción en
minutos. Los datos se muestran en la siguiente tabla:
Control T2 T3 T4
213 76 57 84
214 85 67 82
204 74 55 85
208 78 64 92
212 82 61 87
200 75 63 79
207 82 63 90
yi. 552 430 599 1581 y..
ni 7 7 7 21 N
yi 78.85 61.42 85.57 75.28 Media Y
a). De qué manera el experimentador debe aleatorizar los experimentos y el material
experimental? Tratando los datos completamente al azar, esta manera determinará el
orden en que se realizarán los experimentos
b) De ejemplos de factores que deben estar fijos durante las pruebas experimentales, para que no afecten los resultados y las conclusiones.
Calidad y/o procedencia de los reactivos utilizados
Especie de frijoles
Grosor del recipiente donde se cocerán
Volumen de agua utilizada
Tipo de flama utilizada en el experimento c) Formule y pruebe la hipótesis de que las medias de los tratamientos son iguales.
Ho=µT2= µT3=µT4
HA≠ µT2≠ µT3≠µT4
ANOVA
Fuentes de variación
Suma de cuadrados
Grados de
libertad
Cuadrados medios
Fo F tablas
Tratamiento 2174 2 1087 59.2396194 >3.55455715
Error 330.285714 18 18.3492063
Total 2504.28571 20
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez
El valor crítico de F es mayor que el valor F de tablas por lo tanto, es aceptada de HA,
de acuerdo a los resultados obtenidos se acepta la hipótesis alternativa d) Obtenga el diagrama de caja y el grafico de medias, después interprételos.
e) .Hay algún tratamiento mejor? .Cual es el tiempo de cocción esperado para el mejor tratamiento? LSD; servirá para comprobar la HA que indica que al menos una de las medias es diferente con
respecto al método utilizado.
Comparaciones= (3 (3-1))/2= (3(3-1))/2=6/2=3 LSD= tα/2, GL error √CM error (1/nm+ 1/nn)
LSD= t 0.05/2, 18 √18.34 (1/3+1/7)
LSD= 0.025, 18 √18.34 (10/21)
LSD= 2.10 (2.92)=6.20
Ho |yi-yj| LSD ni nj
μT2- μT3 | 78.85-61.42 | 17.43 6.20* 3 7
μT2- μT4 | 78.85-85.57 | 6.42 6.20* 3 7
μT3- μT4 | 61.42 -85.57 | 24.15 6.20* 3 7
Con la prueba LSD se deduce se rechaza la Ho y se acepta la HA, la cual indica que cada uno de los tratamientos son diferentes.
0
10
20
30
40
50
60
70
80
90
100
0.5 1 1.5 2 2.5 3 3.5
Gráfico de medias
datos orig.
yi. (media)
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez
μT3 ˂ μT2 ˂ μT4
Derivado del análisis anterior se puede llegar a la conclusión de que el tratamiento T3 es el mejor por tener el menos tiempo, recordando que la eficiencia en un proceso se traduce básicamente en tiempo y dinero. f) Algo importante a cuidar en un experimento es que no haya efectos colaterales no deseados, causados por el tratamiento ganador; en este caso, piense en los posibles efectos colaterales que podría causar el mejor tratamiento. El cloruro de sodio puede causar daños severos a la salud, así como al medio ambiente. g) .Se cumplen los supuestos del modelo? Verifique gráficamente. 1.- Normalidad
Los datos presentan una distribución normal , esto se puede comprobar gracias a la
correlación entre sí que es de 0.9441 (0.9735).
R² = 0.9441
-2.5
-2
-1.5
-1
-0.5
0
0.5
1
1.5
2
2.5
0 20 40 60 80 100
Normalidad
Zi
Lineal (Zi)
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez 2.- Homogeneidad
3.- Gráfico de medias
-8
-6
-4
-2
0
2
4
6
8
50
Homogeneidad
eij (e. residual)
0
10
20
30
40
50
60
70
80
90
100
0.5 1 1.5 2 2.5 3 3.5
Gráfico de medias
datos orig.
yi. (media)
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez h) Pruebe la hipótesis de igualdad Independencia
Aunado a lo anterior, los datos presentan independencia, lo que indica que la probabilidad de cada uno de ellos no está influida porque el otro suceso, es decir, que los sucesos no están relacionados. 10.- Una compañía farmacéutica desea evaluar el efecto que tiene la cantidad de almidón en la dureza de las tabletas. Se decidió producir lotes con una cantidad determinada de almidón, y que las cantidades de almidón a aprobar fueran de 2%, 5% y 10%. La variable de respuesta seria el promedio de la dureza de 20 tabletas de cada lote. Se hicieron 4 réplicas por tratamiento y se obtuvieron los siguientes resultados:
% de almidón Dureza
2 4.3 5.2 4.8 4.5
5 6.5 7.3 6.9 6.1
10 9.0 7.8 6.1 8.1
a) Hay evidencia suficiente de que el almidón influya en la dureza de las tabletas? A simple vista, los datos que arroja la tabla anterior, indican que el porcentaje de almidón es directamente proporcional al nivel de dureza que presentan las tabletas.
Ho=µT2= µT3=µT4
% de almidón Dureza
2 4.3 5.2 4.8 4.5
5 6.5 7.3 6.9 6.1
10 9.0 7.8 6.1 8.1
yi. 19.8 20.3 17.8 18.7 76.6 y..
ni 3 3 3 3 12 N
yi 6.6 6.76 5.93 6.23 6.38 Media Y
R² = 0.005
-8
-6
-4
-2
0
2
4
6
8
0 5 10 15 20 25
Independencia
eij (e. residual)
Lineal (eij (e. residual))
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez
b) Realice los análisis complementarios necesarios.
ANOVA
Fuentes de variación
Suma de cuadrados
Grados de
libertad
Cuadrados medios
Fo F tablas
Tratamiento 1.25 3 0.418 0.14 < 4.066
Error 23.62 8 2.95
Total 24.87 11
Según los resultados arrojados por el análisis de varianza, la F de tablas es mayor que la F calculada, por lo que se acepta la hipótesis nula, que dice, que todas las medias de los tratamientos son iguales entre sí, esto es, que tal y como se mostró al inicio de la tabla, el porcentaje de almidón adicionado a las tabletas, es directamente proporcional al nivel de dureza adquirido por las tabletas.
c) Si se desea maximizar la dureza de las tabletas, que recomendaría al fabricante? En principio fabricar tabletas con porciones equivalentes, es decir, almidón con respecto a la sustancia activa, además de revisar bien los datos arrojados por el estudio, ya que cuando pasamos de un 2% a un 5% de almidón la dureza aumenta 1.52 veces, sin embargo, cuando pasan a agregar 10%, sólo aumenta 1.38 respectivamente, por lo que considero que debería llegarse a un término adecuado donde se contemple la economía de la empresa.
d) Verifique los supuestos.
1.- Normalidad
Los datos de dureza de las tabletas presentan una distribución normal con respecto al almidón agregado, esto se puede comprobar gracias a la correlación entre sí que es de
0.98 (0.9735).
R² = 0.9735
-2
-1.5
-1
-0.5
0
0.5
1
1.5
2
0 2 4 6 8 10
Normalidad
Zi
Lineal (Zi)
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez
2.- Homogeneidad
Los datos cumplen con el supuesto de homogeneidad al presentarse en una distribución similar entre sí. 3.- Prueba de independencia
Aunado a lo anterior, los datos presentan independencia, lo que indica que la probabilidad de cada uno de ellos no está influida porque el otro suceso, es decir, que los sucesos no están relacionados.
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
5.8 6 6.2 6.4 6.6 6.8 7
Homogeneidad
eij (e. residual)
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
0 5 10 15
Independencia
eij (e. residual)
Lineal (eij (e. residual))
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez 11.- Los datos que se presentan en seguida son rendimientos en toneladas por hectárea de un pasto con tres niveles de fertilización nitrogenada. El diseño fue completamente aleatorizado, con cinco repeticiones por tratamiento.
Niveles de nitrógeno
1 2 3
14.823 25.151 32.605
14.676 25.401 32.460
14.720 25.131 32.256
14.5141 25.031 32.669
15.065 25.276 32.111
a) ¿Las diferencias muéstrales hacen obvia la presencia de diferencias Poblacionales? No específicamente dado que, al estudiar una pequeña parte de la población, no podemos asumir que todas las demás sean iguales ya que existen determinados factores para cada parte que no se aprecian a simple vista. b) Obtenga el análisis de varianza e interprételo.
ANOVA
Fuentes de variación
Suma de cuadrados
Grados de
libertad
Cuadrados medios
Fo F tablas
Tratamiento 788.36 2 394.18 10102.8 3.885
Error 0.468 12 0.039
Total 788.82 14
Se puede apreciar una diferencia bastante marcada entre la Fo y la F de tablas, lo cual indica que existe una diferencia entre las medias de los tratamientos por lo que procedemos a realizar el cálculo LSD (Diferencia Mínima Significativa). LSD nos ayudará a comprobar con respecto la HA ¿cuál de las medias es diferente con
respecto al método utilizado?
Comparaciones= (3 (3-1))/2= (3(3-1))/2=6/2=3 LSD= tα/2, GL error √CM error (1/nm+ 1/nn)
LSD= t 0.05/2, 12 √0.039 (1/3+1/5)
LSD= 0.025, 12 √0.039 (1/3+1/5)
LSD= 2.178 (0.1438)=0.3131
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez
Ho |yi-yj| LSD ni nj
μA- μB | 14.75-25.19| 10.84 0.3131* 3 5
μB- μC | 25.19-32.42| 7.23 0.3131* 3 5
μC- μA | 32.42-14.75| 17.67 0.3131* 3 5
Con la prueba LSD se deduce se rechaza la Ho y se acepta la HA, la cual indica que cada TODOS los tratamientos son diferentes entre sí.
μA ˂ μB ˂ μC
Derivado del análisis anterior se puede llegar a la conclusión de que el tratamiento 3 es el mejor por tener mayor rendimiento, recordando que la eficiencia de fertilización nitrogenada se traduce básicamente en tiempo y dinero. 12.- Un químico del departamento de desarrollo de un laboratorio farmacéutico desea conocer cómo influye el tipo de aglutinante utilizado en tabletas de ampicilina de 500mg en el porcentaje de friabilidad; para ello, se eligen los siguientes aglutinantes: polivinil-pirrolidona (PVP), carboximetilcelulosa sodica (CMC) y grenetina (Gre). Los resultados del diseño experimental son los siguientes.
Aglutinante % de friabilidad
PVP 0.485 0.250 0.073 0.250 0.161
CMC 9.65 9.37 9.53 9.86 9.79
Gre 0.289 0.275 0.612 0.152 0.137
a) Especifique el nombre del diseño experimental. Análisis del efecto del aglutinante en pastillas de ampicilina con respecto al porcentaje de friabilidad.
b) ¿Sospecha que hay algún efecto significativo del tipo de aglutinante sobre la variable de respuesta? Sí, dado que como se puede observar en los datos, no permanecen todos homogéneos o con un rango de diferencia aceptable sino que dependiendo del aglutinante se disparan, específicamente en el CMC.
c) Escriba la hipótesis para probar la igualdad de medias y el modelo estadístico.
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez
Hipótesis Ho=µT1= µT2=µT3=µT4
HA≠ µT1≠ µT2≠µT3≠µT4
Modelo estadístico
Yij= μ+ Ti+Eij
d) Realice el análisis adecuado para probar las hipótesis e intérprete los resultados.
Aglutinante % de friabilidad
PVP 0.485 0.250 0.073 0.250 0.161
CMC 9.65 9.37 9.53 9.86 9.79
Gre 0.289 0.275 0.612 0.152 0.137
yi. 10.424 9.895 10.215 10.262 10.088 50.884 y..
ni 3 3 3 3 3 15 N
yi 3.47 3.298 3.405 3.4206 3.362 16.96 Media
Y
La razón F calculada es menor a F de tablas por lo que se acepta la Ho que nos dice que todas las medias son iguales entre sí.
e) Revise los supuestos ¿Hay algún problema? 1.- Normalidad
ANOVA
Fuentes de variación
Suma de cuadrados
Grados de
libertad
Cuadrados medios
Fo F tablas
Tratamiento 0.0523 4 394.18 0.0004467 < 3.4780
Error 293.10 10 0.039
Total 293.15 14
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez
El experimento no cumple con el supuesto de normalidad dado su coeficiente de correlación de 0.65.
R² = 0.6506
-2.5
-2
-1.5
-1
-0.5
0
0.5
1
1.5
2
2.5
0 2 4 6 8 10 12
Normalidad
Zi
Lineal (Zi)
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez 2.- Homogeneidad
El experimento no cumple con el supuesto de homogeneidad al presentarse los datos disparados y acumulados solo en algunas partes. 3.- Gráfico de medias
-12
-10
-8
-6
-4
-2
0
9.8 9.9 10 10.1 10.2 10.3 10.4 10.5
Homogeneidad
eij (e. residual)
0
2
4
6
8
10
12
0 1 2 3 4 5 6
Gráfico de medias
datos orig.
yi.(media)
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez 4.- Prueba de independencia
El experimento no cumple con el supuesto de independencia, al presentar datos dependientes unos de otros en algunas partes del experimento. 13.- Se cultivaron cuatro diferentes clonas de Agave tequilana bajo un mismo esquema de manejo. Se quiere saber qué clona es la que responde mejor a dicho manejo, evaluando el nivel de respuesta con el porcentaje de azucares reductores totales en base húmeda. Los datos se muestran a continuación:
Clona
1 2 3 4
8.69 8.00 17.39 10.37
6.68 16.41 13.73 9.16
6.83 12.43 15.62 8.13
6.43 10.99 17.05 4.40
10.30 15.53 15.42 10.38
a) Mediante ANOVA, compare las medias de las clonas y verifique residuales.
R² = 0.71
-14
-12
-10
-8
-6
-4
-2
0
0 5 10 15 20
Prueba de independencia
eij (e. residual)
Lineal (eij (e. residual))
ANOVA
Fuentes de variación
Suma de cuadrados
Grados de
libertad
Cuadrados medios
Fo F tablas
Tratamiento 213.62 3 71.20 12.53 > 3.238
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez
1.- Normalidad
Los datos del experimento cumplen con el supuesto de normalidad entre sus datos al
tener una R2= 0.9491 (0.9491=0.9742), es decir, bastante cercano a 1.
R² = 0.9491
-2.5
-2
-1.5
-1
-0.5
0
0.5
1
1.5
2
2.5
0 5 10 15 20
Normalidad
Zi
Lineal (Zi)
Error 90.925 16 5.68
Total 304.55 19
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez
2.-Homogeneidad
Los datos además, presentan cierto grado de homogeneidad en su distribución porque lo
que se considera que también se cumple con este supuesto.
3.- Independencia
0
0.2
0.4
0.6
0.8
1
1.2
1.4
0 5 10 15 20
Homogeneidad
eij (e. residual)
R² = 0.0005
0
0.2
0.4
0.6
0.8
1
1.2
1.4
0 5 10 15 20 25
Independencia
eij (e. residual)
Lineal (eij (e. residual))
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez Aunado a lo anterior, los datos arrojados también cumplen con el supuesto de
independencia, esto se puede apreciar con el simple hecho de visualizar la distribución de
los datos en el gráfico, o bien, calcular la R2 que nos arroja 0.0005, muy lejano de 1.
b) ¿Hay una clona que haya respondido mejor al esquema de manejo? Argumente su
respuesta. Según el gráfico de medias, la clona 2 es la más cercana a la realidad
(media general).
14.- Se realizó un experimento para determinar si cuatro diferentes temperaturas de
calentamiento afectaron la densidad de cierto tipo de ladrillo. Un diseño completamente
aleatorizado condujo a los siguientes resultados:
Temperatura Densidad
100 21.8 21.9 21.7 21.6 21.7
125 21.7 21.4 21.5 21.4
150 21.9 21.8 21.8 21.6 21.5
175 21.9 21.7 21.8 21.4
yi. 87.3 86.8 86.8 86 43.2 390.1 y..
ni 4 4 4 4 2 18 N
yi 21.8 21.7 21.7 21.5 21.6 21.66 Media Y
0
2
4
6
8
10
12
14
16
18
20
0 1 2 3 4 5
Diagrama de medias
datos orig.
yi.(media)
Media
general: 11.19
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez
a) Hacer el diagrama de punto para los datos del experimento
b) La temperatura produjo un efecto en la densidad de los ladrillos? Usar α=0.05.
Realmente no, ya que como se puede observar, no existe diferencia significativa entre
los valores de las medias
c) ¿Sería apropiado comparar las medias utilizando el método LSD (por ejemplo)
en este experimento? No es tan prudente dado que el método LSD no permite
hace una observación clara entre los valores de las medias que se encuentran
demasiado cercanos.
ANOVA
Fuentes de variación
Suma de cuadrados
Grados de
libertad
Cuadrados medios
Fo F tablas
Tratamiento 0.22861111 4 0.0571 2.58 < 3.179
Error 0.2875 13 0.0221
Total 0.5161 17
21.3
21.4
21.5
21.6
21.7
21.8
21.9
22
0 1 2 3 4 5 6
Gráfico de puntos
datos orig.
yi.(media)
Media global:
21.66
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez
d) Analice los residuales de este experimento. ¿Se cumple el supuesto de
varianza constante?
1.- Normalidad
El experimento cumple con el supuesto de normalidad al tener un coeficiente de
correlación de 0.9218=0.9601, es decir, muy cercano a 1.
2.- Homogeneidad
Los datos presentan una homogeneidad visible en su distribución
R² = 0.9218
-2.5
-2
-1.5
-1
-0.5
0
0.5
1
1.5
2
2.5
21.3 21.4 21.5 21.6 21.7 21.8 21.9 22
Normalidad
Zi
Lineal (Zi)
0.985
0.99
0.995
1
1.005
1.01
1.015
21.4 21.5 21.6 21.7 21.8 21.9
Homogeneidad
eij (e. residual)
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez
3.- Independencia
Los datos presentan cierta independencia al tener un coeficiente de correlación de
0.002= 0.0469, muy por debajo de 1.
15.- En un artículo del Environment International (Vol. 18, No.4, 1992) se describe un
experimento en el cual la cantidad de radon liberado en las regaderas caseras fue
Investigado. Se utilizó agua enriquecida con radon para el experimento, seis
diferentes diámetros de orificio fueron probados en las regaderas. Los datos del
experimento se muestran en la siguiente tabla:
Diámetro del orificio Radón liberado (%)
1 0.37 80 83 83 85
2 0.51 75 75 79 79
3 0.71 74 73 76 77
4 1.02 67 72 74 74
5 1.40 62 62 67 69
6 1.99 60 61 64 66
a) El tamaño del orificio afecta el porcentaje de radón liberado? Usar α=0.05.
Si, como se puede observar en el análisis de varianza, se muestra que la F calculada es menor que la F de tablas, por lo que se puede asumir una diferencia significativa en las medias de cada tratamiento.
R² = 0.0022
0.985
0.99
0.995
1
1.005
1.01
1.015
0 5 10 15 20
Independencia
eij (e. residual)
Lineal (eij (e. residual))
ANOVA
Fuentes de variación
Suma de cuadrados
Grados de
libertad
Cuadrados medios
Fo F tablas
Tratamiento 109.45 3 36.48 0.6034 < 3.098
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez
b) Encontrar el valor de p. 0.6034
c) Analice los residuales de este experimento.
1.- Normalidad
El experimento cumple con el supuesto de normalidad al tener un coeficiente de
correlación de 0.9647=0.9601, es decir, muy cercano a 1.
2.- Homogeneidad
-15
-10
-5
0
5
10
15
69 70 71 72 73 74 75 76
Homogeneidad
eij (e. residual)
Error 1156.16 20 57.80
Total 0.5161 23
R² = 0.9647
-2.5
-2
-1.5
-1
-0.5
0
0.5
1
1.5
2
2.5
0 20 40 60 80 100
Normalidad
Zi
Lineal (Zi)
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez
Los datos presentan una homogeneidad visible en su distribución
3.- Independencia
Los datos presentan cierta independencia al tener un coeficiente de correlación de
0.00585= 0.0469, muy por debajo de 1.
d) Encontrar el intervalo de confianza del 95% de la media del porcentaje de
radon liberado cuando el diámetro es 1.40.
e) Realizar el diagrama de medias de este experimento utilizando el método LSD.
LSD; es de utilidad para comprobar si la HA es aceptada, la cual indica que al menos una de las
medias es diferente con respecto al método utilizado.
Comparaciones= (4 (4-1))/2= 12/2=6 LSD= tα/2, GL error √CM error (1/nm+ 1/nn)
LSD= t 0.05/2, 20 √57.8 (1/4+1/6)
LSD= 0.025, 20 √57.8 (0.416)
LSD= 1.724 (4.903)=8.45
Ho |yi-yj| LSD ni nj
μT1- μT2 | 69.66-71 | 1.33 8.45 4 6
μT1- μT3 | 69.66-78.83 | 4.16 8.45 4 6
μT1- μT4 | 69.66 -75 | 5.33 8.45 4 6
R² = 0.0585
-15
-10
-5
0
5
10
15
0 10 20 30
Independencia
eij (e. residual)
Lineal (eij (e. residual))
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez
μT2- μT3 | 71 -78.83 | 2.83 8.45 4 6
μT2- μT4 | 71 -75 | 4 8.45 4 6
μT3- μT4 | 78.83 -75 | 1.16 8.45 4 6
Con la prueba LSD se reafirma que se acepta la Ho y se rechaza la HA, la cual indica que cada uno de los tratamientos son diferentes.
f) El tamaño del orificio afecta el porcentaje de radón liberado? Usar α=0.05.
Según el método del LSD, el diámetro no afecta el radón liberado al presentarse todas las
medias iguales.
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez
16.- Cuatro catalizadores que pueden afectar la concentración de un componente
en una mezcla de tres líquidos se encuentran bajo investigación. Las siguientes
concentraciones fueron obtenidas para un diseño completamente aleatorio:
Catalizador
1 2 3 4
58.2 56.3 50.1 52.9
57.2 54.5 54.2 49.9
58.4 57.0 55.4 50.0
55.8 55.3 51.7
54.9
a) Realice el diagrama de puntos de este experimento.
b) Los cuatro catalizadores tienen el mismo efecto en la concentración del
componente? No, dado que como se puede observar en el diagrama de
puntos, los catalizadores tienen distintos valores, teniendo una diferencia
significativa entre sus medias.
49
50
51
52
53
54
55
56
57
58
59
0 1 2 3 4 5
Diagrama de puntos
datos orig.
yi.(media)
Media global= 54.25
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez
c) Analice los residuales del experimento.
1.- Normalidad
El experimento cumple con el supuesto de normalidad al tener un coeficiente de
correlación de 0.9361=0.9675, es decir, muy cercano a 1.
2.- Homogeneidad
Los datos presentan una homogeneidad visible en su distribución
R² = 0.9361
-2.5
-2
-1.5
-1
-0.5
0
0.5
1
1.5
2
2.5
48 50 52 54 56 58 60
Normalidad
Zi
Lineal (Zi)
0.92
0.94
0.96
0.98
1
1.02
1.04
1.06
50 52 54 56 58
Homogeneidad
eij (e. residual)
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez
3.- Independencia
Los datos presentan cierta independencia al tener un coeficiente de correlación de
0.0015= 0.0387, muy por debajo de 1.
d) Construya el diagrama de medias para este experimento utilizando el criterio
de LSD.
μ1=±1.64; μ2=±1.84; μ3=±2.12; μ4=±1.84
R² = 0.0015
0.92
0.94
0.96
0.98
1
1.02
1.04
1.06
0 5 10 15 20
Independencia
eij (e. residual)
Lineal (eij (e. residual))
50
51
52
53
54
55
56
57
58
0 1 2 3 4 5
Diagrama de medias
yi.(media)
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez La gráfica anterior, no muestra traslape entre los intervalos de confianza de las medias,
con esto se puede deducir la existencia significativa entre los datos arrojados y así mismo
un mejor catalizador.
17.- Una investigacion realizada por Singh et al. y publicada en la revista Clinical
Inmunology and Inmunophatology se refiere a las anormalidades inmunológicas en
niños autistas. Como parte de su investigación, tomaron mediciones de la
concentración sérica de un antígeno en tres muestras de niños de diez años o menos
de edad. Las mediciones en unidades por milímetro de suero son las siguientes:
Niños autistas (1) Niños normales (2) Niños con retraso (3)
755 165 380
385 390 510
380 290 315
215 435 565
400 235 715
343 345 380
415 320 390
360 330 425
345 205 155
450 375 335
410 345 295
435 305 200
460 220 105
360 270 105
225 355 245
900 360
365 335
440 305
820 325
400 245
170 285
300 370
325 345
345
230
370
285
315
195
270
305
375
220
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez 1.- Análisis de varianza de un factor
2. Existe diferencia entre cada población de niños
0
0.5
1
1.5
2
2.5
0 1 2 3 4
Homogeneidad
eij (e. residual)
ANOVA
Fuentes de variación
Suma de cuadrados
Grados de
libertad
Cuadrados medios
Fo F tablas
Tratamiento 180371.15 2 90185.57 4.9593 > 3.1316
Error 1236577.16 68 18184.95
Total 1416948.31 70
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez
Como se puede apreciar en el gráfico, los datos presentan una independencia entre sí,
esto se puede comprobar de mejor manera con el cálculo de R2= 0.0034.
Resulta imposible la evaluación por el método Tuckey ya que no es un experimento
balanceado.
18.- El propósito de una de las investigaciones realizadas por Schwartz et al. Es
cuantificar los efectos que produce fumar cigarros sobre las medias estándar del
funcionamiento pulmonar en pacientes con fibrosis pulmonar idiopática. Entre las
mediciones registradas está el porcentaje del volumen residual pronosticado. Los
resultados que se registraron de tales mediciones son las siguientes:
Nunca (n=21) Anterior (n=44) Actual (n=7)
35 62 95 96
120 73 82 107
90 60 141 63
109 77 64 134
82 52 124 140
40 115 65 103
68 82 42 158
124 52 53
77 105 67
140 143 95
127 80 99
58 78 69
110 47 118
42 85 131
57 105 76
93 46 69
70 66 69
51 91 97
R² = 0.0034
0
0.5
1
1.5
2
2.5
0 20 40 60 80
Independencia
eij (e. residual)
Lineal (eij (e. residual))
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez
74 151 137
74 40 103
80 108
57 56
El experimento presenta de manera visual, una distribución homogénea entre sus datos.
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2
0 1 2 3 4
Homogeneidad
eij (e. residual)
ANOVA
Fuentes de variación
Suma de cuadrados
Grados de
libertad
Cuadrados medios
Fo F tablas
Tratamiento 6078.04 2 3039.02 3.358 > 3.1316
Error 61538.91 68 904.98
Total 67616.95 70
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez
Como se puede apreciar en el gráfico, los datos presentan una independencia entre sí,
esto se puede comprobar de mejor manera con el cálculo de R2= 0.0033.
19.- El propósito de un estudio realizado por Robert D. Budd es la exploración de la relación entre el uso de cocaína y el comportamiento violento en casos donde se investigan las causas de muerte. Se registraron las siguientes concentraciones de cocaína (μg/ml) en victimas de muerte violenta según el tipo de muerte.
Homicidio
7.8 1.71 0.19 1.55 0.27 4.08 0.16
1.88 4.10 0.14 3.11 0.42 1.52 0.35
0.25 0.38 2.38 2.49 0.35 0.41 1.49
0.81 2.50 0.21 4.70 2.39 0.35 1.18
0.04 1.80 0.13 1.81 4.38 1.79 2.26
0.04 0.12 1.32 1.15 0.10 0.27 0.19
0.09 0.30 3.58 3.49 1.24 2.77 0.47
1.88
Accidente
1.18 1.46 0.03 0.65 0.40 7.62 0.04
0.05 3.85 0.46 0.47 2.96
Suicidio
1.15 0.54 0.92 0.35 3.22 0.21 0.54
1.82
R² = 0.0033
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2
0 20 40 60 80
Independencia
eij (e. residual)
Lineal (eij (e. residual))
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez
1.- Homogeneidad
Los datos presentan de manera visual, una homogeneidad entre sí.
0
1
2
3
4
5
6
0 0.5 1 1.5 2
Homogeneidad
eij (e. residual)
ANOVA
Fuentes de variación
Suma de cuadrados
Grados de
libertad
Cuadrados medios
Fo F tablas
Tratamiento 1.4662 2 0.73311 0.2617 < 3.13376
Error 187.62 67 2.80033
Total 189.088 69
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez 2.- Independencia
Los datos arrojados del estudio, presentan una independencia dada su R2= 0.0018
20.- En un experimento con cinco réplicas y cuatro tratamientos con un diseño totalmente
aleatorizado, se cultivaron secciones de tejido de planta de tomate con diferentes
cantidades y tipos de azúcares. El crecimiento de tejidos en cada cultivo se da en la tabla
siguiente como mm x 10.
Control 3% de glucosa 3% de fructosa 3% de sacarosa
40 30 24 35
45 29 28 33
42 33 27 34
a) En este ejercicio, realizar las comparaciones de todos los tratamientos contra el
contra el tratamiento control, mediante el método de Dunnet.
d= (.05,3,16)= 2.59, D=(.05,3)= 2.59 2(6.875)/5=4.3
Tratamiento Media |yi-yj| ICS 95% (L,U)
Control 42.2 -- --
3% de glucosa 29.0 -13 2 (-17.5, -89)
3% de fructosa 27.6 -14 6 (-18.9, -10.3)
3% de sucrosa 34.0 -8.2 (-12.5, -3.9)
R² = 0.0018
0
1
2
3
4
5
6
0 20 40 60 80
Independencia
eij (e. residual)
Lineal (eij (e. residual))
Tarea # 2 Análisis de Varianza Alumna: Araceli Abigail Sandoval Rodríguez
b) ¿Cuáles son sus conclusiones?
Los tratamientos difieren se manera significativa dado que no se incluye el 0 en ningún
intervalo. El más cercano al control es el 3% de sucrosa derivado de los límites superiores
y el más lejano es el 3% de fructosa.