Diseno Completamente al Azar
-
Upload
alberto-carranza-garcia -
Category
Documents
-
view
20.686 -
download
1
Transcript of Diseno Completamente al Azar
1. Explique en qué consiste y cuando se debe aplicar el diseño completamente al azar con un solo
criterio de clasificación.
Esta centrado en comparar los tratamientos en cuanto a sus medias poblacionales y se utiliza cuando el
objetivo es comparar más de dos tratamientos
2. Supongamos que se desea aprobar la igualdad entre sí de cinco medias. Una alternativa para hacer
esto sería comparar de dos en dos las medias, utilizando la prueba T student y al final tomar una
decisión. Explique porque esto aumenta el error tipo I.
En este caso con cinco medias tenemos diez posible pares de medias, y si la probabilidad de aceptar la H0 para
cada prueba individual es de 1- = 0.95, entonces la probabilidad de aceptar las diez H0 es de 0.9510 = 0.5987, lo
cual representa un aumento considerable del error tipo I. Aunque se utilice un nivel de confianza tal que (1-
)10= 0.95, el procedimiento resulta inapropiado porque se pueden producir sesgos por parte del
experimentador.
3. ¿Qué mide el cuadrado medio del error en el ANOVA de un experimento?
Es la suma de cuadrados divididos entre sus respectivos grados de libertad
4. ¿Qué son los grados de libertad para una suma de cuadrados en un análisis de varianza?
Representa el número de piezas de información independientes en la suma de cuadrados. En general, es el
número de observaciones menos el número de parámetros estimados de los datos.
5. A continuación se muestra parte del ANOVA para comparar cinco tratamientos con cuatro replicas
cada uno.
Fuente de variación
Suma de cuadrados
G. de libertad C. medio Razón F Valor –p
Tratamiento Error Total
800 400 1200
4 15 19
200 26.66
7.5 P(3.06>7.5)
SCT= ∑ki=1∑ni
j=1Y2ij –
2 ; 800+400
Fo = CMTRAT/ CME ; 200/26.66
CMTRAT=
; 800/4
CME =
a) Agregar en esta tabla los grados de libertad, el cuadrado medio y la razón F para cada una de las
Fuentes de variación.
b) Explique de manera esquemática como calcularía el valor –P o la significancia observada, para ver si
hay diferencia entre tratamientos.
Valor-p es el área bajo la distribución Fk-1, N-k a la derecha del estadístico F0, es decir, el valor-p=P(F>F0)
c) ¿con la información disponible se puede hacer conjeturas sobre si hay diferencias significativas entre
tratamientos? Argumente su respuesta.
Es posible determinar la diferencia entre los tratamientos, mediante la información presentada en la tabla
ANOVA con el valor obtenido del estadístico F0 que sigue una distribución F con (k-1) grados de libertad en el
numerador y (N-k) grados de libertad en el denominador y el valor obtenido de la tablas de la distribución F
para probar la hipótesis de igualdad de los tratamientos con respecto a la media de la correspondiente variable
de respuesta. Ya que en caso de rechazar la hipótesis anterior se estaría asumiendo que las medias de los
tratamientos son diferentes.
d) Anote el modelo estadístico y formule la hipótesis pertinente.
H0: = =
HA: ≠ para algún i ≠ j
6. Se desea investigar el efecto del pH en el crecimiento de cierto microorganismo en un medio
específico. Para ello se realiza un experimento, teniendo como punto de partida la misma cantidad
de microorganismos. Se hacen cuatro repeticiones y se obtienen los siguientes resultados. ¿estos
datos son evidencia suficiente para afirmar que los niveles de pH donde se logra menor y mayor
crecimiento son el 3 y el 2, respectivamente? Explique su respuesta.
Nivel de pH Crecimiento promedio (en %)
1 2 3
80 105 75
No se puede afirmar que el nivel de pH influya directamente en el crecimiento promedio, se considera que hay
más factores que intervienen, además es necesario que nos proporcionen más datos por tratamiento para
tomar esa decisión.
7. Se desea investigar la influencia de la temperatura en el rendimiento de un proceso químico, en
particular interesa investigar un rango de temperatura entre 60 y 120 ºC. se tiene recursos para
realizar 20 corridas experimentales.
a) Los niveles de temperatura con los que se experimenta son: 60, 65, 70 y 120; se hacen 5 repeticiones con cada nivel. ¿Considera que es adecuado el diseño experimental usado? Argumente su respuesta, y de ser necesario proponga alternativas.
No es adecuado el diseño experimental debido a que los niveles de temperatura con los cuales se pretende experimentar no están distribuidos uniformemente en el rango establecido, se recomienda hacer un experimento con 5 réplicas para los siguientes tratamientos: 60,80, 100, 120.
b) El orden en que decidieron hacer las corridas experimentales para facilitar el trabajo experimental fue: primero la cinco del nivel bajo de temperatura luego la cinco del siguiente y así hasta finalizar. ¿Es correcto lo que hicieron? Argumente su respuesta
No es correcto, las corridas experimentales deben ser aleatorias para que el resultado de un tratamiento no influya en el inmediato siguiente (no violar los supuestos del modelo)
c) Para hacer el análisis estadístico se comparan, mediante una prueba T-student, de dos en dos niveles de temperatura, y con base en esto obtuvieron conclusiones. ¿Es adecuado tal análisis? , argumente, en su caso proponga alternativas.
No adecuado, aumenta el error tipo I: rechazar la Ho siendo verdadera en cada par de medias.
8. Describa en qué consiste cada uno de los supuestos del modelo en el análisis de varianza, y explique
la forma típica en que estos supuestos se verifican.
Normalidad: Consiste en verificar que los residuos sigan una distribución normal con media cero y se verifica graficando los residuos en una escala X-Y de tal manera que si los residuos siguen una distribución normal al graficarlos tienden a quedar alineados en una línea recta. Varianza Constante: Comprobar que los residuos de cada tratamiento tienen la misma varianza, es verificado graficando los predichos contra los residuos y si los puntos en esta grafica se distribuyen de manera aleatoria en una banda horizontal (sin ningún patrón claro y contundente) entonces es señal de que se cumple el supuesto de que los tratamientos tienen igual varianza. Independencia: Probar que los residuos son independientes entre si, se verifica si se grafica el orden en que se colecto un dato contra el residuo correspondiente, de esta manera si al graficar en el eje horizontal el tiempo (orden de corrida) y en el eje vertical los residuos, se detecta una tendencia o patrón no aleatorio claramente definido, esto es evidencia de que existe una correlación entre los errores y, por lo tanto el supuesto de independencia no se cumple.
9. ¿Qué son y cuando se aplican las pruebas para comparar medias?
Son métodos que nos permiten hacer comparaciones entre todos los posibles pares de medias,
dependiendo del número de tratamientos para identificar cuales resultaron diferentes, Se aplican
cuando es rechazada la Ho (todas las medias son iguales).
15 - Una compañía farmacéutica desea evaluar el efecto que tiene la cantidad de almidón en la dureza de las
tabletas. Se decidió producir lotes con una cantidad determinada de almidón, y que las cantidades de
almidón a probar fueran 2%, 5% y 10% y la variable de respuesta seria el promedio de la dureza de 20
tabletas de cada lote. Se hicieron 4 réplicas por tratamiento y se obtuvieron los siguientes resultados:
% almidón Dureza
2 4.3 4.8 4.5
5 6.5 6.9 6.1
10 9 8.5 8.1
a) ¿Hay evidencia suficiente de que el almidón influye en la dureza de las tabletas? Halle el ANOVA.
Se indican los cálculos manuales:
2% 5% 10% Suma de Cuadrados:
4.3 6.5 9 548.88
5.2 7.3 7.8
4.8 6.9 8.5
4.5 6.1 8.1
Yi. = 18.8 26.8 33.4 Y..= 79
ni= 4 4 4 N= 12
yi. Media= 4.7 6.7 8.35 Y Media= 6.58
Ti= -1.88 0.12 1.77
Obteniendo un:
ANOVA unidireccional: 2%, 5%, 10% Fuente GL SC MC F P
Factor 2 26.727 13.363 58.10 0.000
Error 9 2.070 0.230
Total 11 28.797
S = 0.4796 R-cuad. = 92.81% R-cuad.(ajustado) = 91.21%
Dado el criterio de rechazo con α=0.05, si 58.10 > F (o.o5, 2, 9) se rechaza la H0. 58.10 > 4.256
Se cumple, por lo tanto se rechaza la hipótesis nula, indicando que para cada tratamiento con porcentaje de
almidón si influye en la dureza de las tabletas.
b) Realice los análisis complementarios necesarios:
El diagrama de cajas se ilustra de la siguiente manera:
Se observa que las cajas no se traslapan, otra
muestra visual de que el algodón influye
considerablemente en la dureza de las
tabletas, con 10% de algodón se obtiene
mucha mas dureza.
Comparación de Media con Media:
Haciendo las comparaciones de media se evidencia que todas son significativamente diferentes
TUKEY y LSD
1 2 3
𝜇 𝜇 𝜇3 4.7 6.7 8.35
Tukey
𝜇 − 𝜇
3>0.9471 Significativo
𝜇 − 𝜇3
3.65>0.9471 Significativo
𝜇 − 𝜇3
1.65>0.9471 Significativo
LSD
𝜇 − 𝜇
2>0.76 Significativo
𝜇 − 𝜇3
3.65>0.76 Significativo
𝜇 − 𝜇3
1.65>0.76 Significativo
T𝛼 =q𝛼 (k, N – k) 𝐶𝑀𝐸/𝑛𝑖
T0.05=q0.05 (3,9) 0 23/4
3.95 0 0575 = 0.9471
LSD= t∝/2, N-k 2𝐶𝑀𝐸/𝑛
LSD=2.26 2𝑥0 23/4 LSD=0.76
c) Si se desea maximizar la dureza de las tabletas ¿Qué es lo que recomendaría al fabricante?
Si el objetivo es maximizar la dureza en las tabletas se recomienda ampliamente aumentar el porcentaje de
almidón en el proceso de fabricación de las tabletas.
d) Verifique los supuestos:
Se verificaran los supuestos de
Normalidad
Varianza Constante
Independencia
En la gráfica de probabilidad normal, los residuos tienden a ajustarse a la línea recta, se deduce que: las
observaciones proceden de poblaciones normales. Se cumple el supuesto de normalidad visualmente.
Las otras graficas no presentan patrones anormales tales como forma de embudo o corneta por lo tanto las
muestras son aleatorias e independientes. Se cumple el supuesto de que los tratamientos tienen igual varianza
e independencia.
18.- Se cultivaron cuatro diferentes clonas de agave tequilana bajo un mismo esquema de manejo. Se quiere
saber qué clona es la que responde mejor a dicho manejo, evaluando el nivel de respuesta con el porcentaje de
azúcares reductores totales en base húmeda. Los datos se muestran a continuación:
CLONA
1 2 3 4
8.69 6.68 6.83 6.43
10.30
8.00 16.41 12.43 10.99 15.53
17.39 13.73 15.62 17.05 15.42
10.37 9.16 8.13 4.40
10.38
7.786 12.672 15.842 8.488
a) Mediante ANOVA, compare las medias de las clonas y verifique residuales.
ANOVA unidireccional: % AZUCAR REDUC vs. CLONA Fuente GL SC MC F P
CLONA 3 213,63 71,21 12,53 0,000
Error 16 90,93 5,68
Total 19 304,55
S = 2,384 R-cuad. = 70,14% R-cuad.(ajustado) = 64,55%
H0: =
HA: ≠ para algún i ≠ j
Rechazamos H0 si: F0 > Fk-1, N-k entonces, 12.53 > 3.24
Como esta condición se cumple, procedemos a rechazar la H0. Otra forma de rechazarla es que, el valor-p< α
es decir, 0.000 < 0.05 de esta manera también decimos que rechazamos la H0 sobre igualdad de medias en los
tratamientos.
4321
17,5
15,0
12,5
10,0
7,5
5,0
CLONA
% A
ZU
CA
R R
ED
UC
Gráfica de caja de % AZUCAR REDUC
Para probar cuales medias son diferentes, haremos comparaciones entre los 6 posibles pares de medias con
los siguientes métodos:
Tukey Tα = q α (4,16) / = 4.316
LSD (Fisher) LSD = t 0.025, 16 / = 3.1956
RESIDUALES
DIFERENCIA POBLACIONAL
DIFERENCIA MUESTRAL
(VALOR ABSOLUTO)
DECISIÓN
μ2 – μ1 4.886 > 4.3164 Significativa
μ3 – μ1 8.056 > 4.3164 Significativa
μ4 – μ1 0.702 < 4.3164 No significativa
μ3 – μ2 3.170 < 4.3164 No significativa
μ4 – μ2 4.184 < 4.3164 No significativa
μ4 – μ3 7.354 > 4.3164 Significativa
DIFERENCIA POBLACIONAL
DIFERENCIA MUESTRAL (VALOR ABSOLUTO)
DECISIÓN
μ2 – μ1 4.886 > 3.1956 Significativa
μ3 – μ1 8.056 > 3.1956 Significativa
μ4 – μ1 0.702 < 3.1956 No significativa
μ3 – μ2 3.170 < 3.1956 No significativa
μ4 – μ2 4.184 > 3.1956 Significativa
μ4 – μ3 7.354 > 3.1956 Significativa
5,02,50,0-2,5-5,0
99
90
50
10
1
Residuo
Po
rce
nta
je
161412108
4
2
0
-2
-4
Valor ajustado
Re
sid
uo
420-2-4
4
3
2
1
0
Residuo
Fre
cu
en
cia
2018161412108642
4
2
0
-2
-4
Orden de observación
Re
sid
uo
Gráfica de probabilidad normal vs. ajustes
Histograma vs. orden
Gráficas de residuos para % AZUCAR REDUC
b) ¿Hay una clona que haya respondido mejor al esquema de manejo? Argumente su
respuesta.
En el tercer tratamiento nos indica el promedio mas alto y que indica la mayor aportación de
azucares reductores en base húmeda.
c) En caso de que exista un empate estadístico entre dos o más clonas, ¿qué propondría para
desempatar?
Otro experimento con solo esos dos tipos de clonas pero considerando mas observaciones para
checar cual es más efectiva.