Diseno Completamente al Azar

9
1. Explique en qué consiste y cuando se debe aplicar el diseño completamente al azar con un solo criterio de clasificación. Esta centrado en comparar los tratamientos en cuanto a sus medias poblacionales y se utiliza cuando el objetivo es comparar más de dos tratamientos 2. Supongamos que se desea aprobar la igualdad entre sí de cinco medias. Una alternativa para hacer esto sería comparar de dos en dos las medias, utilizando la prueba T student y al final tomar una decisión. Explique porque esto aumenta el error tipo I. En este caso con cinco medias tenemos diez posible pares de medias, y si la probabilidad de aceptar la H 0 para cada prueba individual es de 1-= 0.95, entonces la probabilidad de aceptar las diez H 0 es de 0.95 10 = 0.5987, lo cual representa un aumento considerable del error tipo I. Aunque se utilice un nivel de confianza tal que (1- ) 10 = 0.95, el procedimiento resulta inapropiado porque se pueden producir sesgos por parte del experimentador. 3. ¿Qué mide el cuadrado medio del error en el ANOVA de un experimento? Es la suma de cuadrados divididos entre sus respectivos grados de libertad 4. ¿Qué son los grados de libertad para una suma de cuadrados en un análisis de varianza? Representa el número de piezas de información independientes en la suma de cuadrados. En general, es el número de observaciones menos el número de parámetros estimados de los datos. 5. A continuación se muestra parte del ANOVA para comparar cinco tratamientos con cuatro replicas cada uno. Fuente de variación Suma de cuadrados G. de libertad C. medio Razón F Valor –p Tratamiento Error Total 800 400 1200 4 15 19 200 26.66 7.5 P(3.06>7.5) SC T = ∑ k i=1 ni j=1 Y 2 ij 2 ; 800+400 Fo = CM TRAT / CM E ; 200/26.66 CM TRAT = ; 800/4 CM E = a) Agregar en esta tabla los grados de libertad, el cuadrado medio y la razón F para cada una de las Fuentes de variación. b) Explique de manera esquemática como calcularía el valor –P o la significancia observada, para ver si hay diferencia entre tratamientos. Valor-p es el área bajo la distribución F k-1, N-k a la derecha del estadístico F 0 , es decir, el valor-p=P(F>F 0 )

Transcript of Diseno Completamente al Azar

Page 1: Diseno Completamente al Azar

1. Explique en qué consiste y cuando se debe aplicar el diseño completamente al azar con un solo

criterio de clasificación.

Esta centrado en comparar los tratamientos en cuanto a sus medias poblacionales y se utiliza cuando el

objetivo es comparar más de dos tratamientos

2. Supongamos que se desea aprobar la igualdad entre sí de cinco medias. Una alternativa para hacer

esto sería comparar de dos en dos las medias, utilizando la prueba T student y al final tomar una

decisión. Explique porque esto aumenta el error tipo I.

En este caso con cinco medias tenemos diez posible pares de medias, y si la probabilidad de aceptar la H0 para

cada prueba individual es de 1- = 0.95, entonces la probabilidad de aceptar las diez H0 es de 0.9510 = 0.5987, lo

cual representa un aumento considerable del error tipo I. Aunque se utilice un nivel de confianza tal que (1-

)10= 0.95, el procedimiento resulta inapropiado porque se pueden producir sesgos por parte del

experimentador.

3. ¿Qué mide el cuadrado medio del error en el ANOVA de un experimento?

Es la suma de cuadrados divididos entre sus respectivos grados de libertad

4. ¿Qué son los grados de libertad para una suma de cuadrados en un análisis de varianza?

Representa el número de piezas de información independientes en la suma de cuadrados. En general, es el

número de observaciones menos el número de parámetros estimados de los datos.

5. A continuación se muestra parte del ANOVA para comparar cinco tratamientos con cuatro replicas

cada uno.

Fuente de variación

Suma de cuadrados

G. de libertad C. medio Razón F Valor –p

Tratamiento Error Total

800 400 1200

4 15 19

200 26.66

7.5 P(3.06>7.5)

SCT= ∑ki=1∑ni

j=1Y2ij –

2 ; 800+400

Fo = CMTRAT/ CME ; 200/26.66

CMTRAT=

; 800/4

CME =

a) Agregar en esta tabla los grados de libertad, el cuadrado medio y la razón F para cada una de las

Fuentes de variación.

b) Explique de manera esquemática como calcularía el valor –P o la significancia observada, para ver si

hay diferencia entre tratamientos.

Valor-p es el área bajo la distribución Fk-1, N-k a la derecha del estadístico F0, es decir, el valor-p=P(F>F0)

Page 2: Diseno Completamente al Azar

c) ¿con la información disponible se puede hacer conjeturas sobre si hay diferencias significativas entre

tratamientos? Argumente su respuesta.

Es posible determinar la diferencia entre los tratamientos, mediante la información presentada en la tabla

ANOVA con el valor obtenido del estadístico F0 que sigue una distribución F con (k-1) grados de libertad en el

numerador y (N-k) grados de libertad en el denominador y el valor obtenido de la tablas de la distribución F

para probar la hipótesis de igualdad de los tratamientos con respecto a la media de la correspondiente variable

de respuesta. Ya que en caso de rechazar la hipótesis anterior se estaría asumiendo que las medias de los

tratamientos son diferentes.

d) Anote el modelo estadístico y formule la hipótesis pertinente.

H0: = =

HA: ≠ para algún i ≠ j

6. Se desea investigar el efecto del pH en el crecimiento de cierto microorganismo en un medio

específico. Para ello se realiza un experimento, teniendo como punto de partida la misma cantidad

de microorganismos. Se hacen cuatro repeticiones y se obtienen los siguientes resultados. ¿estos

datos son evidencia suficiente para afirmar que los niveles de pH donde se logra menor y mayor

crecimiento son el 3 y el 2, respectivamente? Explique su respuesta.

Nivel de pH Crecimiento promedio (en %)

1 2 3

80 105 75

No se puede afirmar que el nivel de pH influya directamente en el crecimiento promedio, se considera que hay

más factores que intervienen, además es necesario que nos proporcionen más datos por tratamiento para

tomar esa decisión.

7. Se desea investigar la influencia de la temperatura en el rendimiento de un proceso químico, en

particular interesa investigar un rango de temperatura entre 60 y 120 ºC. se tiene recursos para

realizar 20 corridas experimentales.

a) Los niveles de temperatura con los que se experimenta son: 60, 65, 70 y 120; se hacen 5 repeticiones con cada nivel. ¿Considera que es adecuado el diseño experimental usado? Argumente su respuesta, y de ser necesario proponga alternativas.

No es adecuado el diseño experimental debido a que los niveles de temperatura con los cuales se pretende experimentar no están distribuidos uniformemente en el rango establecido, se recomienda hacer un experimento con 5 réplicas para los siguientes tratamientos: 60,80, 100, 120.

Page 3: Diseno Completamente al Azar

b) El orden en que decidieron hacer las corridas experimentales para facilitar el trabajo experimental fue: primero la cinco del nivel bajo de temperatura luego la cinco del siguiente y así hasta finalizar. ¿Es correcto lo que hicieron? Argumente su respuesta

No es correcto, las corridas experimentales deben ser aleatorias para que el resultado de un tratamiento no influya en el inmediato siguiente (no violar los supuestos del modelo)

c) Para hacer el análisis estadístico se comparan, mediante una prueba T-student, de dos en dos niveles de temperatura, y con base en esto obtuvieron conclusiones. ¿Es adecuado tal análisis? , argumente, en su caso proponga alternativas.

No adecuado, aumenta el error tipo I: rechazar la Ho siendo verdadera en cada par de medias.

8. Describa en qué consiste cada uno de los supuestos del modelo en el análisis de varianza, y explique

la forma típica en que estos supuestos se verifican.

Normalidad: Consiste en verificar que los residuos sigan una distribución normal con media cero y se verifica graficando los residuos en una escala X-Y de tal manera que si los residuos siguen una distribución normal al graficarlos tienden a quedar alineados en una línea recta. Varianza Constante: Comprobar que los residuos de cada tratamiento tienen la misma varianza, es verificado graficando los predichos contra los residuos y si los puntos en esta grafica se distribuyen de manera aleatoria en una banda horizontal (sin ningún patrón claro y contundente) entonces es señal de que se cumple el supuesto de que los tratamientos tienen igual varianza. Independencia: Probar que los residuos son independientes entre si, se verifica si se grafica el orden en que se colecto un dato contra el residuo correspondiente, de esta manera si al graficar en el eje horizontal el tiempo (orden de corrida) y en el eje vertical los residuos, se detecta una tendencia o patrón no aleatorio claramente definido, esto es evidencia de que existe una correlación entre los errores y, por lo tanto el supuesto de independencia no se cumple.

9. ¿Qué son y cuando se aplican las pruebas para comparar medias?

Son métodos que nos permiten hacer comparaciones entre todos los posibles pares de medias,

dependiendo del número de tratamientos para identificar cuales resultaron diferentes, Se aplican

cuando es rechazada la Ho (todas las medias son iguales).

Page 4: Diseno Completamente al Azar

15 - Una compañía farmacéutica desea evaluar el efecto que tiene la cantidad de almidón en la dureza de las

tabletas. Se decidió producir lotes con una cantidad determinada de almidón, y que las cantidades de

almidón a probar fueran 2%, 5% y 10% y la variable de respuesta seria el promedio de la dureza de 20

tabletas de cada lote. Se hicieron 4 réplicas por tratamiento y se obtuvieron los siguientes resultados:

% almidón Dureza

2 4.3 4.8 4.5

5 6.5 6.9 6.1

10 9 8.5 8.1

a) ¿Hay evidencia suficiente de que el almidón influye en la dureza de las tabletas? Halle el ANOVA.

Se indican los cálculos manuales:

2% 5% 10% Suma de Cuadrados:

4.3 6.5 9 548.88

5.2 7.3 7.8

4.8 6.9 8.5

4.5 6.1 8.1

Yi. = 18.8 26.8 33.4 Y..= 79

ni= 4 4 4 N= 12

yi. Media= 4.7 6.7 8.35 Y Media= 6.58

Ti= -1.88 0.12 1.77

Obteniendo un:

ANOVA unidireccional: 2%, 5%, 10% Fuente GL SC MC F P

Factor 2 26.727 13.363 58.10 0.000

Error 9 2.070 0.230

Total 11 28.797

S = 0.4796 R-cuad. = 92.81% R-cuad.(ajustado) = 91.21%

Dado el criterio de rechazo con α=0.05, si 58.10 > F (o.o5, 2, 9) se rechaza la H0. 58.10 > 4.256

Se cumple, por lo tanto se rechaza la hipótesis nula, indicando que para cada tratamiento con porcentaje de

almidón si influye en la dureza de las tabletas.

Page 5: Diseno Completamente al Azar

b) Realice los análisis complementarios necesarios:

El diagrama de cajas se ilustra de la siguiente manera:

Se observa que las cajas no se traslapan, otra

muestra visual de que el algodón influye

considerablemente en la dureza de las

tabletas, con 10% de algodón se obtiene

mucha mas dureza.

Comparación de Media con Media:

Haciendo las comparaciones de media se evidencia que todas son significativamente diferentes

TUKEY y LSD

1 2 3

𝜇 𝜇 𝜇3 4.7 6.7 8.35

Tukey

𝜇 − 𝜇

3>0.9471 Significativo

𝜇 − 𝜇3

3.65>0.9471 Significativo

𝜇 − 𝜇3

1.65>0.9471 Significativo

LSD

𝜇 − 𝜇

2>0.76 Significativo

𝜇 − 𝜇3

3.65>0.76 Significativo

𝜇 − 𝜇3

1.65>0.76 Significativo

T𝛼 =q𝛼 (k, N – k) 𝐶𝑀𝐸/𝑛𝑖

T0.05=q0.05 (3,9) 0 23/4

3.95 0 0575 = 0.9471

LSD= t∝/2, N-k 2𝐶𝑀𝐸/𝑛

LSD=2.26 2𝑥0 23/4 LSD=0.76

Page 6: Diseno Completamente al Azar

c) Si se desea maximizar la dureza de las tabletas ¿Qué es lo que recomendaría al fabricante?

Si el objetivo es maximizar la dureza en las tabletas se recomienda ampliamente aumentar el porcentaje de

almidón en el proceso de fabricación de las tabletas.

d) Verifique los supuestos:

Se verificaran los supuestos de

Normalidad

Varianza Constante

Independencia

En la gráfica de probabilidad normal, los residuos tienden a ajustarse a la línea recta, se deduce que: las

observaciones proceden de poblaciones normales. Se cumple el supuesto de normalidad visualmente.

Las otras graficas no presentan patrones anormales tales como forma de embudo o corneta por lo tanto las

muestras son aleatorias e independientes. Se cumple el supuesto de que los tratamientos tienen igual varianza

e independencia.

Page 7: Diseno Completamente al Azar

18.- Se cultivaron cuatro diferentes clonas de agave tequilana bajo un mismo esquema de manejo. Se quiere

saber qué clona es la que responde mejor a dicho manejo, evaluando el nivel de respuesta con el porcentaje de

azúcares reductores totales en base húmeda. Los datos se muestran a continuación:

CLONA

1 2 3 4

8.69 6.68 6.83 6.43

10.30

8.00 16.41 12.43 10.99 15.53

17.39 13.73 15.62 17.05 15.42

10.37 9.16 8.13 4.40

10.38

7.786 12.672 15.842 8.488

a) Mediante ANOVA, compare las medias de las clonas y verifique residuales.

ANOVA unidireccional: % AZUCAR REDUC vs. CLONA Fuente GL SC MC F P

CLONA 3 213,63 71,21 12,53 0,000

Error 16 90,93 5,68

Total 19 304,55

S = 2,384 R-cuad. = 70,14% R-cuad.(ajustado) = 64,55%

H0: =

HA: ≠ para algún i ≠ j

Rechazamos H0 si: F0 > Fk-1, N-k entonces, 12.53 > 3.24

Como esta condición se cumple, procedemos a rechazar la H0. Otra forma de rechazarla es que, el valor-p< α

es decir, 0.000 < 0.05 de esta manera también decimos que rechazamos la H0 sobre igualdad de medias en los

tratamientos.

4321

17,5

15,0

12,5

10,0

7,5

5,0

CLONA

% A

ZU

CA

R R

ED

UC

Gráfica de caja de % AZUCAR REDUC

Page 8: Diseno Completamente al Azar

Para probar cuales medias son diferentes, haremos comparaciones entre los 6 posibles pares de medias con

los siguientes métodos:

Tukey Tα = q α (4,16) / = 4.316

LSD (Fisher) LSD = t 0.025, 16 / = 3.1956

RESIDUALES

DIFERENCIA POBLACIONAL

DIFERENCIA MUESTRAL

(VALOR ABSOLUTO)

DECISIÓN

μ2 – μ1 4.886 > 4.3164 Significativa

μ3 – μ1 8.056 > 4.3164 Significativa

μ4 – μ1 0.702 < 4.3164 No significativa

μ3 – μ2 3.170 < 4.3164 No significativa

μ4 – μ2 4.184 < 4.3164 No significativa

μ4 – μ3 7.354 > 4.3164 Significativa

DIFERENCIA POBLACIONAL

DIFERENCIA MUESTRAL (VALOR ABSOLUTO)

DECISIÓN

μ2 – μ1 4.886 > 3.1956 Significativa

μ3 – μ1 8.056 > 3.1956 Significativa

μ4 – μ1 0.702 < 3.1956 No significativa

μ3 – μ2 3.170 < 3.1956 No significativa

μ4 – μ2 4.184 > 3.1956 Significativa

μ4 – μ3 7.354 > 3.1956 Significativa

5,02,50,0-2,5-5,0

99

90

50

10

1

Residuo

Po

rce

nta

je

161412108

4

2

0

-2

-4

Valor ajustado

Re

sid

uo

420-2-4

4

3

2

1

0

Residuo

Fre

cu

en

cia

2018161412108642

4

2

0

-2

-4

Orden de observación

Re

sid

uo

Gráfica de probabilidad normal vs. ajustes

Histograma vs. orden

Gráficas de residuos para % AZUCAR REDUC

Page 9: Diseno Completamente al Azar

b) ¿Hay una clona que haya respondido mejor al esquema de manejo? Argumente su

respuesta.

En el tercer tratamiento nos indica el promedio mas alto y que indica la mayor aportación de

azucares reductores en base húmeda.

c) En caso de que exista un empate estadístico entre dos o más clonas, ¿qué propondría para

desempatar?

Otro experimento con solo esos dos tipos de clonas pero considerando mas observaciones para

checar cual es más efectiva.