Inferencia Estadistica. Marangunich, Laura. 2004

download Inferencia Estadistica. Marangunich, Laura. 2004

of 20

description

asdasf

Transcript of Inferencia Estadistica. Marangunich, Laura. 2004

  • Red de Helmintologa de FAO para Amrica Latina y el Caribe http://cnia.inta.gov.ar/helminto

    Agosto 2004

    INFERENCIA ESTADISTICA: Lic. Laura Marangunich

    Frente a la necesidad de estudiar un fenmeno en la poblacin y ante la imposibilidad de censarla (estudiarla en forma exhaustiva), debemos recurrir a la extraccin o generacin de una muestra (con la ayuda de la teora del muestreo, o el diseo de experimentos segn que el estudio sea observacional o experimental). Si definimos como POBLACION a la totalidad de los individuos donde ocurre el fenmeno de inters, una MUESTRA, ser un subconjunto de inviduos, extrados de esa poblacin, y, a los cuales se les medir efectivamente las variables de inters. Despus de registrar el valor de la(s) variable(s) en todos los individuos de la muestra y, con las herramientas descriptas en el mdulo anterior, los datos sern tabulados, se generarn y graficarn las distribuciones de frecuencia y se calcularn las medidas de posicin y de variacin ms adecuadas para la situacin. Este resumen de la informacin en forma analtica y grfica es lo que en el mdulo anterior definimos como ESTADISTICA DESCRIPTIVA. Pero describir lo efectivamente observado en la muestra es solo el primer paso de un ambicioso proceso (INFERENCIA ESTADISTICA), que nos permite extender a la poblacin la informacin obtenida en la muestra. Las medidas de posicin y variacin que en la poblacion se denominan PARAMETROS y que generalmente se designan con letras maysculas y/o griegas (:, F, P etc), sern desconocidos por la imposibilidad ya expresada de censar la poblacin. Pero a travs de este proceso inferencial, esos parmetros podrn ser estimados a partir de las correspondientes medidas muestrales, definidas a semejanza de ellos. Esas medidas muestrales (de posicin, de variacin, porcentajes etc), se denominan, por su funcin, ESTIMADORES. Asi : (media poblacional) ser estimada por 0 , y F (desvo standard poblacional) por S (o SD). Para que una medida muestral pueda ejercer la funcin de estimar al correspondiente parmetro, ser necesario que cumpla algunas caractersticas deseables. Por ejemplo, si estamos interesados en estimar la media poblacional ( : ), calcularemos 0 en la forma descripta en el mdulo I, pero debemos ser concientes de que si otro investigador, estudiando el mismo fenmeno, en las mismas condiciones, extrae otra muestra del mismo tamao, difcilmente obtendr el mismo valor de 0. Si a partir de una misma poblacin se extrajeran 2, 10, 50, 100, todas las muestras posibles y en cada una de ellas se calculara 0, nos enfrentaramos con una coleccin de valores que fluctuaran de muestra a muestra, es decir 0 se comporta como una variable aleatoria. Esto parece ser una noticia desalentadora, sin embargo si analizamos los distintos valores de 0 obtenidos, veremos que no son todos iguales, pero

  • Red de Helmintologa de FAO para Amrica Latina y el Caribe http://cnia.inta.gov.ar/helminto

    Agosto 2004

    tampoco son todos distintos, y si construyramos la distribucin de frecuencias, observaramos que su forma es, o al menos tiende a ser simtrica, y con un gran parecido a una distribucin terica muy til en Estadstica, que es la DISTRIBUCION NORMAL. TEOREMA CENTRAL DEL LIMITE Un importante teorema en Estadstica es el TEOREMA CENTRAL DEL LIMITE, que justamente nos garantiza que la distribucin de 0 es (o tiende a ser ) normal, dependiendo de que la distribucin de la variable en estudio sea o no normal. Si la poblacin muestreada es normal, la distribucin de 0, an con pequeos tamaos de muestra tambin lo ser. Cuando la poblacin muestreada no es normal, la distribucin de 0, tender a la normalidad a medida que el tamao de muestra aumente. A su vez este teorema tambin nos garantiza que la distribucin de 0 est centrada en el mismo lugar que la variable (o sea en :, que es justamente el parmetro desconocido que pretendemos estimar), esto en definitiva nos dice que la coleccin de valores de 0 flucta alrededor del parmetro m y en promedio coincide con l. En un artculo muy interesante del Dr. Naum Marchevsky (Introduccin a la aplicacin de la Estadistica en salud animal), describe un ejercicio realizado durante un curso en Paraguay en 1984: cada participante fu invitado a seleccionar una muestra de una poblacin conocida y calcular el promedio; los valores obtenidos fueron registrados y pudo verificarse que si bien los valores individuales de 0 resultaban menores, mayores , eventualmente iguales al parmetro (por el efecto de la fluctuacin muestral de la que hablamos), el promedio de esas estimaciones individuales, prcticamente coincida con el parmetro. Esto confirma lo que nos adelantara el T.C. del Limite. Pero, en el mdulo I vimos que saber lo que ocurre en promedio no es suficiente. Afortunadamente el mismo teorema nos informa que la variacin de la distribucin de 0 es " n " veces ms chica que la variacin de la poblacin muestreada (donde " n " es el tamao de la muestra). Teniendo ahora una medida de variacin de la distribucin (normal o aproximadamente normal) de 0 , podemos inferir que por ejemplo el 95% los valores (que, como ya dijimos fluctan alrededor de :), lo harn a una distancia mxima de 2 SE (tal como indica la distribucin normal de Gauss). Donde SE (0) = SD (x) / n) ( SD = Desvio Stndard y SE = Error Standard) Esto nos indica que la variacin de la distribucin de 0 en parte depende de la variacin de la poblacin muestreada (que aparece en el numerador), pero en

  • Red de Helmintologa de FAO para Amrica Latina y el Caribe http://cnia.inta.gov.ar/helminto

    Agosto 2004

    parte del investigador, que eligiendo adecuadamente el tamao de muestra (que aparece en el denominador), puede acotarla. Formalmente el teorema dice: Si x ~ ( : , F )

    0 ~ N (: , F / %n) cuando n 4 (4 = infinito) donde ~ = se distribuye = tiende a (distribuirse) N = Normal Como ilustracin de este teorema, presentaremos (figura 1) dos ejemplos extraidos del libro de Douglas Altman (Practical Statistics for Medical Research Chapman & Hall 1991-pg. 156 y 158) Se trata de dos distribuciones poblaciones: una de albmina en suero y otra de bilirrubina. La primera es normal, en cuyo caso la distribucin en el muestreo de 0 es normal an con muestras pequeas, en cambio en el segundo caso, en que la distribucin original es asimtrica, podemos ver que, recin con grandes tamaos de muestra, la distribucin de 0 se simetriza. (sta es la diferencia que planteamos previamente entre distribuirse o tender a distribuirse en forma normal) Figura 1

  • Red de Helmintologa de FAO para Amrica Latina y el Caribe http://cnia.inta.gov.ar/helminto

    Agosto 2004

    Antes de terminar con este punto, recordemos que en el mdulo I enfatizamos la conveniencia de tener una distribucin simtrica. Las distribuciones asimtricas deben ser sometidas a alguna transformacin normalizante, o demandarn tamaos de muestra ms altos para que va el Teorema Central del Limite, tengamos la seguridad de obtener una buena estimacin. Porqu es necesario conocer la distribucin en el muestreo de un estimador? El conocimiento de la distribucin terica que rige el comportamiento del estimador, ser el soporte probabilstico para efectuar las inferencias. En el caso que analizamos puntualmente, nos referimos al estimador 0 y su distribucin normal, pero las distribuciones podrn ser otras, cuando nos refiramos a otros estimadores de otros parmetros. Si volvemos a la figura 1 del mdulo I, las distribuciones en el muestreo, seran como la plataforma de lanzamiento del camino ascendente de la inferencia que nos permitir expandir nuestras conclusiones a la poblacin. Los dos caminos posibles ( y equivalentes) de la Inferencia son: - Estimacin de parmetros mediante INTERVALOS DE CONFIANZA. - PRUEBA DE HIPOTESIS para testear posibles valores de los parmetros, o

    para efectuar comparaciones entre ellos. Desarrollaremos ambos temas abocndonos en particular al parmetro : (promedio poblacional). INTERVALO DE CONFIANZA PARA :: En primer lugar digamos que cuando en primera instancia informamos como posible valor de : el arrojado por su estimador 0, esa estimacin ser PUNTUAL. Convengamos que dar un nico valor como estimador del parmetro es algo arriesgado, probablemente nadie que venga de un recital se anime a decir que haba 1782 personas, pero probablemente se anime, con menos riesgo de equivocarse, a decir que haba entre 1000 y 2000 personas, o entre 1500 y 2000, etc. En la figura 2 planteamos la incgnita ( el parmetro) y los elementos necesarios para encarar una inferencia acerca de l ( el estimador adecuado, su distribucin y una medida de su variacin).

  • Red de Helmintologa de FAO para Amrica Latina y el Caribe http://cnia.inta.gov.ar/helminto

    Agosto 2004

    PRECISION = f (SE) SE = S / v n Esos elementos adecuadamente procesados nos permitirn complementar una estimacin puntual, con un intervalo del cual tengamos una seguridad aceptable (90, 95, 99% ) de que contenga al parmetro en cuestin (:). La precisin de este intervalo ser una funcin del SE.

  • Red de Helmintologa de FAO para Amrica Latina y el Caribe http://cnia.inta.gov.ar/helminto

    Agosto 2004

    La estructura para construir ese intervalo ser: 0 " z ( SE)

    Sera la estimacin puntual z veces el SE donde SE = F / n y z = valores de abscisa de la distribucin normal que encierran una determinada probabilidad , por citar los ms usados: Entre - 1.65 y + 1.65 hay un 90 % de prob. (de rea) Entre - 1.96 y + 1.96 hay un 95 % de prob. (este valor 1.96, tal vez el ms usado, generalmente se lo utiliza aproximndolo a 2, cuando decimos que el 95% de los valores de una distribucin normal, por ej. la de 0, estn comprendidos entre m 2 SE) Entre - 2.58 y + 2.58 se concentra el 99% de los valores. etc, Pero como en la estructura presentada aparece el SE = s / n, y de la misma manera que m es desconocido, s tambin lo es , deber ser reemplazado por su estimador: S , en cuyo caso la nueva estructura: 0 t S / n (figura 3)

    es equivalente a la anterior, pero la cantidad de SE que le sumamos y le restamos a la estimacin puntual, saldr ahora, no de la distribucin normal, sino de una parecida pero ms chata, que es la distribucin t de Student y que se identifica con los llamados grados de libertad ( n & 1 ). Para tamaos pequeos de muestra t es mayor a z , pero a medida que aumenta el tamao de muestra (n = 25 30) son casi iguales.

  • Red de Helmintologa de FAO para Amrica Latina y el Caribe http://cnia.inta.gov.ar/helminto

    Agosto 2004

    Figura 3

    INTERVALO DE CONFIANZA PARA ______________________________________________________ Pf X - t S = = X + t S = (1 - a) % v n v n

    En forma resumida X t S v n

    donde: a = nivel de riesgo 1 - a = nivel de confianza t = valor de la t de Student (o de la normal

    si n > 30) para el a fijado

    Es equivalente a la anterior, pero la cantidad de SE que le sumamos y le restamos a la estimacin puntual, saldr ahora, no de la distribucin normal, sino de una parecida pero ms chata, que es la distribucin t de Student y que se identifica con los llamados grados de libertad ( n 1 ). Para tamaos pequeos de muestra t es mayor a z , pero a medida que aumenta el tamao de muestra (n = 25 30 ) son casi iguales. Es equivalente a la anterior, pero la cantidad de SE que le sumamos y le restamos a la estimacin puntual, saldr ahora, no de la distribucin normal,

    (1 - a )

    ~ t (n 1) g. l

    ~ N (0,1)

    a 2

    a 2

    - t + t ( - z ) ( + z )

    EJEMPLO: C/UNO X = 4 SEM = 0.365 t 9g.l. (90%) = 1.83 3.33

    4 1.83 * 0.365 = 4 0.67 4.67 En la figura 6 a del mdulo I se pueden leer estos valores como LO 90% CI (=Lmite inferior del I.C. del 90%) y UP 90% CI (= Lmite superior del IC)

  • Red de Helmintologa de FAO para Amrica Latina y el Caribe http://cnia.inta.gov.ar/helminto

    Agosto 2004

    Ejemplo: Supongamos que tenemos el registro de hpg para una muestra de 5 animales. Esos valores son: 300-200-400-300-600 0 = 360, SD = 152 , SE = 152 / 5 = 68 y " t " para 4 g.l. y 90% de Prob. = 2,1. El Intervalo de Confianza (IC) ser: 360 2.1 x 68 = 360 143 = { 217 - 503 } La interpretacin es: Un posible valor del promedio de la poblacin de la cual estos 5 animales provienen es 360 hpg (estimacin puntual), y hay una confianza del 90% de que sea un valor no menor que 217 y no mayor que 503 . El complemento de la confianza es el riesgo, en este caso del 10% de que m sea menor que 217 , o mayor que 503. La longitud de este intervalo es de 286 (la semi amplitud es = 143). Veamos de que depende esa amplitud (que define la precisin del intervalo). En primer lugar observemos que el DS de este conjunto de datos es bastante alto (152) que representa un C.V. del 42%. Esa variacin, inherente a esta particular muestra, no depende totalmente del investigador (la variacin de la muestra refleja en parte la variacin de la poblacin), pero la forma de elegir la muestra puede inflar esa variacin (por ej. eligiendo animales muy distintos en cuanto a origen, peso, nivel nutricional etc.etc.). De lo anterior se desprende que un DISEO adecuado permitir filtrar variacin esprea. En segundo lugar veamos que en la construccin del SE no entra slo el SD, sino tambin el tamao de la muestra (n), sobre lo cual el investigador tiene la responsabilidad de fijarlo adecuadamente. Como n entra en el denominador, su incremento tendr un efecto beneficioso sobre la precisin del I.C. Finalmente observemos que la confianza asociada a ese intervalo fu del 90% y esto tambin es una decisin del investigador, por lo cual uno podria preguntarse, por qu no elegir un valor mayor para la confianza: 95, 99, 99,9%???. Veamos cules seran los valores de t para esas situaciones: t (95%) = 2.77 t (99%) = 4.60

  • Red de Helmintologa de FAO para Amrica Latina y el Caribe http://cnia.inta.gov.ar/helminto

    Agosto 2004

    El valor de " t " es mayor a medida que aumentamos la exigencia en cuanto a la seguridad, y como " t " es la cantidad de SE que le sumanos y restamos a la estimacin puntual, al ser sta mayor, estaremos construyendo intervalos de mayor longitud (por lo tanto ms imprecisos). O sea que hay una relacin inversa entre presicin y confianza. La figura 4 resume estas relaciones, que nos alertan sobre la necesidad de elegir el diseo y el tamao de muestra adecuado y prudencia al seleccionar el nivel de confianza, tal vez 90-95%, para no comprometer la precisin del IC, a menos que al fijar un valor de " t " ms alto, para aumentar la seguridad, pudiramos compensarlo con un incremento importante en el tamao de muestra.

  • Red de Helmintologa de FAO para Amrica Latina y el Caribe http://cnia.inta.gov.ar/helminto

    Agosto 2004

    Figura 4

    _ S X t vn

    d 0 (PRECISION) d = SEMIAMPLITUD d (IMPRECISION) S d = t vn n= t2 S2 d2 DISEO

    90%

    95%

    99%

    < CONF > n < S > PRECISION

  • Red de Helmintologa de FAO para Amrica Latina y el Caribe http://cnia.inta.gov.ar/helminto

    Agosto 2004

    PRUEBA DE HIPOTESIS: Las Hiptesis que se pueden plantear y probar pueden referirse a los Parmetros de una, dos ms poblaciones. Plantearemos en particular las llamadas Hiptesis Comparativas para dos ms promedios poblacionales (m), por ser stas las ms usadas en Parasitologa. Para 2 grupos: Ho) m trat = m cont Vs. H1) m trat m cont Para k 2 (K=n de grupos) Ho) m trat1 = m trat2 =.= m cont Vs. H1) algun mi mj Donde Ho) = Hiptesis nula y H1) = Hiptesis de alternativa La metodologa para comparar 2 ms poblaciones, si bien tienen distinto nombre, son equivalentes. Para k = 2 la Hip. podr ser probada mediante el test t de Student y para k2, el apropiado ser el test F ( a partir del ANOVA = Analisis de variancia). Como este test es equivalente al test t cuando k = 2, puede ser usado siempre (con 2 ms grupos). En cambio el test t slo puede usarse cuando k = 2. La metodologa de la Prueba de Hiptesis (que recomendamos leer con ms detalle por ej. en las pags.111/117 del libro: "Bioestadstica Mdica" de Dowson-Saunders & Trapp Editado por El Manual Moderno Mxico - 1997), propone plantear la Hiptesis de trabajo (por ej. que el promedio de hpg es menor en el grupo tratado que en el grupo control) en la H1, de tal manera que podamos probarlo de una forma fuerte (desde el punto de vista lgico), va el rechazo de la nula (Ho) que establece que ambos promedios poblacionales son iguales. Esto sera el principio de refutabilidad de las Hiptesis, expuesto por Karl Popper, que establece la imposibilidad de probar que una Hiptesis es verdadera, pero si su falsedad en la medida en que la evidencia y el test aplicado sean lo suficientemente potentes como para refutarla. Luego del planteo de la Ho) y la H1), se efectuar un ensayo que provea evidencia experimental, la cual debidamente procesada con el test adecuado ( por ej. el test F ), nos llevar o no al rechazo de la Ho), lo cual equivaldr a probar o no nuestra Hiptesis de trabajo planteada en la alternativa. Debemos tener presente que las decisiones posibles son dos: rechazar o no rechazar, y que la Ho) puede ser Verdadera o Falsa. ( cosa que obviamente ignoramos, si no no estaramos ponindola a prueba). Esto genera una clsica matriz de pago de 2x2 tal como se ilustra en la figura 5.

  • Red de Helmintologa de FAO para Amrica Latina y el Caribe http://cnia.inta.gov.ar/helminto

    Agosto 2004

    Figura 5 PRUEBA DE HIPOTESIS DECISIONES POSIBLES Y ERRORES ASOCIADOS

    Ho V Ho F

    Rechazo

    Error I O.K. O.K. Error II

    Error I = Rechazar Ho. Verd. Prob. = a Error II = Aceptar Ho. Falsa Prob. = b Potencia = Rechazar Ho. Falsa Prob. = 1 - b = p

  • Red de Helmintologa de FAO para Amrica Latina y el Caribe http://cnia.inta.gov.ar/helminto

    Agosto 2004

    All podemos visualizar que hay slo dos decisiones correctas (Rechazar Ho Falsa o no Rechazar Ho verdadera). Pero tambin hay dos posibles errores: Rechazar Ho Verdadera y No rechazar Ho Falsa. Esos errores se identifican como de tipo I y II y sus probabilidades asociadas son a y b respectivamente. El complemento de b es la denominada potencia del test y corresponde a la probabilidad de rechazar Ho) cuando sta es Falsa. Es la capacidad discriminatoria del test, de darse cuenta (a la luz de la evidencia ) que Ho) es insostenible y refutarla. (Decisin sta identificada con un O.K. dentro de un crculo, y que corresponde a la decisin fuerte de la que hablamos previamente). En la bibliografa recomendada se presentan dos interesantes analogas de la prueba de hiptesis con las pruebas de diagnstico (que, como no son 100% sensibles y especficas, tienen una cierta probabilidad de falsos positivos y falsos negativos) y con la ley (asimilando los errores tipo I y II con la probabilidad de condenar a un inocente, o absolver a un culpable respectivamente). El error tipo I se denomina el nivel de significacin de la prueba de hiptesis, y es fijado por el investigador, pero al igual que en Intervalos de Confianza, hay una relacin inversa entre los errores tipo I y II, y, en la medida que quisiramos reducir a niveles despreciables el a podramos aumentar peligrosamente el b, a menos que se pudieran manejar grandes tamaos de muestra. Al momento de disear un ensayo, el investigador deber fijar a priori, la diferencia mnima que considera de inters biolgico (d), el nivel de significacin de la prueba (a) y la potencia del test (1-b), a los fines de determinar el nmero ptimo de repeticiones que le garantice que, de existir la mencionada diferencia (d), que avala a la hiptesis de alternativa, el test tenga una alta probabilidad (1-b) de rechazar la nula, con a lo sumo una probabilidad = a de rechazarla incorrectamente ( lo que habitualmente informamos como p a ). A modo de ejemplo desarrollaremos una situacin donde retomaremos el conjunto de 5 datos de hpg (que analizamos para calcular el IC), aclarando que corresponden a 5 animales tratados con una droga antiparasitaria ( 0 = 360 SD = 152 SE = 68) , donde otros 5 animales controles registraron los siguientes valores: 6200-900-2300-4500 y 7100. (0 = 4200 SD = 2598 y SE = 1162). A partir de esta evidencia muestral queremos probar que el recuento promedio es significativamente menor en los animales tratados. Ho) m trat = mcont Vs. H1) m trat mcont

  • Red de Helmintologa de FAO para Amrica Latina y el Caribe http://cnia.inta.gov.ar/helminto

    Agosto 2004 ANOVA La herramienta que nos ayuda a probar esta Hiptesis, ya dijimos que es el test " F " , a partir del ANALISIS DE VARIANCIA (ANOVA), que cuando k ( nmero de grupos) = 2, es equivalente al test " t " de Student. En la figura 6 incluimos la salida del ANOVA correspondiente al caso planteado, cuya interpretacin es la siguiente: Tanto con los datos originales (parte superior), como con los datos transformados logartmicamente (parte inferior), la " F " alta ( 10.89 y 29.50 respectivamente), estn asociadas a valores probabilsticos ( " p " values) pequeos (0.0109 y 0.0006 respectivamente), lo cual permite rechazar la Hip. nula de igualdad a favor de la Hip. de alternativa que indica que el recuento promedio de los tratados difiere significativamente del promedio de los controles ( o sea que avala la efectividad de la droga).

  • Red de Helmintologa de FAO para Amrica Latina y el Caribe http://cnia.inta.gov.ar/helminto

    Agosto 2004

    Figura 6 ONE-WAY AOV FOR: TRAT1 CONT SOURCE DF SS MS F P ------- ---- --------- --------- ------ ------ BETWEEN 1 3.686E+07 3.686E+07 10.89 0.0109 WITHIN 8 2.709E+07 3386500 TOTAL 9 6.396E+07 CHI-SQ DF P BARTLETT'S TEST OF ------ ------ ------ EQUAL VARIANCES 15.30 1 0.0001 COCHRAN'S Q 0.9966 LARGEST VAR / SMALLEST VAR 293.48 COMPONENT OF VARIANCE FOR BETWEEN GROUPS 6695500 EFFECTIVE CELL SIZE 5.0 SAMPLE GROUP VARIABLE MEAN SIZE STD DEV --------- ---------- ------ ---------- TRAT1 360.00 5 151.66 CONT 4200.0 5 2598.1 TOTAL 2280.0 10 1840.2 CASES INCLUDED 10 MISSING CASES 0 ONE-WAY AOV FOR: LNTRAT1 LNCONT SOURCE DF SS MS F P ------- ---- --------- --------- ------ ------ BETWEEN 1 13.1035 13.1035 29.50 0.0006 WITHIN 8 3.55373 0.44422 TOTAL 9 16.6572 CHI-SQ DF P BARTLETT'S TEST OF ------ ------ ------ EQUAL VARIANCES 1.80 1 0.1800 COCHRAN'S Q 0.8150 LARGEST VAR / SMALLEST VAR 4.4051 COMPONENT OF VARIANCE FOR BETWEEN GROUPS 2.53185 EFFECTIVE CELL SIZE 5.0 SAMPLE GROUP VARIABLE MEAN SIZE STD DEV --------- ---------- ------ ---------- LNTRAT1 5.8220 5 0.4054 LNCONT 8.1114 5 0.8509 TOTAL 6.9667 10 0.6665 CASES INCLUDED 10 MISSING CASES 0

  • Red de Helmintologa de FAO para Amrica Latina y el Caribe http://cnia.inta.gov.ar/helminto

    Agosto 2004

    Aprovechemos estas dos salidas para observar que los datos en escala original presentan lo que denominamos Heterogeneidad de Variancias (S = 151.66 para tratados y 2598.1 para controles), esa diferencia segn el test de Bartlett es muy significativa (p=0.0001), mientras que al pasar a la escala logartmica , esa heterogeneidad (que compromete seriamente la validez del Anova), ha dejado de ser significativa (p = 0.18). Para terminar con este ejemplo, observemos en la fig.7, la salida del test " t " de Student (equivalente al test " F " por que k = 2). En la parte superior t = - 3.30 (p = 0.0109), lo que indica que : (tratados) es significativamente menor que : (controles) (de all el signo negativo de la " t " ). En la parte inferior el test " t " arroja un valor = -5.43 ( p =0.0006).

  • Red de Helmintologa de FAO para Amrica Latina y el Caribe http://cnia.inta.gov.ar/helminto

    Agosto 2004

    Figura 7 TWO-SAMPLE T TESTS FOR TRAT1 VS CONT SAMPLE VARIABLE MEAN SIZE S.D. S.E. --------- --------- ------ --------- --------- TRAT1 360.00 5 151.66 67.823 CONT 4200.0 5 2598.1 1161.9 DIFFERENCE -3840.0 NULL HYPOTHESIS: DIFFERENCE = 0 ALTERNATIVE HYP: DIFFERENCE 0 ASSUMPTION T DF P 95% CI FOR DIFFERENCE ----------------- ------ ------ ------ --------------------- EQUAL VARIANCES -3.30 8 0.0109 (-6523.9, -1156.1) UNEQUAL VARIANCES -3.30 4.0 0.0297 (-7062.8, -617.18) F NUM DF DEN DF P TESTS FOR EQUALITY ------- ------ ------ ------ OF VARIANCES 293.48 4 4 0.0000 CASES INCLUDED 10 MISSING CASES 0 TWO-SAMPLE T TESTS FOR LNTRAT1 VS LNCONT SAMPLE VARIABLE MEAN SIZE S.D. S.E. --------- --------- ------ --------- --------- LNTRAT1 5.8220 5 0.4054 0.1813 LNCONT 8.1114 5 0.8509 0.3805 DIFFERENCE -2.2894 NULL HYPOTHESIS: DIFFERENCE = 0 ALTERNATIVE HYP: DIFFERENCE 0 ASSUMPTION T DF P 95% CI FOR DIFFERENCE ----------------- ------ ------ ------ --------------------- EQUAL VARIANCES -5.43 8 0.0006 (-3.2615, -1.3174) UNEQUAL VARIANCES -5.43 5.7 0.0019 (-3.3329, -1.2459) F NUM DF DEN DF P TESTS FOR EQUALITY ------- ------ ------ ------ OF VARIANCES 4.41 4 4 0.0900 CASES INCLUDED 10 MISSING CASES 0

  • Red de Helmintologa de FAO para Amrica Latina y el Caribe http://cnia.inta.gov.ar/helminto

    Agosto 2004

    Comparando con las salidas de la figura 6, podemos observar que: 1) La relacin entre la " t " y la " F " es: t = F ( por ej. 10.89 = 3.30) 2) Los valores de los " p " values son exactamente iguales (0.0109 en escala original y 0.0006 en escala transformada). Esto es as, porque que en este caso, como k = 2, ambos tests son equivalentes. Finalmente es de hacer notar que como aqu k = 2, el rechazo de la Ho) indica en forma automtica que el tratamiento ha sido efectivo. Pero si el ensayo hubiera includo dos grupos de animales tratados con dos drogas distintas ms un grupo control, en cuyo caso k=3, el rechazo de la Ho) nos indicara que no todos los grupos son iguales, y necesitaramos una herramienta complementaria, que nos permitiera detectar cul (o cuales) grupos difieren. Las Pruebas de COMPARACIONES MULTIPLES ( entre las que se cuentan las pruebas de TUKEY, BONFERRONI, DUNCAN, etc) cumplen con ese cometido. En la figura 8 (a y b) se presenta el Anova (en escala original y transformada) para la comparacin de los tres grupos mencionados. La parte descriptiva del output nos muestra las 0 S de los tres grupos: Trat.1 360 152 ( SE = 68) n = 5 Trat 2 200 94 ( SE = 42) n = 5 Cont. 4200 2598 ( SE = 1162) n = 5 Nuevamente la heterogeneidad de variancias es muy marcada segn el test de Bartlett (p0), lo que compromete el test " F " (= 11.34 con p = 0.0017), sin embargo con los datos en escala logartmica, la heterogeneidad se suaviza (p = 0.2944), lo que hace al test " F " (= 31.84 con p 0) ms confiable. A modo de ejemplo se corri en ambos casos una prueba de comparaciones mltiples (TUKEY en el anlisis con los datos en escala original y BONFERRONI para el anlisis de los datos transformados). Ambos tests llegan a la misma conclusin: los grupos tratados no difieren entre si ( sus promedios presentan barritas en la misma vertical), pero ambos difieren de los controles (su promedio est acompaado por un barrita que no est en la misma vertical). En trminos del problema esto indica que ambos tratamientos son igualmente efectivos.

  • Red de Helmintologa de FAO para Amrica Latina y el Caribe http://cnia.inta.gov.ar/helminto

    Agosto 2004

    Figura 8 a. ONE-WAY AOV FOR: TRAT1 TRAT2 CONT SOURCE DF SS MS F P ------- ---- --------- --------- ------ ------ BETWEEN 2 5.129E+07 2.564E+07 11.34 0.0017 WITHIN 12 2.713E+07 2260583 TOTAL 14 7.841E+07 CHI-SQ DF P BARTLETT'S TEST OF ------ ------ ------ EQUAL VARIANCES 32.57 2 0.0000 COCHRAN'S Q 0.9953 LARGEST VAR / SMALLEST VAR 771.43 COMPONENT OF VARIANCE FOR BETWEEN GROUPS 4676417 EFFECTIVE CELL SIZE 5.0 SAMPLE GROUP VARIABLE MEAN SIZE STD DEV --------- ---------- ------ ---------- TRAT1 360.00 5 151.66 TRAT2 200.00 5 93.541 CONT 4200.0 5 2598.1 TOTAL 1586.7 15 1503.5 CASES INCLUDED 15 MISSING CASES 0 TUKEY (HSD) COMPARISON OF MEANS HOMOGENEOUS VARIABLE MEAN GROUPS --------- ---------- ----------- CONT 4200.0 I TRAT1 360.00 .. I TRAT2 200.00 .. I THERE ARE 2 GROUPS IN WHICH THE MEANS ARE NOT SIGNIFICANTLY DIFFERENT FROM ONE ANOTHER. CRITICAL Q VALUE 3.783 REJECTION LEVEL 0.050 CRITICAL VALUE FOR COMPARISON 2543.9 STANDARD ERROR FOR COMPARISON 950.91

  • Red de Helmintologa de FAO para Amrica Latina y el Caribe http://cnia.inta.gov.ar/helminto

    Agosto 2004

    Figura 8 b. ONE-WAY AOV FOR: LNTRAT1 LNTRAT2 LNCONT SOURCE DF SS MS F P ------- ---- --------- --------- ------ ------ BETWEEN 2 23.2740 11.6370 31.84 0.0000 WITHIN 12 4.38519 0.36543 TOTAL 14 27.6592 CHI-SQ DF P BARTLETT'S TEST OF ------ ------ ------ EQUAL VARIANCES 2.45 2 0.2944 COCHRAN'S Q 0.6605 LARGEST VAR / SMALLEST VAR 4.4051 COMPONENT OF VARIANCE FOR BETWEEN GROUPS 2.25432 EFFECTIVE CELL SIZE 5.0 SAMPLE GROUP VARIABLE MEAN SIZE STD DEV --------- ---------- ------ ---------- LNTRAT1 5.8220 5 0.4054 LNTRAT2 5.2200 5 0.4559 LNCONT 8.1114 5 0.8509 TOTAL 6.3845 15 0.6045 CASES INCLUDED 15 MISSING CASES 0 BONFERRONI COMPARISON OF MEANS HOMOGENEOUS VARIABLE MEAN GROUPS --------- ---------- ----------- LNCONT 8.1114 I LNTRAT1 5.8220 .. I LNTRAT2 5.2200 .. I THERE ARE 2 GROUPS IN WHICH THE MEANS ARE NOT SIGNIFICANTLY DIFFERENT FROM ONE ANOTHER. CRITICAL T VALUE 2.779 REJECTION LEVEL 0.050 CRITICAL VALUE FOR COMPARISON 1.0627 STANDARD ERROR FOR COMPARISON 0.3823