Análisis de Varianza - rinace.net. Analisis de Varianza.pdf · 4. Análisis de Varianza F.J....

14
4 Análisis de Varianza

Transcript of Análisis de Varianza - rinace.net. Analisis de Varianza.pdf · 4. Análisis de Varianza F.J....

Page 1: Análisis de Varianza - rinace.net. Analisis de Varianza.pdf · 4. Análisis de Varianza F.J. Murillo y C. Martínez-Garrido Página 53 El estadístico F está asociado a un nivel

4

Análisis de Varianza

Page 2: Análisis de Varianza - rinace.net. Analisis de Varianza.pdf · 4. Análisis de Varianza F.J. Murillo y C. Martínez-Garrido Página 53 El estadístico F está asociado a un nivel

4. Análisis de Varianza

F.J. Murillo y C. Martínez-Garrido Página 52

4. Análisis de Varianza

e.4.1. ¿Quiénes obtienen mejores resultados en Matemáticas, los estudiantes que viven en

zonas rurales, en pequeñas ciudades, en ciudades medias o en grandes ciudades?

Analicemos la pregunta, se trata de estudiar si "existen diferencias significativas en el

rendimiento en matemáticas de los estudiantes (VD) en función de su hábitat (VI)"; la variable

independiente es nominal politómica (con cuatro alternativas) y la dependiente es de

intervalo.

La hipótesis nula es:

H0:

Es decir, que las muestras obtenidas sean de la misma población. Y la alternativa (H1), que

alguna de las igualdades no se cumpla (que pertenezcan a poblaciones diferentes).

Si la variable dependiente (hábitat) tuviese dos alternativas utilizaríamos la prueba T de

Student para dos muestras, pero al tener más de dos se utilizará un Análisis de Varianza

Simple.

4.1. Análisis de Varianza Simple

El Análisis de Varianza (o ANOVA, del inglés analysis of variance) es una prueba utilizada para

contrastar la hipótesis de que varias medias son iguales. Fueron ideadas por R.A. Fisher en

1925, y son una de las pruebas más importantes de la estadística actual. Como se ha

comentado, es una extensión de la prueba T para dos muestras independientes. Sirve, por

tanto, para estudiar la incidencia de una variable nominal u ordinal (categórica) con más de las

alternativas, en una variable de intervalo o de razón (cuantitativa).

El ANOVA utiliza una estrategia bastante razonable: si los resultados de cada uno de los grupos

(en nuestro ejemplo el rendimiento en Matemáticas de los estudiantes que viven en pueblos,

ciudades pequeñas, medias o grandes) no contienen errores sistemáticos, los valores medios

respectivos no diferirán mucho los unos de los otros y su dispersión, debido a los errores

aleatorios, será comparable a la dispersión presente individualmente en cada grupo (tipo de

hábitat). Así, la prueba se basa en la estimación del estadístico F, que muestra el grado de

parecido existente entre las medias que se comparan.

Si las medias de las poblaciones son iguales, las medias de las muestras de los grupos serán

parecidas, por lo que las únicas diferencias serán las atribuidas al azar, y el valor del estimador

F será de 1. Si las medias poblacionales son diferentes, entonces el valor mayor que 1, y más

alto conforme mayor sea la diferencia.

Page 3: Análisis de Varianza - rinace.net. Analisis de Varianza.pdf · 4. Análisis de Varianza F.J. Murillo y C. Martínez-Garrido Página 53 El estadístico F está asociado a un nivel

4. Análisis de Varianza

F.J. Murillo y C. Martínez-Garrido Página 53

El estadístico F está asociado a un nivel crítico (la probabilidad de obtener valores como el

obtenido o mayores). Si éste es mayor a nuestro nivel de error asumido (que habitualmente

será del 95%, de decir de un 0,05) se rechaza la hipótesis nula, que indica la igualdad de

medias, y se acepta la alternativa.

Además de determinar que existen diferencias entre las medias, es posible que deseemos

saber qué medias difieren. Existen dos tipos de contrastes para comparar medias: a priori y

post hoc.

Los contrastes a priori se plantean antes de ejecutar el experimento.

Los contrastes post hoc se realizan después de haber llevado a cabo el experimento.

El Análisis de Varianza (o ANOVA) es una prueba estadística desarrollada para realizar

simultáneamente la comparación de las medias de más de dos poblaciones.

Para su uso, es necesario que las variables cumplan tres condiciones:

1. Cada conjunto de datos debe ser independiente del resto.

2. Los resultados obtenidos para cada conjunto deben seguir una distribución normal,

aunque soporta bastante bien el incumplimiento de este supuesto siempre que su

distribución sea simétrica1.

3. Las varianzas de cada conjunto de datos no deben diferir de forma significativa2.

Esta condición previa de aplicación se verificará estadísticamente mediante una de las

opciones que se encuentran dentro de la configuración del ANOVA. La configuración del

análisis se realiza en el cuadro de diálogo correspondiente.

Veámoslo:

Elije en los menús:

Analizar -> Comparar medias -> ANOVA de un factor

1 La prueba para comprobar la normalidad de distribución de una variable es la de Kolmogorov-Smirnov, se verá en el tema 7.

2 Para verificar este supuesto, en el subcuadro de opciones está la Prueba de homogeneidad de las

varianzas, que calcula el estadístico de Levene para contrastar la igualdad de las varianzas de grupo. Si las varianzas no son iguales, en este mismo subcuadro se encuentra la opción "Brown-Forsythe". Calcula el estadístico de Brown-Forsythe para contrastar la igualdad de las medias de grupo.

Page 4: Análisis de Varianza - rinace.net. Analisis de Varianza.pdf · 4. Análisis de Varianza F.J. Murillo y C. Martínez-Garrido Página 53 El estadístico F está asociado a un nivel

4. Análisis de Varianza

F.J. Murillo y C. Martínez-Garrido Página 54

FIGURA 4.1. CUADRO DE DIÁLOGO ANOVA DE UN FACTOR

1. Selecciona una o más variables dependientes, en este caso: Rendimiento en

Matemáticas.

2. Selecciona una sola variable como "factor" (variable independiente): en este caso

Hábitat.

Tras aceptar nos ofrece el siguiente resultado (tabla 4.1).

TABLA 4.1. RESULTADOS DEL ANOVA DE UN FACTOR

Rendimiento en Matemáticas

Suma de cuadrados gl Media cuadrática F Sig.

Inter-grupos 52621,047 3 17540,349 54,020 ,000

Intra-grupos 2141072,744 6594 324,700

Total 2193693,791 6597

La información que nos ofrece es la siguiente:

Suma de cuadrados: es una estimación de la desviación entre los resultados medios y

el resultado medio global, tanto dentro de los grupos, como entre los grupos.

gl: Grados de libertad. El número de grupos a comparar, menos 1.

Media cuadrática: Es el valor de dividir la suma de cuadrados entre los grados de

libertad.

Page 5: Análisis de Varianza - rinace.net. Analisis de Varianza.pdf · 4. Análisis de Varianza F.J. Murillo y C. Martínez-Garrido Página 53 El estadístico F está asociado a un nivel

4. Análisis de Varianza

F.J. Murillo y C. Martínez-Garrido Página 55

F: Estadístico llamado F. Es el coeficiente de dividir las medias cuadráticas y refleja el

grado de parecido existente entre las medias que se están comparando.

Sig: Significación o nivel crítico, es la probabilidad de obtener valores F como el

obtenido o mayores bajo la hipótesis nula de la igualdad de medias. En este caso es

0,000.

La interpretación es igual que en la T de Student del tema anterior, si el nivel crítico asociado al

estadístico F es menor que 0,05 (o el α que estemos considerando) se rechaza la hipótesis y se

acepta la alterna, es decir, se concluye que, efectivamente, hay relación entre el hábitat y el

rendimiento en Matemáticas (o que los cuatro hábitat forman parte de la misma población).

Sin embargo, de lo que no tenemos información es entre qué tipo de hábitat hay diferencias,

ni el sentido de las mismas. Para ello se necesitan los contrastes a posteriori.

Contrastes post hoc

Una vez que se ha determinado que existen diferencias entre las medias, los contrastes de

comparaciones múltiples post hoc, o comparaciones a posteriori, permiten determinar entre

qué medias existen diferencias significativas.

El procedimiento es sencillo. Sólo hay que pulsar la opción "Post Hoc" del cuadro de diálogo de

ANOVA de un factor. Lo difícil quizá es elegir entre tantas opciones. En el Anexo, al final de

este tema, se presenta un cuadro resumen con las características de los diferentes

estadísticos.

FIGURA 4.2. SUBCUADRO DE DIÁLOGO ANOVA DE UN FACTOR: COMPARACIONES MÚLTIPLES POST HOC

Page 6: Análisis de Varianza - rinace.net. Analisis de Varianza.pdf · 4. Análisis de Varianza F.J. Murillo y C. Martínez-Garrido Página 53 El estadístico F está asociado a un nivel

4. Análisis de Varianza

F.J. Murillo y C. Martínez-Garrido Página 56

Una posibilidad razonable es elegir el estadístico de HDS Tukey (opción Tukey) si las varianzas

son iguales y el estadístico Games-Howell si no se asumen varianzas iguales.

Los resultados para nuestro ejemplo se muestran en las tablas 4.2 y 4.3.

TABLA 4.2. RESULTADOS DEL ANOVA DE UN FACTOR CON COMPARACIONES MÚLTIPLES POST HOC

Rendimiento en Matemáticas HSD de Tukey

(I) Habitat (pueblo, ciudad pequeña, media o grande)

(J) Habitat (pueblo, ciudad pequeña, media o grande)

Diferencia de medias (I-J) Error típico Sig.

Intervalo de confianza al 95%

Límite inferior Límite superior

Pueblos (menos de 10.009 habs.)

Ciudades pequeñas (de 10.001 a 10.000 habs.)

-3,085022* ,598434 ,000 -4,62281 -1,54723

Ciudades medias (de 100.001 a 500.000 habs.)

-6,209442* ,611973 ,000 -7,78202 -4,63686

Ciudades grandes (más de 500.000 habs.)

-8,560321* ,788173 ,000 -10,58568 -6,53496

Ciudades pequeñas (de 10.001 a 10.000 habs.)

Pueblos (menos de 10.009 habs.)

3,085022* ,598434 ,000 1,54723 4,62281

Ciudades medias (de 100.001 a 500.000 habs.)

-3,124419* ,551351 ,000 -4,54122 -1,70762

Ciudades grandes (más de 500.000 habs.)

-5,475298* ,742086 ,000 -7,38223 -3,56837

Ciudades medias (de 100.001 a 500.000 habs.)

Pueblos (menos de 10.009 habs.)

6,209442* ,611973 ,000 4,63686 7,78202

Ciudades pequeñas (de 10.001 a 10.000 habs.)

3,124419* ,551351 ,000 1,70762 4,54122

Ciudades grandes (más de 500.000 habs.)

-2,350879* ,753047 ,010 -4,28597 -,41578

Ciudades grandes (más de 500.000 habs.)

Pueblos (menos de 10.009 habs.)

8,560321* ,788173 ,000 6,53496 10,58568

Ciudades pequeñas (de 10.001 a 10.000 habs.)

5,475298* ,742086 ,000 3,56837 7,38223

Ciudades medias (de 100.001 a 500.000 habs.)

2,350879* ,753047 ,010 ,41578 4,28597

*. La diferencia de medias es significativa al nivel 0.05.

La interpretación es igualmente sencilla. En cada una de las filas compara las medias de los

grupos por pares. La interpretación, una vez más, es fijándose en el nivel crítico y compararlo

con nuestro α (normalmente 0,05). De esta forma se puede observar que hay diferencias en el

rendimiento de los estudiantes en Matemáticas entre los que viven en pueblos y en ciudades

pequeñas, entre pueblos y ciudades medias... y así entre todos los pares de grupos.

En la segunda de las tablas nos ofrece los resultados y encontramos ayuda para una mejor

interpretación.

TABLA 4.3. RESULTADOS DEL ANOVA DE UN FACTOR CON COMPARACIONES MÚLTIPLES POST HOC,

SUBCONJUNTOS HOMOGÉNEOS

Page 7: Análisis de Varianza - rinace.net. Analisis de Varianza.pdf · 4. Análisis de Varianza F.J. Murillo y C. Martínez-Garrido Página 53 El estadístico F está asociado a un nivel

4. Análisis de Varianza

F.J. Murillo y C. Martínez-Garrido Página 57

HSD de Tukeya,,b

Habitat (pueblo, ciudad pequeña, media o grande) N

Subconjunto para alfa = 0.05

1 2 3 4

Pueblos (menos de 10.009 habs.) 1515 48,28904

Ciudades pequeñas (de 10.001 a 10.000 habs.)

2258

51,37406

Ciudades medias (de 100.001 a 500.000 habs.)

2027

54,49848

Ciudades grandes (más de 500.000 habs.)

798

56,84936

Sig. 1,000 1,000 1,000 1,000

Se muestran las medias para los grupos en los subconjuntos homogéneos.

a. Usa el tamaño muestral de la media armónica = 1403,800.

b. Los tamaños de los grupos no son iguales. Se utilizará la media armónica de los tamaños de los grupos. Los niveles de error de tipo I no están garantizados.

Se observa que existen cuatro grupos diferenciados (cuatro poblaciones), cada una de un tipo

de hábitat, indicándose la media del rendimiento de cada grupo. De esta forma, los resultados

apuntan a que los niños y niñas que viven en pueblos sacan el peor resultado (48,28), después

(con diferencias estadísticamente significativas) los que viven en ciudades pequeñas (51,37),

después los que viven el ciudades medias (54,49) y lo que mejores resultados obtienen en

rendimiento en Matemáticas son los que viven en grandes ciudades (56,84 de media). Este

resultado, obtenido a partir de datos reales, nos muestra la desigual distribución del

rendimiento en función del lugar donde vive el niño, y muestra unas preocupantes señales de

inequidad en función del hábitat.

4.2. Análisis de Varianza factorial

También es posible estudiar el efecto de varias variables y su interacción sobre una variable

dependiente cuantitativa. Así, por ejemplo, podemos estudiar el efecto que tiene el género del

estudiante sobre el rendimiento en lengua, el efecto del género del docente y la interacción

entre las dos variables sobre el rendimiento en matemáticas.

Así, puede verse el siguiente caso inventado (tabla 4.4). El rendimiento promedio de todos los

estudiantes es de 6. El de los niños es igual que el de la niñas, de 6; y sacan los mismos

resultados los estudiantes con profesores varones que con profesoras, 6. Sin embargo, se

produce un curioso efecto de interacción, dado que si el género del docente y del estudiante

coinciden los resultados serán claramente mejores que si no coinciden.

TABLA 4.4. EFECTO DE LA INTERACCIÓN ENTRE VARIABLES. RENDIMIENTO EN MATEMÁTICAS DE LOS

ESTUDIANTES EN FUNCIÓN DE SU GÉNERO Y DEL GÉNERO DE SU DOCENTE

Estudiante varón

Estudiante mujer

Total

Docente varón 7 4 6

Docente mujer 4 7 6

Total 6 6 6

Page 8: Análisis de Varianza - rinace.net. Analisis de Varianza.pdf · 4. Análisis de Varianza F.J. Murillo y C. Martínez-Garrido Página 53 El estadístico F está asociado a un nivel

4. Análisis de Varianza

F.J. Murillo y C. Martínez-Garrido Página 58

Un ejemplo de esto con nuestros datos puede ser el siguiente:

e.4.2. ¿Existen diferencias significativas en el Rendimiento en Matemáticas de los estudiantes en

función de su hábitat, de sus años de preescolarización y de la interacción entre ambas

variables?

Como se observa, probaremos de forma simultánea las tres hipótesis:

1. Existen diferencias significativas en el Rendimiento en Matemáticas en función del

hábitat

2. Existen diferencias significativas en Rendimiento en Matemáticas en función de los

años de preescolarización

3. Existen diferencias significativas en el Rendimiento de los estudiantes en función de la

interacción entre ambas variables?

Para ello se realizará un Análisis de Varianza Factorial. Este estadístico se encuentra en el

cuadro de diálogo "Modelo Lineal General" y luego "Univariante" (dado que sólo tenemos una

única variable dependiente). Observemos en la figura 4.4, el cuadro de diálogo en el que

aparece.

FIGURA 4.4. CUADRO DE DIÁLOGO "UNIVARIANTE" PARA HACER UN ANÁLISIS DE VARIANZA FACTORIAL

Entonces seleccione:

"Rendimiento en Matemáticas" como Dependiente.

"Preescolarización" y "Hábitat" como Factores fijos.

Page 9: Análisis de Varianza - rinace.net. Analisis de Varianza.pdf · 4. Análisis de Varianza F.J. Murillo y C. Martínez-Garrido Página 53 El estadístico F está asociado a un nivel

4. Análisis de Varianza

F.J. Murillo y C. Martínez-Garrido Página 59

Y pinchamos en "Aceptar".

Nos aparecen cuatro opciones:

Efectos fijos: un factor de efectos fijos es aquel en el que contamos con todas las

alternativas en la variable. Bien sea porque están todas -por ejemplo, el hábitat- bien

porque queremos ver la diferencia entre esas alternativas. Es decir, las alternativas son

la población de alternativas de respuesta sobre los que se quiere hacer la inferencia.

Efectos aleatorios: un factor de efectos aleatorios, por su parte, es aquel que las

alternativas seleccionadas son una muestra aleatoria de todas las alternativas posibles.

Luego haremos un ejemplo de las mismas.

Covariables: para hacer un Análisis de Covarianza (ver apartado 4.3).

Ponderación MCP: si tenemos alguna variable para ponderar al utilizar el Método de

Mínimos Cuadrados Ponderados (que no es el caso).

El resultado se muestra en la tabla 4.5.

TABLA 4.5. RESULTADOS DEL ANOVA FACTORIAL. PRUEBAS DE EFECTOS INTERSUJETOS

Variable dependiente:Rendimiento en Matemáticas

Origen Suma de

cuadrados tipo III gl Media cuadrática F Sig.

Modelo corregido 95166,829a 15 6344,455 19,899 ,000

Intersección 8140315,782 1 8140315,782 25531,985 ,000

Habitat 29030,841 3 9676,947 30,352 ,000

Preescol 30473,790 3 10157,930 31,860 ,000

Habitat * Preescol 4895,081 9 543,898 1,706 ,082

Error 2098526,962 6582 318,828

Total 2,023E7 6598

Total corregida 2193693,791 6597

a. R cuadrado = ,043 (R cuadrado corregida = ,041)

Los resultados nos dan respuesta a las tres hipótesis planteadas:

1. Hay diferencias en Rendimiento en Matemáticas en función del Hábitat (el nivel crítico

que aparece en la 3ª fila es 0,000<0,05), como ya habíamos visto.

2. Hay diferencias en función de la edad de escolarización en preescolar (4ª fila).

3. No hay diferencias en función de la interacción (5ª columna: 0,082>0,05).

Page 10: Análisis de Varianza - rinace.net. Analisis de Varianza.pdf · 4. Análisis de Varianza F.J. Murillo y C. Martínez-Garrido Página 53 El estadístico F está asociado a un nivel

4. Análisis de Varianza

F.J. Murillo y C. Martínez-Garrido Página 60

4.3. Análisis de Covarianza

Sabiendo que el Nivel Socio-Económico de las familias influye de forma importante en el

rendimiento de los estudiantes (rxy = 0,33), y que el Hábitat está relacionado con ese nivel

socio-económico, sería posible pensar que quizá las diferencias en Rendimiento en función del

Hábitat sea debido al Nivel Socio-económico de las familias, y no al hábitat. Es decir que la

relación entre Hábitat y Rendimiento sea una relación espuria3. Para descartar (o confirmar)

esa posibilidad, tenemos el Análisis de Covarianza (ANCOVA). La pregunta es:

e.4.3. ¿Existen diferencias en el Rendimiento en Matemáticas de los estudiantes en función del

Hábitat, si controlamos el efecto del Nivel Socio-económico?

El Análisis de Covarianza (ANCOVA) es una técnica de control estadístico que permite eliminar

de la variable dependiente del ANOVA el efecto atribuible a variables no incluidas en el diseño

y, con ello, no sometidas a control.

Al igual que en el Análisis de Varianza Factorial este estadístico se encuentra en el cuadro de

diálogo "Modelo Lineal General" y luego "Univariante" (dado que sólo tenemos una única

variable dependiente), pero donde ponemos la variable de control como covariable. El cuadro

de diálogo en el que aparece se encuentra en la figura 4.5.

FIGURA 4.5. CUADRO DE DIÁLOGO "UNIVARIANTE", PARA HACER UN ANÁLISIS DE COVARIANZA

3 Estadísticamente, una relación espuria es una relación en la cual dos acontecimientos no tienen conexión, aunque aparentemente la tienen debido a un tercer factor no considerado aún (llamado "factor de confusión" o "variable escondida"). La relación espuria da la impresión de la existencia de un vínculo apreciable entre dos grupos que es inválido cuando se examina objetivamente.

Page 11: Análisis de Varianza - rinace.net. Analisis de Varianza.pdf · 4. Análisis de Varianza F.J. Murillo y C. Martínez-Garrido Página 53 El estadístico F está asociado a un nivel

4. Análisis de Varianza

F.J. Murillo y C. Martínez-Garrido Página 61

Entonces selecciona:

"Rendimiento en Matemáticas" como Dependiente.

"Hábitat" en Factores fijos.

"N-SocEc" (Nivel Socio-económico de las familias) como covariable.

Y pinchamos en "Aceptar".

Los resultados aparecen en la tabla 4.6.

TABLA 4.6. RESULTADOS DEL ANCOVA. PRUEBAS DE EFECTOS INTERSUJETOS

Variable dependiente: Rendimiento en Matemáticas

Origen Suma de

cuadrados tipo III gl Media cuadrática F Sig.

Modelo corregido 256689,123a 4 64172,281 218,424 ,000

Intersección 1,556E7 1 1,556E7 52965,266 ,000

N_SocEc 204068,075 1 204068,075 694,588 ,000

Habitat 19724,214 3 6574,738 22,378 ,000

Error 1937004,669 6593 293,797

Total 2,023E7 6598

Total corregida 2193693,791 6597

a. R cuadrado = ,117 (R cuadrado corregida = ,116)

Page 12: Análisis de Varianza - rinace.net. Analisis de Varianza.pdf · 4. Análisis de Varianza F.J. Murillo y C. Martínez-Garrido Página 53 El estadístico F está asociado a un nivel

4. Análisis de Varianza

F.J. Murillo y C. Martínez-Garrido Página 62

El resultado buscado se presenta en la cuarta fila: nos indica que existen diferencias en el

rendimiento en función del Hábitat, incluso habiendo controlado el Nivel Socio-económico de

las familias de los estudiantes (0,00<0,05).

En la fila tercera nos indica que la variable "Nivel Socio-económico", al mostrar un nivel crítico

de menos de 0,05 se encuentran relacionadas con la variable dependiente, y tiene sentido

incluirlo en el modelo. Es decir, el Hábitat y el Nivel Socio-económico son dos factores de

inequidad en el sistema educativo cuya influencia es aditiva.

4.4. Anexo. Contrastes a posteriori.

Asumiendo varianzas iguales

LSD. Utiliza pruebas T para llevar a cabo todas las comparaciones por pares entre las medias de los grupos. No se efectúa ninguna corrección de la tasa de error para el hecho de realizar múltiples comparaciones.

Bonferroni. Utiliza las pruebas T para realizar comparaciones por pares entre las medias de los grupos, pero controla la tasa de error global estableciendo que la tasa de error de cada prueba sea igual a la tasa de error por experimento dividida entre el número total de contrastes. Así, se corrige el nivel crítico por el hecho de que se están realizando múltiples comparaciones.

Sidak. Prueba de comparaciones múltiples por parejas basada en un estadístico T. La prueba de Sidak corrige el nivel de significación para las comparaciones múltiples y da lugar a límites más estrechos que los de Bonferroni.

Scheffe. Realiza comparaciones conjuntas simultáneas por pares para todas las posibles parejas de combinaciones de las medidas. Usa la distribución muestral F. Puede utilizarse para examinar todas las combinaciones lineales de grupos de medias posibles, no sólo las comparaciones por parejas.

R-E-G-W F. Procedimiento múltiple por pasos (por tamaño de las distancias) de Ryan-Einot-Gabriel-Welsch que se basa en una prueba F.

R-E-G-W Q. Procedimiento múltiple por pasos (por tamaño de las distancias) de Ryan-Einot-Gabriel-Welsch que se basa en el rango estudentizado.

S-N-K. Realiza todas las comparaciones por parejas entre las medias utilizando la distribución del rango de Student. Con tamaños de grupo iguales, también compara pares de medias dentro de subconjuntos homogéneos utilizando un procedimiento por pasos. Las medias se ordenan de mayor a menor y se contrastan en primer lugar las diferencias extremas.

Tukey. Utiliza el estadístico del rango estudentizado para realizar todas las comparaciones por pares entre los grupos. Establece la tasa de error por experimento como la tasa de error para el conjunto de todas las comparaciones por pares.

Tukey-b. Prueba que emplea la distribución del rango estudentizado para realizar comparaciones por pares entre los grupos. El valor crítico es el promedio de los valores correspondientes a la diferencia honestamente significativa de Tukey y al método de Student-Newman-Keuls.

Duncan. Realiza comparaciones por pares utilizando un orden por pasos idéntico al orden usado por la prueba de Student-Newman-Keuls, pero establece un nivel de protección en la tasa de error para la colección de contrastes, en lugar de usar una tasa de error para los contrastes individuales. Utiliza el estadístico del rango estudentizado.

UT2 de Hochberg. Prueba de comparaciones múltiples y de rango que utiliza el módulo máximo estudentizado. Es similar a la prueba de la diferencia honestamente significativa de Tukey.

Gabriel. Prueba de comparación por parejas que utiliza el módulo máximo estudentizado y que es generalmente más potente que la GT2 de Hochberg, cuando los tamaños de las casillas son desiguales. La prueba de Gabriel se puede convertir en liberal cuando los tamaños de las casillas varían mucho.

Waller-Duncan. Prueba de comparaciones múltiples basada en un estadístico T. Utiliza la aproximación Bayesiana.

Dunnett. Prueba de comparaciones múltiples por parejas que compara un conjunto de tratamientos respecto a una única media de control. La última categoría es la categoría de control por defecto. Si lo deseas, puedes seleccionar la primera categoría. Para comprobar que la media de cualquier nivel del factor (excepto la categoría de control) no es igual a la de la categoría de control, utiliza una prueba bilateral. Para contrastar si la media en cualquier nivel del factor es menor que la de la categoría de control, selecciona "Control". Para contrastar si la media en cualquier nivel del factor es mayor que la de la categoría de control, selecciona "Control".

No asumiendo varianzas iguales

T2 de Tamhane. Prueba conservadora de comparación por parejas basada en la prueba T. Esta prueba es

Page 13: Análisis de Varianza - rinace.net. Analisis de Varianza.pdf · 4. Análisis de Varianza F.J. Murillo y C. Martínez-Garrido Página 53 El estadístico F está asociado a un nivel

4. Análisis de Varianza

F.J. Murillo y C. Martínez-Garrido Página 63

adecuada cuando las varianzas son desiguales.

T3 de Dunnett. Prueba de comparación por parejas basada en el módulo máximo estudentizado. Esta prueba es adecuada cuando las varianzas son desiguales.

Games-Howell. Prueba de comparación por parejas que es en ocasiones liberal. Esta prueba es adecuada cuando las varianzas son desiguales.

C de Dunnett. Prueba de comparación por parejas basada en el rango estudentizado. Esta prueba es adecuada cuando las varianzas son desiguales Fuente: Manual base del SPSS.

4.5. Ejercicios

e.4.4. ¿Existen diferencias significativas en el Rendimiento en Lengua de los estudiantes en

función del Hábitat? Si es así, ¿dónde viven los estudiantes que sacan mejores y peores

resultados?

e.4.5. ¿Existen diferencias significativas en el Rendimiento en Lengua de los estudiantes en

función de su hábitat, de su género y de la interacción entre ambas variables?

e.4.6. ¿Existen diferencias en el Rendimiento en Lengua de los estudiantes en función del

Hábitat, si controlamos el efecto del Nivel Socio-económico?

e.4.7. ¿Los estudiantes matriculados en centros públicos obtienen diferente Rendimiento en

Matemáticas que los que asisten a centros privados? ¿Si controlamos el efecto del Nivel

Socio-Económico de las familias, hay diferencias?

e.4.8. ¿El entorno socio-económico donde está situado el centro influye en el Rendimiento de los

estudiantes en Matemáticas? ¿Si lo controlamos por titularidad de centro?

Page 14: Análisis de Varianza - rinace.net. Analisis de Varianza.pdf · 4. Análisis de Varianza F.J. Murillo y C. Martínez-Garrido Página 53 El estadístico F está asociado a un nivel

4. Análisis de Varianza

F.J. Murillo y C. Martínez-Garrido Página 64