REPRESENTACIONES GRÁFICAS EN LA …mramos/EPIP/CursoUNED1ReprGraf.pdf · Manuel Miguel Ramos...

40
Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 1 REPRESENTACIONES GRÁFICAS EN LA INVESTIGACIÓN EDUCATIVA. ANÁLISIS DE DATOS DESDE UNA PERSPECTIVA EXPLORATORIA Manuel Miguel Ramos Álvarez Junio de 2005 PRIMERA PARTE. INTRODUCCIÓN A LOS CONCEPTOS PRINCIPALES. 1) Introducción al análisis con base exploratoria. a) Objetivos y perspectiva. b) El papel de las representaciones gráficas. 2) Bases para la representación a) Tipos más frecuentes. b) Nuevos formatos de representación. c) Convenciones en torno al sistema de representación. SEGUNDA PARTE. ANÁLISIS GRÁFICO DE INVESTIGACIONES EDUCATIVAS DESTACADAS. 3) Análisis descriptivo básico. a) Propiedades elementales. i) Tendencia central, posición y variabilidad. ii) Forma: Asimetría y apuntamiento. b) La forma de la distribución según algunos modelos representativos. i) El caso de la distribución normal. ii) La distribución exponencial. c) Detección de casos anómalos. 4) Análisis de la relación entre variables. a) Introducción. b) El caso lineal. c) Relación no lineal. 5) Representaciones Multidimensionales. 1

Transcript of REPRESENTACIONES GRÁFICAS EN LA …mramos/EPIP/CursoUNED1ReprGraf.pdf · Manuel Miguel Ramos...

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 1

REPRESENTACIONES GRÁFICAS EN LA INVESTIGACIÓN EDUCATIVA.

ANÁLISIS DE DATOS DESDE UNA PERSPECTIVA EXPLORATORIA

Manuel Miguel Ramos Álvarez Junio de 2005

PRIMERA PARTE. INTRODUCCIÓN A LOS CONCEPTOS PRINCIPALES.

1) Introducción al análisis con base exploratoria. a) Objetivos y perspectiva. b) El papel de las representaciones gráficas.

2) Bases para la representación

a) Tipos más frecuentes. b) Nuevos formatos de representación. c) Convenciones en torno al sistema de representación.

SEGUNDA PARTE. ANÁLISIS GRÁFICO DE INVESTIGACIONES EDUCATIVAS DESTACADAS.

3) Análisis descriptivo básico.

a) Propiedades elementales. i) Tendencia central, posición y variabilidad. ii) Forma: Asimetría y apuntamiento.

b) La forma de la distribución según algunos modelos representativos. i) El caso de la distribución normal. ii) La distribución exponencial.

c) Detección de casos anómalos. 4) Análisis de la relación entre variables.

a) Introducción. b) El caso lineal. c) Relación no lineal.

5) Representaciones Multidimensionales.

1

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 2

Bibliografía 1. 2.

3. 4.

5.

6. 7.

Supuesto 2: Predicciones de éxito escolar a partir de las expectativas del profesor.

Amón, J. (1980): Estadística para Psicólogos 1. Madrid: Pirámide. Botella, J., León, O. y San Martín, R. (1993): Análisis de Datos en Psicología I. Madrid: Pirámide. Ferguson, G.A. (1986) Análisis Estadístico en Educación y Psicología. Madrid: Anaya. Freixa, M., Salafranca, L., Guardia, J., Ferrer, R. y Turbany, J. (1992): Análisis exploratorio de datos: Nuevas técnicas estadísticas. Barcelona: PPU. Guilford, J. P. y Frutcher, B. (1984): Estadística Aplicada a la Psicología y a la Educación. Bogotá: McGraw-Hill. Palmer. A. (1995). El Análisis Exploratorio de Datos. Madrid: Pirámide. Welkowitz, J., Ewen, R. B. y Cohen, J. (1981): Estadística Aplicada a las Ciencias de la Educación. Madrid: Santillana.

Investigaciones Supuesto 1: Implicaciones educativas de la estructura de interacción entre los alumnos.

Supuesto 3: Análisis de la progresión evolutiva de las destrezas cognitivas.

2

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 3

PRIMERA PARTE. INTRODUCCIÓN A LOS CONCEPTOS PRINCIPALES.

1. Introducción al análisis con base exploratoria.

a) Objetivos y perspectiva. b) El papel de las representaciones gráficas.

a) Objetivos y Perspectiva 1ª parte: una descripción básica de características y tipos de representaciones que se apoyará

mediante transparencias y fotocopias. Incluye también unas definiciones básicas de puntos destacados, EDA como perspectiva moderna, convenciones, etc. Se realizará un breve recorrido por la estadística descriptiva, teniendo en cuenta el objetivo de representaciones, que abarca desde la perspectiva clásica hasta la moderna.

2ª parte de aplicaciones concretas. Centrado en ejemplos mejor que en técnicas. Es decir relatar ejemplos concretos de investigaciones educativas con una serie de objetivos a cubrir y entonces situar su análisis dentro de un esquema amplio de análisis donde se vea claramente la utilidad de las representaciones gráficas. Además será importante que quede patente el carácter interactivo de la perspectiva que se defiende en el curso. Es decir cómo vamos forjando Hipótesis y explorando recurrentemente las representaciones, etc.

• Utilización de abundante cantidad de ejemplos que ilustren bien la problemática. A veces un tipo de representación camufla una realidad importante. Pues bien, un objetivo importante es que el supuesto seleccionado permita clarificar esta cuestión.

• Múltiples representaciones de los mismos datos para ver cosas diferentes en los mismos cada vez. • De forma interactiva. Es decir presentarlo como una continua generación y contraste

de Hipótesis. Explicar los ejemplos dentro del seno de la Psicología Educación. Contenidos de la Psicología de la Educación.

Definición proceso básico de aprendizaje. Factores intrapersonales Factores interpersonales y socio-ambientales. Análisis psicoeducativo del proceso. Conocimiento psicológico y práctica educativa.

3

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 4 • Describir los programas de análisis estadístico y sus posibilidades gráficas. Uno de los más

destacados es SYSTAT, motivo por el que hemos optado por él. Menú Graph del programa SYSTAT:

OPCIÓN DESCRIPCIÓN Spin Rotación gráficos 3-D Plot Diagrama dispersión Cplot Categórico Bar de Barras o rectángulos Pie De tartas o circular Density Histograma, Polígono y Función Probabilidad Box Diagrama “cajas y barbas” Stemleaf Diagrama “tallos y hojas” Pplot Densidad –Probabilísticos- Qplot Cuantiles SPLOT Matricial Icon Simbólico o Pictograma Map Simbólico de Mapas … …

4

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 5 El fichero “repres1.syd” es para el programa SYSTAT y servirá para desarrollar los Supuestos 1 y 2. El fichero incluye la siguiente información:

niño rencoop rencompi exptprofe cultpadre tampandi

1 1 5 9,0 1 0 2 11 11 3,5 1 1 3 32 19 2,5 1 1 4 41 21 2,6 2 2 5 41 23 2,5 2 2 6 42 32 3,5 3 3 7 55 37 5,5 3 0 8 57 38 7,0 4 0 9 60 39 6,8 4 1 10 60 50 5,0 4 1 11 62 50 3,5 2 2 12 62 51 4,0 2 3 13 65 52 6,7 4 4 14 65 53 3,5 3 4 15 66 54 5,5 2 1 16 71 54 5,0 2 2 17 73 60 5,0 2 2 18 75 66 4,0 1 1 19 82 65 5,5 4 2 20 84 73 5,0 4 2 21 85 75 6,0 2 4

Aclaración: Las variables representan: • rencoop: rendimiento en

situación cooperativa. • rencompi: rendimiento en

situación competitiva. • Exptprofe: expectativas

del profesor. • cultpadre: nivel

sociocultural padres. • tampandi: tamaño de las

pandillas.

22 87 82 8,6 1 2 23 88 85 8,8 1 1 24 92 87 9,0 2 2 25 100 92 8,0 3 4

5

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 6 Con los promedios:

rencoop rencompi exptprofe cultpadre tampandi Promedio 62,28 50,96 5,44 2,40 1,88

Y sirven para describir las implicaciones educativas de la estructura de interacción entre los alumnos y más en concreto para analizar las predicciones de éxito escolar a partir de las expectativas del profesor.

6

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 7 El fichero “repres2.syd” es para el programa SYSTAT y servirá para desarrollar el Supuesto 3. El fichero incluye la siguiente información:

edad error 5.000 10.000 5.000 9.000 5.000 10.000 5.000 8.000 5.000 10.000 5.000 9.000 5.000 8.000 5.000 9.000 5.000 10.000 5.000 7.000 7.000 6.000 7.000 5.000 7.000 7.000 7.000 5.000 7.000 5.000 7.000 4.000 7.000 7.000 7.000 4.000 7.000 5.000 7.000 2.000

Y sirve para efectuar el análisis de la progresión evolutiva de las destrezas cognitivas.

9.000 6.000 9.000 4.000 9.000 2.000 9.000 3.000 9.000 2.000 9.000 3.000 9.000 3.000 9.000 2.000 9.000 3.000 9.000 2.000

11.000 1.000 11.000 0.0 11.000 2.000 11.000 2.000 11.000 1.000 11.000 3.000 11.000 2.000 11.000 4.000 11.000 5.000 11.000 0.0 13.000 0.0 13.000 1.000 13.000 1.000 13.000 2.000 13.000 2.000 13.000 2.000 13.000 2.000 13.000 3.000 13.000 1.000 13.000 1.000

Aclaración: Las variables representan: • Edad: medida en años • Error: Número de errores

cometidos en una batería de aptitudes.

7

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 8 Por último, el fichero “normal.syd” es para el programa SYSTAT y servirá para desarrollar la simulación de la distribución Normal Multivariada, como ilustración de las posibilidades gráficas más sofisticadas. El fichero incluye la siguiente información:

Z1 Z2 Altura 2 2 0,00292 2 1,79 0,00434 2 1,58 0,00618 2 1,37 0,00843 2 1,16 0,01099 2 0,95 0,01372 2 0,74 0,01638 2 0,53 0,01872 2 0,32 0,02046 2 0,11 0,02141 2 -0,1 0,02143 2 -0,31 0,02053 2 -0,52 0,01882 2 -0,73 0,01650 2 -0,94 0,01385 2 -1,15 0,01112 2 -1,36 0,00854

2 -1,57 0,00628 2 -1,78 0,00442 2 -1,99 0,00297 2 -2,2 0,00192

1,79 2 0,00434 1,79 1,79 0,00646 1,79 1,58 0,00920 1,79 1,37 0,01255 1,79 1,16 0,01636 1,79 0,95 0,02042 1,79 0,74 0,02439 1,79 0,53 0,02787 1,79 0,32 0,03047 1,79 0,11 0,03187 1,79 -0,1 0,03191 1,79 -0,31 0,03056 1,79 -0,52 0,02801 1,79 -0,73 0,02457 1,79 -0,94 0,02062 1,79 -1,15 0,01655 1,79 -1,36 0,01272 1,79 -1,57 0,00935 1,79 -1,78 0,00658 1,79 -1,99 0,00443 1,79 -2,2 0,00285 1,58 2 0,00618 … … …

Aclaración: Las variables representan: • Z1: Tipificación

Dimensión1 • Z1: Tipificación

Dimensión2 • Altura: calculada a partir de

la función Normal.

8

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 9

b) El papel de las representaciones gráficas.

Un énfasis en • La comprensión de los datos ¿Qué hay aquí? • Tipología de Representaciones gráficas. • Aproximación de construcción tentativa de modelos y generación de Hipótesis en un

proceso interactivo. Especificación modelo, análisis residual, re-especificación. • Uso de medidas robustas y re-análisis sobre subconjuntos seleccionados de datos. • Flexibilidad y escepticismo respecto al método concreto de análisis a aplicar.

Descubrir patrones en los datos. Como un trabajo detectivesco, atender y observar los datos hasta que emerja una historia coherente en los mismos. Es decir aprender a partir de los datos. Abre una perspectiva que debe tomarse como complementaria más que opuesta a la perspectiva clásica. Se trata de una perspectiva exploratoria más que confirmatoria. Más que una colección de técnicas se trata de una genuina opción teórica. Es decir de una actitud hacia los datos.

La tendencia reinante de análisis de datos psicológicos pretende muchas veces que todo lo que nos interesa es el contraste de algún parámetro determinado (el mito del “Test de Hipótesis”). Pero lo cierto es que hay multitud de preguntas no menos importantes, de amplio alcance, y que requieren de una perspectiva más flexible (menos tajante) en la que de manera interactiva vamos planteando diferentes preguntas a los datos, es decir planteando diferentes Hipótesis, a la vez que vamos tomando una serie de decisiones descartando algunas de las mismas y concretando otras.

Así pues se trata más bien de estudiar las etapas iniciales del análisis, con perspectiva exploratoria más que confirmatoria, realizando análisis preliminares de los datos y donde las técnicas de representación gráfica son cruciales como guía del proceso. También veremos el uso de técnicas de representación como una ayuda ineludible para detectar patrones complejos en los datos. ¿Qué sucedería a un modelo por ejemplo lineal si uno de los predictores lo reducimos a algunos de los valores que puede adoptar? ¿Cuál es el modelo que mejor describe los datos? ¿Es exponencial? ¿Es logarítmico? Temas incluidos bajo el epígrafe EDA:

• Representación de datos. • Transformación de variables. • Línea resistente. • Técnicas de suavizado. • Ajuste de medianas. • Estimación robusta.

9

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 10

2) Bases para la representación

a) Tipos más frecuentes. b) Nuevos formatos de representación. c) Convenciones en torno al sistema de representación.

a) Los tipos de representación más frecuentes

1. GRÁFICOS BÁSICOS. A. GRUPO HISTOGRAMA. 1. Diagrama rectángulos (bar). Nivel sociocultural padres (1: sin estudios, 2: primarios, 3: secundarios, 4: superiores).

0 1 2 3 4 5CULTPADRE

0

1

2

3

4

5

6

7

8

9

10

Cou

nt

2. Diagrama barras (bar). Tamaño de las pandillas (0,1,2,3,4 ó 5 componentes).

0 1 2 3 4 5TAMPANDI

0

1

2

3

4

5

6

7

8

9

10

Cou

nt

Histograma (histogram). Agrupación rendimiento en situación Cooperativa en intervalos de

10 puntos. e histograma acumulativo (histogram_Histogram Options “Cumulative”:)

0 20 40 60 80 100 120RENCOOP

0

1

2

3

4

5

6

7

8

Cou

nt

0.0

0.1

0.2

0.3

Proportion per Bar

0 20 40 60 80 100 120RENCOOP

0

10

20

30

Cou

nt

0.0

0.2

0.4

0.6

0.8

1.0

1.2

Cum

ulative Density

10

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 11 B. GRUPO POLÍGONO FRECUENCIAS. 4. Perfil ortogonal (Line, Profile o Pyramid). Expectativa profesor Rendimiento cada niño del aula.

0 10 20 30NIñO

2

3

4

5

6

7

8

9

10

EXPT

PRO

FE

0 10 20 30NIñO

2

3

4

5

6

7

8

9

10

EXPT

PRO

FE

0 10 20 30NIñO

2

3

4

5

6

7

8

9

10

EXPT

PRO

FE

Polígono frecuencias (Histogram_Type of dsiplay: Frequency Poligon). Agrupación

rendimiento en situación Cooperativa en intervalos de 10 puntos. y Polígono frecuencias acumulativo (histogram_ Type of dsiplay: Frequency Poligon_ Histogram Options “Cumulative”:).

0 20 40 60 80 100 120RENCOOP

0

10

20

30

Cou

nt

0 20 40 60 80 100 120RENCOOP

0

1

2

3

4

5

6

7

8

Cou

nt

11

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 12 C. GRUPO DIAGRAMAS SIMBÓLICOS. 6. Diagrama circular o Gráfico tarta. (Pie chart). Nivel sociocultural padres.

1

2

3

4

Pictograma (Icon Plot). Rendimiento en cada niño.

12

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 13

2. GRÁFICOS PARA ESTUDIO DE LA RELACIÓN ENTRE VARIABLES. Diagrama de dispersión o nube de puntos (scatterplot). Relación rendimiento y expectativas profesor.

2 3 4 5 6 7 8 9 10EXPTPROFE

0

20

40

60

80

100

120R

ENC

OO

P

13

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 14

b) Nuevos formatos de representación 3.1. Diagrama de tallos y hojas (Descriptive Statistics_stem and leaf Plot). Rendimiento en situación cooperativa. Con letra Courier New. Stem and Leaf Plot of variable: RENCOOP, N = 25 Minimum: 1.000 Lower hinge: 55.000 Median: 65.000 Upper hinge: 82.000 Maximum: 100.000 0 1 1 1 * * * Outside Values * * * 3 2 4 112 5 H 57 6 M 0022556 7 135 8 H 24578 9 2 10 0 3.2. Diagrama de cajas y bigotes (Box Plot). Rendimiento en situación cooperativa.

0 20 40 60 80 100 120RENCOOP

14

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 15 El ejemplo de tallos-hojas a dos niveles diferentes de detalle: el sugerido por el programa SYSTAT (unas 10 líneas) y otro en que se fuerza al doble de intervalos (20 líneas). Stem and Leaf Plot of variable: RENCOOP, N = 25 Minimum: 1.000 Lower hinge: 55.000 Median: 65.000 Upper hinge: 82.000 Maximum: 100.000 0 1 1 1 * * * Outside Values * * * 3 2 4 112 5 H 57 6 M 0022556 7 135 8 H 24578 9 2 10 0

Forzando 20 niveles 0 1 1 1 * * * Outside Values * * * 3 2 3 4 112 4 5 5 H 57 6 0022 6 M 556 7 13 7 5 8 H 24 8 578 9 2 9 10 0

15

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 16 Ventajas de los sistemas modernos de representación 1) Permite retener mayor riqueza informativa (todas y cada una de las puntuaciones) pero

no facilita los cálculos numéricos de diferentes estadísticos. 2) Ofrece simultáneamente un listado de las puntuaciones y un dibujo (si lo tumbamos es

como un histograma). 3) Flexible para alterar el nivel de detalle. 4) Facilita la comparabilidad entre grupos, estudios diferentes, y por ende la comprensión de

los datos.

16

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 17

c) Convenciones en torno al sistema de representación.

1) Valores variable en abcisas (X) y frecuencia en ordenada (Y). 2) Graduación ordinal de derecha-izquierda y abajo-arriba desde menor a mayor. 3) Indicaciones de ruptura del eje cuando deseamos dar un salto. 4) Incluir toda la información posible para evitar ambigüedades y facilitar su interpretación

(títulos descriptivos de los ejes y del propio gráfico). 5) Cuando sea el caso, equiparación de diferentes grupos o niveles de una variable:

a) Frecuencias relativas en lugar de absolutas para evitar distorsiones interpretativas por el tamaño.

b) Indicación de dispersión en cada grupo. c) Igualar la amplitud de los ejes que representan a cada uno de ellos-.

6) No utilizar más de 8-9 unidades conceptuales diferentes, intervalos, columnas, barras, grupos, secciones, etc.

7) Adaptar el tipo de representación al tipo de público al que irá dirigida. 8) No alterar o manipular los ejes para inducir imágenes inadecuadas. Por ejemplo este

engaño se puede lograr recortando la altura de los histogramas correspondientes. 9) Usar histogramas en lugar de pictogramas en la medida de lo posible. Por ejemplo, a pesar

de mantener la misma altura se puede inducir la impresión visual de una mayor diferencia si por ejemplo alteramos el ancho de las figuras o símbolos utilizados.

17

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 18

SEGUNDA PARTE. ANÁLISIS GRÁFICO DE INVESTIGACIONES EDUCATIVAS DESTACADAS.

3) Análisis descriptivo básico.

a) Propiedades elementales: i) Tendencia central, posición y variabilidad ii) Forma: Asimetría y apuntamiento

b) La forma de la distribución según algunos modelos representativos. i) El caso de la distribución normal ii) La distribución exponencial.

c) Detección de casos anómalos.

Introducción

Confeccionar representaciones que faciliten la comparación de grupos diferentes o donde se ha manipulado algún aspecto. En nuestro ejemplo centraremos la comparación de lo que sucede en situaciones competitivas y cooperativas. Así por ejemplo un diagrama tallos-hojas conjunto.

18

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 19 Veamos primero un ejemplo comparativo que ilustra las diferentes propiedades:

05

10152025303540

ABCD

A 1 6 10 14 37 14 10 6 2

B 2 10 12 16 19 16 12 10 3

C 8 35 30 10 7 5 3 1 1

D 1 1 3 5 7 10 30 35 8

1 2 3 4 5 6 7 8 9

A y B similar tendencia central (en torno a 5 puntos) pero A es más homogénea –su

varianza es menor- que B. Las dos son simétricas. A es más apuntada que B. La primera tiende a ser leptocúrtica y la segunda a ser más bien platicúrtica.

C y D el mismo grado de variabilidad pero C es asimétrica positiva y D negativa.

El ejemplo que centraremos es el siguiente. Supuesto 1: análisis de las implicaciones educativas de la estructura de interacción entre los alumnos. Más en concreto sobre las diferencias en rendimiento y en socialización según que la estructura sea cooperativa o competitiva.

19

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 20

3. Análisis descriptivo básico

a) Propiedades elementales i) Tendencia central 1. Mediante Diagrama de tallos y hojas (Descriptive Statistics_stem and leaf Plot). Comparación de rendimiento en las situaciones cooperativa y competitiva. Con letra Courier New. Sin forzar Stem and Leaf Plot of variable: RENCOOP, N = 25 Minimum: 21.000 Lower hinge: 50.000 Median: 54.000 Upper hinge: 82.000 Maximum: 100.000 2 12 3 27 4 00 5 M 0000024 6 015 7 35 8 H 24578 9 2 10 0 Stem and Leaf Plot of variable: RENCOMPI, N = 25 Minimum: 22.000 Lower hinge: 37.000 Median: 50.000 Upper hinge: 60.000 Maximum: 100.000 2 23 2 9 3 3 H 5557 4 0034 4 5 M 00002 5 5 6 H 002 6 7 2 7 5 8 2 * * * Outside Values * * * 9 8 10 0

20

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 21 Forzando 10 líneas en los dos variables para compararlas. Stem and Leaf Plot of variable: RENCOOP, N = 25 Minimum: 21.000 Lower hinge: 50.000 Median: 54.000 Upper hinge: 82.000 Maximum: 100.000 2 12 3 27 4 00 5 M 0000024 6 015 7 35 8 H 24578 9 2 10 0 Stem and Leaf Plot of variable: RENCOMPI, N = 25 Minimum: 22.000 Lower hinge: 37.000 Median: 50.000 Upper hinge: 60.000 Maximum: 100.000 2 239 3 H 5557 4 0034 5 M 000025 6 H 002 7 25 8 2 * * * Outside Values * * * 9 8 10 0

21

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 22 2. Clásica. Mediante histogramas

20 30 40 50 60 70 80 90 100 110RENCOOP

0

1

2

3

4

5

6

7

Coun

t

0.0

0.1

0.2

Proportion per Bar

20 30 40 50 60 70 80 90 100 110RENCOMPI

0

1

2

3

4

5

6

7

8

Coun

t

0.0

0.1

0.2

0.3

Proportion per Bar

22

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 23 i) Variabilidad 1. Mediante Diagrama de cajas y barbas (Box Plot). Comparación de rendimiento en las situaciones cooperativa y competitiva. 2. Clásica. Mediante cuantiles Displaying Error Bars on a Graph From the Graph menu, select Bar, Dot, or Line. In the dialog box choose: Options Error Bar

20 30 40 50 60 70 80 90 100 110RENCOMPI

20 30 40 50 60 70 80 90 100 110RENCOOP

23

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 24 ii) Ilustración comparativa de diferentes formas según asimetría y apuntamiento (curtosis). (comparar con los índices numéricos)

0 20 40 60 80 100 120RENCOOP

0

2

4

6

8

10

12

Cou

nt

0.0

0.1

0.2

0.3

0.4

Proportion per Bar

0 10 20 30 40 50 60 70 80 90 100RENCOMPI

0

1

2

3

4

5

6

7

8

Cou

nt

0.0

0.1

0.2

0.3

Proportion per Bar

2 3 4 5 6 7 8 9 10EXPTPROFE

0

1

2

3

4

5

6

7

8

Cou

nt

0.0

0.1

0.2

0.3

Proportion per Bar

0 1 2 3 4 5CULTPADRE

0

2

4

6

8

10

12

Cou

nt

0.0

0.1

0.2

0.3

0.4

Proportion per Bar

0 1 2 3 4 5TAMPANDI

0

5

10

15

Cou

nt

0.0

0.1

0.2

0.3

0.4

0.5

0.6

Proportion per Bar

24

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 25

b) Ilustración de la forma de la distribución según algunos Modelos representativos.

i) El caso de la Distribución Normal Univariada (Graph “Line” sobre fichero Normal.syd tomando Z1 e Y1).

-3 -2 -1 0 1 2 3Z1

0.0

0.1

0.2

0.3

0.4

Y1

25

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 26 Estudio de la Forma-Modelo de la distribución A través de representaciones específicas. “Density Function”

30 40 50 60 70 80 90 100 110RENCOOP

0

1

2

3

4

5

6

7

Cou

nt

0 10 20 30 40 50 60 70 80 90 100RENCOMPI

0

1

2

3

4

5

6

7

8

Cou

nt

Que se aproximen o no a una línea recta. Cuanto más próximo a esta mejor ajusta el modelo hipotetizado. Esta función sí que incluye “smooth” para ajustar una línea recta precisamente y poder aproximarnos mejor. Veamos la aproximación a la normal.

30 40 50 60 70 80 90 100 110RENCOOP

-3

-2

-1

0

1

2

3

Expe

cted

Val

ue fo

r Nor

mal

Dis

trib u

tion

0 10 20 30 40 50 60 70 80 90 100RENCOMPI

-3

-2

-1

0

1

2

3

Expe

cted

Val

ue fo

r Nor

mal

Dis

tribu

tion

26

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 27 ii) La distribución exponencial

Así pues, que los juicios sean comparativos (relativos) mas que absolutos. En este caso vamos a comparar con otro tipo de modelo de distribución, vg una exponencial.

30 40 50 60 70 80 90 100 110RENCOOP

0

1

2

3

4

Expe

c ted

Val

ue fo

r Exp

onen

tial D

ist ri

butio

n

0 10 20 30 40 50 60 70 80 90 100RENCOMPI

0

1

2

3

4

Expe

cted

Val

ue fo

r Exp

onen

tial D

istri

butio

n

Como se puede apreciar el ajuste normal es mejor que el de la exponencial por ejemplo.

27

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 28

Ilustración de diferentes tipos de relación

LINEAL

0

2

4

6

8

1 11 21 31 41 51

bxay +=

EXPONENCIAL

0

20

40

60

80

100

1 11 21 31 41 51

bxaey =

POTENCIAL

0

0,02

0,04

0,06

0,08

0,1

1 11 21 31 41 51

baxy =

HIPERBÓLICA

0

0,05

0,1

0,15

0,2

0,25

1 11 21 31 41

xbay +=

LOGÍSTICA

0

0,2

0,4

0,6

0,8

1

1 11 21 31 41 51

bxaey

+=

11

28

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 29

c) Detección de casos anómalos.

29

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 30

30

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 31

4. Análisis de relación entre variables

a) Introducción. b) El caso lineal. c) Relación no lineal.

a) Introducción Es importante la exploración gráfica de la relación, sobre todo para perfilar el tipo de

relación. La más importante ha sido en las disciplinas afines a la Psicología sin lugar a dudas la lineal. Pero no es este tipo de relación ni mucho menos el único tipo posible. De hecho veremos un ejemplo extraído de la investigación educativa que apunta más bien un tipo diferente de relación. Una vez más el análisis exploratorio es crucial en este punto. Por otro lado, también es importante observar/explorar con detenimiento el conjunto de datos de nuestro estudio. Nuevamente la presencia de puntos anómalos puede se distorsionante. En este punto podríamos forjarnos una idea de relación que es inadecuada. El análisis exploratorio tipo EDA vuelve a ser crucial. Veremos un método robusto de estimación. Todos los puntos trazados están relacionados con la estadística robusta. El análisis exploratorio puede ayudarnos, además, a evitar algunos riesgos inherentes a la interpretación de relaciones.

Dependencia de la variabilidad. Mediación de terceras variables. Rango de valores restringido y por tanto poco representativo de la población de

referencia. Mezcla de grupos heterogéneos.

Centraremos dos ejemplos de manera comparativa. Veamos el primero de ellos. Supuesto 2: Análisis de las predicciones en el éxito escolar a partir de las expectativas del profesor. Incluye un “outlier”, lo que permite apreciar la distorsión que provoca sobre la recta de regresión. Algo que se puede detectar mediante la representación gráfica correspondiente y que se puede corregir mediante la recta de Tukey que es robusta (se basa en las medianas). Le ajustamos algunos modelos diferentes para que se vea claramente la superioridad del lineal frente a otros modelos como el exponencial o logarítmico. Realmente el estudio fue de regresión múltiple, cuya ecuación sería de la forma:

801,0;18.016.062.0 2 =⋅⋅+⋅=′ Rzzzz RAAEAEPRF RF: Rendimiento académico Final del curso, EP: Expectativas profesor, EA: Expectativas alumno y RAA: Rendimiento Anterior del Alumno.

De Navas, Sampascual y Castejón (1991). Relación entre rendimiento y variables motivacionales cognitivas en niños de 5º EGB.

31

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 32

b) El caso Lineal

20 30 40 50 60 70 80 90 100 110RENCOOP

0

1

2

3

4

5

6

7

8

9

10

EXPT

PRO

FE Tantear el ajuste hasta dar con la tecla del lineal: Smoother (Scatterplot_options)

20 30 40 50 60 70 80 90 100 110RENCOOP

0

1

2

3

4

5

6

7

8

9

10

EXPT

PRO

FE

32

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 33 Estudio de la relación entre variables a partir del Supuesto 2 El gráfico nos permite comparar lo que sucede cuando está presente el “outlier” identificado frente a cuando éste desaparece (como si se tratara de un valor perdido).

30 40 50 60 70 80 90 100 110RENCOOP

2

3

4

5

6

7

8

9

10

Valu

e

EXPTPROFENEWEXPT

Por ello sería útil disponer de una estimación robusta en casos como este. Veamos la línea resistente de Tukey, una de las técnicas más representativas en este punto.

X Y Case nº ExpecProf RendCoo Case nº ExpecProf RendCoo

1 9,0 1 3 2,5 32 2 3,5 11 5 2,5 41 3 2,5 32 4 2,6 41 4 2,6 41 2 3,5 11 5 2,5 41 6 3,5 42 6 3,5 42 11 3,5 62 7 5,5 55 14 3,5 65 8 7,0 57 12 4,0 62 9 6,8 60 18 4,0 75

10 5,0 60 10 5,0 60 11 3,5 62 16 5,0 71 12 4,0 62 17 5,0 73 13 6,7 65 20 5,0 84 14 3,5 65 7 5,5 55 15 5,5 66 15 5,5 66 16 5,0 71 19 5,5 82 17 5,0 73 21 6,0 85 18 4,0 75 13 6,7 65 19 5,5 82 9 6,8 60 20 5,0 84 8 7,0 57 21 6,0 85 25 8,0 100 22 8,6 87 22 8,6 87 23 8,8 88 23 8,8 88 24 9,0 92 1 9,0 1 25 8,0 100 24 9,0 92

Md 5,0 65 Md1 3,5 61 Md2 6,9 74

33

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 34 Representación de la relación a partir de un diagrama de dispersión:

Representación de la relación junto con la extrapolación de la recta de regresión lineal:

0

20

40

60

80

100

120

0,0 2,0 4,0 6,0 8,0 10,0

EXPECTATIVA PROFE

REN

DIM

IEN

TO

y = 3,8235x + 47,618y = 4,4472x + 38,087

0

20

40

60

80

100

120

0,0 2,0 4,0 6,0 8,0 10,0

EXPECTATIVA PROFE

REN

DIM

IEN

TO

34

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 35

C) De tipo no lineal. Por ejemplo una función exponencial. Por otro lado, veamos otro estudio en que también interesa la relación entre dos variables. Supuesto 3: Análisis de la progresión evolutiva en las destrezas. Se mide el número de errores cometidos en una batería que incluye una muestra representativa de las habilidades cognitivas (aptitudes) más destacadas a diferentes grupos de edad. Entonces realizamos un seguimiento de las destrezas medido a través del número de errores. Como se podrá apreciar se trata de una función exponencial. Le ajustamos también algunos modelos diferentes para que se vea claramente la superioridad del lineal frente a otros modelos como el exponencial o logarítmico. Interpretación de la exponencial. Paulatinamente se comete menor número de errores, luego mejoran las destrezas básicas. Pero ese cambio no es constante en los diferentes momentos sino que es proporcionalmente mayor al principio que en edades posteriores. (Fichero “repres2.syd”)

0 5 10 15EDAD

0

2

4

6

8

10

12

ERR

Ir tanteando los ajustes hasta dar con el mejor ajuste, proporcionado por el modelo exponencial: Smoother (Scatterplot_options)

35

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 36 Supuesto 3 para estimación de relación no lineal sobre Análisis de la progresión evolutiva de las destrezas cognitivas. Matriz de datos. Dentro figura el número de errores cometido por cada niño en cada nivel de edad.

AÑOS 5 7 9 11 13

NIÑOS 1 10 6 6 1 0 2 9 5 4 0 1 3 10 7 2 2 1 4 8 5 3 2 2 5 10 5 2 1 2 6 9 4 3 3 2 7 8 7 3 2 2 8 9 4 2 4 3 9 10 5 3 5 1 10 7 2 2 0 1

MEDIA 9,0 5,0 3,0 2,0 1,5

36

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 37 REPRESENTACIÓN DE LA RELACIÓN A PARTIR DE UN DIAGRAMA DE DISPERSIÓN:

Representación de la relación junto con la extrapolación de la función exponencial:

0

2

4

6

8

10

12

0 5 10 15EDAD

ERR

OR

ES

0

2

4

6

8

10

12

0 5 10 15EDAD

ERR

OR

ES

37

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 38 5) Representaciones Multidimensionales Se ilustrará la Normal Multidimensional, como ejemplo de gráfico 3-D y sus posibilidades.

• Para ello se simulan variaciones cíclicas de una variable Z2 (tipificada) anidada a otra variable Z1 y se estima a partir de la interacción (el producto) de ambas la altura de la función. Los datos de dicha simulación se recogen en el fichero “normal.syd” y el gráfico tridimensional resultante en el fichero “Normal3D.SYG”

El resultado es la representación:

38

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 39

Anexos.- Listados de diferentes análisis con el programa SYSTAT El análisis descriptivo detallado del Supuesto 1: RENCOOP RENCOMPI EXPTPROFE CULTPADRE TAMPANDI N of cases 25 25 25 25 25 Minimum 31.000 5.000 1.000 1.000 0.0 Maximum 100.000 92.000 9.000 4.000 4.000 Range 69.000 87.000 8.000 3.000 4.000 Sum 1607.000 1274.000 128.500 60.000 47.000 Median 65.000 52.000 5.000 2.000 2.000 Mean 64.280 50.960 5.140 2.400 1.880 95% CI Upper 72.501 60.921 6.017 2.862 2.390 95% CI Lower 56.059 40.999 4.263 1.938 1.370 Std. Error 3.983 4.826 0.425 0.224 0.247 Standard Dev 19.915 24.131 2.124 1.118 1.236 Variance 396.627 582.290 4.512 1.250 1.527 C.V. 0.310 0.474 0.413 0.466 0.657 Skewness(G1) -0.165 -0.125 0.205 0.272 0.390 SE Skewness 0.464 0.464 0.464 0.464 0.464 Kurtosis(G2) -0.815 -0.708 -0.521 -1.253 -0.530 SE Kurtosis 0.902 0.902 0.902 0.902 0.902

RENCOOP RENCOMPI EXPTPROFE CULTPADRE TAMPANDI N of cases 25 25 25 25 25 Minimum 1.000 5.000 2.500 1.000 0.0 Maximum 100.000 92.000 9.000 4.000 4.000 Range 99.000 87.000 6.500 3.000 4.000 Sum 1557.000 1274.000 136.000 60.000 47.000 Median 65.000 52.000 5.000 2.000 2.000 Mean 62.280 50.960 5.440 2.400 1.880 95% CI Upper 72.266 60.921 6.302 2.862 2.390 95% CI Lower 52.294 40.999 4.578 1.938 1.370 Std. Error 4.839 4.826 0.418 0.224 0.247 Standard Dev 24.193 24.131 2.089 1.118 1.236 Variance 585.293 582.290 4.362 1.250 1.527 C.V. 0.388 0.474 0.384 0.466 0.657 Skewness(G1) -0.880 -0.125 0.376 0.272 0.390 SE Skewness 0.464 0.464 0.464 0.464 0.464 Kurtosis(G2) 0.763 -0.708 -0.931 -1.253 -0.530 SE Kurtosis 0.902 0.902 0.902 0.902 0.902

39

Manuel Miguel Ramos Álvarez Curso “Representaciones gráficas de datos en Psicología Educación” 40 Diferentes variaciones de representaciones modernas a partir de EDA: Stem and Leaf Plot of variable: RENCOOP, N = 25 Minimum: 31.000 Lower hinge: 55.000 Median: 65.000 Upper hinge: 82.000 Maximum: 100.000 3 112 4 112 5 H 57 6 M 0022556 7 135 8 H 24578 9 2 10 0 Stem and Leaf Plot of variable: RENCOMPI, N = 25 Minimum: 5.000 Lower hinge: 37.000 Median: 52.000 Upper hinge: 66.000 Maximum: 92.000 0 5 1 19 2 13 3 H 2789 4 5 M 0012344 6 H 056 7 35 8 257 9 2 Stem and Leaf Plot of variable: RENCOOP, N = 25 Minimum: 31.000 Lower hinge: 55.000 Median: 65.000 Upper hinge: 82.000 Maximum: 100.000 3 112 4 112 5 H 57 6 M 0022556 7 135 8 H 24578 9 2 10 0 Stem and Leaf Plot of variable: RENCOMPI, N = 25 Minimum: 5.000 Lower hinge: 37.000 Median: 52.000 Upper hinge: 66.000 Maximum: 92.000 0 5 1 19 2 13 3 H 2789 4 5 M 0012344 6 H 056 7 35 8 257 9 2

40