Análisis de Regresión

21
Escuela de Psicología Elaborado por Lic. Omar Alcalá. 2011. Actualizado 2013 Descripción Bivariante de datos cuantitativos

Transcript of Análisis de Regresión

Page 1: Análisis de Regresión

Escuela de Psicología

Elaborado por Lic. Omar Alcalá. 2011. Actualizado 2013

Descripción Bivariante de datos cuantitativos

Page 2: Análisis de Regresión

REGRESIÓNExpresión cuantitativa que describe lanaturaleza básica de la relación entre lasvariables dependientes y las independientes

EXPRESIÓN CUANTITATIVA MODELO

MODELO

1. SI LAS VARIABLES TIENDEN A DESPLAZARSE EN AL MISMA DIRECCIÓN

2. SI LAS VARIABLES TIENDEN A DESPLAZARSE EN

SENTIDOS OPUESTOS

3. LA CANTIDAD EN QUE VARÍA V.D. CUANDO

LA IND. VARÍA EN UNA UNIDAD

Para profundizar: Tópicos de estadística, páginas 179 en adelante. Capítulo IV.

Page 3: Análisis de Regresión

REGRESIÓN

SimpleDos variable. Una dependiente. Una independiente

Múltiple

Más de dos variables. Una

dependiente. Dos o más independientes

,x y

, , ,...,x z t y

Page 4: Análisis de Regresión

REGRESIÓNREGRESIÓN

PASOS PARA EL AJUSTE DE REGRESIÓN

1. RECOLECCIÓN DE DATOS

2. DIAGRAMA DE DISPERSIÓN

3. REALIZAR EL AJUSTE SEGÚN EL DIAGRAMA DE DISPERSIÓN

Para profundizar: Tópicos de estadística, páginas 179 en adelante. Capítulo IV.

Page 5: Análisis de Regresión

3. … EL AJUSTE SEGÚN EL DIAGRAMA DE DISPERSIÓN

RECTA DE REGRESIÓN

Modelo que describe la relación Lineal (variación) entre dos variables

ε Y 10 X

DETERMINISTA ALEATORIOCausas:

Error de medición

Error estocástico

POBLACIONAL

Page 6: Análisis de Regresión

3. … EL AJUSTE SEGÚN EL DIAGRAMA DE DISPERSIÓN

RECTA DE REGRESIÓN

ebxay ˆ

MUESTRAL

Coeficiente

de regresión

(Pendiente)

Constante

de regresión

Componente de error

bxay ˆ

Page 7: Análisis de Regresión

3. … EL AJUSTE SEGÚN EL DIAGRAMA DE DISPERSIÓN

RECTA DE AJUSTE ÓPTIMO

MÉTODO DE LOS MÍNIMOS CUADRADOSLa recta que genera es tal que hace mínimos los cuadrados de las distancia verticales desde cada punto de observación a dicha recta

Page 8: Análisis de Regresión

Aplicación

1. Con base en los datos 10 alumnos que tomaron la prueba, si unestudiante obtuvo 30 puntos en la primera administración, ¿qué valorpodría predecir el modelo para su segunda administración?

138,30338,130960,030ˆ y

2. Si un estudiante obtuvo 50 puntos en la primera administración, ¿quévalor podría predecir el modelo para su segunda administración?

La recta no aplica en este caso por que el valor seencuentra fuera del rango de la variable x.

Page 9: Análisis de Regresión

Ejemplo 2

Número de horas de estudio fuera de clase (durante un

período de tres semanas) de alumnos de un curso de

estadística y sus calificaciones en el examen final de ese

período

Horas 20 16 34 23 27 32 18 22

Calificación 64 61 84 70 88 92 72 77

rxy= 0,86

Para profundizar: Tópicos de estadística, páginas 179 en adelante. Capítulo IV.

Page 10: Análisis de Regresión

Ejemplo 2

Si un estudiante se dedicó 18 horas de estudio (fuera de clase

durante esas tres semanas), ¿cuánto se espera sea su calificación?

bxay ˆ

Se monta el modelo para predecir la calificación (Y) a partir de las

horas de estudio (X).

a=40,08

b= 1,496

Entonces, y=40,08+1,496x18=67.

Un estudiante que dedicó 18 horas de estudio fuera de clase en

esas tres semanas se espera tenga una calificación de 67 puntos.

Page 11: Análisis de Regresión

Ejemplo 2

Si un estudiante obtuvo 85 puntos en el examen, ¿cuántas horas

podemos decir que ha dedicado ese estudiante para prepararse

para la evaluación?

bxay ˆ

Se monta el modelo para predecir las horas de estudio (Y) a partir

de la calificación en el examen (X). Nótese que cambia el

modelo respecto al anterior, en este caso las horas de estudio

pasó a ser la variable predicha y la calificación la variable

predictora.a=-13,74

b= 0,496Entonces, y=-13,74+0,496x85= 28,42

Un estudiante que obtuvo una puntuación de 85 puntos, se puede

inferir que estudió 28 horas durante esas tres semanas para dicha

evaluación

Page 12: Análisis de Regresión

4. Error de estimación en la predicción

ERROR TÍPICO DE ESTIMACIÓN

Medida de la cantidad media en que las observaciones reales de y varían en torno a los predichos por el modelo.

Donde:

Se= error de estimación

Sy= desviación típica de la variable dependiente

1-rxy2= coeficiente de no determinación

21 xyye rSS

Page 13: Análisis de Regresión

3. Error de estimación en la predicción

Si la correlación entre dos variables es perfecta, es decir 1 o -1, el

error de estimación será cero (0).

Si no existe correlación entre dos variables, el error de estimación

será igual a la desviación típica de la variable predicha.

21 xyye rSS

Page 14: Análisis de Regresión

4. Error de estimación en la predicción

Número de horas de estudio fuera de clase (durante un período de tres

semanas) de alumnos de un curso de estadística y sus calificaciones en

el examen final de ese períodoSi un estudiante se dedicó 18 horas a

estudiar (fuera de clase durante esas tres semanas), ¿cuánto se espera

sea su calificación? (con un 95% de confianza)

Horas 20 16 34 23 27 32 18 22

Calificación 64 61 84 70 88 92 72 77

rxy= 0,86

Modelo para predecir la

calificación (Y) a partir de las

horas de estudio (X). bxay ˆa=40,08

b= 1,496

Page 15: Análisis de Regresión

Si un estudiante se dedicó 18 horas a estudiar (fuera de clase

durante esas tres semanas), ¿cuánto se espera sea su calificación?

(con un 95% de confianza)

bxay ˆ a=40,08 b= 1,496

Entonces, y=40,08+1,496(18)=67puntos.

Un estudiante que dedicó 18 horas de estudio fuera de clase en

esas tres semanas se espera tenga una calificación de 67 puntos.

OJO: esto como predicción puntual, pero piden la estimación con el

95% de confianza.

Es decir, se deben encontrar los límites entre los cuales se

encuentra el valor de Y. Dado que los errores de estimación son

aleatorios, su distribución es normal, por ende se puede utilizar la

curva Z para estimar el área.

4. Error de estimación en la predicción

Page 16: Análisis de Regresión

Si un estudiante se dedicó 18 horas a estudiar (fuera de clase

durante esas tres semanas), ¿cuánto se espera sea su calificación?

(con un 95% de confianza)

y´=40,08+1,496(18)=67puntos.

4. Error de estimación en la predicción

Para este modelo el Se es:

𝑆𝑒 = 𝑆𝑦 1 − 𝑟𝑥𝑦2

Se=11,25 √(1-,862)= 5,74

0,0250,025

6778,25 Xi=67+(1,96*5,74)55,75Xi=67+(-1,96*5,74)

Si el estudiante se

dedicó 18 horas a

estudiar, lo más

probable es que

obtenga 67 puntos y,

con un 95% de

confianza se

encontrará entre

55,75 y 78,25 puntos.

Page 17: Análisis de Regresión

4. Error de estimación en la predicción

0,0250,025

6778,25 Xi=67+(1,96*5,74)55,75Xi=67+(-1,96*5,74)

Nótese que:

El error de estimación es la desviación típica de la distribución de

posibles valores obtenidos en torno al valor predicho.

La media de la distribución de errores es el valor predicho, ya que, es el

valor más probable.

X xz

s

Se=Sy√(1-rxy2)

Se=11,25 √(1-,862)= 5,74

Page 18: Análisis de Regresión

Gráfica de la estimación puntual.

60

65

70

75

80

85

90

95

15 20 25 30 35

Cali

fic

ació

n

Horas de estudio

Media=24

Desviación=6,48

Me

dia

=7

6

De

svia

ció

n=

11

,25

y´=40,08+1,496(18)=67puntos.

Page 19: Análisis de Regresión

Gráfica de la estimación con intervalos de confianza. En este caso 95%.

60

65

70

75

80

85

90

95

15 20 25 30 35

Cali

fic

ació

n

Horas de estudio

Media=24

Desviación=6,48

Media

=76

Desvia

ció

n=

11,2

5

67

55,75

78,25

Page 20: Análisis de Regresión

Error de estimación en la predicción

60

65

70

75

80

85

90

95

15 20 25 30 35

Cali

fic

ació

n

Horas de estudio

Media=24

Desviación=6,48

Media

=76

Desvia

ció

n=

11,2

5

Page 21: Análisis de Regresión

Ejercicios

Número de horas de estudio fuera de clase (durante un período de

tres semanas) de alumnos de un curso de estadística y sus

calificaciones en el examen final de ese período

Horas 20 16 34 23 27 32 18 22

Calificación 64 61 84 70 88 92 72 77

-Si un alumno estudió 25 horas, ¿cuánto se espera sea su

calificación con un 90% de confianza?.

-Si un alumno estudió 36 horas, ¿cuánto se espera sea su

calificación con un 85% de confianza?

-Si un alumno estudió 17 horas, cuál es la probabilidad de obtener

más de 50 puntos.

-Si un alumno estudió 28 horas, ¿cuál es la probabilidad de obtener

entre 70 y 90 puntos?