El análisis de correlación en la regresión múltiple

21
Análisis de correlación en regresión múltiple

description

Transparencias para un curso de regresión lineal múltiple

Transcript of El análisis de correlación en la regresión múltiple

Page 1: El análisis de correlación en la regresión múltiple

Análisis de correlación en regresión múltiple

Page 2: El análisis de correlación en la regresión múltiple

• Si el modelo de ajuste será perfecto.

• Si el modelo de ajuste no será perfecto. El vector de los residuos no será nulo y, en consecuencia, los valores observados y estimados serán diferentes entre sí.

YY0eee' ˆ00 SCR

Calidad del modelo de ajuste

0SCR

0SCR

Page 3: El análisis de correlación en la regresión múltiple

Calidad del modelo de ajuste (II)

• Si es pequeña, la calidad del modelo de ajuste será buena pero ¿cómo sabremos si es grande o pequeña?

• Tendremos que comparar con otra “suma de cuadrados”. Para obtener esa otra suma llevaremos a cabo un análisis de la desviación de cada observación respecto a la media.

SCR

SCR

SCR

Page 4: El análisis de correlación en la regresión múltiple

Análisis de la desviación de cada observación

• Dada una observación cualquiera podemos expresar la desviación de la variable dependiente respecto a la media del siguiente modo:

• Esta desviación la podemos descomponer en dos partes:

yyi

iiii yyyyyy ˆˆ

Page 5: El análisis de correlación en la regresión múltiple

Análisis de la desviación de cada observación (II)

• es la desviación respecto a la media• es la desviación que es explicada por las

variables explicativas• es el residuo o la desviación que no

explican las variables explicativas

yyi yyi ˆ

ii yy ˆ

Page 6: El análisis de correlación en la regresión múltiple

Cuadrados de las desviaciones

• Si calculamos los cuadrados de las desviaciones:

• Esta expresión se cumple para todos los individuos. Por tanto, si las sumamos para todos ellos:

iiiiiii yyyyyyyyyy ˆˆ2ˆˆ 222

n

iiii

n

iii

n

ii

n

ii yyyyyyyyyy

11

2

1

2

1

2 ˆˆ2ˆˆ

Page 7: El análisis de correlación en la regresión múltiple

Sumas de cuadrados de las desviaciones

• Pero, como se puede comprobar fácilmente,

• Y en consecuencia:

n

iii

n

ii

n

ii yyyyyy

1

2

1

2

1

2 ˆˆ

0ˆˆ1

n

iiii yyyy

Page 8: El análisis de correlación en la regresión múltiple

Sumas de cuadrados de las desviaciones (II)

• Suma total de cuadrados (STC): es una medida de la variabilidad de la variable dependiente cuando no tomamos en consideración la información que nos proporcionan las variables explicativas.

• Suma de cuadrados de los residuos (SCR): es una medida de la variabilidad de la variable dependiente cuando tomamos en consideración la información que nos proporcionan las variables explicativas.

• Suma de cuadrados explicada (SCE): es la parte de la variabilidad de la variable dependiente que es explicada por las variables independientes.

n

ii yy

1

n

ii yy

1

2

n

iii yy

1

Page 9: El análisis de correlación en la regresión múltiple

Sumas de cuadrados de las desviaciones (III)

n

ii yy

1

2

n

iii yy

1

n

ii yy

1

Page 10: El análisis de correlación en la regresión múltiple

Coeficiente de determinación

• Es la proporción de la variabilidad de la variable dependiente que queda explicada por las variables independientes:

n

ii

n

iii

yy

yy

STC

SCR

STC

SCER

1

2

1

2

2

ˆ

11

10 2 R

Page 11: El análisis de correlación en la regresión múltiple

Coeficiente de determinación (II)

• Es una medida de la calidad del ajuste:– Si la calidad del ajuste no es buena y,

en principio, las variables explicativas no explican la variabilidad de la variable dependiente.

– Si la calidad del ajuste es buena y, en principio, las variables explicativas explican la variabilidad de la variable dependiente.

02 R

12 R

Page 12: El análisis de correlación en la regresión múltiple

Coeficiente de determinación (III)

• Cuando añadimos una nueva variable explicativa al modelo de ajuste R2 siempre aumenta (¿por qué?):

• Para poder comparar modelos con un número diferente de variables explicativas utilizaremos otro coeficiente al que llamaremos coeficiente de determinación corregido (o ajustado).

112

12 ,,...,,..., jjj XXXRXXR

Page 13: El análisis de correlación en la regresión múltiple

Coeficiente de determinación corregido

2

2

1

2

1

2

2 1

1

1

ˆ

1y

n

ii

n

iii

s

s

n

yy

kn

yy

R

• : varianza estimada de la variable dependiente cuando tomamos en cuenta la información de las variable explicativas.

• : varianza estimada de la variable dependiente cuando no tomamos en cuenta la información de las variables explicativas.

2s

2ys

Page 14: El análisis de correlación en la regresión múltiple

Coeficiente de correlación parcial(k=2)

• : Porcentaje de variación explicado por X1

• : Porcentaje de variación no explicado por X1

• : Porcentaje de variación explicado por el conjunto {X1, X2}

• : Diferencia entre los porcentajes de variación explicados por X1 y por el conjunto {X1, X2}

2/

2/

2,/

2/

2,/2

/

1

121

1

21

12 11

11

XY

XYXXY

XY

XXYXYX R

RR

R

RR

2/

2,/ 121 XYXXY RR

2/ 1XYR

2/ 1

1 XYR

2,/ 21 XXYR

Page 15: El análisis de correlación en la regresión múltiple

2/ 1XYR

2/ 1

1 XYR

2,/ 21 XXYR

2,/ 21

1 XXYR

2/

2/

2,/

2/

2,/2

/

1

121

1

21

12 11

11

XY

XYXXY

XY

XXYXYX R

RR

R

RR

Coeficiente de correlación parcial(II)(k=2)

Page 16: El análisis de correlación en la regresión múltiple

2/ 1

1 XYR

2,/ 21

1 XXYR

2/

2/

2,/

2/

2,/2

/

1

121

1

21

12 11

11

XY

XYXXY

XY

XXYXYX R

RR

R

RR

Coeficiente de correlación parcial(III)(k=2)

2/

2,/ 121 XYXXY RR

Page 17: El análisis de correlación en la regresión múltiple

Coeficiente de correlación parcial (caso general)

• : Porcentaje de variación explicado por el conjunto {X1,..., Xj-1}

• : Porcentaje de variación no explicado por {X1,..., Xj-1}

• : Porcentaje de variación explicado por {X1,..., Xj-1 , Xj}

• : Diferencia entre los porcentajes de variación explicados por {X1,..., Xj-1 , Xj} y por {X1,..., Xj-1}

2,...,/

2,...,/ 111

jj XXYXXY RR

2,...,/ 11 jXXYR

2,...,/ 11

1

jXXYR

2,...,/ 1 jXXYR

2,...,/

2,...,/

2,...,/

2,...,/

2,...,/2

,...,/

11

111

11

1

11 11

11

j

jj

j

j

jj

XXY

XXYXXY

XXY

XXY

XXYX R

RR

R

RR

Page 18: El análisis de correlación en la regresión múltiple

2,...,/ 11 jXXYR

2,...,/ 11

1

jXXYR

2,...,/ 1 jXXYR

2,...,/ 1

1jXXYR

Coeficiente de correlación parcial (II)(caso general)

2,...,/

2,...,/

2,...,/

2,...,/

2,...,/2

,...,/

11

111

11

1

11 11

11

j

jj

j

j

jj

XXY

XXYXXY

XXY

XXY

XXYX R

RR

R

RR

Page 19: El análisis de correlación en la regresión múltiple

2,...,/ 11

1

jXXYR

2,...,/

2,...,/ 111

jj XXYXXY RR

2,...,/ 1

1jXXYR

2,...,/

2,...,/

2,...,/

2,...,/

2,...,/2

,...,/

11

111

11

1

11 11

11

j

jj

j

j

jj

XXY

XXYXXY

XXY

XXY

XXYX R

RR

R

RR

Coeficiente de correlación parcial (III)(caso general)

Page 20: El análisis de correlación en la regresión múltiple

Coeficiente de correlación parcial (IV) (caso general)

2,...,/

2,...,/

2,...,/

2,...,/

2,...,/2

,...,/

11

111

11

1

11 11

11

j

jj

j

j

jj

XXY

XXYXXY

XXY

XXY

XXYXYj R

RR

R

RRr

Page 21: El análisis de correlación en la regresión múltiple

Ejercicio

En el ejemplo de los alquileres, calcular los coeficientes de correlación parcial de las variables explicativas.