ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la...

34
CAPÍTULO III .- ANÁLISIS DE DOS CARACTERÍSTICAS (DISTRIBUCIONES BIDIMENSIONALES) ESTADÍSTICA (GRUPO 12) TEMA 9 .- REGRESIÓN Y CORRELACIÓN. DIPLOMATURA EN CIENCIAS EMPRESARIALES UNIVERSIDAD DE SEVILLA

Transcript of ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la...

Page 1: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

CAPÍTULO III.-ANÁLISIS DE DOS CARACTERÍSTICAS

(DISTRIBUCIONES BIDIMENSIONALES)

ESTADÍSTICA (GRUPO 12)

TEMA 9.- REGRESIÓN Y CORRELACIÓN.

DIPLOMATURA EN CIENCIAS EMPRESARIALES

UNIVERSIDAD DE SEVILLA

Page 2: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

2© Antonio Pajares Ruiz

1. CONCEPTO DE REGRESIÓN.CURVA DE REGRESIÓN EMPÍRICA.

Concepto

Conjunto de técnicas estadístico-matemáticas que permiten:Explicitar la relación matemática que liga las dos variablesOfrecer un valor aproximado de una de ellas cuando la otra toma un valor prefijadoOfrecer una medida de la bondad de la aproximación

XVariable explicativa

(independiente) REGRESIÓN DE YSOBRE X

REGRESIÓN

YVariable a explicar

(dependiente)

Page 3: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

3© Antonio Pajares Ruiz

1. CONCEPTO DE REGRESIÓN.CURVA DE REGRESIÓN EMPÍRICA.

nk.nkm...nkj...nk2nk1xk

...

...n2m

n1m

ym

...ni.

...n2.

n1.

ni.

..................

...nij...ni2ni1xi

..................

...n2j...n22n21x2

...n1j...n12n11x1

...yj...y2y1X/YY/X = x1

Y/X = x2

Y/X = xi

Y/X = xk

REGRESIÓNDE Y SOBRE X

Y = f (xi) Por cada valorde X, hay unadistribución

de valores de Y

PROBLEMA

Aproximación:Tomar la media

de cadadist. condicionada

Media de Y/X = x1

Media de Y/X = x2

Media de Y/X = xi

Media de Y/X = xk

DISTRIBUCIÓN DEL VECTOR (X, Y)

REGRESIÓN

Page 4: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

4© Antonio Pajares Ruiz

1. CONCEPTO DE REGRESIÓN.CURVA DE REGRESIÓN EMPÍRICA.

CURVA DE REGRESIÓN EMPÍRICAConcepto

Poligonal resultante de unir los puntos de intersección entre cada uno de los valores de la variable X (xi) y las medias de las correspondientes distribuciones condicionadas de Y a cada uno éstos.

( )i ix , y / X x=

m

j j / ij 1

ii.

y ny / X x

n=

⋅= =

∑ No presenta una forma funcional concreta

Posibles soluciones

Aproximar una función matemática a la curva de regresión empírica.Aproximar una función matemática a los valores originales de la distribución.

Page 5: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

5© Antonio Pajares Ruiz

2. REGRESIÓN LINEAL MÍNIMO-CUADRÁTICA.

*Y a b X= + ⋅*i iy a b x= + ⋅

*ij j ie y y= −

i 1, 2, ..., k=jy

j 1, 2, ..., m=errorde ajuste

x1 x2 x3 …

…y3

…y1

*12 1 2e y y= −

Page 6: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

6© Antonio Pajares Ruiz

2. REGRESIÓN LINEAL MÍNIMO-CUADRÁTICA.PARÁMETROS DEL MODELO

Consideraciones para estimar los parámetros

Posibles criterios para la estimación de los parámetros

1. Minimizar la suma de los errores cometidos:k m

ij iji 1 j 1

min e n= =

⋅∑∑2.Minimizar la suma de los errores absolutos cometidos:

k m

ij iji 1 j 1

min e n= =

⋅∑∑3.Minimizar la suma de los errores al cuadrado cometidos:

k m2ij ij

i 1 j 1

min e n= =

⋅∑∑

Interesa que los posibles errores que cometemos al tomar el valor ajustado en lugar del real sean lo más pequeños posibles.

Page 7: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

7© Antonio Pajares Ruiz

2. REGRESIÓN LINEAL MÍNIMO-CUADRÁTICA.

ESTIMACIÓN DE LOS PARÁMETROS DEL MODELO

Criterio para estimar los parámetros

Minimizar la suma de los errores al cuadrado cometidos al aproximar la variable Y por Y*, utilizando las condiciones de extremos.

ij j ie y a b x= − − ⋅

ij

k m2

iji 1 j 1

min e n= =

⋅∑∑ ij

k m2

iji 1 j 1

e nmin min ECM

N= =

⋅=

∑∑

k m2ij ij

j 1i=1

e n0

a=

⎛ ⎞∂ ⋅⎜ ⎟⎝ ⎠ =

∑∑k m

2ij ij

j 1i=1

e n0

b=

⎛ ⎞∂ ⋅⎜ ⎟⎝ ⎠ =

∑∑CONDICIONES DE EXTREMOS

Page 8: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

8© Antonio Pajares Ruiz

2. REGRESIÓN LINEAL MÍNIMO-CUADRÁTICA.

ESTIMACIÓN DE LOS PARÁMETROS DEL MODELO

k m2ij ij

j 1i=1

e n0

a=

⎛ ⎞∂ ⋅⎜ ⎟⎝ ⎠ =

∑∑

k m2ij ij

j 1i=1

e n0

b=

⎛ ⎞∂ ⋅⎜ ⎟⎝ ⎠ =

∑∑

( )k m

j i ijj 1i=1

2 y a b x n 0=

− − − ⋅ ⋅ =∑∑

( )k m

j i i ijj 1i=1

2 y a b x x n 0=

− − − ⋅ ⋅ ⋅ =∑∑

k m

ji iji=1 j=1

e n =0⋅∑∑k m

ij i iji=1 j=1

e x n =0⋅ ⋅∑∑SISTEMA DE ECUACIONES NORMALES

Page 9: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

9© Antonio Pajares Ruiz

2. REGRESIÓN LINEAL MÍNIMO-CUADRÁTICA.

ESTIMACIÓN DE LOS PARÁMETROS DEL MODELO

Operando en el sistema de ecuaciones normales obtenemos los valores estimados de los parámetros de la recta de regresión de Y sobre X:

xy2x

sb

s=

a y b x= − ⋅

Es el coeficiente de regresión o pendiente.Representa el incremento o disminución que se produce en la variable dependiente cuando la independiente aumenta en una unidad.

Es la ordenada en el origen.Representa el valor de la variable dependiente cuando la independiente toma el valor cero.

Page 10: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

10© Antonio Pajares Ruiz

2. REGRESIÓN LINEAL MÍNIMO-CUADRÁTICA.

ESTIMACIÓN DE LOS PARÁMETROS DEL MODELO

Propiedades básicas de la recta de regresión de Y sobre X

Siempre pasa por el punto medio de ambas variables.

Los cambios de origen en cualquiera de las variables modifican el coeficiente a, pero no el coeficiente b.

Un cambio de escala en la variable X modifica el coeficiente b, pero no el coeficiente a.

Un cambio de escala en la variable Y modifica ambos coeficientes.

Cuando las variables son independientes o, al menos, incorreladas, la recta de regresión de Y sobre X coincide con la media de Y.

Page 11: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

11© Antonio Pajares Ruiz

2. REGRESIÓN LINEAL MÍNIMO-CUADRÁTICA.RECTA DE REGRESIÓN DE X SOBRE Y

*X a' b ' Y= + ⋅*j jx a ' b ' y= + ⋅

' *ij i je x x= −

j 1, 2, ..., m=ix

i 1, 2, ..., k=errorde ajuste

( )ij

k m 2'

iji 1 j 1

min e n= =

⋅∑∑

( )ij

k m 2'

ijj 1i=1

'

e n0

a=

⎛ ⎞∂ ⋅⎜ ⎟⎝ ⎠ =

∑∑

( )ij

k m 2'

ijj 1i=1

'

e n0

b=

⎛ ⎞∂ ⋅⎜ ⎟⎝ ⎠ =

∑∑

xy'2y

sb

s=

' 'a x b y= − ⋅

Page 12: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

12© Antonio Pajares Ruiz

2. REGRESIÓN LINEAL MÍNIMO-CUADRÁTICA.

Propiedades generales de las rectas de regresión

Las rectas de regresión de Y sobre X y de X sobre Y se cortan necesariamente en el punto medio de ambas variables.

Los coeficientes de regresión b y b’ de las rectas de regresión tienen el mismo signo.

Cuando las variables son independientes o, al menos, incorreladas, la recta de regresión de Y sobre X es perpendicular a la de X sobre Y.

Page 13: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

13© Antonio Pajares Ruiz

Ej.: Para la distrib. conjunta de los 30 alumnos presentados a un examen de las variables “Calificación” (X) y “Nº de veces que se han matriculado en la disciplina” (Y), determinar la recta de regresión de Y sobre X.

304818-n.j

1213

753

xi\yj

715(6-8]1044(4-6]1339[2-4]ni.21X/Y

2. REGRESIÓN LINEAL MÍNIMO-CUADRÁTICA.

Para definir la recta de regresión de Y sobre X, es preciso concretar los valores de determinadas medidas de la distribución:

xy2x

sb

s= a y b x= − ⋅

2x x

x 4,6

s 2,51 s 1,58

=

= → = 2y y

y 1,53 v.

s 0,52 s 0,72 v.

=

= → =

xys = 0,08

Page 14: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

14© Antonio Pajares Ruiz

Ej.: Recta de regresión de Y sobre X para la distrib., definida sobre los 30 alumnos presentados a un examen, de las variables “Calificación” (X) y “Nº de veces que se han matriculado en la disciplina” (Y).

Recta de regresión de Y sobre X

Un incremento de un punto en la nota representaría un incremento en el número de veces que se matricula en la asignatura de 0,032.

2. REGRESIÓN LINEAL MÍNIMO-CUADRÁTICA.

Para una calificación en el examen de 0 puntos, se tiene que el alumno se habría matriculado 1,386 veces.

x 4,6= y 1,53 v.=2xs 2,51= xys 0,08=

xy2x

s 0,08b

s 2,51= = a y b x 1,53 0,032 4,6= − ⋅ = − ⋅

b 0,032=

a 1,386=

Page 15: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

15© Antonio Pajares Ruiz

Recta de regresión de Y sobre X

2. REGRESIÓN LINEAL MÍNIMO-CUADRÁTICA.

0 X

Y

3 5 7

1

2

3

Y * = 1 .1 3 6 + 0 .0 3 2 X

Ej.: Recta de regresión de Y sobre X para la distrib. definida sobre los 30 alumnos presentados a un examen, de las variables “Calificación” (X) y “Nº de veces que se han matriculado en la disciplina” (Y).

*Y 1,386 0,032 X= + ⋅

Page 16: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

16© Antonio Pajares Ruiz

2. REGRESIÓN LINEAL MÍNIMO-CUADRÁTICA.

BONDAD DEL AJUSTE

PrincipioLa bondad del ajuste vendrá derivada de la importancia de los errores estimados a partir de la recta definida, considerados como residuos.

1. Media de los residuos:

Posibles medidas para valorar la importancia de los residuos

*ij j i j ie y y y a b x= − = − − ⋅

k m

ij ijj 1i=1

e n

N=

⋅∑∑ Es igual a 0(1ª ecuación normal)

2. Media de los cuadrados de los residuos:

k m2ij ij

j 1i=1

e n

N=

⋅∑∑

Page 17: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

17© Antonio Pajares Ruiz

2. REGRESIÓN LINEAL MÍNIMO-CUADRÁTICA.

BONDAD DEL AJUSTE: VARIANZA RESIDUALk m

2ij ij

j 12 i 1r

e ns e

N==

⋅= −

∑∑

k m2ij ij

j 12 i 1r

e ns

N==

⋅=

∑∑

( )k m 2

j i ijj 12 i 1

r

y a b x ns

N==

− − ⋅ ⋅=

∑∑

e 0=

Interpretación de la varianza residual

Si es pequeña, el ajuste efectuado es adecuado.

Si es grande, el ajuste no seríaadecuado.

El valor mínimo de la varianza residual es cero, pero el máximo no está acotado.

Está afectada por las unidades de medida de la variable dependiente.

Page 18: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

18© Antonio Pajares Ruiz

2. REGRESIÓN LINEAL MÍNIMO-CUADRÁTICA.BONDAD DEL AJUSTE: VARIANZA RESIDUAL

*y y=

*2 2 2

xys b s= ⋅

*2 2 2y ry

s s s= +e 0=

Resultados a considerar para acotar la varianza residual

1. Varianza explicada por la regresión.

2. Varianza residual o no explicada por la regresión.

Descomposición de la varianza

2 2r y0 s s≤ ≤

1. Mínimo: Variables incorreladas

Valores extremos de la varianza explicada

2. Máximo: Varianza residual nula

*y y=

ije 0; i= ∀

2 2r ys s=

*2 2y y

s s=

Otra forma de calcular la varianza residual:

( )2 2 2r y xys s 1 r= ⋅ −

Page 19: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

19© Antonio Pajares Ruiz

2. REGRESIÓN LINEAL MÍNIMO-CUADRÁTICA.BONDAD DEL AJUSTE: VARIANZA RESIDUAL

Ej.: Determinar la varianza residual para el ajuste lineal de Y sobre X para la distribución de las variables “Altura en cm.” (X) y “Nº de zapato que usa habitualmente” (Y) definida sobre 10 alumnos.

45191431884418442179431764017441169411674016640163yixi

6,109041941917570,3430,58644,414451910,848-0,92143,921431880,5420,73643,264441840,196-0,44242,442421791,1041,05141,949431762,627-1,62141,621401740,0400,20140,799411690,2800,53040,470411670,094-0,30640,306401660,0350,18739,81340163

ei2eiyi

*yixi

Total

*Y 13,029 + 0,164 X= ⋅

N2i

2 i 1r

e6,109

sN 10

== =∑

2rs 0,611=

Page 20: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

20© Antonio Pajares Ruiz

2. REGRESIÓN LINEAL MÍNIMO-CUADRÁTICA.

BONDAD DEL AJUSTE: VARIANZA RESIDUAL

Ej.: Descomposición de la varianza total para el ajuste lineal de Y sobre X en la distrib. de las variables “Altura en cm.” (X) y “Nº de zapato que usa habitualmente” (Y) definida sobre 10 alumnos.

( )( )*

N 2*i 22 *i=1

Y

ys y

N= −∑

*

22Y

17578,891 419s

10 10⎛ ⎞= − ⎜ ⎟⎝ ⎠

2ys 2,890=

*2Y

s 2,279=

2rs 0,611=

*2 2 2y ry

s s s= + 2,890 2,279 0,661= +

*2Y

s 2,279= ( )2 2 2r y XYs s 1 r= ⋅ −

( )22,89 1 0,888 ⋅ −

2rs 0,611=

Page 21: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

21© Antonio Pajares Ruiz

2. REGRESIÓN LINEAL MÍNIMO-CUADRÁTICA.

BONDAD DEL AJUSTE: COEFICIENTE DE DETERMINACIÓNConcepto

Es la proporción de la varianza total que es explicada por la recta de regresión mínimo cuadrática.

*2y22y

sR

s=

( )2 2y xy2

2y

s 1 rR 1

s

⋅ −= −

22 r

2y

s1R

s= − 2 2

xyR r=

20 R 1≤ ≤

Propiedades básicas

1. Está acotada:

2. Sus valores extremos:

Minimo: var. incorreladas

*y y= 2R 0=

Máx: varianza residual nula

ije 0; i= ∀ 2R 1=3. No depende de las unidades de

medida en las que se expresen ambas variables.

Page 22: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

22© Antonio Pajares Ruiz

2. REGRESIÓN LINEAL MÍNIMO-CUADRÁTICA.

BONDAD DEL AJUSTE: COEFICIENTE DE DETERMINACIÓNEj.: Determinación del coeficiente de determinación para el ajuste lineal de Y sobre X en la distribución de las variables “Altura en cm.” (X) y “Nº de zapato que usa habitualmente” (Y) definida sobre 10 alumnos.

2 2xyR r= 2 2R 0,888= 2R 0,789=

2ys 2,890= 2

rs 0,611=*2Y

s 2,279=

*2y22y

sR

s=

22 r

2y

s1R

s= −

2 2,279R

2,890=

2 0,6111R

2,890= −

2R 0,789=

2R 0,789=

Conclusión

El 78,9% de la varianza de Y es explicada por la recta de regresión de Y sobre X

Page 23: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

23© Antonio Pajares Ruiz

2. REGRESIÓN LINEAL MÍNIMO-CUADRÁTICA.BONDAD DEL AJUSTE

(RECTA DE REGRESIÓN DE X SOBRE Y)

( )( )

k m 2'ijij2 j 1' i 1

r

e ns

N==

⋅=

∑∑( )

( )k m 2' '

i j ij2 j 1' i 1

r

x a b y ns

N==

− − ⋅ ⋅=

∑∑

( )*

22 2 'x x r

s s s= +

( ) ( )2' 2 2x xyr

s s 1 r= ⋅ −

( )( )2'

2 2 2rxy2

x

s1 r RR'

s= − = =

Page 24: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

24© Antonio Pajares Ruiz

2. REGRESIÓN LINEAL MÍNIMO-CUADRÁTICA.

BONDAD DEL AJUSTE(RECTA DE REGRESIÓN DE X SOBRE Y)

Relación del coeficiente de determinacióncon los parámetros de la recta

xy2x

sb

s=

xy'2y

sb

s=

2xy22

xy 2 2x y

srR

s s= =

⋅xy xy22 2x y

s sR

s s= ⋅

'2 b bR = ⋅ 'xyr b b= ± ⋅

Page 25: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

25© Antonio Pajares Ruiz

2. REGRESIÓN LINEAL MÍNIMO-CUADRÁTICA.BONDAD DEL AJUSTE

CONCLUSIONES

El producto entre los coeficientes de regresión b y b’ coincide con el valor del coeficiente de determinación.

La raíz cuadrada positiva del producto entre los coeficientes b y b’

coincide con el valor absoluto del coeficiente de correlación.

Los valores de las varianzas residuales de las regresiones lineales de Y sobre X, y de X sobre Y, son distintos, salvo que coincidan los correspondientes a las varianzas de las variables.

El coeficiente de determinación es único para las dos rectas., esto es, la proporción de varianza total de la variable dependiente explicada por la recta de regresión mínimo cuadrática es la misma, ya sea en la regresión de Y sobre X o en la de X sobre Y.

Page 26: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

26© Antonio Pajares Ruiz

2. REGRESIÓN LINEAL MÍNIMO-CUADRÁTICA.

BONDAD DEL AJUSTE

INTERPRETACIONES SOBRE R2 y r

a) R2=1⇒ La varianza total coincide con la varianza explicadaLas rectas de regresión de Y sobre X y de X sobre Y son coincidentesEl ajuste lineal es perfectoPosibles relaciones:r = 1: Relación lineal directa y perfecta entre X e Yr = - 1: Relación lineal inversa y perfecta entre X e Y

b) R2=0⇒ La varianza explicada es nulaLas rectas de regresión de Y sobre X y de X sobre Y son perpendiculares entre siEl coeficiente r es nulo y las variables están incorreladas

Page 27: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

27© Antonio Pajares Ruiz

2. REGRESIÓN LINEAL MÍNIMO-CUADRÁTICA.

BONDAD DEL AJUSTE

INTERPRETACIONES SOBRE R2 y r

c) 0<R2<1⇒ La varianza explicada es menor que la varianza total

Las rectas de Y sobre X y de X sobre Y se cortan en el punto medio de X e Y

Posibles relaciones:0<r<1: Relación lineal directa entre X e Y-1<r<0: Relación lineal inversa entre X e Y

Page 28: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

28© Antonio Pajares Ruiz

Planteamiento

A partir de la representación gráfica de la distribución o de la relación matemática de la evolución de las variables se intuye otro tipo de relación distinta a la lineal.

FUNCIÓN EXPONENCIAL

3. REGRESIÓN NO LINEAL.

ALGUNAS POSIBLES FUNCIONES

FUNCIÓN POTENCIAL

* XY A B= ⋅*Ln Y Ln A Ln B X= + ⋅

*V a b U= + ⋅

aA e=bB e=

Linealización

* BY A X= ⋅*Ln Y Ln A B Ln X= + ⋅

*V a b U= + ⋅

aA e=B b=

Linealización

Page 29: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

29© Antonio Pajares Ruiz

4. PREDICCIÓN Y ELASTICIDAD.TASAS DE VARIACIÓN

PARA LA REGRESIÓN DE Y SOBRE Xa) Tasa de variación absoluta.-

Variación de Y cuando X se incrementa en una unidad.

b) Tasa de variación relativa.-Variación relativa de Y cuando X se incrementa en una unidad.

*d Yd X

*Ej. : Y a b X= + ⋅*d Y

bd X

=

*

*

d Y 1d X Y

⋅ *Ej. : Y a b X= + ⋅*

*

d Y 1 1b

d X Y a b X⋅ = ⋅

+ ⋅* XEj. : Y A B= ⋅

*a b X

* a b X

d Y 1 1b e b

d X Y e+ ⋅

+ ⋅⋅ = ⋅ =

*Ln Y a b X= + ⋅

* a b XY e + ⋅=

Page 30: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

30© Antonio Pajares Ruiz

4. PREDICCIÓN Y ELASTICIDAD.TASAS DE VARIACIÓN

PARA LA REGRESIÓN DE Y SOBRE Xc) Elasticidad.-

Variación relativa de la variable dependiente como consecuencia de un incremento relativo unitario de la independiente.

*

*

*Y / X

d Y XE

d X Y= ⋅

*Ej. : Y a b X= + ⋅ *

*

*Y / X

d Y X XE b

d X Y a b X= ⋅ = ⋅

+ ⋅* BEj. : Y A X= ⋅

*

*a b Ln X

* a b Ln XY / X

d Y X 1 XE b e b

d X Y X e+ ⋅

+ ⋅= ⋅ = ⋅ ⋅ =

*Ln Y Ln A B Ln X a b Ln X= + ⋅ = + ⋅

* a b Ln XY e + ⋅=

Page 31: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

31© Antonio Pajares Ruiz

4. PREDICCIÓN Y ELASTICIDAD.TASAS DE VARIACIÓN

PARA LA REGRESIÓN DE Y SOBRE XEj.: Para el ajuste lineal de Y sobre X en la distrib. de las variables “Altura en cm.” (X) y “Nº de zapato que usa habitualmente” (Y) definida sobre 10 alumnos, determinar la variación relativa que se produce en la variable Y cuando consideramos un incremento del 1% en la altura, para un valor de ésta igual a 169 cm.

Ej. :13,029 + 0,164 X⋅

*

*i i*Y /X 169i i

x xdYE b

dX y a bx== ⋅ = ⋅

+

*Y /X 169

169E 0,164 0,680

13,029 0,164 169=== ⋅ =

+ ⋅Si se incrementa un 1% la altura, para un valor de ésta igual a 169 cm., el número de zapato se incrementaría en un 0’680%.

Page 32: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

32© Antonio Pajares Ruiz

4. PREDICCIÓN Y ELASTICIDAD.

PREDICCIÓN PARA LA REGRESIÓN DE Y SOBRE XConcepto

Se trata de especificar el posible valor que tomaría la variabledependiente Y cuando la independiente tomase uno en concreto, considerando la función ajustada.

1. Predicción por interpolación:El valor xp de la variable X que se utiliza para predecir es un valor perteneciente al recorrido de la misma, sea o no sea un valor observado.

2. Predicción por extrapolación:El valor xp de la variable X que se utiliza para predecir no está incluido en el recorrido de la misma.

TIPOS DE PREDICCIÓN

*p p py y e= + ( )*

p py f x=

Page 33: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

33© Antonio Pajares Ruiz

4. PREDICCIÓN Y ELASTICIDAD.

PREDICCIÓN PARA LA REGRESIÓN DE Y SOBRE X

Consideraciones a tener en cuenta:

Bondad del ajuste.

Características derivadas de la naturaleza de las variables.

Lejanía de los valores del recorrido.

Indicios o señales.

BONDAD DE LA PREDICCIÓN

Page 34: ESTADÍSTICA (GRUPO 129Conjunto de técnicas estadístico-matemáticas que permiten: ¾Explicitar la relación matemática que liga las dos variables ¾Ofrecer un valor aproximado

34© Antonio Pajares Ruiz

4. PREDICCIÓN Y ELASTICIDAD.PREDICCIÓN PARA LA REGRESIÓN DE Y SOBRE X

Ej.: Para el ajuste lineal de Y sobre X en la distribución de frecuencias conjunta de las variables X (edad en años) e Y (número de horas que dedican semanalmente al estudio) referidas a 70 alumnos, predecir el número de horas que dedica semanalmente al estudio un alumno de 23 años, siendo los valores extremos de la edad, para esa distribución, los 18 y 25 años.

Se trata de una predicción aceptable.

Ej.: Para los mismos datos, realizar la predicción para un alumno de 30 años.

Recta de regresión de Y sobre X: *Y 129,887 5,455 X= − ⋅2R 0,838=

Predicción: ( )Y X 23 129,887 5,455 23 4,422 horas= = − ⋅ =

( )Y X 30 129,887 5,455 30 33,763 horas= = − ⋅ = −Se trata de una predicción mala.