1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.
-
Upload
eugenio-gaona -
Category
Documents
-
view
265 -
download
0
Transcript of 1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.
![Page 1: 1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.](https://reader033.fdocuments.co/reader033/viewer/2022061517/5665b4441a28abb57c909023/html5/thumbnails/1.jpg)
1
Pronósticos, Series de Tiempo y Regresión
Capítulo 3: Regresión Lineal Simple
![Page 2: 1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.](https://reader033.fdocuments.co/reader033/viewer/2022061517/5665b4441a28abb57c909023/html5/thumbnails/2.jpg)
2
Temas
Modelo de Regresión Lineal Simple Estimaciones puntuales de los mínimos
cuadrados Estimaciones puntuales y predicciones
puntuales Suposiciones del modelo y el error estándar Prueba de la significancia de la pendiente y la
ordenada al origen Intervalos de confianza y de predicción Coeficientes de determinación y correlación
simples Una prueba F para el modelo
![Page 3: 1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.](https://reader033.fdocuments.co/reader033/viewer/2022061517/5665b4441a28abb57c909023/html5/thumbnails/3.jpg)
3
Modelo de Regresión Lineal Simple
Supuesto básico: la relación entre la variable dependiente (y) y la variable independiente (x) es aproximadamente una linea recta.
![Page 4: 1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.](https://reader033.fdocuments.co/reader033/viewer/2022061517/5665b4441a28abb57c909023/html5/thumbnails/4.jpg)
4
Modelo de Regresión Lineal Simple
Consumo de combustible según temperatura
28.00, 11.7032.50, 12.40
39.00, 10.80
45.90, 9.40 57.80, 9.50
62.50, 7.50
28.00, 12.40
58.10, 8.00
0.00
2.00
4.00
6.00
8.00
10.00
12.00
14.00
0.00 10.00 20.00 30.00 40.00 50.00 60.00 70.00
Temperatura media por hora (Fahrenheit)
Co
nsu
mo
de
com
bu
stib
le (
ton
elad
as
po
r se
man
a)
Diagramade
dispersión
![Page 5: 1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.](https://reader033.fdocuments.co/reader033/viewer/2022061517/5665b4441a28abb57c909023/html5/thumbnails/5.jpg)
5
Modelo de Regresión Lineal Simple
Consumo de combustible según temperatura
28.00, 11.7032.50, 12.40
39.00, 10.80
45.90, 9.40 57.80, 9.50
62.50, 7.50
28.00, 12.40
58.10, 8.00
0.00
2.00
4.00
6.00
8.00
10.00
12.00
14.00
0.00 10.00 20.00 30.00 40.00 50.00 60.00 70.00
Temperatura media por hora (Fahrenheit)
Co
nsu
mo
de
com
bu
stib
le (
ton
elad
as
po
r se
man
a)
Diagramade
dispersión
observamos: - tendencia negativa- puntos dispersados alrededor de la línea
![Page 6: 1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.](https://reader033.fdocuments.co/reader033/viewer/2022061517/5665b4441a28abb57c909023/html5/thumbnails/6.jpg)
6
Modelo de Regresión Lineal Simple
y = μy|x + = β0 + β1x + Donde
μy|x = β0 + β1x es el valor medio de la variable dependiente y
cuando el valor de la variable independiente es x.
β0 = ordenada al origen (valor medio de y cuando x = 0)
β1 = pendiente ( valor medio de y cuando x una unidad)
es un término de error: describe los efectos de todos los factores no incluidos en el modelo
![Page 7: 1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.](https://reader033.fdocuments.co/reader033/viewer/2022061517/5665b4441a28abb57c909023/html5/thumbnails/7.jpg)
7
Modelo de Regresión Lineal Simple
Si β0 = 15.77 y β1 = -0.1281, entonces cuando la temperatura x = 28, el valor medio de consumo de combustible que observamos es
μy|x = β0 + β1x = 15.77 – 0.1281(28)
= 12.1832 MMcf de gas natural.
![Page 8: 1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.](https://reader033.fdocuments.co/reader033/viewer/2022061517/5665b4441a28abb57c909023/html5/thumbnails/8.jpg)
8
Modelo de Regresión Lineal Simple
Si β0 = 15.77 y β1 = -0.1281, entonces cuando la temperatura x = 29, el valor medio de consumo de combustible que observamos es
μy|x = β0 + β1x = 15.77 – 0.1281(29)
= 12.0551 MMcf de gas natural.
La diferencia = 12.0551 - 12.1832 = -0.1281
![Page 9: 1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.](https://reader033.fdocuments.co/reader033/viewer/2022061517/5665b4441a28abb57c909023/html5/thumbnails/9.jpg)
9
Modelo de Regresión Lineal Simple β0 y β1 se llaman parámetros de regresión. Ya que no conocemos los valores reales de
β0 y β1 , debemos estimarlos con los datos de la muestra.
(Nota: la interpretación de β0 a veces no es aplicable.)
Importante: observamos que estas variables se mueven juntas, mas no podemos deducir una relación causa-efecto.
![Page 10: 1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.](https://reader033.fdocuments.co/reader033/viewer/2022061517/5665b4441a28abb57c909023/html5/thumbnails/10.jpg)
10
Estimaciones puntuales de los mínimos cuadrados estimación puntual de los mínimos cuadrados de la
pendiente β1
n
xxxSS
yn
yxyxyyxxSS
donde
SS
SSb
iixx
iiiiiixy
xx
xy
2
2
1
![Page 11: 1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.](https://reader033.fdocuments.co/reader033/viewer/2022061517/5665b4441a28abb57c909023/html5/thumbnails/11.jpg)
11
Estimaciones puntuales y predicciones puntuales Estimación puntual del valor medio de la
variable dependiente cuando el valor de la variable independiente es x0
se predice = 0
010ˆ xbby
![Page 12: 1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.](https://reader033.fdocuments.co/reader033/viewer/2022061517/5665b4441a28abb57c909023/html5/thumbnails/12.jpg)
12
Estimaciones puntuales y predicciones puntuales Se puede demostrar que estas estimaciones
puntuales dan un valor de la suma de los residuos cuadráticos (SSE) que es menor que la que se obtiene con cualesquiera otros valores de b0 y b1. Se les llaman estimaciones puntuales de los mínimos cuadrados.
la recta se llama recta de regresión de mínimos cuadrados
la ecuación se llama ecuación de prediccción de mínimos cuadrados.
![Page 13: 1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.](https://reader033.fdocuments.co/reader033/viewer/2022061517/5665b4441a28abb57c909023/html5/thumbnails/13.jpg)
13
Suposiciones del modelo y el error estándar Suposiciones
1. A cualquier valor dado de x, la media de la población de los valores potenciales del término error es igual a cero.
2. Suposición de la varianza constante. A cualquier valor dado de x, tiene una varianza que no depende del valor de x.
3. Suposición de la normalidad. A cualquier valor dado de x, tiene una distribución normal.
4. Suposición de la independencia. Cualquier valor del término error es estadísticamente independiente de cualquier otro valor de .
![Page 14: 1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.](https://reader033.fdocuments.co/reader033/viewer/2022061517/5665b4441a28abb57c909023/html5/thumbnails/14.jpg)
14
Suposiciones del modelo y el error estándar En otras palabras,
dado un valor de x, la población de valores potenciales del término de error tiene una distribución normal, con valor medio 0 y varianza σ2 que no depende de x.
La población de valores potenciales de y|x tiene distribución normal con valor medio de β0 + β1x y varianza σ2 que no depende de x.
Es más probable que la suposición de independencia se viole cuando se utilizan series temporales en un estudio de regresión.
![Page 15: 1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.](https://reader033.fdocuments.co/reader033/viewer/2022061517/5665b4441a28abb57c909023/html5/thumbnails/15.jpg)
15
Suposiciones del modelo y el error estándar Error cuadrático medio = estimación puntual
de σ2
error estándar = estimación puntual de σ
22
n
SSEs
2n
SSEs
n
i
n
i
n
i
n
iiiiiii yxbybyyySSE
1 1 1 110
22ˆ
vary|x
![Page 16: 1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.](https://reader033.fdocuments.co/reader033/viewer/2022061517/5665b4441a28abb57c909023/html5/thumbnails/16.jpg)
16
Prueba de la significancia de la pendiente y la ordenada al origen
Hipótesis nula: β1 = 0
nivel de significancia α (0.10, 0.05, 0.01) los valores p se basan en n-2 grados de
libertad Se rechaza la hipótesis nula si se
cumple la condición de punto de rechazo de alguna de las hipótesis alternativas, o si p < α
![Page 17: 1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.](https://reader033.fdocuments.co/reader033/viewer/2022061517/5665b4441a28abb57c909023/html5/thumbnails/17.jpg)
17
Prueba de la significancia de la pendiente y la ordenada al origen
Si se cumplen los supuestos de la regresión, entonces la población de todos los valores posibles de b1 es normalmente distribuida con valor medio β1 y desviación estándar
cuya estimación puntual es
xx
bSS
1
xx
bSS
ss 1
![Page 18: 1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.](https://reader033.fdocuments.co/reader033/viewer/2022061517/5665b4441a28abb57c909023/html5/thumbnails/18.jpg)
18
Prueba de la significancia de la pendiente y la ordenada al origen
y la población de todos los valores posibles de la estadística de prueba t
tiene una distribución t con n – 2 grados de libertad.
1
1
bs
bt
![Page 19: 1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.](https://reader033.fdocuments.co/reader033/viewer/2022061517/5665b4441a28abb57c909023/html5/thumbnails/19.jpg)
19
Prueba de la significancia de la pendiente y la ordenada al origen
Hipótesis alternativa
Condición de punto de rechazo
Valor p
Ha : β1 ≠ 0 2 (área bajo la curva t a la derecha de |t|)
Ha : β1 > 0 área bajo la curva t a la derecha de t
Ha : β1 < 0 área bajo la curva t a la izquierda de t
)2(2/|| ntt
2 ntt
2 ntt
![Page 20: 1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.](https://reader033.fdocuments.co/reader033/viewer/2022061517/5665b4441a28abb57c909023/html5/thumbnails/20.jpg)
20
Intervalos de confianza y de predicción
Si se cumplen las suposiciones de la regresión, un intervalo de confianza de 100(1-α)% para la pendiente verdadera β1 es
1
22/1 b
n stb
![Page 21: 1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.](https://reader033.fdocuments.co/reader033/viewer/2022061517/5665b4441a28abb57c909023/html5/thumbnails/21.jpg)
21
Intervalos de confianza y de predicción
Si se cumplen las suposiciones de la regresión, un valor de distancia (v.d.) para un valor particular x0 de x (para la regresión lineal simple) es
xxSS
xx
ndv
201
..
![Page 22: 1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.](https://reader033.fdocuments.co/reader033/viewer/2022061517/5665b4441a28abb57c909023/html5/thumbnails/22.jpg)
22
Intervalos de confianza y de predicción
Si se cumplen las suposiciones de la regresión, un intervalo de confianza de 100(1-α)% para el valor medio de y cuando la variable independiente es x0 es
..ˆ 22/ dvsty n
![Page 23: 1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.](https://reader033.fdocuments.co/reader033/viewer/2022061517/5665b4441a28abb57c909023/html5/thumbnails/23.jpg)
23
Intervalos de confianza y de predicción La población de todos los errores
posibles de predicción está normalmente distribuida con media cero y desviación estándar
σ√1 + valor de distancia La estimación puntual es
s√1 + valor de distanciaSe llama error estándar del error de
predicción
![Page 24: 1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.](https://reader033.fdocuments.co/reader033/viewer/2022061517/5665b4441a28abb57c909023/html5/thumbnails/24.jpg)
24
Intervalos de confianza y de predicción Si se cumplen las suposiciones de la
regresión, un intervalo de predicción 100(1-α)% para un valor individual de y cuando la variable independiente es x0 es
..1ˆ 22/ dvsty n
![Page 25: 1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.](https://reader033.fdocuments.co/reader033/viewer/2022061517/5665b4441a28abb57c909023/html5/thumbnails/25.jpg)
25
Intervalos de confianza y de predicción
Nótese que el intervalo de predicción es mayor que el intervalo de confianza: mayor incertidumbre acerca del término de error.
Entre más alejado del valor medio es xi, mayores son los intervalos de confianza y de predicción.
![Page 26: 1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.](https://reader033.fdocuments.co/reader033/viewer/2022061517/5665b4441a28abb57c909023/html5/thumbnails/26.jpg)
26
Coeficientes de determinación y correlación simples En el caso del modelo de regresión lineal simple,
1. Variación total = Σ(yi-y)2
2. Variación explicada = Σ(yi-y)2
3. Variación inexplicada = Σ(yi-yi)2
4. Variación total = Variación explicada + Variación inexplicada
5. El coeficiente de determinación simple es
r2 = (variación explicada)/(variación total)
6. El r2 es la proporción de la variación total en los n valores observados de la variable dependiente que explica el modelo de regresión lineal simple
![Page 27: 1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.](https://reader033.fdocuments.co/reader033/viewer/2022061517/5665b4441a28abb57c909023/html5/thumbnails/27.jpg)
27
Coeficientes de determinación y correlación simples
Coeficiente de correlación simple (r) entre y y x
si b1 > 0
si b1 < 0
donde b1 es la pendiente de la recta de mínimos cuadrados que relaciona y con x. Este coeficiente de correlación mide la fuerza de la relación lineal entre y y x.
2
2
rr
rr
![Page 28: 1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.](https://reader033.fdocuments.co/reader033/viewer/2022061517/5665b4441a28abb57c909023/html5/thumbnails/28.jpg)
28
Coeficientes de determinación y correlación simples
También se puede calcular mediante la fórmula
yyxx
xy
SSSS
SSr
![Page 29: 1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.](https://reader033.fdocuments.co/reader033/viewer/2022061517/5665b4441a28abb57c909023/html5/thumbnails/29.jpg)
29
Coeficientes de determinación y correlación simples
La correlación de la población de todas las combinaciones posibles de valores observados de x e y se denomina ρ
Para probar la hipótesis nula H0: ρ = 0, utilizamos la estadística de prueba
21
2
r
nrt
![Page 30: 1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.](https://reader033.fdocuments.co/reader033/viewer/2022061517/5665b4441a28abb57c909023/html5/thumbnails/30.jpg)
30
Una prueba F para el modelo
estadística F global
F(modelo) = Variación inexplicada(Variación explicada)/(n-2)
Podemos rechazar H0:β1=0 y aceptar Ha: β1≠0 en el nivel de
significancia α si se cumple alguna de:
F(modelo)>F[α]
Valor p < α
En el punto F[α] se basa en 1 grado de libertad para el
numerador y n-2 grados de libertad para el denominador.