Estadística Descriptiva y Analisis de Datos con la Hoja de Cálculo Excel
Regresión mínimo cuadrada (II)
Problemas con los errores
• Violación de las hipótesis sobre los errores
• Heterocedasticidad• Autocorrelación
Heterocedasticidad
Residu o s con hetero ced astic idad
0
5 00
10 00
15 00
20 00
25 00
30 00
35 00
0 200 400 600 800 10 00
Re siduo s valor ab so lu to (e)
Va
ria
ble
es
tim
ad
a (
y)
Test para detectar la Heterocedasticidad
• Test de Bartlett• Test de Goldfeld-Quandt• Test de White
Autocorrelación
Residuos con problema de autocorrelación
-1000
-500
0
500
1000
1940 1950 1960 1970 1980 1990 2000 2010
Test de Durbin-Watson
ttt uee += −1ˆ·ˆ ρ
∑
∑
=
=−−
=n
tt
n
ttt
e
eed
1
2
2
21
ˆ
)ˆˆ(
El valor de estadístico d oscila entre 0 y 4, valores cercanos 2 indican ausencia de autocorrelación.
Ejemplo 5.2
Consumo de Energía Eléctrica(miles de TEP)
PIB(millones de euros)
1987 9427 35531219889876 3734121989 10410 3914431990 10974 406252199111372 4165821992 11488 420462199311569 4161261994 11999 426041199512462 437787199612827 4484571997 13331 466513199814290 4867851999 15364 507346200016309 5287142001 17282 5437462002 17756 554852
Estimación MCO. Ejemplo 5.2
Estadísticas de la regresiónCoeficiente de correlación múltiple 0.99619699Coeficiente de determinación R2 0.99240844R2 ajustado 0.99186619Error típico 233.805853Observaciones 16
Coeficientes Error típico Estadístico t ProbabilidadIntercepción -6234.453 451.562 -13.806 0.000PIB-$ 0.043 0.001 42.780 0.000
Errores Ejemplo 5.2
Grafico de los residuos
-400,0-300,0
-200,0
-100,0
0,0
100,0
200,0
300,0
400,0
500,0600,0
1986 1988 1990 1992 1994 1996 1998 2000 2002 2004
Calculo estadístico. Ejemplo 5.2
Y* e t et2 et-et-1 (et-et-1)
2
1987 8933 494.2 354817.81988 9705 170.5 373241.5 -323.6 104742.41989 10475 -65.2 391508.2 -235.7 55551.61990 11107 -133.3 406385.3 -68.2 4645.21991 11548 -176.3 416758.3 -43.0 1845.51992 11714 -225.9 420687.9 -49.6 2462.81993 11529 40.2 416085.8 266.1 70804.91994 11952 46.9 425994.1 6.8 45.61995 12453 8.5 437778.5 -38.4 1474.91996 12909 -81.9 448538.9 -90.5 8185.41997 13680 -348.7 466861.7 -266.8 71161.51998 14545 -255.1 487040.1 93.6 8769.21999 15423 -58.8 507404.8 196.3 38536.62000 16335 -25.9 528739.9 32.9 1079.72001 16977 305.4 543440.6 331.3 109776.42002 17451 305.3 554546.7 -0.1 0.0Total 0.0 7179830.0 -188.8 479081.7
0667.00.830,179,7
7.081,479
ˆ
)ˆˆ(
1
2
2
21
==−
=∑
∑
=
=−
n
ii
n
iii
e
eed
Regla de decisión
• Si d ≤ di rechazamos la hipótesis nula de no autocorrelación frente a la hipótesis alternativa de autocorrelación positiva.
• Si d ≥ 4 – di rechazamos la hipótesis nula de no autocorrelación frente a la hipótesis alternativa de autocorrelación negativa.
• Si ds ≤ d ≤ 4- ds aceptamos la hipótesis nula de no autocorrelación.
• Los valores teóricos del estadístico para n=16 observaciones y k=1 variables explicativas, son dD=0.98 y dU=1.24. Dado 0.0667 < 0.98 no podemos rechazar la hipótesis de existencia de autocorrelación positiva.
Regresión Lineal Múltiple: forma matricial del modelo
MCO
tktktt eXXXeXY ++++=+= ββββ ...· 2211
=
nY
Y
Y
Y...
2
1
[ ]k21
21
22221
11211
X ...X X
...
............
...
...
=
=
nknn
k
k
XXX
XXX
XXX
X
=
Kβ
ββ
β...
2
1
=
ne
e
e
e...
2
1
Solución matricial MCO
YXXX ')'(ˆ 1−=β
=
∑∑∑
∑∑∑
∑∑∑
===
===
===
n
iik
n
iiik
ii
n
iiki
n
ii
n
iii
n
iiki
n
iii
n
ii
XXXX
XXXXX
XXXXX
XX
1
2
12
n
11ik
12
1
22
112
11
121
1
21
...X
..................
...
...
'
=
∑
∑
∑
=
=
=
n
iiik
n
iii
n
iii
YX
YX
YX
YX
1
12
11
....
`
Con término independiente
=
∑∑∑
∑∑∑
∑∑
===
===
==
n
iik
n
iiik
iik
n
iiki
n
ii
n
ii
n
iik
n
ii
XXX
XXXX
XXn
XX
1
2
12
n
1
11
1
21
11
111
...X
..................
...
...
'
=
∑
∑
∑
=
=
=
n
iiik
n
iii
n
ii
YX
YX
Y
YX
1
11
1
....
`
Problema de las estimaciones del modelo lineal múltiple:
multicolinealidad
• Matriz (X’X) no invertible porque su determinante es cero ó próximo a cero
• Ocurre por que existe alguna combinación lineal entre las variables dependientes (Xk)
Funciones que se pueden estimar por MCO
• Funciones que se transforman en ecuaciones lineales.
• Funciones con variables explicativas cualitativas.
• Funciones con variables endogenascualitativas: modelos logit y probit.
Funciones q ue se pueden estimar por MCO mediante
transformaciones
• Función polinómica• Función potencial• Función exponencial• Función logaritmica tt XbaY log+=
tXt abY =
btt aXY =
ktkttt XXXY ββββ ++++= ...2
210
Variable cualitativa como explicativa
• Las variables cualitativas expresan cualidades o atributos de los agentes o individuos (sexo, religión, nacionalidad, nivel de estudios, etc.) y también recogen acontecimientos extraordinarios como guerras, terremotos, climatologías adversas, huelgas, etc.
• Toman valores según atributos. Varón=1, Mujer=0 . mes de Huelga=1, Mes sin huelga=0.
• También pueden utilizarse para tratar los cambios estacionales.• Hay que tener cuidado con la multicolinealidad
Cualitativa para modelizarestacionalidad (I)
Año Q Demanda de Electricidad (GWh)PIB (millones de euros)1S 2S 3S1996 1 40919 109275 1 0 0
2 37275 111875 0 1 03 38070 111211 0 0 14 39981 116096 0 0 0
1997 1 40246 113396 1 0 02 39070 115566 0 1 03 40464 115744 0 0 14 42602 121807 0 0 0
1998 1 43263 118399 1 0 02 41535 120735 0 1 03 43273 121472 0 0 14 45010 126179 0 0 0
Cualitativa para modelizarestacionalidad (II)
3S 2S 1S PIB cteβ 1066,059923 -996,2154378 3087,378754 0,554750757 -24706,01664
σβ 434,268651 432,1741601 439,4452975 0,014926114 1999,126408
R2 0,981770046 854,4242183 #N/A #N/A #N/AF 363,5197257 27 #N/A #N/A #N/A
Modelos Logit/Probit
• La variable dependiente es dicotómica (toma valores 0 y 1)
• Los errores no siguen la distribución binomial
• Para que las predicciones estén en el intervalo (0,1) hay que utilizar la funciones acotadas como son la distribución normal o logística para obtener prediciones para la variable dependiente.