Este material docente se distribuye bajo la Creative Commons Attribution-Share Alike 30 Spain Para ver una copia de esta licencia visite httpcreativecommons
orglicensesby-sa30es
Tabla de Contenido
1 Regresion Lineal por Mınimos Cuadrados Ordinarios (MCO) 4
11 Introduccion 4
12 Algunos casos particulares 18
2 Propiedades algebraicas de la estimacion MCO 27
21 Propiedades basicas 27
22 Medidas de ajuste 32
Apendices 42
1 Derivacion tradicional de las Ecuaciones Normales 43
Bibliografıa 45
Transparencias 45
1 Regresion Lineal por Mınimos Cuadrados Ordinarios (MCO)
Capıtulos 2 y 3 de Wooldridge (2006)
Apendice E1 de Wooldridge (2006)
11 Introduccion
uArr Relacionar una variables con otras puede mejorar la comprension 1
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd =[1 rd
] [β1β2
]Aquı llamamos
regresando (o variable a explicar) al vector de datos de consumo con
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd =[1 rd
] [β1β2
]Aquı llamamos
regresando (o variable a explicar) al vector de datos de consumo con
regresores (o variables explicativas) al vector de unos (1) junto al vector de
datos de renta disponible (rd) [1 rd
]= X
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd =[1 rd
] [β1β2
]Aquı llamamos
regresando (o variable a explicar) al vector de datos de consumo con
regresores (o variables explicativas) al vector de unos (1) junto al vector de
datos de renta disponible (rd) [1 rd
]= X
vector de parametros a
β =
[β1β2
]
Ejemplo 2 [precio de las viviendas]
EjPviviendainp Gretl
Suponga que dispone de los siguientes datos
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ejemplo 2 [precio de las viviendas]
EjPviviendainp Gretl
Suponga que dispone de los siguientes datos
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ejemplo 2 [precio de las viviendas]
EjPviviendainp Gretl
Suponga que dispone de los siguientes datos
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ası
y= β1 middot 1 + β2 middot x
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
=
1 1065
1 1254
1 1300
1 1577
1 1600
1 1750
1 1800
1 1870
1 1935
1 1948
1 2254
1 2600
1 2800
1 3000
[β1
β2
]= Xβ
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
=
1 1065
1 1254
1 1300
1 1577
1 1600
1 1750
1 1800
1 1870
1 1935
1 1948
1 2254
1 2600
1 2800
1 3000
[β1
β2
]= Xβ
de manera que por ejemplo precio ajustado a la superficie del septimo piso de la muestra sera
y7 = β1 + β2 middot x7 = β1 + β2 middot 1800
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
iquestComo calcular los parametos β1 y β2 de la recta y = β1 middot 1 + β2 middot x
uArr Modelos lineales en los parametros 3
El ajuste del regresando y es una combinacion lineal de los regresores por lo tanto y1
yn
= β1
1
1
+ β2
x12
xN2
+ β3
x13
xN3
+ middot middot middot+ βk
x1kxNk
o
uArr Modelos lineales en los parametros 3
El ajuste del regresando y es una combinacion lineal de los regresores por lo tanto y1
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
Este material docente se distribuye bajo la Creative Commons Attribution-Share Alike 30 Spain Para ver una copia de esta licencia visite httpcreativecommons
orglicensesby-sa30es
Tabla de Contenido
1 Regresion Lineal por Mınimos Cuadrados Ordinarios (MCO) 4
11 Introduccion 4
12 Algunos casos particulares 18
2 Propiedades algebraicas de la estimacion MCO 27
21 Propiedades basicas 27
22 Medidas de ajuste 32
Apendices 42
1 Derivacion tradicional de las Ecuaciones Normales 43
Bibliografıa 45
Transparencias 45
1 Regresion Lineal por Mınimos Cuadrados Ordinarios (MCO)
Capıtulos 2 y 3 de Wooldridge (2006)
Apendice E1 de Wooldridge (2006)
11 Introduccion
uArr Relacionar una variables con otras puede mejorar la comprension 1
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd =[1 rd
] [β1β2
]Aquı llamamos
regresando (o variable a explicar) al vector de datos de consumo con
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd =[1 rd
] [β1β2
]Aquı llamamos
regresando (o variable a explicar) al vector de datos de consumo con
regresores (o variables explicativas) al vector de unos (1) junto al vector de
datos de renta disponible (rd) [1 rd
]= X
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd =[1 rd
] [β1β2
]Aquı llamamos
regresando (o variable a explicar) al vector de datos de consumo con
regresores (o variables explicativas) al vector de unos (1) junto al vector de
datos de renta disponible (rd) [1 rd
]= X
vector de parametros a
β =
[β1β2
]
Ejemplo 2 [precio de las viviendas]
EjPviviendainp Gretl
Suponga que dispone de los siguientes datos
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ejemplo 2 [precio de las viviendas]
EjPviviendainp Gretl
Suponga que dispone de los siguientes datos
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ejemplo 2 [precio de las viviendas]
EjPviviendainp Gretl
Suponga que dispone de los siguientes datos
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ası
y= β1 middot 1 + β2 middot x
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
=
1 1065
1 1254
1 1300
1 1577
1 1600
1 1750
1 1800
1 1870
1 1935
1 1948
1 2254
1 2600
1 2800
1 3000
[β1
β2
]= Xβ
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
=
1 1065
1 1254
1 1300
1 1577
1 1600
1 1750
1 1800
1 1870
1 1935
1 1948
1 2254
1 2600
1 2800
1 3000
[β1
β2
]= Xβ
de manera que por ejemplo precio ajustado a la superficie del septimo piso de la muestra sera
y7 = β1 + β2 middot x7 = β1 + β2 middot 1800
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
iquestComo calcular los parametos β1 y β2 de la recta y = β1 middot 1 + β2 middot x
uArr Modelos lineales en los parametros 3
El ajuste del regresando y es una combinacion lineal de los regresores por lo tanto y1
yn
= β1
1
1
+ β2
x12
xN2
+ β3
x13
xN3
+ middot middot middot+ βk
x1kxNk
o
uArr Modelos lineales en los parametros 3
El ajuste del regresando y es una combinacion lineal de los regresores por lo tanto y1
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
1 Regresion Lineal por Mınimos Cuadrados Ordinarios (MCO) 4
11 Introduccion 4
12 Algunos casos particulares 18
2 Propiedades algebraicas de la estimacion MCO 27
21 Propiedades basicas 27
22 Medidas de ajuste 32
Apendices 42
1 Derivacion tradicional de las Ecuaciones Normales 43
Bibliografıa 45
Transparencias 45
1 Regresion Lineal por Mınimos Cuadrados Ordinarios (MCO)
Capıtulos 2 y 3 de Wooldridge (2006)
Apendice E1 de Wooldridge (2006)
11 Introduccion
uArr Relacionar una variables con otras puede mejorar la comprension 1
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd =[1 rd
] [β1β2
]Aquı llamamos
regresando (o variable a explicar) al vector de datos de consumo con
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd =[1 rd
] [β1β2
]Aquı llamamos
regresando (o variable a explicar) al vector de datos de consumo con
regresores (o variables explicativas) al vector de unos (1) junto al vector de
datos de renta disponible (rd) [1 rd
]= X
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd =[1 rd
] [β1β2
]Aquı llamamos
regresando (o variable a explicar) al vector de datos de consumo con
regresores (o variables explicativas) al vector de unos (1) junto al vector de
datos de renta disponible (rd) [1 rd
]= X
vector de parametros a
β =
[β1β2
]
Ejemplo 2 [precio de las viviendas]
EjPviviendainp Gretl
Suponga que dispone de los siguientes datos
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ejemplo 2 [precio de las viviendas]
EjPviviendainp Gretl
Suponga que dispone de los siguientes datos
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ejemplo 2 [precio de las viviendas]
EjPviviendainp Gretl
Suponga que dispone de los siguientes datos
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ası
y= β1 middot 1 + β2 middot x
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
=
1 1065
1 1254
1 1300
1 1577
1 1600
1 1750
1 1800
1 1870
1 1935
1 1948
1 2254
1 2600
1 2800
1 3000
[β1
β2
]= Xβ
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
=
1 1065
1 1254
1 1300
1 1577
1 1600
1 1750
1 1800
1 1870
1 1935
1 1948
1 2254
1 2600
1 2800
1 3000
[β1
β2
]= Xβ
de manera que por ejemplo precio ajustado a la superficie del septimo piso de la muestra sera
y7 = β1 + β2 middot x7 = β1 + β2 middot 1800
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
iquestComo calcular los parametos β1 y β2 de la recta y = β1 middot 1 + β2 middot x
uArr Modelos lineales en los parametros 3
El ajuste del regresando y es una combinacion lineal de los regresores por lo tanto y1
yn
= β1
1
1
+ β2
x12
xN2
+ β3
x13
xN3
+ middot middot middot+ βk
x1kxNk
o
uArr Modelos lineales en los parametros 3
El ajuste del regresando y es una combinacion lineal de los regresores por lo tanto y1
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
1 Regresion Lineal por Mınimos Cuadrados Ordinarios (MCO)
Capıtulos 2 y 3 de Wooldridge (2006)
Apendice E1 de Wooldridge (2006)
11 Introduccion
uArr Relacionar una variables con otras puede mejorar la comprension 1
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd =[1 rd
] [β1β2
]Aquı llamamos
regresando (o variable a explicar) al vector de datos de consumo con
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd =[1 rd
] [β1β2
]Aquı llamamos
regresando (o variable a explicar) al vector de datos de consumo con
regresores (o variables explicativas) al vector de unos (1) junto al vector de
datos de renta disponible (rd) [1 rd
]= X
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd =[1 rd
] [β1β2
]Aquı llamamos
regresando (o variable a explicar) al vector de datos de consumo con
regresores (o variables explicativas) al vector de unos (1) junto al vector de
datos de renta disponible (rd) [1 rd
]= X
vector de parametros a
β =
[β1β2
]
Ejemplo 2 [precio de las viviendas]
EjPviviendainp Gretl
Suponga que dispone de los siguientes datos
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ejemplo 2 [precio de las viviendas]
EjPviviendainp Gretl
Suponga que dispone de los siguientes datos
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ejemplo 2 [precio de las viviendas]
EjPviviendainp Gretl
Suponga que dispone de los siguientes datos
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ası
y= β1 middot 1 + β2 middot x
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
=
1 1065
1 1254
1 1300
1 1577
1 1600
1 1750
1 1800
1 1870
1 1935
1 1948
1 2254
1 2600
1 2800
1 3000
[β1
β2
]= Xβ
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
=
1 1065
1 1254
1 1300
1 1577
1 1600
1 1750
1 1800
1 1870
1 1935
1 1948
1 2254
1 2600
1 2800
1 3000
[β1
β2
]= Xβ
de manera que por ejemplo precio ajustado a la superficie del septimo piso de la muestra sera
y7 = β1 + β2 middot x7 = β1 + β2 middot 1800
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
iquestComo calcular los parametos β1 y β2 de la recta y = β1 middot 1 + β2 middot x
uArr Modelos lineales en los parametros 3
El ajuste del regresando y es una combinacion lineal de los regresores por lo tanto y1
yn
= β1
1
1
+ β2
x12
xN2
+ β3
x13
xN3
+ middot middot middot+ βk
x1kxNk
o
uArr Modelos lineales en los parametros 3
El ajuste del regresando y es una combinacion lineal de los regresores por lo tanto y1
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
uArr Relacionar una variables con otras puede mejorar la comprension 1
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd =[1 rd
] [β1β2
]Aquı llamamos
regresando (o variable a explicar) al vector de datos de consumo con
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd =[1 rd
] [β1β2
]Aquı llamamos
regresando (o variable a explicar) al vector de datos de consumo con
regresores (o variables explicativas) al vector de unos (1) junto al vector de
datos de renta disponible (rd) [1 rd
]= X
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd =[1 rd
] [β1β2
]Aquı llamamos
regresando (o variable a explicar) al vector de datos de consumo con
regresores (o variables explicativas) al vector de unos (1) junto al vector de
datos de renta disponible (rd) [1 rd
]= X
vector de parametros a
β =
[β1β2
]
Ejemplo 2 [precio de las viviendas]
EjPviviendainp Gretl
Suponga que dispone de los siguientes datos
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ejemplo 2 [precio de las viviendas]
EjPviviendainp Gretl
Suponga que dispone de los siguientes datos
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ejemplo 2 [precio de las viviendas]
EjPviviendainp Gretl
Suponga que dispone de los siguientes datos
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ası
y= β1 middot 1 + β2 middot x
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
=
1 1065
1 1254
1 1300
1 1577
1 1600
1 1750
1 1800
1 1870
1 1935
1 1948
1 2254
1 2600
1 2800
1 3000
[β1
β2
]= Xβ
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
=
1 1065
1 1254
1 1300
1 1577
1 1600
1 1750
1 1800
1 1870
1 1935
1 1948
1 2254
1 2600
1 2800
1 3000
[β1
β2
]= Xβ
de manera que por ejemplo precio ajustado a la superficie del septimo piso de la muestra sera
y7 = β1 + β2 middot x7 = β1 + β2 middot 1800
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
iquestComo calcular los parametos β1 y β2 de la recta y = β1 middot 1 + β2 middot x
uArr Modelos lineales en los parametros 3
El ajuste del regresando y es una combinacion lineal de los regresores por lo tanto y1
yn
= β1
1
1
+ β2
x12
xN2
+ β3
x13
xN3
+ middot middot middot+ βk
x1kxNk
o
uArr Modelos lineales en los parametros 3
El ajuste del regresando y es una combinacion lineal de los regresores por lo tanto y1
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd =[1 rd
] [β1β2
]Aquı llamamos
regresando (o variable a explicar) al vector de datos de consumo con
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd =[1 rd
] [β1β2
]Aquı llamamos
regresando (o variable a explicar) al vector de datos de consumo con
regresores (o variables explicativas) al vector de unos (1) junto al vector de
datos de renta disponible (rd) [1 rd
]= X
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd =[1 rd
] [β1β2
]Aquı llamamos
regresando (o variable a explicar) al vector de datos de consumo con
regresores (o variables explicativas) al vector de unos (1) junto al vector de
datos de renta disponible (rd) [1 rd
]= X
vector de parametros a
β =
[β1β2
]
Ejemplo 2 [precio de las viviendas]
EjPviviendainp Gretl
Suponga que dispone de los siguientes datos
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ejemplo 2 [precio de las viviendas]
EjPviviendainp Gretl
Suponga que dispone de los siguientes datos
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ejemplo 2 [precio de las viviendas]
EjPviviendainp Gretl
Suponga que dispone de los siguientes datos
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ası
y= β1 middot 1 + β2 middot x
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
=
1 1065
1 1254
1 1300
1 1577
1 1600
1 1750
1 1800
1 1870
1 1935
1 1948
1 2254
1 2600
1 2800
1 3000
[β1
β2
]= Xβ
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
=
1 1065
1 1254
1 1300
1 1577
1 1600
1 1750
1 1800
1 1870
1 1935
1 1948
1 2254
1 2600
1 2800
1 3000
[β1
β2
]= Xβ
de manera que por ejemplo precio ajustado a la superficie del septimo piso de la muestra sera
y7 = β1 + β2 middot x7 = β1 + β2 middot 1800
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
iquestComo calcular los parametos β1 y β2 de la recta y = β1 middot 1 + β2 middot x
uArr Modelos lineales en los parametros 3
El ajuste del regresando y es una combinacion lineal de los regresores por lo tanto y1
yn
= β1
1
1
+ β2
x12
xN2
+ β3
x13
xN3
+ middot middot middot+ βk
x1kxNk
o
uArr Modelos lineales en los parametros 3
El ajuste del regresando y es una combinacion lineal de los regresores por lo tanto y1
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd =[1 rd
] [β1β2
]Aquı llamamos
regresando (o variable a explicar) al vector de datos de consumo con
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd =[1 rd
] [β1β2
]Aquı llamamos
regresando (o variable a explicar) al vector de datos de consumo con
regresores (o variables explicativas) al vector de unos (1) junto al vector de
datos de renta disponible (rd) [1 rd
]= X
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd =[1 rd
] [β1β2
]Aquı llamamos
regresando (o variable a explicar) al vector de datos de consumo con
regresores (o variables explicativas) al vector de unos (1) junto al vector de
datos de renta disponible (rd) [1 rd
]= X
vector de parametros a
β =
[β1β2
]
Ejemplo 2 [precio de las viviendas]
EjPviviendainp Gretl
Suponga que dispone de los siguientes datos
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ejemplo 2 [precio de las viviendas]
EjPviviendainp Gretl
Suponga que dispone de los siguientes datos
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ejemplo 2 [precio de las viviendas]
EjPviviendainp Gretl
Suponga que dispone de los siguientes datos
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ası
y= β1 middot 1 + β2 middot x
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
=
1 1065
1 1254
1 1300
1 1577
1 1600
1 1750
1 1800
1 1870
1 1935
1 1948
1 2254
1 2600
1 2800
1 3000
[β1
β2
]= Xβ
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
=
1 1065
1 1254
1 1300
1 1577
1 1600
1 1750
1 1800
1 1870
1 1935
1 1948
1 2254
1 2600
1 2800
1 3000
[β1
β2
]= Xβ
de manera que por ejemplo precio ajustado a la superficie del septimo piso de la muestra sera
y7 = β1 + β2 middot x7 = β1 + β2 middot 1800
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
iquestComo calcular los parametos β1 y β2 de la recta y = β1 middot 1 + β2 middot x
uArr Modelos lineales en los parametros 3
El ajuste del regresando y es una combinacion lineal de los regresores por lo tanto y1
yn
= β1
1
1
+ β2
x12
xN2
+ β3
x13
xN3
+ middot middot middot+ βk
x1kxNk
o
uArr Modelos lineales en los parametros 3
El ajuste del regresando y es una combinacion lineal de los regresores por lo tanto y1
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd =[1 rd
] [β1β2
]Aquı llamamos
regresando (o variable a explicar) al vector de datos de consumo con
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd =[1 rd
] [β1β2
]Aquı llamamos
regresando (o variable a explicar) al vector de datos de consumo con
regresores (o variables explicativas) al vector de unos (1) junto al vector de
datos de renta disponible (rd) [1 rd
]= X
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd =[1 rd
] [β1β2
]Aquı llamamos
regresando (o variable a explicar) al vector de datos de consumo con
regresores (o variables explicativas) al vector de unos (1) junto al vector de
datos de renta disponible (rd) [1 rd
]= X
vector de parametros a
β =
[β1β2
]
Ejemplo 2 [precio de las viviendas]
EjPviviendainp Gretl
Suponga que dispone de los siguientes datos
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ejemplo 2 [precio de las viviendas]
EjPviviendainp Gretl
Suponga que dispone de los siguientes datos
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ejemplo 2 [precio de las viviendas]
EjPviviendainp Gretl
Suponga que dispone de los siguientes datos
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ası
y= β1 middot 1 + β2 middot x
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
=
1 1065
1 1254
1 1300
1 1577
1 1600
1 1750
1 1800
1 1870
1 1935
1 1948
1 2254
1 2600
1 2800
1 3000
[β1
β2
]= Xβ
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
=
1 1065
1 1254
1 1300
1 1577
1 1600
1 1750
1 1800
1 1870
1 1935
1 1948
1 2254
1 2600
1 2800
1 3000
[β1
β2
]= Xβ
de manera que por ejemplo precio ajustado a la superficie del septimo piso de la muestra sera
y7 = β1 + β2 middot x7 = β1 + β2 middot 1800
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
iquestComo calcular los parametos β1 y β2 de la recta y = β1 middot 1 + β2 middot x
uArr Modelos lineales en los parametros 3
El ajuste del regresando y es una combinacion lineal de los regresores por lo tanto y1
yn
= β1
1
1
+ β2
x12
xN2
+ β3
x13
xN3
+ middot middot middot+ βk
x1kxNk
o
uArr Modelos lineales en los parametros 3
El ajuste del regresando y es una combinacion lineal de los regresores por lo tanto y1
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd =[1 rd
] [β1β2
]Aquı llamamos
regresando (o variable a explicar) al vector de datos de consumo con
regresores (o variables explicativas) al vector de unos (1) junto al vector de
datos de renta disponible (rd) [1 rd
]= X
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd =[1 rd
] [β1β2
]Aquı llamamos
regresando (o variable a explicar) al vector de datos de consumo con
regresores (o variables explicativas) al vector de unos (1) junto al vector de
datos de renta disponible (rd) [1 rd
]= X
vector de parametros a
β =
[β1β2
]
Ejemplo 2 [precio de las viviendas]
EjPviviendainp Gretl
Suponga que dispone de los siguientes datos
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ejemplo 2 [precio de las viviendas]
EjPviviendainp Gretl
Suponga que dispone de los siguientes datos
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ejemplo 2 [precio de las viviendas]
EjPviviendainp Gretl
Suponga que dispone de los siguientes datos
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ası
y= β1 middot 1 + β2 middot x
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
=
1 1065
1 1254
1 1300
1 1577
1 1600
1 1750
1 1800
1 1870
1 1935
1 1948
1 2254
1 2600
1 2800
1 3000
[β1
β2
]= Xβ
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
=
1 1065
1 1254
1 1300
1 1577
1 1600
1 1750
1 1800
1 1870
1 1935
1 1948
1 2254
1 2600
1 2800
1 3000
[β1
β2
]= Xβ
de manera que por ejemplo precio ajustado a la superficie del septimo piso de la muestra sera
y7 = β1 + β2 middot x7 = β1 + β2 middot 1800
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
iquestComo calcular los parametos β1 y β2 de la recta y = β1 middot 1 + β2 middot x
uArr Modelos lineales en los parametros 3
El ajuste del regresando y es una combinacion lineal de los regresores por lo tanto y1
yn
= β1
1
1
+ β2
x12
xN2
+ β3
x13
xN3
+ middot middot middot+ βk
x1kxNk
o
uArr Modelos lineales en los parametros 3
El ajuste del regresando y es una combinacion lineal de los regresores por lo tanto y1
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
Ejemplo 1 [funcion de consumo] Supongamos que el consumo y la renta disponible
de las personas se relaciona del siguiente modo
CONn = β1 + β2RDn + Un
Si dispusieramos de datos sobre renta y consuno podrıamos ajustar el consumo
con como una funcion lineal de la renta disponible rd
con = β1 middot 1 + β2 middot rd =[1 rd
] [β1β2
]Aquı llamamos
regresando (o variable a explicar) al vector de datos de consumo con
regresores (o variables explicativas) al vector de unos (1) junto al vector de
datos de renta disponible (rd) [1 rd
]= X
vector de parametros a
β =
[β1β2
]
Ejemplo 2 [precio de las viviendas]
EjPviviendainp Gretl
Suponga que dispone de los siguientes datos
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ejemplo 2 [precio de las viviendas]
EjPviviendainp Gretl
Suponga que dispone de los siguientes datos
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ejemplo 2 [precio de las viviendas]
EjPviviendainp Gretl
Suponga que dispone de los siguientes datos
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ası
y= β1 middot 1 + β2 middot x
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
=
1 1065
1 1254
1 1300
1 1577
1 1600
1 1750
1 1800
1 1870
1 1935
1 1948
1 2254
1 2600
1 2800
1 3000
[β1
β2
]= Xβ
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
=
1 1065
1 1254
1 1300
1 1577
1 1600
1 1750
1 1800
1 1870
1 1935
1 1948
1 2254
1 2600
1 2800
1 3000
[β1
β2
]= Xβ
de manera que por ejemplo precio ajustado a la superficie del septimo piso de la muestra sera
y7 = β1 + β2 middot x7 = β1 + β2 middot 1800
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
iquestComo calcular los parametos β1 y β2 de la recta y = β1 middot 1 + β2 middot x
uArr Modelos lineales en los parametros 3
El ajuste del regresando y es una combinacion lineal de los regresores por lo tanto y1
yn
= β1
1
1
+ β2
x12
xN2
+ β3
x13
xN3
+ middot middot middot+ βk
x1kxNk
o
uArr Modelos lineales en los parametros 3
El ajuste del regresando y es una combinacion lineal de los regresores por lo tanto y1
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ejemplo 2 [precio de las viviendas]
EjPviviendainp Gretl
Suponga que dispone de los siguientes datos
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ejemplo 2 [precio de las viviendas]
EjPviviendainp Gretl
Suponga que dispone de los siguientes datos
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ası
y= β1 middot 1 + β2 middot x
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
=
1 1065
1 1254
1 1300
1 1577
1 1600
1 1750
1 1800
1 1870
1 1935
1 1948
1 2254
1 2600
1 2800
1 3000
[β1
β2
]= Xβ
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
=
1 1065
1 1254
1 1300
1 1577
1 1600
1 1750
1 1800
1 1870
1 1935
1 1948
1 2254
1 2600
1 2800
1 3000
[β1
β2
]= Xβ
de manera que por ejemplo precio ajustado a la superficie del septimo piso de la muestra sera
y7 = β1 + β2 middot x7 = β1 + β2 middot 1800
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
iquestComo calcular los parametos β1 y β2 de la recta y = β1 middot 1 + β2 middot x
uArr Modelos lineales en los parametros 3
El ajuste del regresando y es una combinacion lineal de los regresores por lo tanto y1
yn
= β1
1
1
+ β2
x12
xN2
+ β3
x13
xN3
+ middot middot middot+ βk
x1kxNk
o
uArr Modelos lineales en los parametros 3
El ajuste del regresando y es una combinacion lineal de los regresores por lo tanto y1
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ejemplo 2 [precio de las viviendas]
EjPviviendainp Gretl
Suponga que dispone de los siguientes datos
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ası
y= β1 middot 1 + β2 middot x
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
=
1 1065
1 1254
1 1300
1 1577
1 1600
1 1750
1 1800
1 1870
1 1935
1 1948
1 2254
1 2600
1 2800
1 3000
[β1
β2
]= Xβ
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
=
1 1065
1 1254
1 1300
1 1577
1 1600
1 1750
1 1800
1 1870
1 1935
1 1948
1 2254
1 2600
1 2800
1 3000
[β1
β2
]= Xβ
de manera que por ejemplo precio ajustado a la superficie del septimo piso de la muestra sera
y7 = β1 + β2 middot x7 = β1 + β2 middot 1800
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
iquestComo calcular los parametos β1 y β2 de la recta y = β1 middot 1 + β2 middot x
uArr Modelos lineales en los parametros 3
El ajuste del regresando y es una combinacion lineal de los regresores por lo tanto y1
yn
= β1
1
1
+ β2
x12
xN2
+ β3
x13
xN3
+ middot middot middot+ βk
x1kxNk
o
uArr Modelos lineales en los parametros 3
El ajuste del regresando y es una combinacion lineal de los regresores por lo tanto y1
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
Cuadro 1 Superficie (en pies al cuadrado) y precio de venta de los pisos (en miles de dolares) (Ramanathan
2002 pp 78)
Podemos suponer que el modelo que describe los precios es Yn = a+ bXn+Un donde Yn es el precio
del piso n-esimo Xn es su superficie y Un son otros factores que influyen en el precio del piso (situacion
estado de mantenimiento servicios etc)
Y podemos tratar de ajustar el precio como una funcion lineal de la superficie del piso
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
leemos el archivo de datos data3-1open data3-1 vamos a pintar el digrama de dispersion con GNUPLOTgnuplot price sqft --suppress-fitted --output=display Vamos a estimar el modelo ols price const sqft Los vamos a copiar en la variable phat1genr phat = $yhat vamos a copiar los residuos en la variable ehatgenr ehat = $uhat Vamos escribir las columnas de precios precios superficies precios estimados y erroresprint -o price sqft phat ehat Otra forma de obtener los valores ajustados es restar los errores de los preciosgenr phat2 = price - ehat Y otra forma mas con mayores errores de redondeogenr phat3 = 52351+(0139sqft) Vamos a ver como coinciden estas formas de calcularprint -o phat phat2 phat3 vamos a pintar la recta de regresion estimadagnuplot price sqft --output=display
Marcos Bujosa
Ası
y= β1 middot 1 + β2 middot x
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
=
1 1065
1 1254
1 1300
1 1577
1 1600
1 1750
1 1800
1 1870
1 1935
1 1948
1 2254
1 2600
1 2800
1 3000
[β1
β2
]= Xβ
Ası
y= β1 middot 1 + β2 middot x =
y1y2y3y4y5y6y7y8y9y10y11y12y13y14
= β1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
+ β2
1065
1254
1300
1577
1600
1750
1800
1870
1935
1948
2254
2600
2800
3000
=
1 1065
1 1254
1 1300
1 1577
1 1600
1 1750
1 1800
1 1870
1 1935
1 1948
1 2254
1 2600
1 2800
1 3000
[β1
β2
]= Xβ
de manera que por ejemplo precio ajustado a la superficie del septimo piso de la muestra sera
y7 = β1 + β2 middot x7 = β1 + β2 middot 1800
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
uArr Recta de regresion 2
ZCodigo EjPviviendainp Gretl
150
200
250
300
350
400
450
500
550
1500 2000 2500 3000
price versus sqftpric
e
sqft
Recta
deaj
uste
linea
l
y7
y12
e gt 0
y12
iquestComo calcular los parametos β1 y β2 de la recta y = β1 middot 1 + β2 middot x
uArr Modelos lineales en los parametros 3
El ajuste del regresando y es una combinacion lineal de los regresores por lo tanto y1
yn
= β1
1
1
+ β2
x12
xN2
+ β3
x13
xN3
+ middot middot middot+ βk
x1kxNk
o
uArr Modelos lineales en los parametros 3
El ajuste del regresando y es una combinacion lineal de los regresores por lo tanto y1
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
La SRC(β) es mınima para valores β tales que los errores son ortogonales a los
regresores de la muestra X
e perp X rArr Xᵀe = 0
Ası
Xᵀe = 0 rArr Xᵀ(y minus Xβ
)= 0 rArr Xᵀy minus XᵀXβ = 0
es decir
XᵀX β=Xᵀy (11)
El calculo MCO de lo parametros es la solucion β a dichas ecuaciones
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
uArr Condicion para que las ecuaciones normales tengan solucion unica 9
Las ecuaciones normales
XᵀX β=Xᵀy
tienen solucion unica si y solo si XᵀX es de rango completo
Es decir podemos obtener unos valores para β solo si
rango
(X
[Ntimesk]
)= k
En tal caso
β=(XᵀX)-1Xᵀy (12)
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
Ejemplo 3 [ecuacion de salarios] Supongamos el siguiente modelo no-lineal en los parametros
SALARn = eβ1+β2EDUCn+β3ANTIGn+β4EXPERn+Un
donde SALARn es el salario del individuo n-esimo EDUCn son sus anos de educacion ANTIGn sus
anos de antiguedad en la empresa y EXPERn sus anos de experiencia en el sector de la empresa y Unson otros factores distintos de los anteriores (Wooldridge 2006 ejemplo 32)
Al tomar logaritmos tenemos un nuevo modelo para ln(SALARn) que es lineal en los parametros
En este ejemplo iquestque pasa si tenemos una muestra en la que ningun trabajador ha cambiado de
empresa pues ocurre que las columnas de la matriz de regresores X correspondientes a anos de experiencia
y anos de antiguedad son iguales y por tanto linealmente dependientes ası que XᵀX no es invertible
Como en ese caso anos de experiencia y anos de antiguedad coinciden no es posible discriminar el
efecto por separado de ambas variables solo podemos calcular su efecto conjunto
ln(SALARn) = β1 + β2EDUCn + (β3 + β4)EXPERn + Un
12 Algunos casos particulares
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
uArr Modelo 1 una constante como unico regresor 10
Veamos en que consiste el ajuste MCO cuando X = 1
β = (XᵀX)-1Xᵀy
se reduce a
β1 = (1ᵀ1)-11ᵀy
y calculando los productos escalares
1ᵀ1 = N 1ᵀy =sum
yn
tenemos que
β1 =
sumyn
N= y y = Xβ = y middot 1 equiv y (13)
uArr Modelo 2 Modelo Lineal Simple 11
Un regresor adicional a la constante
y =
y1y2
yN
X =
1 x11 x2
1 xN
β =
(a
b
)
Las ecuaciones normales son
XᵀXβ = Xᵀy
es decir
(1 1 1
x1 x2 xN
)1 x11 x2
1 xN
(a
b
)=
(1 1 1
x1 x2 xN
)y1y2
yN
uArr Modelo 2 Modelo Lineal Simple 12
a N + bsumxn =
sumyn
asumxn + b
sumx2n =
sumxnyn
(14)
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
dividiendo por N la primera igualdad despejando a y sustituyendo en la segunda y
operando
a + b x = y
b s2x = sxy(15)
es decir
b=sxy
s2x(16)
y
a =y- b x (17)
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
uArr Relacion entre el estimador de la pendiente y el coeficiente de correlacion lineal 13
Ası pues el modelo lineal simple
b =sxy
s2x=
sxy
s2xmiddotsy
sy=
sxy
sxsymiddotsy
sx= rxy middot
sy
sx
es decir
b = rxy middotsy
sx
Ejemplo 4 [precio de las viviendas]
ZCodigo EjPviviendainp Gretl
n Precio Superficie
1 1999 1065
2 2280 1254
3 2350 1300
4 2850 1577
5 2390 1600
6 2930 1750
7 2850 1800
8 3650 1870
9 2950 1935
10 2900 1948
11 3850 2254
12 5050 2600
13 4250 2800
14 4150 3000
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
Cuadro 2 Superficie (pies al cuadrado) y precio de venta de los pisos (miles de dolares)
Tratemos de ajustar por MCO un modelo lineal simple a los precios
y = β1 middot 1 + β2 middot x =[1 x
] [β1β2
]= Xβ
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
a partir de (16) y (17) en la pagina˜21 tenemos
b =sxy
s2x= 013875 a = y minus xb = 523509
Es decir
price = 5235 + 0139 sqft
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
Por ejemplo con esta muestra de datos el precio de venta ajustado de un piso con una superficie de
1800 pies cuadrados sera de
y7 = 5235 + 0139 middot 1800 = 3021 miles de dolares
sin embargo y7 = 285 Esta discrepancia (el error e7 puede deberse a que dicho piso esta en una mala
situacion dispone de pocos servicios etc)
n Precio Superficie Precio ajustado Error
por el modelo lineal e
1 1999 1065 2001200 -022000
2 2280 1254 2263438 165619
3 2350 1300 2327263 227368
4 2850 1577 2711602 1383984
5 2390 1600 2743514 -3535142
6 2930 1750 2951640 -216397
7 2850 1800 3021015 -1710148
8 3650 1870 3118140 5318600
9 2950 1935 3208328 -2583278
10 2900 1948 3226365 -3263653
11 3850 2254 3650941 1990587
12 5050 2600 4131017 9189826
13 4250 2800 4408518 -1585180
14 4150 3000 4686019 -5360187
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
Cuadro 3 Superficie (en pies al cuadrado) precio de venta (en miles de dolares) precio estimado y errores
estimados
Modelo simulado Pn = 100 + 3Sn minus 130Dn + Un
EjPviviendaSimuladoinp Gretl
ZCodigo EjPviviendaSimuladoinp Gretl
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
open datosEjPviviendaSimuladogdtsummary P S Dgnuplot D S --suppress-fitted --output=displaygnuplot P S --suppress-fitted --output=displaygnuplot P D --suppress-fitted --output=displayModelo1 lt- ols S 0 D regresion de la superficie sobre la distanciaModelo2 lt- ols P 0 S modelo incompleto (sin distancia)Modelo3 lt- ols P 0 D modelo incompleto (sin superficie)ModeloCompleto lt- ols P 0 S D estimamos los paramentros del modelo correctorho=corr(SD)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 19 6910(6999)
+ 2 93003(10564)
Edad
T = 8 R2 = 0 9405 F (1 6) = 111 6 σ = 1 8161
(entre parentesis los estadısticos t)
grafico
(Modelo 2 Pn = β1 + β2EDADn + β3EDAD2n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = minus5 11497(minus0664)
+ 8 06835(5159)
Edadminus 0 252102(minus3305)
Edad2
T = 8 R2 = 0 9776 F (2 5) = 153 57 σ = 1 1148
(entre parentesis los estadısticos t)
grafico
(Modelo 3 Pn = β1 + β2EDADn + β3EDAD2n + β4EDAD3
n + Un)
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
E(P | e) = a + b middot e + c middot e2 + d middot e3estimada
observada35
40
45
50
55
60
65
6 7 8 9 10 11 12 13 14 15
Pes
oK
g
Edad
Peso con respecto a Edad (observado y estimado)
Peso Kg = 81 7714(1904)
minus 18 5964(minus1419)
Edad + 2 37778(1845)
Edad2minus 0 0836541(minus2043)
Edad3
T = 8 R2 = 0 9863 F (3 4) = 168 75 σ = 0 87188
(entre parentesis los estadısticos t)
grafico
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
uArr Regresograma y recta de regression 21
EstCondVentasinp Gretl
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales
La media es un estimador insesgado de la esperanza
en el regresograma E(Yn | intervalo)
En el tema siguiente veremos bajo que condiciones la regresion es un estimador
insesgado de la esperanza condicional E(Yn | xn
)
include EstadCondinp cargamos la funcion EstadCondopen datosventastxt cargamos los datos de ventas calculamos los estadisticos de Ventas en intervalos de la variable Antig (intervalos de antiguedad de 10 meses)list EstCond = EstadCond(VentasAntig10)
Marcos Bujosa
Apendices
1 Derivacion tradicional de las Ecuaciones Normales