2003.2 - Pauta

download 2003.2 - Pauta

of 14

Transcript of 2003.2 - Pauta

  • 8/18/2019 2003.2 - Pauta

    1/14

    Universidad Santa María

    ICN 312 Econometría, Santiago

    Prof. Pedro Fernández de la Reguera

    Certamen No. 1 / 4 de septiembre de 2003

    PAUTA

    1. (2 pts) Una de las limitaciones del modelo de regresión lineal clásico es que

    se puede aplicar solamente a modelos intrínsecamente lineales y no es

    aplicable a los otros modelos.

    a)  ¿Qué se entiende por modelos lineales y no lineales en econometría?

    Se entiende por modelos lineales en econometría a aquellos que sean lineales en los parámetros , independiente de la forma que tengan las variables. En cambio, enlos modelos no lineales sus parámetros  no son lineales.

    b)  De, a lo menos, dos ejemplos de modelos no lineales que se utilicen en laliteratura económica

      Cobb-Douglas: Y = 1 L2 K 3   Modelo con sesgo: Y = x´  + x´   Curva de Phillips: Y = 0  + 1 (1/X)

    c)  ¿Por qué no puede utilizar el modelo de regresión en el caso de modelos no

    lineales?

    Al estimar el modelo de regresión se trata de minimizar 2ie  y si no hay modeloslineales, no se garantiza un mínimo. Además, el coeficiente de una variable seráirreal, pues la estimación no es del coeficiente mismo, sino que de una función nolineal del coeficiente mismo.

  • 8/18/2019 2003.2 - Pauta

    2/14

    ICN 312, Stgo., PFR, Certamen No. 1 / 4  –  09 - 2003 2

    2.  (3 pts) Se trata de predecir EMPLEO a partir del PIB. Se dispone de lasiguiente información: Respuesta: Empleo (miles de personas); Predictores:

    PIB ( MM $ ); Series trimestrales; Empleo, sin corregir estacionalidad; PIB,

    estacionalidad corregida; Datos de 78 trimestres y uso de variables ficticias

    para explicar estacionalidad del empleo.

    Variables ficticias:

    Q1 =1, si trimestre I, 0, otro caso Q2 =1, si trimestre II, 0, otro caso

    Q3 =1, si trimestre III, 0, otro caso Q4 =1, si trimestre IV, 0, otro caso

    Se proponen los siguientes modelos:

    Modelo 1: Usando las cuatro ficticias

    Modelo 2: Usando sólo tres ficticias

    Modelo 3: Usar tres ficticias y tendencia

    Se le pide: Señalar, en cada modelo, el comportamiento del intercepto, si es

    que el modelo lo lleva. Explicar en qué modelos no se puede definir un

    intercepto.

      Modelo 1: No puede llevar el intercepto, pues su variable asociada es X0 = 1 yQ1 + Q2 + Q3 + Q4 = 1 = X0 indicando una colinealidad perfecta; por lo tanto, elmodelo 1 queda planteado: Empleo = 1Q1 + 2Q2 + 3Q3 + 4Q4 + 5 PIB.

      Modelo 2: Si debe llevar el intercepto, donde el valor del intercepto es elcoeficiente del trimestre omitido y es igual al que tiene en el modelo 1. SiEmpleo = 0 + 1Q1 + 2Q2 + 3Q3 + 5 PIB, entonces 0 = 4.

      Modelo 3: Aquí, el intercepto es más puro. La tendencia recoge la variación promedio de los trimestres y el intercepto será el valor promedio remanente; porlo tanto, el modelo 3 queda planteado: Empleo = 0 + 1Q1 + 2Q2 + 3Q3 + 5PIB + 6Tendencia.

  • 8/18/2019 2003.2 - Pauta

    3/14

    ICN 312, Stgo., PFR, Certamen No. 1 / 4  –  09 - 2003 3

    3. (2 pts). Deduzca la expresión para el estimador MCO de 0 si el modelo es:

    Yi = 0 + i 

    Sea: n

    1i

    20i

    n

    1i

    2i )(Y 

    Y  b 

    nb Y 

    0 ) b(Y 

    0 )1)( b(Y2 

    0

    0

    n

    1ii

    n

    1i0i

    n

    1i0i

     b0 00

     

  • 8/18/2019 2003.2 - Pauta

    4/14

    ICN 312, Stgo., PFR, Certamen No. 1 / 4  –  09 - 2003 4

    4. (4 pts) En trabajos econométricos de series de tiempo es usual trabajar con

    información de diferentes períodos, los cuales también se utilizan como una

    variable exógena (predictora) del modelo. Esta variable cuantifica la tendencia

    lineal a través del tiempo, así por ejemplo, en una serie de tiempo de ingresos

    se tendría la siguiente información:

    Tiempo Ingreso1 1052 1093 1134 1055 1086 1157 120

    8 128¦  ¦ n Yn

    El modelo en este caso es YT  = 0  + 1T + T  . En base a esta información,

    demuestre que la varianza de 0 y 1 tienden, necesariamente, a cero a medida

    que la muestra tiende a infinito. De este modo obtendría muy buenos

    estimadores si utilizara un número suficientemente grande de observaciones y

    si no se presentaran otros problemas econométricos.

    NOTAS: 1: 1)/2n(n Tn1T

    ; 1)/61)(2nn(n Tn1T

    2

     

    2: Es posible que tenga que utilizar además la regla de L´Hopital.

    a) Caso de Var( bo )

    i

    22

    i

    i

    2

    i

    2

     n0n

    )n(n

    ˆ

    Lim ) b(Var Lim  

    }4/1)n(n - 6/)1n2)(1n(n{n

    1)/61)(2nn(nˆLim 

    2

    2

     n

       

    12/}1)3n(n - )1n2)(1n(n2{

    1)/61)(2n(nˆLim 

    2

    2

     n

       

  • 8/18/2019 2003.2 - Pauta

    5/14

    ICN 312, Stgo., PFR, Certamen No. 1 / 4  –  09 - 2003 5

    1-n2

    4ˆLim 

    HopitalL'aplicando n-n

    1)2(2nˆLim 

    }3-3n-2n4){1n(n

    1)1)(2n2(nˆLim 

    2

     n

    2

    2

     n

    2

     n

     

    0 ) b(Var Lim  0n    

    b) Caso de Var( b1 )

    0 ) b(Var Lim 

    n-n

    ˆ12Lim 

    1)-n)(1n(n

    ˆ12Lim 

    }3-3n-2n4){1n(n

    ˆ12Lim 

    12/}1)3n(n - )1n2)(1n(n2{

    ˆLim 

    4/1){n(n - }6/)1n2)(1n(n{

    ˆLim 

    n

    ˆ Lim ) b(Var Lim

    1n

    3

    2

     n

    2

     n

    2

     n

    2

    2

     n

    2

    2

     n

    i

    22

    i

    2

     n1n

     

  • 8/18/2019 2003.2 - Pauta

    6/14

    ICN 312, Stgo., PFR, Certamen No. 1 / 4  –  09 - 2003 6

    5. (3 pts) Suponga que la regresión de la balanza comercial con un

    determinado país es:

    Ŷ  = 100.000 + 0,6 X R 2 = 0,4

    Utilizando datos anuales en base a dólares de 1972.

    a)  Suponga que los números cambiaron de base y se refirieron a dólares de

    1982 mediante la multiplicación por 0,74. ¿Cómo habrían cambiado la

    pendiente y la constante?

    La pendiente del modelo no cambia. Sigue siendo b1 = 0,6, debido a que b0 = (Y  - b1X )0,74 = 0,74 b0; en cambio, en la constante si se producen cambios,

    disminuyendo a b0 = 74.000.

    b)  Basándose en las cifras anteriores ¿ Sería capaz de determinar los

    resultados del procedimiento de MC si los datos se hubieran expresados en

    la moneda de otro país, si conociera los tipos de cambio?

    Sí, efectuando el mismo procedimiento que se realizó en la alternativa (a).

    c)  Basándose en las cifras anteriores ¿ Sería capaz de determinar los

    resultados del procedimiento de MC si los datos se hubieran expresados en

    dólares nominales sin estar deflactados por inflación?

     No, se necesita la inflación como variable predictora para poder determinarsoluciones al problema planteado, pues la inflación anual cambia de año en año.

  • 8/18/2019 2003.2 - Pauta

    7/14

    ICN 312, Stgo., PFR, Certamen No. 1 / 4  –  09 - 2003 7

    6. (3 + 5 pts) Una teoría extendida entre alumnos profesores de una facultad es

    que las mejores calificaciones académicas son obtenidas por mujeres.

    Suponiendo que tiene acceso a la siguiente información: i) Calificaciones en la

    asignatura de Econometría (de 0 a 10) obtenidas por los estudiantes en el

    primer semestre de 1993; ii) Número de horas que cada uno de ellos ha

    invertido en la preparación de la asignatura; iii) Si ha asistido o no

    regularmente a las clases (medido como la relación entre horas de asistencia

    sobre el total de horas lectivas); iv) Sexo del estudiante.

    NOTA IMPORTANTE: La respuesta correcta a la letra d) significan 5 puntos

    adicionales sobre los alcanzados en el certamen, a título de premio

    a)  ¿Cómo docimaría si la teoría de los profesores es cierta?

      Definir la variable Sexo: 1 si es mujer y 0 si es hombre  Estimar el modelo: C = 0 + 1 H + 2 A + 3 S  Si los profesores están en lo correcto, se debe cumplir: 3    0  Realizar la dócima de la hipótesis: H0 : 3   0 vs Ha : 3   0 mediante una t de

    Student a una cola.

    b)  ¿Cómo docimaría la hipótesis de que el aprovechamiento de las horas

    dedicadas al estudio es superior en las mujeres que en los hombres?.

    Especificar el modelo adecuado en cada caso y explique detalladamente el

    mecanismo de cada contraste propuesto.

      Definir los modelos: CMUJERES = 0 + 1 H + 2 ACHOMBRES = 0 + 1 H + 2 A

      Se trata de docimar si 1 1  Ajustar ambos modelos  Establecer el siguiente test de hipótesis: H0 : 1  1 vs Ha : 1 1 mediante una

    t de Student a una cola con nM + nH  –  6 grados de libertad.

      El estadígrafo será:) ba(Var 

    ˆˆ E

    11

    11

     

    c)  ¿Hay alguna otra hipótesis que le parezca interesante docimar con estos

    datos?, ¿Cómo lo haría?

  • 8/18/2019 2003.2 - Pauta

    8/14

    ICN 312, Stgo., PFR, Certamen No. 1 / 4  –  09 - 2003 8

      Una hipótesis interesante de analizar es si la asistencia a clases es relevante y lamejor manera de desarrollarla es mediante la dócima F parcial, es decir,considerando el modelo original con las variables H y S, y ver si la variable Adebiera ingresar al modelo.

      Otra manera de analizar la asistencia a clases es docimar el  de la asistencia aclases en el modelo general, pero es poco adecuado realizarlo debido a la faltade independencia entre los b.

    d)  Si pudiera contar con el mismo tipo de datos para las convocatorias del

    primer semestre de 1989 y quisiera docimar las mismas hipótesis,

    ¿Utilizaría los mismos modelos?, ¿los modificaría de alguna forma? ¿cómo

    y por qué?

  • 8/18/2019 2003.2 - Pauta

    9/14

    ICN 312, Stgo., PFR, Certamen No. 1 / 4  –  09 - 2003 9

    7. (4 pts) Para estimar el modelo Yt  = o + 1 L  t  + 2 K   t  + t  donde Yt  es elvolumen de producción facturado en el período t, L t es cantidad del factor mano deobra en el período t y K t es el factor de capital, en el período t.

    Se dispone de las siguientes observaciones:

    Y 230 140 180 270 300 240 230 350 120L 30 10 20 40 50 20 30 60 40K 160 50 100 200 240 190 160 300 150

    El investigador estima el modelo tomando sólo las primeras 8 observaciones yobtiene los siguientes resultados (valores entre paréntesis son desviaciones estándardel  estimado respectivo):

    Ŷ t = 97,258 + 0,970 Lt + 0,650 K t  R 2 = 0,999(1,956) (0,12) (0,03)

    Cuando se da cuenta del error cometido, piensa que este es irrelevante y decidetomar los resultados obtenidos como válidos, pero su honestidad profesional seimpone y, finalmente, estima el modelo con todas las observaciones (T = 9)obteniendo, en este caso, los siguientes resultados:

    Ŷ t = 75,479 –  1,970 Lt + 1,272 K t  R 2 = 0,824

    (32,05) (1,74) (0,38)

    Su desconcierto es grande al comparar ambas estimaciones y no puede comprendercómo, utilizando una sola observación adicional, los resultados son tan diferentes:

    a)  ¿Cabe encontrar alguna razón que pueda justificar estas diferencias?Modelo mal formulado.Última observación influyenteColinealidad entre predictoresVer ejemplo pág. 35 apuntes

     b)  ¿Podría haber llegado a la misma conclusión sin necesidad de realizar lasegunda estimación?, ¿Puede explicar cómo?

    Sí. Usar gráficos de dispersión, calcular correlaciones entre todas lasvariables.

  • 8/18/2019 2003.2 - Pauta

    10/14

    ICN 312, Stgo., PFR, Certamen No. 1 / 4  –  09 - 2003 10

    8.= ( 4 pts) Datos de niños, 1976. Y = Talla actual del bebé (cm); X1 = Edad

    (días); X2 = Talla al nacer (cm); X3 = Peso al nacer (kg); X4 = Tamaño del

    torax, al nacer (cm).

    Y X1 X2 X3 X4

    57,5 78 48,2 2,75 29,552,8 69 45,5 2,15 26,361,3 77 46,3 4,41 32,267,0 88 49,0 5,52 36,553,5 67 43,0 3,21 27,262,7 80 48,0 4,32 27,756,2 74 48,0 2,31 28,368,5 94 53,0 4,30 30,369,2 102 58,0 3,71 28,7

    Correlac. Y X1 X2 X3

    X1 0,947 1,000X2 0,819 0,952 1,000X3 0,761 0,534 0,263 1,000X4 0,560 0,390 0,155 0,784

    Modelo g.l. residual SC(regre) SC(error) CM(error)X1 7 288,1468 33,0932 4,7276X2 7 215,3013 105,9387 15,1341X3 7 186,1065 135,1335 19,3048X4 7 100,8594 220,3806 31,4829X1, X2 6 312,0172 9,2228 1,5371X1, X3 6 317,4555 3,7845 0,6307

    X1, X4 6 301,9647 19,2753 3,2126X2, X3 6 318,2036 3,0364 0,5061X2, X4 6 277,1571 44,0829 7,3471X3, X4 6 187,2354 134,0046 22,3341X1, X2, X3 5 318,2503 2,9897 0,5979X1, X2, X4 5 312,0221 9,2179 1,8436X1, X3, X4 5 317,6410 3,5990 0,7198X2, X3, X4 5 318,2101 3,0299 0,6060X1, X2, X3, X4 4 318,2744 2,9656 0,7414

  • 8/18/2019 2003.2 - Pauta

    11/14

    ICN 312, Stgo., PFR, Certamen No. 1 / 4  –  09 - 2003 11

    a)  Seleccione un modelo por el método de todas las regresiones posibles.

    Modelog.l.

    residual SC(regre) SC(error) CM(error) R2 Cp

    X1 7 288,1468 33,0932 4,7276 0,897 39,6X2 7 215,3013 105,9387 15,1341 0,670 137,9X3 7 186,1065 135,1335 19,3048 0,579 177,3X4 7 100,8594 220,3806 31,4829 0,314 292,2X1, X2 6 312,0172 9,2228 1,5371 0,971 9,4X1, X3 6 317,4555 3,7845 0,6307 0,988 2,1X1, X4 6 301,9647 19,2753 3,2126 0,940 23,0X2, X3 6 318,2036 3,0364 0,5061 0,991 1,1X2, X4 6 277,1571 44,0829 7,3471 0,863 56,5X3, X4 6 187,2354 134,0046 22,3341 0,583 177,7

    X1, X2, X3 5 318,2503 2,9897 0,5979 0,991 3,0X1, X2, X4 5 312,0221 9,2179 1,8436 0,971 11,4X1, X3, X4 5 317,641 3,599 0,7198 0,989 3,9X2, X3, X4 5 318,2101 3,0299 0,606 0,991 3,1X1, X2, X3, X4 4 318,2744 2,9656 0,7414 0,991 5,0

    El mejor modelo seleccionado a través del método de todas las regresiones posiblesserá aquel que cumpla con la mayor SC(regresión) y menor SC (error), siendo los posibles candidatos los modelos: (X2, X3), (X1, X2, X3), (X1, X2, X4), (X2, X3, X4) y(X1, X2, X3, X4).

    Además, se seleccionan por Cp más cercano al número de variables. Esto reduce laselección a los modelos (X2, X3) (X1, X2, X3) y (X2, X3, X4). Si no se deseacolinealidad, cualquiera de los modelos con tres variables es admisible. El modelocon dos variables tiene algo de colinealidad, mínimo valor del CME y menornúmero de variables.

    b)  Partiendo de un modelo con dos o tres variables (a su elección), realice una

    iteración del método paso a paso ascendente

    Supongamos que partimos con el modelo:  Y = 0  + 1  X1  + 2  X2, siendo loscandidatos a entrar X3  ó X4, entrando el que tiene mayor correlación parcial.Analicemos las dócimas parciales para ver cual debe entrar.

    10,42 5979,0

    312,0172-318,2503 

    CME

    SCR SCR  E

    )3,2,1(

    )2,1((1,2,3)

    3  

     

  • 8/18/2019 2003.2 - Pauta

    12/14

    ICN 312, Stgo., PFR, Certamen No. 1 / 4  –  09 - 2003 12

    0,00265 8436,1

    312,0172-312,0221 

    CME

    SCR SCR  E

    )4,2,1(

    )2,1((1,2,4)

    4  

     

    Por lo tanto, E3 = 10,42 tiene la dócima parcial mayor y X3 es la variable candidataa ingresar al modelo; además E3 = 10,42  F1 ; 5 ; 0,95 = 6,61 entonces la variable X3  produce el incremento mas significativo en la SC(regresión), por lo cual debeingresar al modelo, quedando este establecido por Y = 0 + 1 X1 + 2 X2 + 3 X3

    c)  Partiendo del modelo con las variables X1, X2 y X3, realice una iteración

    del método paso a paso descendente

    Supongamos el modelo completo como Y = 0 + 1 X1 + 2 X2 + 3 X3, siendo loscandidatos a salir X1  ó X2  ó X3, saliendo el que tiene menor correlación parcial.Entonces, analizando las dócimas parciales tenemos:

    0,078 5979,0

    318,2036-318,2503 

    CME

    SCR SCR  E

    )3,2,1(

    )3,2((1,2,3)

     

    1,329 5979,0

    317,4555-318,2503 

    CME

    SCR SCR  E

    )3,2,1(

    )3,1((1,2,3)

     

    10,42 5979,0

    312,0172-318,2503 

    CME

    SCR SCR  E

    )3,2,1(

    )2,1((1,2,3)

     

    Por lo tanto, la dócima E1 es la menor, entonces X1 debiera salir del modelo. ComoE1 no es significativo, debemos retirar esta variable del modelo, quedando esteestablecido por Y = 0 + 2 X2 + 3 X3

  • 8/18/2019 2003.2 - Pauta

    13/14

    ICN 312, Stgo., PFR, Certamen No. 1 / 4  –  09 - 2003 13

    d)  Partiendo del modelo con las variables X3 y X4, realice una iteración del

    método paso a paso mixto (puede usar sus resultados previos, si lo desea)

    Comenzaremos el análisis del paso a paso mixto con una iteración del métodoascendente, partiendo con el modelo: Y = 0 + 3 X3 + 4 X4, siendo los candidatosa entrar X1 ó X2. Analicemos las dócimas parciales para ver cual debe entrar.

    181,169 7198,0

    187,2354-317,6410 

    )4,3,1(CME

    )4,3(SCR SCR(1,3,4) E1  

     

    216,129 6060,0

    187,2354-318,2101 

    )4,3,2(CME

    )4,3(SCR SCR(2,3,4) E2  

     

    Por lo tanto, E2  = 216,129 tiene la dócima parcial mayor y X2 es la variable

    candidata a ingresar al modelo; además debemos notar que ambas dócimas parciales son mayores que F1 ; 5 ; 0,95 = 6,61 pero la que produce un incremento mássignificativo en la SC(regresión) es X2, por lo cual debe ingresar al modelo,quedando este establecido por Y = 0 + 2 X2 + 3 X3 + 4 X4

    Ahora, realizar una iteración del método descendente, partiendo con el modeloestablecido en la parte anterior Y = 0 + 2 X2 + 3 X3 + 4 X4 siendo los candidatosa salir X2 ó X3 ó X4. Analizando las dócimas parciales tenemos:

    216,129 6060,0187,2354-318,2101 

    )4,3,2(CME)4,3(SCR SCR(2,3,4) E2    

    67,74 6060,0

    277,1571-318,2101 

    )4,3,2(CME

    )4,2(SCR SCR(2,3,4) E3  

     

    0,011 6060,0

    318,2036-318,2101 

    )4,3,2(CME

    )3,2(SCR SCR(2,3,4) E4  

     

    Por lo tanto, la dócima E4 es la menor, entonces X4 debiera salir del modelo. ComoE4 no es significativo, debemos retirar esta variable del modelo, quedando Y = 0 +2 X2 + 3 X3 

  • 8/18/2019 2003.2 - Pauta

    14/14

    ICN 312, Stgo., PFR, Certamen No. 1 / 4  –  09 - 2003 14

    9. (3 pts) En un estudio de las remuneraciones de gerentes de empresas se

    ajusta el modelo siguiente usando los datos de 50 empresas:

    Ln R = 7,57 + 0,165 ln V –  0,196 ln NE; R 2 = 0,54; S = 0,25

    (4,54) (-5,04)

    Donde V = Ventas, NE = No. Empleados de la empresa, R remuneraciones

    gerenciales y los valores entre paréntesis son los estadígrafos t.

    a)  Interpretar los coeficientes

    Al ser un modelo logarítmico, los coeficientes son elasticidades de la respuestacon respecto a cada predictora.Las rentas gerenciales son inelásticas respecto a las ventas, aunque tienden a

    aumentar un poco con el aumento de las ventas. No así con el número deempleados, pues, aunque siguen siendo inelásticas, la tendencia es a disminuirsegún el aumento en la cantidad de empleados.Ambos casos interpretados son consecuentes con la economía de una empresa.

    b)  Calcular los coeficientes de correlación parcial. ¿Qué podría decir de las

    correlaciones parciales entre las variables originales, no transformadas?

    0,552 r  0,305 

    474,54

    54,4 

    .l.gE

    E R 

     NEV,R 2

    2

    2

    1

    2

    1 NE)V,(R 

    2

     

    0,592 r  0,351 475,04

    04,5 

    .l.gE

    E R 

    V NE,R 2

    2

    2

    2

    2

    2V) NE,(R 

    2

     

    Como log es una transformación monótona, las correlaciones moderadas que seaprecian arriba serán también moderadas entre las variables originales.