2006.2 - Pauta (1)

download 2006.2 - Pauta (1)

of 4

Transcript of 2006.2 - Pauta (1)

  • 8/18/2019 2006.2 - Pauta (1)

    1/4

    ICN 312 –  ECONOMETRÍAICIPEV / Certamen 1 / 12 de agosto de 2006Santiago, Trimestre 2Prof. Pedro Fernández de la Reguera Nota:

    NOMBRE:

    Cómo responder al certamen:

    1.  Revise el certamen por entero antes de empezar a contestar

    2.  Determine su estrategia para completar el máximo de respuestascorrectas en el mínimo de tiempo (por ejemplo, intente todas laspreguntas; una letra, al menos, por pregunta),

    3.  Son 180 puntos a responder en 160 minutos.

    Pregunta Ptos. Preg. Ptos. Obten Obs

    1 10

    2 10

    3 10

    4 10

    5 106 10

    7 10

    8 20

    9 40

    10 50

    Total: 180

    Nota = 100*(Ptos. obtenidos) / 180

  • 8/18/2019 2006.2 - Pauta (1)

    2/4

    ICN 312 / CERTAMEN 1 / ICIPEV / SANTIAGO / 12 AGOSTO 2006 2

    1.  Explique los criterios que hay para decidir si una observación es influyente y/o atípica en unmodelo de regresión

    Respuesta correcta si explica cuatro de los métodos siguientes:Atípico: residual fuera del intervalo [-2; 2]

    residual fuera del intervalo [-t*; t*]Influyente: Apalancamiento, DFBETA, DFBETAS, rsidual omitido

    Atíp/Influ: D de Cook

    2.  Se estima un modelo usando 17 observaciones. Resultados son los siguientes:

    Matriz X´X inv = 1,9635 -0,0769 0,1265 0,0611

    -0,0769 0,0032 -0,0105 -0,0078

    0,1265 -0,0105 0,3261 0,1505

    0,0611 -0,0078 0,1505 0,4772

     Nota: Filas y columnas corresponden a Xo y las tres variables exógenas

    iŶ = 8,157 + 0,560 X

    i + 0,876 D1

    i + 2,825 D2

     ANOVA g.l. sc cm F calc. Valor-p

    Regresión 3 145,0671600 48,3557 12,755 0,00036

    Residuos 13 49,284997 3,7912

    Total 16 194,3521500

    Estime el valor promedio de Y, usando un intervalo al 95% de confianza, si X = 26,8; D1 = 0 yD2 = 1.

    Var(Y^) = S2*( x´i (X´X)-1 xi ) = 3,7912 *

    1  30,1  0  1 1,9635 -0,0769 0,1265 0,0611 1-0,0769 0,0032 -0,0105 -0,0078 30,1

    0,1265 -0,0105 0,3261 0,1505 0

    0,0611 -0,0078 0,1505 0,4772 1

    Var(Y^) = 3,7912 * 0,363192 = 1,3769 = ( 1,1734 )2 

    t* = t(13, 0,975) = 2,16Intervalo al 95% de confianza para la media:

    E[ Y | x = (1; 30,1; 0; 1)´ ] = 27,8280

     2,16 * 1,1734 = 27,828

     2,535O sea, 25,293   Y    30,363

    3.  Planteado el modelo muestral Yi = o + 1X1i + 2X2i + 3X3i + i  , se lo estima por MCO

    obteniendo el modelo estimado Ŷ i  = bo + b1X1i  + b2X2i  + b3X3i. ¿Qué cosa está siendo

    estimada por Ŷ i ?

    Se obtiene un solo número para cada i= 1, 2, ..., n observación. Este númerorepresenta una estimación del promedio poblacional E[ Y | xi  ] o bien unaestimación puntual del valor real Yi.

    4.  Se trata de estimar el modelo y = X +  . ¿Qué cambios se producen en las estimaciones sitodas las variables (endógenas, exógenas) se estandarizan a media cero y varianza unitaria?

    Cambian los coeficientes, pero mantienen las proporciones, dócimas (valores t son

    los mismos), excepto para el intercepto.

    5.  Explique qué es la multicolinealidad, cómo afecta al modelo y cómo podría eliminarse delmodelo.

  • 8/18/2019 2006.2 - Pauta (1)

    3/4

    ICN 312 / CERTAMEN 1 / ICIPEV / SANTIAGO / 12 AGOSTO 2006 3

    La multicolinealidad es la asociación lineal ( o correlación) que hay entre una variable endógena

    X y las demás (o, al menos una de las demás). Se la puede eliminar dle modelo eliminando una

    de las variables X colineales con otra(s).

    6.  Demuestre que el estimador MCO de β (= (X´X)-1 X´y ) es insesgado.

    Expresión de b en términos de :b = (X'X)-1 X'y = (X'X) -1 X'(X  + ) = + (X'X) -1 X' 

    E[ b ] = E[ + (X'X) -1 X' 

    ] = + (X'X) -1 X'E[ 

    ] = , pues E[ 

    ] = 0.

    7.  Demuestre que la varianza de β̂  es σ2 (X´X)-1  1 

    Var( b ) = Var( + (X'X) -1 X'  ) = Var ( (X'X) -1 X'  )= (X'X) -1 X' [

    2 I ] [(X'X) -1 X']´ = 2 (X'X) -1 

    8.  Se trata de analizar la relación entre dos variables, X e Y, para lo que se proponen lossiguientes dos modelos: 2 

    Yt = α + β Xt  + εt  (1)

    Xt = γ + δ Yt  + ηt  (2)

    a)  Sabiendo que el coeficiente de determinación de la regresión (1) es 0,98, calcule elcoeficiente de determinación en la regresión (2).

    Como R2 es el cuadrado de la correlación entre X e Y, el R2 del modelo (2) es el mismo delmodelo (1); es decir, 0,98.

     b)  ¿Qué implicaciones tiene considerar el coeficiente de correlación lineal simple como unamedida de la bondad del ajuste ?

    Un R2 alto se puede lograr agregando variables al modelo. Entonces, un R2 alto indica que lacorrelación múltiple de Y con todas las X es alta, pero NO indica que el modelo sea “bueno” en

    términos de tener las variables adecuadas y en número o cantidad mínima.

    9.  (40 puntos) El camionero Juan Pérez realiza fletes locales de corto recorrido, sin salir de suregión. Acostumbra comprar el petróleo para su camión en una gasolinera cercana a su

    domicilio, en el mismo contador, y anotar los litros comprados así como la distancia recorrida

    en cada ocasión. Las última observaciones han sido: 3 

    Distancia (km) Petróleo (litros)

    320 168

    356 192

    596 318

    325 170

    220 118

    423 223

    365 195

    A la siguiente ocasión se encuentra con que la gasolinera ha cambiado de dueño y registra 234

    km con una compra de 140 litros de petróleo. Más tarde escucha que el nuevo dueño hamanipulado la bomba a fin de tener litros “más pequeños”, de manera que cobra a sus clientes

    más de lo que corresponde.

    Suponiendo que las condiciones del camión no han variado, docime la hipótesis de que el

    contador de la gasolinera funciona correctamente, usando una confianza del 95%.

    1 Fernández, pág. 382 Fernández, pág. 443 Fernández, pág. 59

  • 8/18/2019 2006.2 - Pauta (1)

    4/4

    ICN 312 / CERTAMEN 1 / ICIPEV / SANTIAGO / 12 AGOSTO 2006 4

    Se trata de calcular un pronóstico para petróleo = 140 litros, usando unintervalo de confianza para la media de Y. Si el valor registrado, 234 km, estáincluido dentro del intervalo, el dueño es honrado. Caso contrario, hayevidencia que tiene los “litros” “más cortos”. 

    a) Estimar el modelo: Distancia = 2,32 + 1,87 Petróleo.b) Tabla ANOVA

     ANOVA gl SC CM F valor-p de F

    Regresión 1 810.077.698 810.077.698 4.446.707.759 1,44E-05

    Residuos 5 910.873.552 18.217.471

    Total 6 810.988.571

    c)  Varianza de Y^

    Var(D^ medio) = S2 * ( x´(X´X)-1 x ) = S2= (S2 = 18,217471 con 5 g.l.) * (1, 140) * M * (1, 140)´

    Donde =

    X´X = 7 1384(X´X) inv

    =1.83120056

    -0.00853931

    1384 296790-

    0.008539314.319E-05

    d) Intervalo al 95% de confianza:Distancia estimada para petróleo = 140 es D^ = 264,19Vector x´ = (1; 140)Intervalo confianza es 264,19 ± t* √{18,217471 * (1; 140) (X´X)-1 (1; 140)´}del t* = t(5; 0,05) = 2,57.

    10. (50 puntos) Los datos siguientes son los consumos de carne de 250 familias, donde Yi =consumo en carne, en cientos de pesos; X1i = renta, en miles de pesos de la familia i-ésima;

    X2i = gasto en pescado, en miles de pesos y X3 = número de miembros de la familia (no

    usada). Para analizar Y se propone el modelo de regresión lineal habitual: Y i  = βo + β1 X1i 

    + β2 X2i  + εi. 4 

    250,00 501,20 45,00 0,0717 -0,0139 -0,2211

    (X´X)= 501,20 1170,37 88,85

    (X´X)-1 = -0,0139 0,0061 0,0092

    45,00 88,85 9,00 -0,2211 0,0092 11,252

    Σ Yi  = 7812,5 ΣYX1i  = 17730

    ΣY2  = 280657,225 ΣY X2i  = 1377,5

    a)  Interpretar los parámetros del modelo. ¿qué signos esperaría que tuvieran?

     b)  Estimar el modelo propuesto por MCOc)  Obtener el coeficiente de determinación. Interpretarlo.

    d)  Obtener la matriz de varianzas y covarianzas de β̂  

    e)  La información sobre los resultados, que se entrega arriba, ¿es suficiente para calcular ladistancia de Cook?. Si no es suficiente, ¿qué datos faltan y que no se pueden obtener delos resultados entregados?.

    4 Fernández, pág. 71