So Lucio Nario Wood Ri Edge 2

43
Capitulo 2. Notas para la enseñanza Este es el capítulo en el que esperamos que los estudiantes la mayoría sigue, si no todas, de las derivaciones algebraicas. En la clase me gusta para obtener al menos la insesgadez del coeficiente de la pendiente MCO, y por lo general derivar la varianza. Como mínimo, me refiero a los factores que afectan la varianza. Para simplificar la notación, después de destacar los supuestos en el modelo de la población, y asumir al azar muestreo, al cabo de condiciones en los valores de las variables explicativas de la muestra. Técnicamente, esto se justifica mediante un muestreo aleatorio, ya que, por ejemplo: E (ui | x1, x2,..., x n) = E (ui | xi) por muestreo independiente. Me parece que los estudiantes son capaces de centrarse en el supuesto clave SLR.3 y posteriormente tomar mi palabra acerca de cómo acondicionado en las variables independientes en la muestra es inofensivo. (Si lo prefiere, el apéndice del capítulo 3 hace el argumento acondicionado con cuidado.) Debido a la inferencia estadística no es más difícil la regresión múltiple que en la regresión simple, Puedo posponer la inferencia hasta el capítulo 4. (Esto reduce la redundancia y le permite centrarse en las diferencias de interpretación entre regresión simple y múltiple). Usted puede notar cómo, en comparación con la mayoría de otros textos, yo uso

Transcript of So Lucio Nario Wood Ri Edge 2

Page 1: So Lucio Nario Wood Ri Edge 2

Capitulo 2.Notas para la enseñanza

 

Este es el capítulo en el que esperamos que los estudiantes la mayoría sigue, si no todas, de las derivaciones algebraicas. En la clase me gusta para obtener al menos la insesgadez del coeficiente de la pendiente MCO, y por lo general derivar la varianza. Como mínimo, me refiero a los factores que afectan la varianza. Para simplificar la notación, después de destacar los supuestos en el modelo de la población, y asumir al azar muestreo, al cabo de condiciones en los valores de las variables explicativas de la muestra. Técnicamente, esto se justifica mediante un muestreo aleatorio, ya que, por ejemplo:

E (ui | x1, x2,..., x n) = E (ui | xi) por muestreo independiente. Me parece que los estudiantes son capaces de centrarse en el supuesto clave SLR.3 y posteriormente tomar mi palabra acerca de cómo acondicionado en las variables independientes en la muestra es inofensivo. (Si lo prefiere, el apéndice del capítulo 3 hace el argumento acondicionado con cuidado.)

Debido a la inferencia estadística no es más difícil la regresión múltiple que en la regresión simple, Puedo posponer la inferencia hasta el capítulo 4. (Esto reduce la redundancia y le permite centrarse en las diferencias de interpretación entre regresión simple y múltiple).  Usted puede notar cómo, en comparación con la mayoría de otros textos, yo uso los supuestos relativamente pocos derivar el insesgamiento del estimador MCO pendiente, seguido por la fórmula para su varianza. Esto se debe a que no se introducen los supuestos redundantes o innecesarios. Por ejemplo, una vez SLR.3 se supone, nada más sobre la relación entre U y X es necesaria para obtener el insesgamiento de la Operación en un muestreo aleatorio.

Page 2: So Lucio Nario Wood Ri Edge 2

SOLUCIONES A LOS PROBLEMAS 2.1 (i) Los ingresos, edad y antecedentes familiares (por ejemplo, número de hermanos) son sólo algunas posibilidades. Parece que cada uno de ellos podría estar correlacionado con los años de educación. (Ingresos y la educación son probablemente una correlación positiva, con una edad y la educación puede ser una correlación negativa porque las mujeres en las cohortes más recientes tienen, en la educación media, más, y el número de hermanosy la educación son probablemente una correlación negativa.)

   (II) No, si los factores que figuran en la parte (i) se correlacionan con educ. Debido a que nos gustaría, tienen estos factores fijos, que son parte del término de error. Pero si U se correlaciona con educ a continuación E (u | EDUC) ≠ 0, y así SLR.3 falla.

2.2 En la ecuación y = β0 + β1x + u, sumar y restar α0 desde el lado derecho para obtener

y = (α0 + β0) + β1x + (u - α0). Llame al nuevo error e = u - α0, de modo que E (e) = 0. La

intersección es nueva α0 + β0, pero la pendiente es todavía β1.

2.3 (i) Sea yi = GPAI, xi = ACTi, y n = 8. Entonces x (media) = 25,875, y media = 3,2125,

x1ni=Σi – x)(yi – y)= 5.8125, and (x1ni=Σi – x)2 = 56.875. = 56,875. De la ecuación (2.9), se

obtiene la pendiente como una ß = 5.8125/56.875 0.1022, redondeado a cuatro lugares después del punto decimal. A partir de (2.17), ≈ 0 β = y -1 β x 3,2125 - (0,1022) 25.875 = 0.5681. Por lo tanto podemos escribir:

GPA    = 0.5681 + 0.1022 ACT.n=8.

La intersección no tiene una interpretación útil ya que la ACT no está cerca de cero para lapoblación de interés. Si la ACT es de 5 puntos por encima, se incrementa en 0,1022 (5) = 0.511. GPA

  (II) Los valores ajustados y los residuos - redondeado a cuatro decimales - se administran junto con la observación número i y GPA en la siguiente tabla: i GPA GPA u1 2.8 2.7143 .08572 3.4 3.0209 .37913 3.0 3.2253 -.22534 3.5 3.3275 .17255 3.6 3.5319 .06816 3.0 3.1231 -.12317 2.7 3.1231 -.42318 3.7 3.6341 .0659

Page 3: So Lucio Nario Wood Ri Edge 2

Usted puede verificar que los residuos, según lo informado en la tabla, suma que - .0002, que está muy cerca de cero dado el error de redondeo inherente.

(III) Cuando ACT = 20, GPA (estimado)= 0.5681 + 0.1022 (20) ≈ 2,61.

   (IV) La suma de los cuadrados de los residuos, (Σu^2) es de aproximadamente 0,4347 (redondeado a cuatro decimales), y la suma total de cuadrados, (Σ yi - y)^2, Es de aproximadamente 1,0288. Así que el R-cuadrado de la regresión es:

R^2  = 1 - SSR / SST ≈ 1 - (.4347/1.0288) ≈ 0.577.

Por lo tanto, alrededor de 57,7% de la variación en el GPA se explica por ACT en esta pequeña muestra de estudiantes.

 2.4 (i) Cuando cigs = 0, predijo que el peso al nacer es de 119.77 onzas. Cuando cigs = 20 = 109,49. Esto se trata de una caída de 8,6%.  Bwght

   (II) No necesariamente. Hay muchos otros factores que pueden afectar el peso al nacer, en particular estado general de salud de la madre y la calidad de la atención prenatal. Estos podrían ser correlacionados con el tabaquismo durante el nacimiento. Por otra parte, algo así como el consumo de cafeína puede afectar el nacimiento y el del peso, y también podría estar relacionada con el tabaquismo.

   (III) Si queremos un bwght previsto de 125, entonces cigs = (125 - 119,77) / (- 0.524) = -10,18, o aproximadamente -10 cigarrillos. Eso es una tontería, por supuesto, y muestra lo que sucede cuando estamos tratando de predecir algo tan complicado como el peso al nacer con sólo una sola variable explicativa. El mayor peso que predijo el nacimiento es necesariamente 119,77. Sin embargo, casi 700 de los nacimientos en la muestratenía un peso al nacer superior a 119,77.   (IV) 1,176 fuera de 1,388 mujeres que no fumaron durante el embarazo, u 84,7%.

2.5 (i) La intersección implica que cuando inc = 0, se prevé que “cons” sea negativa en $ 124,84. Esto, por supuesto, no puede ser verdad, y refleja el hecho de que esta función de consumo puede ser un mal predictor del consumo a muy bajos niveles de ingresos. Por otro lado, sobre una base anual, $ 124,84 no está tan lejos de cero.

   (II) Sólo tiene que conectar 30.000 en la ecuación: cons = -124,84 + 0,853 (30,000) = 25,465.16 dólares.

   (III) El MPC y la APC se muestran en el gráfico siguiente. A pesar de que la intersección es negativa, el más pequeño de APC en la muestra es positivo. La gráfica comienza en un nivel de ingresos anuales de $ 1.000 (en dólares de 1970).

Page 4: So Lucio Nario Wood Ri Edge 2

2.6 (I) Sí. Si vive cerca de un incinerador deprime los precios de la vivienda, siendo entonces más lejos aumenta el precio de la vivienda.

    (II) Si la ciudad decidió ubicar la incineradora en una zona alejada de la más caralos barrios, entonces log (dist) se correlaciona positivamente con la calidad de la vivienda. Esto violaría Estimación de SLR.3 y OLS es sesgado.

    (III) Tamaño de la casa, número de cuartos de baño, tamaño del lote, edad de la casa, y la calidad del barrio (incluyendo la calidad de la escuela), son sólo algunos de los factores. Como se menciona en parte (II), se trata sin duda podría estar relacionada con dist [y log (dist)]. 2.7 (I) Cuando en la condición de inc en el cálculo de la expectativa, √ inc se convierte en una constante. Tanto E (u | inc) = E (√ inc (e) |inc) = √inc ⋅ E (e | inc) = √ inc (0) porque E(e | inc) = E (e) = 0.    (II) Una vez más, cuando en la condición de inc en el cálculo de la varianza, inc se convierte en una constante. Tanto Var (u|inc)=Var (inc⋅e|inc)=(inc) Var (u | inc) = Var(√ inc (e)|inc) = (√inc )^2 Var (e | inc) = σ^2 inc, porque Var(e|inc) = σ^2.

    (III) Las familias de bajos ingresos no tienen mucha discreción sobre el gasto, por regla general, una familia de bajos ingresos tiene que gastar en comida, ropa, vivienda y otras necesidades. A mayores ingresos la gente tiene más criterio, y algunos podrían elegir más el consumo, mientras que otros, más ahorro de energía. Este criterio sugiere una mayor variabilidad en el ahorro de las familias de mayores ingresos.

 

Page 5: So Lucio Nario Wood Ri Edge 2

2.8 (i) De la ecuación (2.66),

La conexión de yi = β0 +β1Xi+ Ui da

Después de álgebra estándar, el numerador se puede escribir como

Poner esto en el denominador muestral se puede escribir como

Condicional en xi, tenemos

Por que E(Ui) = 0 para todo i. Por lo tanto, el sesgo en está dado por el primer término en esta ecuación. Este sesgo es, obviamente, cero cuando β0 = 0. También es cero cuando

= 0, que es el mismo que = 0. En este último caso, la regresión a través del origen es idéntica a la regresión con una intersección.

     (ii) De la última expresión de , en parte, (i) que tenemos, condicionada a la X1,

Page 6: So Lucio Nario Wood Ri Edge 2

   (iii) A partir de (2.57), desde y

también, Una forma más directa de ver esto es escribir

Que es menor que menos que X= 0

(Iv) Para un tamaño de muestra, el sesgo en β1 aumenta a medida que aumenta x (titulares de la suma de la X^2i fijo). Pero a medida que aumenta x, la varianza de una β aumenta en relación con Var (β1). El sesgo en β1 también es pequeño cuando β es pequeño. Por lo tanto, si se prefiere β1 o β1 en un error cuadrático medio base depende de los tamaños de β,

x, y N (en adición al tamaño de βo, Xmedia, y n (en adición al tamaño de .

2.9 (I) Seguimos la pista, señalando que (la media de la muestra de c1Yi veces

promedio de la muestra de yi) y Cuando hacemos una regresión en la c1yi C2Xi (incluyendo una intercepción) que utilizará la ecuación (2.19) para obtener la pendiente:

A partir de (2.17), obtenemos la ordenada como

ya que el

intercepto de la regresión Yi en Xi es   

(ii) Se utiliza el mismo enfoque de la parte (i), junto con el hecho de que y

por lo tanto y

Así que C1 y C2 por completo abandono de la fórmula de la pendiente de

la regresión de (C1 +Yi) el (C2 + Xi), y . La intersección es

que es lo que quería mostrar.

Page 7: So Lucio Nario Wood Ri Edge 2

  (iii) Simplemente se puede aplicar la parte (ii) porque log(C1) + log(Y1). En otras palabras, reemplazar a C1 con log (C1), Yi, con registro de (Yi), y el conjunto C2 = 0.   (iv) Una vez más, podemos aplicar la parte (ii) con C1 y C2 = 0 reemplazando C2 con log de (C2) y XI, con log(Xi). Si es ß0 y β1 son el intercepto y la pendiente original, luego

 SOLUCIONES A LOS EJERCICIOS DE INFORMÁTICA

 2.10 (I) El prate promedio es de aproximadamente 87,36 y el mrate promedio es de 0.732.   (II) La ecuación estimada es:

prate = 83.05 + 5.86 mraten = 1.534

R^2 = 0.075.

   (III) La intersección implica que, incluso si mrate = 0, la tasa de actividad predicha es 83,05%. El coeficiente de mrate implica que un aumento de un dólar en la tasa de encuentro – un aumento bastante grande - se calcula que aumentará prate de 5,86 puntos porcentuales. Esto supone, por supuesto, que este cambio en prate, es posible (si, por ejemplo, prate ya está en 98, hace que esta interpretación no tenga sentido).   (IV) Si se conecta mrate = 3,5 en la ecuación obtenemos prate = 83.05 + 5.86 (3.5) = 103.59. Esto es imposible, ya que puede tener como máximo una tasa de participación 100%. Esto ilustra que, sobre todo cuando las variables dependientes están acotadas, un modelo de regresión simple puede dar extraña predicciones para los valores extremos de la variable independiente. (En la muestra de 1,534 empresas, sólo 34 tienen mrate ≥ 3.5).

 (V) mrate explica aproximadamente 7.5% de la variación en prate. Esto no es mucho, y sugiere que muchos otros factores influyen en 401 (k) las tasas de participación en el plan.

2.11 (I) El salario promedio es de unos 865.864, lo que significa $865,864 dólares porque el salario es en miles de dólares. La media es de aproximadamente 7.95 ceoten.   (II) Hay cinco directores generales con ceoten = 0. El mandato más largo es de 37 años.   (III) La ecuación estimada es:

Log(salary) = 6.51+0,0097ceotenn=177

R^2 = 0.013.

Se obtiene el porcentaje de cambio aproximado en el salario dado Δceoten = 1 multiplicando el coeficiente de ceoten por 100, 100 (0.0097) = 0.97%. Por lo tanto, un año más como director general se prevé a aumentar el sueldo en casi un 1%. 

Page 8: So Lucio Nario Wood Ri Edge 2

2.12 (I) La ecuación estimada es:sleep = 3.586.4 – 0.151totwrk

n = 706,R^2 = 0.103.

La intersección implica que la cantidad estimada de sueño por semana para alguien que notrabajó es 3,586.4 minutos u horas 59.77 aproximadamente. Esto viene a ser alrededor de 8,5 horas por noche.

  (II) Si alguien trabaja dos horas más por semana, a continuación, Δtotwrk = 120 (porque

totwrk se mide en minutos), y así Δsleep = -0.151 (120) = -18.12 minutos. Esto es sólo unos minutos a una noche. Si alguien fuera a trabajar una hora más en cada uno de los cinco días hábiles, sleepΔ =   - 0.151 (300) = -45.3 minutos, o alrededor de cinco minutos cada noche. 2.13 (i) Salario promedio es de aproximadamente $ 957.95 y el coeficiente intelectual promedio es de 101.28. El estándar de la muestra de desviación del coeficiente intelectual es de 15.05, que es bastante cerca del valor de la población de 15 años.

(II) Esto requiere un modelo de nivel de nivel:   

Wage = 116.99 + 8.30 IQ   n = 935,

R^2  = 0.096.

Un aumento en el coeficiente intelectual de 15 aumentos de salario mensual prevista a las 8.30 (15) = $ 124,50 (en 1980 de dólares). IQ ni siquiera explican el 10% de la variación de los salarios.

    (III) Esto requiere un modelo de registro de nivel:

  log(salario) = 5.89 + 0.0088 IQn = 935

  R^2= 0.099.Si ΔIQ = 15, entonces Δlog(Wage) = 0.0088(15) = 0.132, que es el proporcional (aproximado)cambio en el salario previsto. El porcentaje de incremento es por lo tanto, aproximadamente 13.2.

2.14 (I) El modelo de elasticidad constante es un modelo log-log:

log(rd) = β0 + β1 log(ventas) + u.

Donde β1, es la elasticidad de “rd” con respecto a las ventas.

(II) La ecuación estimada es: log(rd)  = -4.105 + 1.076 log (ventas)

n = 32R^2   = 0.910.

Page 9: So Lucio Nario Wood Ri Edge 2

La elasticidad estimada de rd con respecto a las ventas es 1.076, lo que es justo por encima de uno. Un uno por ciento de aumento en las ventas se estima que aumentará en alrededor de RD 1,08%.

Page 10: So Lucio Nario Wood Ri Edge 2

Capitulo 3. Notas para la enseñanza

Para estudiantes de pregrado, no hago la mayor parte de las derivaciones de este capítulo, al menos no en detalle. Por el contrario, me concentro en la interpretación de los supuestos, los cuales se refieren principalmente a la población. Otro que es el muestreo aleatorio, la única hipótesis que involucra a más de las consideraciones de la población es la hipótesis acerca de ninguna colinealidad perfecta, donde la posibilidad de colinealidad perfecta en la muestra (incluso si no se produce en la población) debe ser tocada. El más importante es cuestión de colinealidad perfecta en la población, pero esto es bastante fácil prescindir de a través de ejemplos. Éstos vienen de mis experiencias con los tipos de problemas, las especificaciones del modelo que los principiantestienen problemas con el. La comparación de las estimaciones de regresión simple y múltiple - basada en la muestra en particular en la mano, a diferencia de sus propiedades estadísticas - por lo general deja una fuerte impresión. A veces no me molesto con la interpretación de regresión múltiple "fuera partialling”. En cuanto a las propiedades estadísticas, observe cómo tratar el problema de la inclusión de una variable irrelevante: ninguna derivación separada es necesaria, ya que el resultado se sigue en el teorema de la forma 3.1.

Me gusta para derivar el sesgo de variable omitida en el caso sencillo. Esto no es mucho más difícil de mostrar insesgamiento de MCO en el caso de regresión simple en los cuatro primeros supuestos de Gauss-Markov. Es importante conseguir que los alumnos se pongan a pensar en este problema desde el principio, y antes de que muchos otros (no es necesario) los supuestos se han introducido.

Intencionalmente he mantenido la discusión de multicolinealidad a un mínimo. En parte, esto indica mis prejuicios, pero también refleja la realidad. Es, por supuesto, muy importante para los estudiantes llegar a entender en las posibles consecuencias de tener una alta correlación variables independientes. Pero esto es a menudo más allá de nuestro control, excepto que le podemos pedir menos de nuestro análisis de regresión múltiple. Si dos o más variables explicativas están altamente correlacionadas en la muestra, no debemos esperar que, precisamente, estimar sus efectos ceteris paribus de la población. Me parecen tratamientos extensos de multicolinealidad, donde unas "pruebas" o de alguna manera "soluciona" el problema de multicolinealidad, para inducir a error, en el mejor de los casos. Incluso la organización de algunos de los textos da la impresión de que la multicolinealidad imperfecta es en cierto modo una violación de la de Gauss-Markov supuestos: que incluyen multicolinealidad en un capítulo o una parte del libro dedicado a la "violación de los supuestos básicos ", o algo por el estilo. He notado que los estudiantes de maestría que tienen algunos conocimientos en la econometría de pregrado se confunden a menudo sobre la cuestión de la multicolinealidad.

Es muy importante que los estudiantes, no confundan la multicolinealidad entre las variables explicativas incluidas, variables en un modelo de regresión con el sesgo causado por la omisión de una variable importante. Yo no probaré el teorema de Gauss-Markov. En su lugar, hago hincapié en sus implicaciones. A veces, y, ciertamente, para los principiantes avanzados, pongo un caso especial del problema 3.12 en un examen de mitad de período, donde hacer una elección particular para la función g(x). En vez de que los estudiantes directamente puedan comparar las variaciones, se debe de recurrir al teorema de Gauss-Markov para la superioridad del MCO a través de cualquier otro estimador lineal e imparcial.

Page 11: So Lucio Nario Wood Ri Edge 2

SOLUCIONES A LOS PROBLEMAS 3.1 (i) hsperc se define de forma que cuanto menor es, menor es la posición del estudiante en la escuela secundaria. Manteniendo todo lo demás igual, la peor situación es la del estudiante en la escuela secundaria, menor es su espera que la universidad del GPA.   (ii) Sólo tiene que conectar estos valores en la ecuación:

 colgpa = 1.392 – 0.0135 (20) + 0.00148 (1.050) = 2.676.

  (iii) La diferencia entre A y B no es más que 140 veces el coeficiente de sat, porque hsperc es el mismo para los estudiantes. Así que, A, prevé contar con una puntuación de 0.00148 (140) = 0.207 más alto.  (iv) Con hsperc fijo, Δcolgpa = 0.00148 Δsat. Ahora, queremos encontrar Δsat de tal manera queΔcolgpa = 0.5, por lo que 0.5 = 0.00148 (Δsat) o Δsat = 0.5 / (0.00148) = $ 338.Quizás no sea sorprendente, una gran diferencia en la puntuación, ceteris paribus, SAT - casi dos y media desviaciones estándar – es necesario para obtener una diferencia prevista en la universidad o un GPA de medio punto. 3.2 (i) Sí. Debido a las limitaciones presupuestarias, tiene sentido que, a más hermanos que haya en una familia, la educación, es menor que la de un solo hijo en la familia. Para encontrar el aumento en el número de los hermanos que reduce la educación prevista por un año, se resuelve: 1= 0.094 (Δsibs), por lo que Δsibs =1/.094 = 10.6.

  (ii) Manteniendo fijos feduc, un año más de educación de la madre implica 0.131 años más de la educación prevista. Así que si una madre tiene cuatro años más de educación, su hijo se prevé, contar con alrededor de medio año (0.524) más años de educación.   (iii) Dado que el número de hermanos es el mismo, pero meduc y feduc son diferentes, elcoeficientes de meduc y feduc ambos tienen que tenerse en cuenta. La diferencia predicha enla educación entre B y A es 0.131 (4) + 0.210 (4) = 1.364. 3.3 (i) Si los adultos comrcian el sueño para el trabajo, más trabajo implica menos horas de sueño

(ceteris paribus), por lo que β1 < 0.

   (ii) Los signos de β2 y β3 no son evidentes, al menos para mí. Se podría argumentar que máspersonas educadas como para sacar más provecho de la vida, y por lo tanto, la igualdad de otras cosas, dormir menos (β2 < 0). La relación entre el sueño y la edad es más complicada que este modelo sugiere, y los economistas no están en la mejor posición para juzgar esas cosas.  (iii) Desde totwrk que es en cuestión de minutos, se deben convertir cinco horas en minutos: Δtotwrk = 5 (60) = 300. Entonces el sueño se ha previsto un descenso de 0.148 (300) = 44.4 minutos. Para una semana, 45 minutos menos de sueño no es un cambio enorme.

(iv) Más de la educación implica dormir menos tiempo previsto, pero el efecto es muy pequeño. Sisuponemos que la diferencia entre la universidad y la escuela secundaria es de cuatro años, el graduado de la universidad duerme unos 45 minutos menos por semana, permaneciendo todo lo demás constante.

   (V) No es sorprendente que las tres variables explicativas explican sólo alrededor de un 11.3% de

Page 12: So Lucio Nario Wood Ri Edge 2

la variación en el sueño. Un factor importante en el término de error es la salud general. Otro es el matrimonio estatus y, si la persona tiene hijos. Salud (sin embargo se mide eso), estado civil,y el número y edades de los niños por lo general se correlaciona con totwrk. (Por ejemplo, menoslas personas sanas tienden a trabajar menos.) 3.4 (i) Un rango más amplio de una escuela de derecho significa que la escuela tiene menos prestigio, lo que reduce los salarios iniciales. Por ejemplo, un rango de 100 significa que hay 99 escuelas que se consideran mejor.

 (ii) β1> 0, β2> 0. Tanto LSAT y el GPA son medidas de la calidad de la clase entrante.No importa dónde los mejores estudiantes asisten a la escuela de derecho, esperamos que para ganar más, en promedio. Β3, β4> 0. El número de volúmenes en la biblioteca de la ley y los costos de matrícula son las dos medidas de la escuela de calidad. (El costo es menos obvio que los volúmenes de la biblioteca, sino que, debe reflejar la calidad de los profesores, y la planta física de la facultad, etc.)

   (iii) Esto es sólo el coeficiente de la GPA, multiplicado por 100: 24.8%.   (iv) Se trata de una elasticidad: un aumento del uno por ciento en los volúmenes de la biblioteca supone un 0.095% de aumento en la partida prevista del salario medio, ceteris paribus.   (V) Es definitivamente mejor para asistir a una escuela de derecho con un rango inferior. Si la escuela de derecho A tiene un puesto situándose en el número 20 menos que la ley de la escuela B, la diferencia prevista en el salario inicial es de 100 (0.0033) (20) = 6.6% superior a la ley de la escuela A. 3.5(I) No. Por definición, study + sleep + work + leisure = 168. Así que si cambiamos estudio, debe cambiar por lo menos una de las otras categorías de modo que la suma es todavía 168.

   (ii) de la parte (i), podemos escribir, por ejemplo, estudiar como una función lineal perfecta de las otras variables independientes: estudio = 168 - el sueño - trabajo - ocio. Esto es válido para todas las observaciones, por lo MLR.3 es violado.   (iii) Simplemente coloque una de las variables independientes, por ejemplo leisure:

 GPA = β0 + β1 + estudio + β2 sueño β3 trabajo + u.

Ahora, por ejemplo, β1 se interpreta como el cambio en el GPA cuando estudio aumenta por una hora, donde el sueño, el trabajo, y U están mantiene fijo. Si estamos llevando a cabo el sueño y el trabajo fijo, pero cada vez mayor estudiar por una hora, entonces debemos ser la reducción de ocio en una hora. Los parámetros de pendiente de otros tienen una interpretación similar.

3.6 Para el acondicionamiento de los resultados de las variables explicativas, tenemos:

E (θ1) = E (β1 + β2) = E (β1) + E (β2) = β1 + β2 = θ1.

3.7 Sólo (ii), omitiendo una variable importante, puede causar sesgo, y esto sólo es cierto cuando lavariable omitida se correlaciona con las variables incluidas explicativas. La homocedasticidad,suposición. MLR.5, no desempeñó ningún papel en demostrar que los estimadores MCO son insesgados. (La Homocedasticidad fue utilizada para obtener las fórmulas de varianza estándar para la βj.) Además, el grado de colinealidad entre las variables explicativas de la muestra, incluso si se

Page 13: So Lucio Nario Wood Ri Edge 2

refleja en una correlación tan alta como 0.95, no afecta a los supuestos de Gauss-Markov. Sólo si hay una relación lineal perfecta entre dos o más variables explicativas es MLR.4 violados. 

3.8 Podemos utilizar la Tabla 3.2. Por definición, β2 > 0, y por supuesto, Corr(x1, x2) < 0.Por lo tanto, existe una polarización negativa en β1: E (β1) < β1. Esto significa que, en promedio, el simple estimador de regresión subestima el efecto del programa de capacitación. Es incluso posible que E (β1) sea negativa a pesar de que β1 > 0.

 3.9 (i) β1 < 0 debido a que más contaminación se puede esperar para bajar los valores de la vivienda, tenga en cuenta que es β1 la elasticidad del precio con respecto a los nox. β2 es probablemente positivo porque las habitaciones más o menos miden el tamaño de una casa. (Sin embargo, no nos permite distinguir entre los hogares donde cada habitación es grande de hogares donde cada habitación es pequeña.)   (ii) Si asumimos que los aumentos de las habitaciones con la calidad de la casa, entonces log (nox) y las habitaciones tienen una correlación negativa cuando los barrios más pobres tienen más contaminación, algo que es suele ser cierto. Se puede utilizar la Tabla 3,2 para determinar la

dirección de la polarización. Si β2 > 0 y Corr(x1, x2) < 0, el estimador de regresión simple β1 tiene un sesgo a la baja. Pero debido a β1 < 0, esto significa que la regresión simple, en promedio, exagera la importancia de la contaminación. [E (β1estimador) es más negativa que β1.]   (iii) Esto es lo que podemos esperar de la típica muestra sobre la base de nuestro análisis, en la parte (ii). La estimación de regresión simple, -1,043, es más negativa (mayor en magnitud) que el

múltiple estimación de regresión, -0.718. A medida que esas estimaciones son sólo para una muestra, nunca podemos saber qué está más cerca de β1. Pero si se trata de un "típico" de la

muestra, β1 está más cerca de -0.718. 3.10 De la ecuación (3.22) tenemos

Donde se definen en el problema. Como de costumbre, hay que conectar el verdadero modelo

para

Page 14: So Lucio Nario Wood Ri Edge 2

Del numerador de esta expresión, se simplifica debido a que:

Todos estos, siguen del hecho de que son los residuos de la regresión de en : y

el promedio de la muestra, tienen cero y no están correlacionados en la muestra con Por lo tanto el numerador de β1 se puede expresar como:

Poner estos detrás sobre el denominador da:

Bajo la condición de todos los valores de la muestra en x1, x2 y x3, sólo el último término es al

azar, debido a su dependencia. Pero E (ui) = 0, y así:

Que es lo que quería mostrar. Observe que el término β3 multiplicando es la regresión

del coeficiente de la regresión simple de xi3 en

3.11 (i) Las acciones, por definición, añadir a una. Si no, omitir una de las acciones luego de lala ecuación que sufren de multicolinealidad perfecta. Los parámetros no tendría una interpretación ceteris paribus en estas circunstancias, ya que es imposible cambiar una cuota mientras mantiene todos los otros partes fijas.

(ii) Dado que cada acción es una proporción (y puede ser a lo sumo una, cuando todas las otras acciones son cero), no tiene mucho sentido para aumentar sharep en una unidad. Si sharep aumenta por 0.01 - que es equivalente a un aumento de un punto porcentual en la proporción de impuestos

Page 15: So Lucio Nario Wood Ri Edge 2

sobre la propiedad en los ingresos totales -Sharei celebración, acciones, y los demás factores fijos, entonces el crecimiento se incrementa por β1 (0.01). Con las otras acciones, la cuota fija excluidos, Sharef, debe caer por 0.01 cuando se aumenta en un 0.01 sharep.

 3.12 (i) Por simplicidad notacional, definir esto no es bastante, la muestra de la covarianza entre Z y X debido a que no se dividen por n - 1, pero sólo estamos usando

para simplificar la notación. Entonces se puede escribir como :

Esto es claramente una función lineal de la yi: tomar los pesos que son .

Para mostrar insesgamiento, como siempre, nos conecta Yi = β0 + β1Xi + ui en esta ecuación, y simplificar:

Donde se utiliza el hecho de que siempre. Ahora SZX es una función de la zi y Xi

y el valor esperado de cada ui es cero condicional sobre todo zi y Xi en la muestra. Por lo tanto, condicionada en estos valores,

Page 16: So Lucio Nario Wood Ri Edge 2

Porque E (ui) = 0 para todo i.

(ii) De la cuarta ecuación de la parte (i), tenemos (una vez más condicionada a la zi y Xi en la muestra),

 

Debido a la suposición de homocedasticidad [Var(ui) = σ^2  para todo i]. Dada la

definición de Szx, esto es lo que quería mostrar.

(iii) Se sabe que Ahora podemos reorganizar la

desigualdad en la sugerencia, caída de la covarianza de la muestra, y cancelamos  

en todas partes, para obtener

Cuando multiplicamos por tenemos Var (β1) ≥ Var( ), que es lo hemos querido mostrar.

Page 17: So Lucio Nario Wood Ri Edge 2

SOLUCIONES A LOS EJERCICIOS DE INFORMÁTICA

 3.13 (i) Probablemente β2 > 0, como mayores ingresos normalmente significa una mejor nutrición para la madre y una mejor atención prenatal.

    (ii) Por un lado, un aumento de los ingresos en general, aumenta el consumo de un bien,cigs y faminc podría ser una correlación positiva. Por otro lado, los ingresos familiares son también más altos para las familias con más educación y más educación y fumar cigarrillos tienden a ser una correlación negativa. La correlación de la muestra entre el cigs y faminc se trata de -0.173, lo que indica una correlación negativa.   (iii) Las regresiones con bwght y sin faminc son:

      bwght = 119.77 - 0.514 cigs n = 1, 388

R^2 = 0.023

Y

      bwght = 116.97 – 0.463cigs + 0.093faminc    n = 1, 388

R^20 = 030.

El efecto de fumar cigarrillos es ligeramente más pequeño cuando faminc se añade a la regresión, pero la diferencia no es grande. Esto es debido al hecho de que cigs y faminc no están muy correlacionados, y el coeficiente de faminc es prácticamente pequeño. (El faminc variable se mide en miles, por lo que $ 10.000 más en 1988 que aumenta el ingreso predijo el peso al nacer por sólo 0.93 oz.)

 3.14 (i) La ecuación estimada es:

      price = - 19.32 + 0.128sqrft + 15.20bdrmsn = 88,

R^2 = 0.632.

   (ii) Películas de Holding cuadrada constante, Δprice = 15.20Δbdrms, y así los aumentos de precios de 15.20, lo que significa $ 15,200.   (iii) Ahora Δprice = 0.128Δsqrft + 15.20Δbdrms = 0.128 (140) + 15.20 = 33.12, o $ 33,120.Debido a que el tamaño de la casa está aumentando, este es un efecto mucho mayor que en (ii).

    (iv) Acerca de 63.2%.

(v) El precio previsto es -19,32 + 0.128 (2,438) + 15.20 (4) = 353.544, o 353,544 dólares.

 (vi) De la parte (v), el valor estimado de la vivienda basado sólo en superficie y número de dormitorios es $ 353,544. El precio de venta real fue de $ 300,000, lo que sugiere lo mal pagados

Page 18: So Lucio Nario Wood Ri Edge 2

por el comprador de un cierto margen. Pero, por supuesto, hay muchas otras características de una casa (algunos que ni siquiera se puede medir) que afectan a los precios, y no hemos controlado para estos.

3.15 (i) La ecuación de la elasticidad constante es: 

     log(salary) = 4.62 + 0.162 log(sales) + 0.107log(mktval)     n = 177,

R^2 = 0.299.

   (ii) No podemos incluir los beneficios en forma logarítmica porque los beneficios son negativos para las nueve muestras de las empresas. Cuando se agrega en los niveles de forma que obtenemos:

     Log (salary) = 4.69 + 0.161 log(sales) + 0.098 log (mktval) + 0.000036profits    n = 177

R^2 = 0.299 El coeficiente de los beneficios es muy pequeño. Aquí, los beneficios se miden en millones, por lo que, si los beneficios aumentan en $ 1 mil millones, lo que significa Δprofits = 1.000 - un cambio enorme - salario predicho aumenta en alrededor de sólo el 3.6%. Sin embargo, recuerde que estamos llevando a cabo las ventas y valor de mercado fijo. En conjunto, estas variables (y que podrían caer los beneficios sin perder nada) explican casi el 30% de la variación de la muestra en el log (salario). Este no es ciertamente "la mayoría" de la variación.

 (iii) Adicionando ceoten a la ecuación da: 

 log (salary) = 4.56 + 0.162 log (sales) 0.102 log (mktval) + 0.000029profits + 0.012 ceoten    

n = 177R^2 = 0.318

 Esto significa que un año más, a medida que aumenta CEO la predicción salarial, sube aproximadamente en 1.2%.   (iv) La correlación de la muestra entre el inicio (mktval) y las ganancias es de aproximadamente 0.78, que es bastante alta. Como sabemos, esto no causa ningún sesgo en los estimadores MCO, aunque puede causar a que su varianza a sea grande. Dada la correlación bastante sustancial entre el valor de mercado y la empresa beneficios, no es demasiado sorprendente que este último no añade nada a la explicación de los salarios del director general. Además, los beneficios es una medida a corto plazo de cómo la empresa está haciendo mientras mktval se basa en el pasado, presente, y se espera rentabilidad futura.

Page 19: So Lucio Nario Wood Ri Edge 2

3.16 (i) El mínimo, máximo y promedio de estas tres variables se dan en la siguiente tabla:

Variable Promedio Mínimo Máximo Atndrte 81,71 6,25 100priGPA 2,59 0.86 3,93ACT 22,51 13 32   (ii) La ecuación estimada es:

      atndrte = 75.70 + 17.26priGPA-1.72 ACT  n = 680

R^2  = 0.291.

 La intersección significa que, para un estudiante cuyo GPA antes es cero y la puntuación en el test es cero, la tasa prevista la asistencia es del 75.7%. Pero este no es un segmento interesante de la población. (De hecho, no hay estudiantes en la población universitaria con priGPA = 0 y ACT = 0.)

   (iii) El coeficiente de priGPA significa que, si antes GPA de un estudiante es un punto por encima (Por ejemplo, de 2.0 a 3.0), la tasa de asistencia es de unos 17.3 puntos porcentuales más. Esto el ACT fijo. El coeficiente negativo en el ACT es, tal vez al principio un poco sorprendente. Cinco puntos más en la ACT se prevé que baje la asistencia de 8,6 puntos porcentuales a un nivel dado de priGPA. Como priGPA mide el desempeño en la universidad (y, por lo menos parcialmente, podrían reflejar, la asistencia más allá las tasas), mientras que ACT es una medida del potencial en la universidad, parece que los estudiantes que tenían más npromesa (lo que podría significar más habilidad innata) piensan que pueden llegar a funcionar con clases que faltan.

(iv) tenemos atndrte = 75.70 + 17.267 (3.65) – 1.72 (20) ≈ 104,3. Por supuesto, un estudiante. No se puede tener mayor que una tasa de asistencia del 100%. Obtención de las predicaciones de este tipo siempre es posible cuando se utilizan métodos de regresión con los naturales límites superiores o inferiores de la variable dependiente. En la práctica, podemos predecir una tasa de asistencia del 100% para este estudiante. (De hecho, este estudiante tuvo una tasa de asistencia de sólo el 87,5%).

    (v) La diferencia en las tasas de asistencia previstas para A y B es 17.26 (3.1 - 2.1) - (21 -26) = 25.86.

3.17 La regresión de educ con exper y la antigüedad es: 

educ = 13.57 – 0.074 exper + 0.048 tenere +   n = 526,

R^2   = 0.101.

 

Page 20: So Lucio Nario Wood Ri Edge 2

Ahora bien, cuando hacemos una regresión log (salario) en obtenemos:

log (salario) = 1,62 + 0,092   n = 526,

R^2 = 0.207

Como se esperaba, el coeficiente de regresión en el segundo es idéntico al coeficiente de educen la ecuación (3.19). Observe que el R-cuadrado de la regresión anterior es menor que en (3.19).En efecto, la regresión en sólo utiliza la parte de educ que no está correlacionado con exper ypara explicar la tenencia de log (salario).

 3.18 (i) El coeficiente de la pendiente de la regresión en educ IQ está (redondeado a cinco

decimales)  δ1 = 3.53383. 

   (ii) El coeficiente de la pendiente de log (salario) en la educ es = 0.05984.    (iii) Los coeficientes de la pendiente de log (salario) en educ, IQ son respectivamente.

= 0.03912 y β2 = 0.00586, respectivamente.

   (iv) Tenemos = 0.03912 + 3.53383 (0.00586) = 0.05983 que está muy cerca de 0.05984. (Sujeto a errores de redondeo).

Page 21: So Lucio Nario Wood Ri Edge 2

CAPÍTULO 4 Notas para la enseñanza.

 La estructura de este capítulo le permite recordar a los estudiantes que una distribución de error específico no desempeñó ningún papel en los resultados del capítulo 3. La normalidad es necesaria, sin embargo, para obtener exactamente una distribución normal muestral (condicionada a las variables explicativas). Hago hincapié en que el conjunto completo deSupuestos CLM que se utilizan en este capítulo, pero que en el capítulo 5 nos relajamos la normalidad supuesto y aún realizar la inferencia válida aproximadamente. Se podría argumentar que en el modelo clásico, los resultados de un modelo lineal podrían ser omitidos por completo, y que el análisis sólo se muestra grande que se necesita. Pero, desde una perspectiva práctica, los estudiantes todavía tienen que saber de dónde viene la distribución t, porque prácticamente todos los paquetes de regresión el informe estadístico t y obtener los valores de p fuera de la t distribución. Que luego se les hace muy fácil para cubrir el capítulo 5 rápidamente, con sólo decir que puede caer la normalidad y seguir utilizando las estadísticas de las camisetas y los p-valores asociados como aproximadamente válida.Además, en ocasiones los alumnos tienen que analizar conjuntos de datos más pequeños, especialmente si hacen sus propias pequeñas encuestas para un proyecto a largo plazo.Es fundamental hacer hincapié en que ponemos a prueba las hipótesis sobre los parámetros desconocidos de la población, le digo a mis estudiantes que van a ser castigados si escriben algo así como H0: β1 = 0 en un examen o, peor aún, H0: 0,632 = 0.Una característica útil del capítulo 4 es su énfasis en la reescritura de un modelo de población que contiene el parámetro de interés en la prueba de una sola restricción. Creo que esto es más fácil, tanto teórica y prácticamente, que las variaciones de cómputo que puede, en algunos casos, dependen numerosos términos de covarianza. El ejemplo de pruebas de la igualdad de la vuelta a dos y cuatro años de colegios ilustra el método de base, y muestra que el modelo especificado puede tener una útil interpretación. Se puede utilizar una prueba de F para simples restricciones lineales en varios parámetros, pero esto es menos transparente que en la prueba y no inmediatamente producir el error estándar necesario para un intervalo de confianza o para probar una alternativa unilateral. El truco de la reescritura de la población del modelo es útil en varios casos, incluyendo la obtención de intervalos de confianza para las predicciones en el Capítulo 6, así como para la obtención de intervalos de confianza para efectos marginales en modelos con interacciones (también en el capítulo 6). El ejemplo del jugador de la liga mayor de béisbol ilustra la diferencia salarial entre el individuo y la significación conjunta, cuando las variables explicativas (rbisyr hrunsyr y en este caso) son altamente correlacionados. Que tienden a enfatizar la forma R-cuadrado del estadístico F, ya que, en la práctica, es aplicable a un gran porcentaje del tiempo, y es mucho más fácilmente computado. Lamento que este ejemplo tiene un sesgo hacia los estudiantes en los países donde el béisbol se juega. Sin embargo, es uno de losmejores ejemplos de multicolinealidad que he encontrado, y los estudiantes de todos los orígenes parece que consigue el punto.

Page 22: So Lucio Nario Wood Ri Edge 2

SOLUCIONES A LOS PROBLEMAS 4,1 (i) y (iii) generalmente causan las estadísticas t no tener una distribución bajo H0.Homoscedasticidad es uno de los supuestos de CLM. Una variable importante omitida violael supuesto MLR.3. Los supuestos CLM no contienen mención de las correlaciones de muestrasentre las variables independientes, excepto para descartar el caso en que la correlación es una.

 4.2 (i) H0: β3 = 0. H1: β3> 0.

   (ii) El efecto proporcional en el salario es 0,00024 (50) = 0.012. Para obtener el efecto en porcentaje, multiplicamos esto por 100: 1,2%. Por lo tanto, un aumento de 50 puntos, ceteris paribus, en el ROS se prevé a aumentar el sueldo sólo un 1,2%. Prácticamente hablando, esto es un efecto muy pequeño para una gran cambio en ros.

   (iii) El valor crítico del 10% para una prueba de una cola, con gl = ∞, se obtiene de la tabla G.2, como 1,282. El estadístico t de ROS es .00024/.00054 ≈ 0,44, muy por debajo del valor crítico.Por lo tanto, no rechazamos H0 en el nivel de significación del 10%.

   (iv) En base a este ejemplo, el coeficiente estimado ros parece ser diferente de cero sólo debido a la variación de muestreo. Por otro lado, incluyendo ROS no puede causar ningún daño, sino quedepende de la correlación es con las otras variables independientes (aunque estos son muy significativa a pesar de ROS en la ecuación).

 4.3 Manteniendo profmarg fija, Δrdintens = 0,321 Δlog (ventas) = (.321/100) [100] 0,00321 Por lo tanto, si %Δsales = 10,    0.032, o sólo tres centésimas de punto porcentual. Para un porcentaje tan grande aumento de las ventas, esto parece un efecto prácticamente pequeño.rdintensΔ log las ventas.

 (ii) Ho: β1 = 0 contra H1: β1 > 0, donde β1 es la pendiente de la población en el registro (de ventas). El t estadístico es .321/.216 ≈ 1.486. El valor crítico del 5% para una prueba de una cola, con gl = 32 - 3 = 29, se obtiene de la tabla G.2, como 1,699, por lo que no puede rechazar Ho al nivel del 5%. Pero el 10% crítico valor es 1,311; ya que el estadístico t está por encima de este valor, se rechaza Ho a favor de H1 en el 10% de significancia.

   (iii) En realidad no. Su estadística t es sólo 1,087, que está muy por debajo incluso del valor crítico del 10% para una prueba de una cola. 4,4 (i) H0: β3 = 0. H1: β3 ≠ 0.

4.4   (i) en igualdad de circunstancias, una mayor población aumenta la demanda de viviendas de alquiler, que deben aumentar los alquileres. La demanda de vivienda en general es mayor cuando el ingreso promedio es más alto, empujando hacia arriba el costo de la vivienda, incluyendo las tarifas de alquiler.

   (ii) El coeficiente de log (pop) es una elasticidad. Una declaración correcta es que "un aumento del 10% en la población aumenta en alquiler por 0.066 (10) = 0.66%. " (Iv) Con gl = 64 - 4 = 60, el valor crítico al 1% para una prueba de dos colas es 2,660. El estadístico t es de aproximadamente 3,29, lo cual está muy por encima del valor crítico. Así 3β es estadísticamente diferente de cero enel nivel de 1%.

 4.5 (i) 0,412 ± 1,96 (0.094), o alrededor de .228 a .596.  (ii) No, porque el valor es 0.4 y el interior de la IC del 95%.

Page 23: So Lucio Nario Wood Ri Edge 2

   (iii) Sí, porque 1 está fuera del IC del 95%. 4.6 (i) Con gl = n - 2 = 86, obtenemos el valor crítico del 5% de la Tabla G.2 con gl = 90.Debido a que cada prueba es de dos colas, el valor crítico es 1.987. El estadístico t para Ho: βo = 0 es de aproximadamente -0,89, que es mucho menos de 1,987 en valor absoluto. Por lo tanto, no rechazamos βo = 0. El t estadística para Ho: β1 = 1 es (0.976-1) / 0.049 ≈ - .49, que es incluso menos significativo. (Recuerde que rechazar Ho a favor de H1, en este caso sólo si | t |.> 1.987)   (ii) Usamos la forma SSR de la estadística F. Estamos probando q = 2 las restricciones y los gl en el modelo sin restricciones es de 86. Se nos ha dado SSRr = 209,448.99 y 165,644.51 = SSRnr.

que es un fuerte rechazo de Ho: a partir de la Tabla G.3c, el valor de 1% de crítico con 2 y 90 grados de libertad es de 4,85.   (iii) Se utilice el formulario R-cuadrado del estadístico F. Estamos probando q = 3 y no hay restricciones son 88 - 5 = 83 grados de libertad en el modelo sin restricciones. El estadístico F es [(0.829-0.820) / (1 - 0.829)] (83/3) ≈ 1.46. El valor crítico del 10% (de nuevo con 90 gl del denominador en la Tabla G.3a) es 2,15, por lo que no rechazar Ho en, incluso al nivel del 10%. De hecho, el valor de p es de 0.23.

  (iv) Si heteroscedasticidad estuvieron presentes, Asunción MLR.5 serían violadas, y la Festadística no tendría una distribución F bajo la hipótesis nula. Por lo tanto, comparando el Festadística en contra de los valores críticos habituales, o para obtener el valor de p de la distribución F, se no ser especialmente significativa. 4,7 (i) Si bien el error estándar en hrsemp no ha cambiado, la magnitud del coeficiente tiene aumentó en un medio. El estadístico t en hrsemp ha pasado de unos -1,47 a -2,21, lo que ahora el coeficiente es estadísticamente menor que cero al nivel del 5%. (De la Tabla G.2 el valor crítico del 5% con 40 grados de libertad es -1,684. El valor crítico es del 1% -2.423, por lo que el valor de p es entre .01 y .05.) 4.7  (ii) Si sumamos y restamos registro 2β (empleo) de la mano derecha del lado y recoger los términos, tener log (chatarra) = + 0β 1β hrsemp + [log 2β (ventas) - 2β log (empleo)]    + [Log 2β (empleo) + 3β log (empleo)] + u   = 0β + 1β hrsemp + 2β log (ventas / empleo)    + (2β + 3β) registro (empleados) + u, donde la segunda igualdad se deduce del hecho de que log (ventas / empleo) = log (ventas) -log (empleo). Definición de 3θ ≡ 2β + 3β da el resultado.

  (iii) N º Estamos interesados en el coeficiente de log (empleo), que tiene en la estadística de 0,2,que es muy pequeño. Por lo tanto, se concluye que el tamaño de la empresa, medida por los empleados, no importa, una vez que controlamos para la formación y las ventas por empleado (en una funcional logarítmica forma).

  (Iv) La hipótesis nula en el modelo de la parte (ii) es H0: 2β = -1. La estadística es t [- 0.951 -(-1)] / 0,37 = (1-0.951) / 0,37 0.132, lo que es muy pequeño, y no somos capaces de rechazar si se especifica una alternativa-o de dos caras. 4.8 (i) Usamos la propiedad VAR.3 del Apéndice B: Var (1β - 3 2β) = Var (1β) + 9 Var (2β) – 6 Cov (1β, 2β).  (Ii) t = (1β - 3 2β - 1) / SE (1β - 3 2β), así que necesitamos el error estándar de unaβ - 3 2β.

Page 24: So Lucio Nario Wood Ri Edge 2

  (iii) Porque 1θ = 1β - 3β2, podemos escribir 1β + = 1θ 3β2. Al conectar este a la poblaciónmodelo da   y = 0β + (+ 1θ 3β2) x1 + x2 + 2β 3β x3 + u   = + 0β 1θ x1 + 2β (3x1 + x2) + 3β x3 + u.Esta última ecuación es lo que se estiman mediante la regresión y el x1, 3x1 + x2 y x3. La coeficiente y error estándar de x1 es lo que queremos.

 4.9 (i) Con gl = 706 - 4 = 702, se utiliza el estándar de valor normal crítico (gl = ∞ en la tabla G.2),que es 1,96 para una prueba de dos colas al nivel del 5%. Ahora t = educ = -11.13/5.88 -1,89, por lo que | t ≈ educ | = 1,89 <1,96, y no somos capaces de rechazar Ho: βeduc = 0 al nivel del 5%. Además, tage ≈ 1,52, por lo que la edad es también estadísticamente significativa al nivel del 5%.

   (ii) Es necesario para calcular la forma R-cuadrado del estadístico F de significación conjunta. Sin embargo, F = [(0.113-0.103) / (1-0.113)] (702/2) 3,96. El valor crítico del 5% en la F ≈ 2.702 de distribución puede ser obtenido de la tabla con el denominador G.3b gl = ∞: cv = 3,00. Por lo tanto, educ y la edad son conjuntamente significativas al nivel del 5% (3,96> 3,00). De hecho, el valor de p es de aproximadamente 0.019, y por lo educ y la edad son conjuntamente significativos al nivel del 2%.

(iii) En realidad no. Estas variables son conjuntamente significativas, pero su inclusión sólo cambia el coeficiente de totwrk de - .151 a - .148.

   (iv) El t estándar y F estadísticas que hemos utilizado asumir Homoscedasticidad, además de la otros supuestos CLM. Si hay heteroscedasticidad en la ecuación, las pruebas ya no son válidas. 4.10 (i) Es necesario para calcular el estadístico F para la significación general de la regresión con n = 142 yk = 4: F = [0,0395 / (1-0,0395)] (137/4) ≈ 1,41. El valor crítico del 5% con 4 df del numerador y el uso de 120 para el df del numerador, es de 2,45, muy por encima del valor de F. Por lo tanto, no rechazamos H0: 1β = 2β = 3β = 4β = 0 al nivel del 10%. No explica por variable es individualmente significativo al nivel del 5%. El más grande estadístico t absoluto es el de coronas danesas, TDKR ≈1,60, lo cual no es significativo al nivel del 5% contra una alternativa de dos caras.  (ii) La estadística F (con el mismo df) es ahora [0,0330 / (1-0.0330)] (137/4) 1,17, que esincluso más baja que en la parte (i). Ninguno de los estadísticos t es significativo a un nivel razonable.

  (iii) Me parece muy débil. No hay estadísticas significativas t al nivel del 5% (contra una de dos alternativa caras), y las estadísticas F son insignificantes en ambos casos. Además, menos del 4% del variación en la rentabilidad se explica por las variables independientes.

 4,11 (i) En las columnas (2) y (3), el coeficiente de profmarg es negativa, aunque su testadística es sólo alrededor de -1. Parece que, una vez que las ventas en firme y el valor de mercado se han controlado para el, margen de beneficio no tiene ningún efecto sobre el salario director general.   (ii) Usamos la columna (3), que controla la mayoría de los factores que afectan a sueldo.

Page 25: So Lucio Nario Wood Ri Edge 2

El estadístico t de registro (mktval) es de aproximadamente 2,05, que es sólo significativo al nivel de 5% en contra de una alternativa de dos caras. (Se puede utilizar la norma fundamental del valor normal, 1,96). Por lo tanto log (mktval) es estadísticamente significativa. Debido a que el coeficiente es una elasticidad, un aumento, ceteris paribus, un 10% del valor de mercado es prevé un aumento salarial del 1%. Esto no es un gran efecto, pero no es insignificante, tampoco.   (iii) Estas variables son individualmente significativos en los niveles de significación bajo, con tceoten ≈ 3,11 y tcomten -2,79. Otros factores fijos, un año más como director general con la empresa aumentos salariales alrededor de 1,71%. Por otro lado, otro año con la empresa, pero no como CEO, disminuye salarial en alrededor de 0.92%. Este hallazgo segunda a primera vista parece sorprendente, pero podría estar relacionado con el"Superestrella" efecto: las empresas que contratan a directores ejecutivos de fuera de la empresa van a menudo después de un pequeño grupo de muy bien considerado candidatos, y los salarios de estas personas son objeto de puja. Más no-CEO de años con un la empresa hace que sea menos probable que la persona fue contratada como una superestrella exterior.

 SOLUCIONES A LOS EJERCICIOS DE INFORMÁTICA

 4.12 (i) La celebración de los demás factores fijos,

donde usamos el hecho de que el 100 log () expendA Δ ≈ expendAΔ%. Así 1β / 100 es el (ceteris⋅ paribus) variación en puntos porcentuales en el voteA expendA cuando se incrementa en uno por ciento.   (ii) La hipótesis nula es H0: 2β = - 1β, lo que significa aumento de az% en el gasto por Ay el aumento de az% en el gasto por B deja voteA sin cambios. Nos puede escribir de forma equivalente H0: 1β + 2β = 0.

   (iii) La ecuación estimada (con los errores estándar en paréntesis debajo de las estimaciones) es

 El coeficiente de log (expendA) es muy significativo (estadístico t ≈ 15,92), como es el coeficiente de log (expendB) (estadístico t -17,45). Las estimaciones implican que un 10%, ceteris paribus, aumento de la pasando por el candidato A aumenta la proporción prevista de la votación va a la A, sobre la 0.61 puntos porcentuales. [Recordemos que, manteniendo los demás factores fijos, ≈ voteAΔ ≈ (6.083/100) ΔexpendA%).] Del mismo modo, un aumento del 10%, ceteris paribus, en el gasto de B reduce en alrededor de 0,66 puntos porcentuales. Estos efectos ciertamente no pueden ser ignorados. Vote A  Mientras que los coeficientes de registro (expendA) y log (expendB) son de

Page 26: So Lucio Nario Wood Ri Edge 2

magnitudes similares (y de signo opuesto, como es de esperar), no tenemos el error estándar de unaβ1 + β2, que es lo que tendría que probar la hipótesis de la parte (ii).  (Iv) Escribir 1θ = 1β + 2β, o 1β = 1θ - 2β. Si conecta este en la ecuación original, y reorganizar, da    = VoteA 0β + log 1θ (expendA) + 2β [log (expendB) - log (expendA)] + 3β prtystrA + u, Cuando se estima esta ecuación obtenemos $ 1θ ≈ - 0.532 y SE ($ 1θ) ≈ 0.533. El estadístico t para la hipótesis en la parte (ii) es -.532/.533 -1. Por lo tanto, no rechazamos H ≈ 0: 2β = - 1β.

 4,13 (i) En el modelo log (salario) = + 0β 1β LSAT + 2β PAM + 3β registro (libvol) + 4β registro (costo) + 5β rango de + u, la hipótesis de que el rango no tiene efecto sobre log (salario) es H0: 5β = 0. La ecuación estimada (ahora con errores estándar) es

= 8.34 + 0.0047 + 0.248 LSAT ACP + 0,095 log (libvol) log () salario     (0,53) (.0040) (.090) (.033) + 0,038 log (costo) - 0,0033 Rango   (.032) (.0003) n = 136, R2 = 0.842. El estadístico t en el rango es -11, que es muy significativo. Si rango disminuye por 10 (que es un movimiento para una escuela de derecho), salario promedio de inicio se prevé que aumente en alrededor de 3,3%.

  (ii) LSAT no es estadísticamente significativa (estadístico t ≈ 1,18), pero GPA es muy significativa (t estadística de 2,76). La prueba de significación conjunta es discutible dado que la ACP es tan importante, pero para integridad el estadístico F es de 9.95 (con 2 y 130 grados de libertad) y p-valor ≈ 0.0001.

   (iii) Cuando añadimos clsize y la facultad de la regresión perdemos cinco observaciones. La prueba de significativa de su conjunto (con 2 y 131 - 8 = 123 gl) da F ≈ 0,95 y p-valor de 0,39. Así que estos dos variables que no son conjuntamente significativos a menos que utilice un nivel de significación muy grande.

  (v) Si queremos determinar con exactitud el efecto de la clasificación numérica de la Facultad de Derecho de partida los salarios, hay que controlar otros factores que afectan a los salarios y las clasificaciones. La idea es que hay algo de aleatoriedad en el ranking, o la clasificación puede depender en parte de factores frívolas que no afectan a la calidad de los estudiantes. Resultados del LSAT y el PAM son, quizás, un buen control de estudiante calidad. Sin embargo, si hay diferencias de género y la composición racial de todo es cuelas, y el género y la raza sistemática las diferencias en los salarios, también se podría controlar para ellos. Sin embargo, no está claro por qué estos se correlacionan con el rango. La calidad del profesorado, como tal vez medido por los registros de la publicación, se podrían incluir. Este tipo de cosas no entran los rankings de la ley las escuelas.

 4.14 (i) El modelo estimado es

       11.67 + 0.000379 sqrft + 0,0289 log hab () = precio

Page 27: So Lucio Nario Wood Ri Edge 2

    (0,10) (.000043) (.0296)  n = 88, R2 = 0.588.

Por lo tanto, un

θ = 150 (.000379) + 0.0289 = 0.0858, lo que significa que un adicional de 150 metros cuadradoshabitación aumenta el precio pronosticado en alrededor de 8,6%.

  (ii) 2β = 1θ - 150 1β, y así  log (precio) = + 0β 1β sqrft + (1θ - 150 1β) hab + u     = 0β + 1β (sqrft - 150 hab) + 1θ hab + u.

(iii) De la parte (ii), se corre la regresión log (precio) en (sqrft - 150 hab) y hab, y obtener el error estándar en hab. Ya sabemos que una θ = 0.0858, y ahora también obtenemos sí (θ) = 0,0268. El intervalo de confianza del 95% reportado por mi paquete de software es .0326 a .1390 (O alrededor de un 3,3% a 13,9%).

 4.15 El R-cuadrado de la bwght regresión en CIGS, la paridad y faminc, utilizando todos los 1388 observaciones, se trata de 0.0348. Esto significa que, si por error usar esto en lugar de 0.0364, lo que es el uso de R-cuadrado de las mismas 1.191 observaciones disponibles en la regresión sin restricciones, que obtendría F = [(0,0387 a 0,0348) / (1-0,0387)] (1185/2) ≈ 2,40, lo que da valor p .091 en una distribución F con 2 y df 1,1185. Esto es significativo al nivel del 10%, pero es incorrecta. El estadístico F correcta se calcula como 1,42 en el ejemplo 4.9, con valor de p ≈ 0.242. 4.16 (i) Si dejamos caer rbisyr la ecuación estimada se convierte en      = 11,02 + .0677 + 0.0158 años gamesyr log () salario     (0,27) (.0121) (.0016)   + 0,0014 + 0,0359 bavg hrunsyr    (.0011) (.0072)  n = 353, R2 = 0.625. Ahora hrunsyr es muy significativa (estadístico t ≈ 4,99), y su coeficiente ha aumentadopor cerca de dos veces y media.  (Ii) La ecuación con runsyr, fldperc, y sbasesyr añadido es

    = 10,41 + .0700 + 0.0079 años gamesyr log () salario   (2,00) (.0120) (.0027) + 0,00053 + 0,0232 bavg hrunsyr   (.00110) (.0086) + 0,0174 + 0,0010 runsyr fldperc - 0.0064 sbasesyr   (.0051) (.0020) (.0052)

Page 28: So Lucio Nario Wood Ri Edge 2

  n = 353, R2 = 0.639.

De las tres variables independientes adicionales, sólo runsyr es estadísticamente significativa (t estadística = .0174/.0051 ≈ 3,41). La estimación implica que una carrera más por cada año, otros factores fija, los aumentos de sueldos prevista en alrededor de 1,74%, un incremento sustancial. Las bases robadas variable, incluso tiene el "mal" con el signo de un estadístico de alrededor de -1,23, mientras que fldperc tiene un estadísticode sólo 0,5. La mayoría de los jugadores de grandes ligas son muy buenos jardineros, de hecho, el más pequeño fldperc es 800 (lo que significa 0.800). Con una variación relativamente pequeña en fldperc, tal vez no sea sorprendente que su efecto es difícil de estimar.

   (iii) A partir de sus estadísticas t, bavg, fldperc y sbasesyr son individualmente insignificantes. El F estadística de su significación conjunta (con 3 y 345 grados de libertad) es de aproximadamente 0,69 con p-valor de 0,56. Por lo tanto, estas variables son conjuntamente muy in significante.

4,17 (i) En el modelo log (salario) = 0β + 1β + 2β educ exper + + u 3β la tenencia la hipótesis nula de interés es H0: = 2β 3β.  (ii) Que 2θ = 2β - 3β. A continuación, se puede estimar la ecuación log (salario) = 0β + 1β + educ exper 2θ + 3β (expe + la tenencia) + u para obtener el IC del 95% de 2θ. Este resulta ser de 0,0020 ± 1,96 (0,0047), o alrededor de - .0072 a 0,0112. Puesto que el cero es en este IC, 2θ no es estadísticamente diferente de cero al nivel del 5%, y no somos capaces de rechazar H0: = 2β 3β al nivel del 5%. 4.18 (i) El valor mínimo es 0, el máximo es 99, y el promedio es de 56,16.    (ii) Cuando phsrank se añade a (4.26), obtenemos lo siguiente:

    1,459 hasta 0,0093 x + 0,0755 + 0,0049 totcoll exper + 0,00030 registro phsrank () = salario     (0,024) (.0070) (.0026) (.0002) (.00024) n = 6.763, R2 = 0.223 Así phsrank tiene un estadístico equivalente a sólo el 1,25, no es estadísticamente significativa. Si aumentamos phsrank por 10, log (salario) se prevé que aumente por (0.0003) 10 = 0,003. Esto implica un 0,3% aumento de los salarios, lo que parece un modesto incremento dado un incremento porcentual de 10 puntos en phsrank.(Sin embargo, la desviación estándar de la muestra de phsrank es aproximadamente 24.) (iii) Adición phsrank hace que el estadístico t en aún menor JC en valor absoluto, aproximadamente 1,33, pero la magnitud coeficiente es similar a (4,26). Por lo tanto, el punto base se mantiene sin cambios: la volver a una universidad se estima en algo más pequeño, pero la diferencia no es niveles significativos significativos y estándar.   (iv) la identificación de la variable es sólo un número de identificación del trabajador, que debe ser al azar asignado (al menos aproximadamente). Por lo tanto, id no debe estar

Page 29: So Lucio Nario Wood Ri Edge 2

relacionada con cualquier variable de la ecuación de regresión. Debe ser insignificante cuando se añade a (4,17) o (4,26). De hecho, su t estadística es de 0,54.

4.19 (i) Hay 2.017 personas solteras en la muestra de 9275.      (ii) La ecuación estimada es    = -43,04 + 0,799 + 0,843 años inc $ neto FA      (4,08) (.060) (.092) n = 2.017, R2  = 0.119. El coeficiente de inc indica que un dólar más en el ingreso (edad celebración fijo) se refleja en alrededor de 80 centavos de dólar más en predijo nettfa, no hay sorpresa. El coeficiente de la edad significa que, la celebración de la renta fija, si una persona recibe un año más viejo, él / ella nettfa se prevé que aumente en cerca de $ 843. (Recuerde, nettfa es en miles de dólares.) Una vez más, esto no es sorprendente.    (iii) La intersección no es muy interesante, ya que da la nettfa previsto para inc = 0 y la edad = 0. Claramente, no hay una con incluso cerca de estos valores en la población relevante.   (iv) La estadística es t (0,843 a 1) / 0.092 ≈ -1.71. Contra el H1 alternativa unilateral: β2 <1, el p-valor es de aproximadamente 0.044. Por lo tanto, podemos rechazar H0: β2 = 1 en el nivel de significación del 5% (frente a la alternativa de un solo lado).    (v) El coeficiente de la pendiente en inc en la regresión simple es de aproximadamente 0.821, que no es muy diferente de la obtenida en la parte .799 (ii). Como resultado, la correlación entre la edad y el inc en la muestra de personas solteras es de sólo 0.039, lo que ayuda a explicar por qué el simple y las estimaciones de regresión múltiple no son muy diferentes, se refieren de nuevo a la página 79 del texto.