UNIVERSIDAD NACIONAL
SANTIAGO ANTUNEZ DE MAYOLO
Facultad de Economa y Contabilidad
Escuela Acadmico Profesional de Economa
ECONOMETRIA
II
VIOLACIN A LOS
SUPUESTOS DEL MCRL:
MULTICOLINEALIDAD
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
INTRODUCCION
El modelo de Gauss, modelo clsico o estndar de regresin lineal
(MCRL), es el cimiento de la mayor parte de la teora economtrica y
plantea siete supuestos.
1. Modelo de regresin lineal, o lineal en los parmetros.
2. Los valores de las regresoras, X, son fijos en muestreo repetido
3. Para X dadas, el valor medio de la perturbacin es cero.
4. Para X dadas, las varianzas de es constante u homocedstica.
5. Para X dadas, no hay autocorrelacin en las perturbaciones.
6. Si las X son estocsticas, el trmino de perturbacin y las X
(estocsticas) son independientes, o lo menos, no estn
correlacionadas.
7. El nmero de observaciones debe ser mayor que el nmero de
regresoras.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
INTRODUCCION
8. Debe haber suficiente variabilidad en los valores que toman las
regresoras.
9. El modelo de regresin est correctamente especificado
10. No hay relacin lineal exacta (es decir, no hay multicolinealidad)
en las regresoras.
11. El trmino estocstico (de perturbacin) est normalmente
distribuido.
El supuesto 2 lo estudiaremos en los modelos de ecuaciones
simultneas.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
INTRODUCCION
Respecto al supuesto 3, si no se satisface este supuesto, no podemos
estimar el intercepto original 1 o podemos obtener una estimacin
sesgada de 1. Sin embargo, en muchas situaciones prcticas el
intercepto, 1, es de poca importancia; los parmetros con mayor
significado son los coeficientes de pendiente, que permanecen
inalterados aunque se viole el supuesto 3. Adems, en muchas
aplicaciones el trmino del intercepto no tiene interpretacin alguna.
Supuesto 10. Este supuesto no es esencial si el objetivo es solamente
la estimacin. Con el supuesto de normalidad, sin embargo, es
posible establecer que los estimadores de MCO de los coeficientes
de regresin siguen la distribucin normal y que pueden utilizarse
las pruebas t y F para verificar diversas hiptesis estadsticas, sin
importar el tamao de la muestra.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
INTRODUCCION
Pero, qu sucede si las ui no estn normalmente distribuidas?
El hecho de que los estimadores de MCO sigan una distribucin
normal asinttica (segn el supuesto de varianza homoscedstica y
valores fijos de X) aunque las perturbaciones no tengan distribucin
normal es de poca ayuda para los analistas econmicos, que pocas
veces disponen de datos de muestras grandes.
Por tanto, el supuesto de normalidad adquiere importancia para los
fines de pruebas de hiptesis y prediccin. Entonces, teniendo en
mente los problemas de estimacin y de pruebas de hiptesis, y
debido a que las muestras pequeas son la regla ms que la excepcin
en la mayora de los anlisis econmicos, debemos mantener el
supuesto de normalidad.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
INTRODUCCION
Por supuesto, esto significa que, cuando se trata de una muestra finita,
se debe realizar la prueba explcita del supuesto de normalidad
(Anderson-Darling y Jarque-Bera). Se sugiere aplicar stas u otras
pruebas de normalidad a los residuos de la regresin Se debe tener en
cuenta que en muestras finitas sin el supuesto de normalidad, los
estadsticos usuales t y F pueden no seguir las distribuciones t y F.
Los supuestos 6, 7 y 8 estn estrechamente interrelacionados y se
analizan en el tema sobre multicolinealidad.
El supuesto 4 se estudia en el captulo sobre heteroscedasticidad.
El supuesto 5, en el captulo sobre autocorrelacin.
El supuesto 9, en el captulo sobre especificacin de modelos y prueba
de diagnstico.
El supuesto 1 se analizar como tema especial.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
El supuesto 8 del modelo clsico de regresin lineal (MCRL) plantea
que no existe multicolinealidad entre las regresoras incluidas en el
modelo de regresin. En este captulo consideramos en forma crtica
el supuesto de no multicolinealidad en busca de respuestas a las
siguientes preguntas:
1. Cul es la naturaleza de la multicolinealidad?
2. Es la multicolinealidad realmente un problema?
3. Cules son sus consecuencias prcticas?
4. Cmo se detecta?
5. Qu medidas pueden tomarse para aliviar el problema de
multicolinealidad?
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
En este captulo tambin analizaremos el supuesto 6 del MCRL, a
saber, que el nmero de observaciones en la muestra debe ser mayor
que el de regresoras, as como el supuesto 7, que requiere una
variabilidad suficiente en los valores de las regresoras, en vista de que
ambos estn estrechamente relacionados con el supuesto de la
multicolinealidad. Al supuesto 6 se le ha denominado, tambin como
el problema de la micronumerosidad, lo cual simplemente significa
un tamao pequeo de muestra.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
NATURALEZA DE LA MULTICOLINEALIDAD
El trmino multicolinealidad originalmente, designaba una relacin
lineal perfecta o exacta entre algunas o todas las variables
explicativas de un modelo de regresin. Para la regresin con k
variables que incluye las variables explicativas X1, X2, . . . , Xk (donde
X1= 1 para todas las observaciones de forma que den cabida al
trmino del intercepto), se dice que existe una relacin lineal exacta si
se satisface la siguiente condicin:
11 + 22 + + = 0
Donde:
1 , 2 son constantes tal que no todas son simultneamente igual a cero.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Hoy en da, sin embargo, el trmino multicolinealidad incluye el caso
de multicolinealidad perfecta, como lo indica:
11 + 22 + + = 0
y tambin el caso en el cual hay X variables intercorrelacionadas pero
no en forma perfecta, de la siguiente manera:
11 + 22 + + + = 0
donde es un trmino de error estocstico.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Para apreciar la diferencia entre multicolinealidad perfecta y
multicolinealidad menos que perfecta suponga, que 20. Entonces:
11 + 22 + + = 0
se escribe como
que muestra la forma como 2 est exactamente relacionada de manera lineal con otras variables, o cmo se deriva de una
combinacin lineal de otras variables X.
En esta situacin, el coeficiente de correlacin entre la variable 2 y la combinacin lineal del lado derecho de la ltima ecuacin est
obligado a ser igual a uno.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
En forma similar, si 20, la ecuacin:
11 + 22 + + + = 0
se escribe como
lo cual muestra que 2 no es una combinacin lineal exacta de otras Xporque est determinada tambin por el trmino de error estocstico
.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Por ejemplo:
Es evidente que X3i =5X2i. Por consiguiente, hay colinealidad perfecta
entre X2 y X3, pues el coeficiente de correlacin r23 es la unidad.
La variable 3 se cre de X3 agregndole simplemente los siguientes
nmeros, tomados de una tabla de nmeros aleatorios: 2, 0, 7, 9, 2.
Ahora ya no hay multicolinealidad perfecta entre X2 y 3. Sin
embargo, las dos variables estn muy correlacionadas, pues los
clculos indicarn que el coeficiente de correlacin entre ellas es
0.9959
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
El diagrama de Ballentine representa grficamente el problema de la
multicolinealidad.. En esta figura los crculos Y, X2 y X3, representan
las variaciones en Y (la variable dependiente) y en X2 y X3, (las
variables explicativas). El grado de colinealidad se mide por la
magnitud de la interseccin (rea sombreada) de los crculos X2 y X3, .
En la figura (a) no hay interseccin entre X2 y X3, y, por tanto, no hay
colinealidad. En las figuras (b) (c) (d) y (e), el grado de colinealidad
va de bajo a alto: entre mayor sea la interseccin entre X2 y X3,
(es decir, entre mayor sea el rea sombreada), mayor ser el grado de
colinealidad. En el extremo, si X2 y X3, estuvieran superpuestos
completamente (o si X2 estuviera por completo dentro de X3, o
viceversa), la colinealidad sera perfecta.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Observe que la multicolinealidad, como la definimos, se refiere slo a
relaciones lineales entre las variables X. Este concepto no aplica a las
relaciones no lineales entre ellas. Por ejemplo, considere el siguiente
modelo de regresin:
= 0 + 1 + 22 + 3
3 + Donde:
: Costo total de produccin
: Produccin
Las variables 2 (produccin al cuadrado) y
3 (produccin al cubo)
por supuesto estn funcionalmente relacionadas con , pero la relacin es no lineal. De manera estricta, por consiguiente, modelos
como no lineales no violan el supuesto de no multicolinealidad.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Sin embargo, en aplicaciones concretas, el coeficiente de correlacin
medido de forma convencional demostrar que , 2
3 estn
altamente correlacionadas, lo cual dificultar estimar los parmetros
de este modelo regresional con mayor precisin (es decir, con errores
estndar pequeos).
Por qu supone el modelo clsico de regresin lineal que no hay
multicolinealidad entre las X?
El razonamiento es el siguiente: Si la multicolinealidad es perfecta,
los coeficientes de regresin de las variables X son indeterminados y
sus errores estndar, infinitos. Si la multicolinealidad es menos que
perfecta, los coeficientes de regresin, aunque sean determinados,
poseen grandes errores estndar (en relacin con los coeficientes
mismos), lo cual significa que los coeficientes no pueden ser
estimados con gran precisin o exactitud.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Existen diversas fuentes de multicolinealidad y puede deberse a los
siguientes factores:
1. El mtodo de recoleccin de informacin. Por ejemplo, la
obtencin de muestras en un intervalo limitado de valores tomados
por las regresoras en la poblacin.
2. Restricciones en el modelo o en la poblacin objeto de muestreo.
Por ejemplo, en la regresin del consumo de electricidad sobre el
ingreso (2) y el tamao de las viviendas (3) hay una restriccin fsica en la poblacin, pues las familias con ingresos ms altos
suelen habitar viviendas ms grandes que las familias con ingresos
ms bajos.
3. Especificacin del modelo. Por ejemplo, la adicin de trminos
polinomiales a un modelo de regresin, en especial cuando el
rango de la variable X es pequeo.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
4. Un modelo sobredeterminado. Esto sucede cuando el modelo tiene
ms variables explicativas que el nmero de observaciones. Esto
puede suceder en investigacin mdica, donde en ocasiones hay
un nmero reducido de pacientes sobre quienes se rene
informacin respecto de un gran nmero de variables.
5. Otra razn para la multicolinealidad, sobre todo en los datos de
series de tiempo, puede ser que las regresoras del modelo
compartan una tendencia comn; es decir, que todas aumenten o
disminuyan a lo largo del tiempo. Por tanto, en la regresin del
gasto de consumo sobre el ingreso, la riqueza y la poblacin, las
regresoras ingreso, riqueza y poblacin tal vez todas crezcan con
el tiempo a una tasa aproximadamente igual, con lo cual se
presentara la colinealidad entre dichas variables.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
ESTIMACIN EN PRESENCIA DE MULTICOLINEALIDAD
PERFECTA
Un modelo de regresin con tres variables, expresado con la forma de
desviacin, en la cual todas la variables se expresan como
desviaciones de sus medias muestrales, se escribe de la siguiente
manera:
= 22 + 33 + Los estimadores 2 y 3 se calculan de la siguiente manera:
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Suponga ahora que 3 = 2 en donde es una constante diferente de cero (por ejemplo, 2, 4, 1.8, etc.). Si sustituimos esto en la
ecuacin que define 2 obtenemos
Que es una expresin indeterminada.
Se puede demostrar que 3 tambin es indeterminada.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Porqu obtenemos obtenemos 2 =0
0?
Recuerde el significado de 2: da la tasa de cambio en el valor promedio de Y a medida que 2 cambia en una unidad, manteniendo
3 constante. Pero si 3 y 2 son perfectamente colineales, no hay forma de que 3 se mantenga constante: a medida que 2 cambia, tambin lo hace 3 por el factor .
Esto significa, entonces, que no hay forma de desenredar las
influencias separadas de 2 y 3 de la muestra dada: para fines prcticos, 2 y 3 son indistinguibles. En la econometra aplicada, este problema ocasiona mucho dao, pues la idea consiste en separar
los efectos parciales de cada X sobre la variable dependiente.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Otra forma de ver el mismo cuadro es la siguiente:
Sustituya 3 = 2 en:
= 22 + 33 + se obtiene lo siguiente:
= 22 + 32 +
= 2 2 + 3 +
= 2 +
Donde
= 2 + 3
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Al aplicar la conocida frmula de MCO a
= 2 +
Obtenemos:
= 2 + 3 = 2
22
Por consiguiente, aunque se puede estimar en forma nica, no hay forma de estimar 2 y 3 en forma igualmente nica.
Matemticamente:
= 2 + 3
nos proporciona una sola ecuacin con dos incgnitas (observe que
est dada) y existen infinidad de soluciones para = 2 + 3 con
valores dados de y .
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Para expresar esto en trminos concretos, sea = 0.8 y = 2. Entonces:
0.8 = 2 + 23
2 = 0.8 23
Ahora seleccione un valor de 3 arbitrariamente y tendr una solucin para 2. Seleccione otro valor para 3 y tendr otra solucin para 2. No importa cunto lo intente, no existe un valor nico para 2.
En conclusin, en el caso de multicolinealidad perfecta, no puede
obtenerse una solucin nica para los coeficientes de regresin
individual. Sin embargo, se puede obtener una solucin nica para
combinaciones lineales de estos coeficientes.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
La combinacin lineal 2 + 3 se estima en forma nica con ,
dado el valor de .
Asimismo, observe que en el caso de multicolinealidad perfecta, las
varianzas y los errores estndar de 2 y 3 individualmente son infinitos.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
ESTIMACIN EN PRESENCIA DE MULTICOLINEALIDAD
ALTA PERO IMPERFECTA
La situacin de multicolinealidad perfecta es un extremo patolgico.
Por lo general no existe una relacin lineal exacta entre las variables
X, en especial en informacin econmica relacionada con series de
tiempo.
Por tanto, de regreso al modelo de tres variables en forma de
desviacin:
= 22 + 33 + en lugar de multicolinealidad exacta podemos tener
3 = 2 + Donde 0 y donde es un trmino de error estocstico tal que 2
= 0
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
ESTIMACIN EN PRESENCIA DE MULTICOLINEALIDAD
ALTA PERO IMPERFECTA
En este caso, sera posible la estimacin de los coeficientes de
regresin 2 y 3. Por ejemplo, al sustituir 3 = 2 + en
Obtenemos:
Donde se aprovecha que 2 = 0 Se deriva una expresin similar
para 3
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
ESTIMACIN EN PRESENCIA DE MULTICOLINEALIDAD
ALTA PERO IMPERFECTA
Ahora, a diferencia del clculo de 2 anterior, esta beta si puede estimarse. Desde luego, si es lo bastante pequeo, es decir, muy cercano a cero, la ecuacin
3 = 2 + indicar colinealidad casi perfecta, y regresaremos al caso
indeterminado.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
CONSECUENCIAS TEORICAS DE LA MULTICOLINEALIDAD
En el MCRL, si se satisfacen los supuestos, los estimadores de MCO
de los coeficientes de regresin son MELI. Sin embargo, puede
demostrarse que, aunque la multicolinealidad sea muy alta, los
estimadores de MCO conservarn la propiedad MELI.
Entonces, cules son los inconvenientes de la multicolinealidad?
Christopher Achen comenta al respecto:
Los novatos en el estudio de la metodologa en ocasiones se
preocupan porque sus variables independientes estn
correlacionadas: el llamado problema de multicolinealidad. Sin
embargo, la multicolinealidad no viola los supuestos bsicos de la
regresin...
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
CONSECUENCIAS TEORICAS DE LA MULTICOLINEALIDAD
Se presentarn estimaciones consistentes e insesgadas y sus errores
estndar se estimarn en la forma correcta. El nico efecto de la
multicolinealidad tiene que ver con la dificultad de obtener los
coeficientes estimados con errores estndar pequeos. Sin embargo,
se presenta el mismo problema al contar con un nmero reducido de
observaciones o al tener variables independientes con varianzas
pequeas. (De hecho, en el nivel terico, los conceptos de
multicolinealidad, nmero reducido de observaciones y varianzas
pequeas en las variables independientes forman parte esencial del
mismo problema.) Por tanto, la pregunta qu debe hacerse
entonces con la multicolinealidad? es similar a qu debe hacerse
si no se tienen muchas observaciones? Al respecto no hay una
respuesta estadstica.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
CONSECUENCIAS TEORICAS DE LA MULTICOLINEALIDAD
Para referirse a la importancia del tamao de la muestra, Goldberger
acu el trmino micronumerosidad, como contraparte del extico
nombre polislabo de multicolinealidad.
De acuerdo con Goldberger, la micronumerosidad exacta (la
contraparte de multicolinealidad exacta) surge cuando n, el tamao de
la muestra, es cero, en cuyo caso es imposible cualquier clase de
estimacin. La casi micronumerosidad, igual que la casi
multicolinealidad, surge cuando el nmero de observaciones
escasamente excede al nmero de parmetros que se va a estimar.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
CONSECUENCIAS TEORICAS DE LA MULTICOLINEALIDAD
1. Es cierto que aun en el caso de casi multicolinealidad los
estimadores de MCO son insesgados. Pero el insesgamiento es una
propiedad multimuestral o de muestreo repetido. Esto significa que, si
mantenemos fijos los valores de X, si obtenemos muestras repetidas y
calculamos los estimadores de MCO para cada una de esas muestras,
el promedio de los valores muestrales se aproximar a los verdaderos
valores poblacionales de los estimadores a medida que aumenta el
nmero de las muestras. Pero esto nada dice sobre las propiedades de
los estimadores en una muestra dada.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
CONSECUENCIAS TEORICAS DE LA MULTICOLINEALIDAD
2. Es cierto que la colinealidad no destruye la propiedad de varianza
mnima: en la clase de los estimadores lineales insesgados, los
estimadores de MCO tienen varianza mnima; es decir, son eficientes.
Pero esto no significa que la varianza de un estimador de MCO
necesariamente sea pequea (en relacin con el valor del estimador)
en cualquier muestra dada.
3. La multicolinealidad es en esencia un fenmeno (de regresin)
muestral en el sentido en que, aunque las variables X no estn
linealmente relacionadas en la poblacin, pueden estarlo en la muestra
particular disponible: cuando se postula la funcin de regresin
terica o poblacional (FRP), se considera que todas las variables X
incluidas del modelo ejercen una influencia separada o independiente
sobre la variable dependiente Y.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
CONSECUENCIAS TEORICAS DE LA MULTICOLINEALIDAD
Pero puede suceder que en cualquier muestra dada con que se pruebe
la FRP, alguna o todas las variables X sean tan colineales que no sea
posible aislar su influencia individual sobre Y. Es decir, la muestra
falla aunque la teora establezcaque todas las X son importantes. En
resumen, la muestra puede no ser lo bastante rica para acomodar
todas las variables X en el anlisis.
Por todas estas razones, el hecho de que los estimadores de MCO sean
MELI a pesar de la presencia de multicolinealidad es poco consuelo
en la prctica.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
CONSECUENCIAS PRCTICAS DE LA MULTICOLINEALIDAD.
En los casos de casi o alta multicolinealidad es probable que se
presenten las siguientes consecuencias:
1. Aunque los estimadores de MCO son MELI (Mejor Estimador
Lineal Insesgado) (Insesgado: su valor promedio o esperado,
(2), es igual al valor verdadero, 2), presentan varianzas y covarianzas grandes que dificultan la estimacin precisa.
2. Debido a la consecuencia (1), los intervalos de confianza tienden a
ser mucho ms amplios, lo cual propicia una aceptacin ms fcil
de la hiptesis nula cero (es decir, que el verdadero coeficiente
poblacional es cero).
3. Tambin debido a la consecuencia (1), la razn t de uno o ms
coeficientes tiende a ser estadsticamente no significativa.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
CONSECUENCIAS PRCTICAS DE LA MULTICOLINEALIDAD.
4. Aunque la razn t de uno o ms coeficientes sea estadsticamente
no significativa, 2, la medida global de bondad de ajuste, puede ser muy alta.
5. Los estimadores de MCO y sus errores estndar son sensibles a
pequeos cambios en los datos.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Estimadores de MCO con varianzas y covarianzas grandes
Si r23 es el coeficiente de correlacin entre X2 y X3 y si las varianzas y
covarianzas estn dadas por:
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Estimadores de MCO con varianzas y covarianzas grandes
De 2 y 3 se desprende que, a medida que r23 tiende a 1,
es decir, a medida que aumenta la colinealidad, tambin lo hacen las
varianzas de los dos estimadores y, en el lmite, cuando r23= 1, son
infinitas.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Estimadores de MCO con varianzas y covarianzas grandes
En el caso de 2, 3 , es igualmente claro que, a medida que r23aumenta hacia 1, la covarianza de los dos estimadores tambin
aumenta en valor absoluto.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Estimadores de MCO con varianzas y covarianzas grandes
La velocidad con que se incrementan las varianzas y covarianzas se ve
con el factor inflacionario de la varianza (FIV), que se define como:
El FIV muestra la forma en que la varianza de un estimador se infla
por la presencia de la multicolinealidad. A medida que 232 se acerca a
1, el FIV se acerca a infinito. Es decir, a medida que el grado de
colinealidad aumenta, la varianza de un estimador tambin y, en el
lmite, se vuelve infinita. Como se aprecia, si no hay colinealidad
entre X2 y X3, el FIV ser 1.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Estimadores de MCO con varianzas y covarianzas grandes
As, las varianzas de los estimadores se definen::
Cabe observar que el inverso del FIV se conoce como tolerancia
(TOL). Es decir,
Cuando 2 = 1 (es decir, colinealidad perfecta), = 0, y cuando
2 = 0 (es decir, no existe ninguna colinealidad), = 1.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Intervalos de confianza ms amplios
Debido a los errores estndar grandes, los intervalos de confianza para los
parmetros poblacionales relevantes tienden a ser mayores.
En casos de alta multicolinealidad, los datos muestrales pueden ser
compatibles con un diverso conjunto de hiptesis. De ah que aumente la
probabilidad de aceptar una hiptesis.
Razones t no significativas
Recuerde que para probar la hiptesis nula de que, por ejemplo, 2 = 0,
utilizamos la razn t, es decir, 2/ = 0 2 y comparamos el valor testimado con el valor t crtico de la tabla t. Pero, como vimos, en casos de
alta colinealidad los errores estndar estimados aumentan drsticamente, lo
que disminuye los valores t. Por consiguiente, en tales casos se acepta cada
vez con mayor facilidad la hiptesis nula de que el verdadero valor
poblacional relevante es cero.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
alta pero pocas razones t significativas
Consideremos el modelo de regresin lineal con k variables:
= 1 + 22 + + +
En casos de alta colinealidad es posible encontrar, como acabamos de
mencionar, que uno o ms coeficientes parciales de pendiente son, de
manera individual, no significativos estadsticamente con base en la prueba
t. Aun as, en tales situaciones puede ser tan alto, digamos, superior
a 0.9, que, con base en la prueba F, es posible rechazar convincentemente la
hiptesis de que
2 = 3 = = = 0
En realidad, sta es una de las seales de multicolinealidad: valores t no
significativos pero un global alto (y un valor F significativo).
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Sensibilidad de los estimadores de MCO y sus errores estndar ante
cambios pequeos en los datos
Siempre que la multicolinealidad no sea perfecta, es posible la estimacin de
los coeficientes de regresin; sin embargo, las estimaciones y sus errores
estndar se tornan muy sensibles aun al ms ligero cambio de los datos.
Por ejemplo, considere los siguientes datos hipotticos:
Y X2 X3
1 2 4
2 0 2
3 4 12
4 6 0
5 8 16
DATOS HIPOTETICOS DE Y, X2 y X3 Con base en estos datos obtenemos la
siguiente regresin mltiple:
= 1.1639 + 0.44632 + 0.00303 0.7737 0.1848 (0.0851)
= 1.5431 2.4151 (0.0358)
2 = 0.8101 23 = 0.5523
2, 3 = 0.00868 = 2
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Ahora considere la tabla adjunta en que se
intercambiaron el tercer y el cuarto valores de
X3. Con esta informacin obtenemos:
= 1.2108 + 0.40142 + 0.02703 0.7480 0.2721 (0.1252)
= 1.6187 1.4752 (0.2158)
2 = 0.8143 23 = 0.8285
2, 3 = 0.0282 = 2
Como resultado de un ligero cambio en los datos vemos que 2, antes estadsticamente significativo en un nivel de significancia de 10%, deja
ahora de serlo aun en ese nivel. Observe tambin que antes, la
2 , 3 = 0.00868 mientras que ahora es 0.0282, un aumento superior a tres veces su valor inicial.
Y X2 X3
1 2 4
2 0 2
3 4 0
4 6 12
5 8 16
DATOS HIPOTETICOS DE Y, X2 y X3
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
= 1.2108 + 0.40142 + 0.02703 0.7480 0.2721 (0.1252)
= 1.6187 1.4752 (0.2158)
2 = 0.8143 23 = 0.8285
2, 3 = 0.0282 = 2
Todos estos cambios pueden atribuirse a un aumento de la multicolinealidad:
* Inicialmente, 23 = 0.5523; ahora, 23 = 0.8285. En forma similar, los errores estndar de 2 3 aumentan entre las dos
regresiones, sntoma caracterstico de la colinealidad.
En presencia de alta colinealidad, no se pueden estimar los coeficientes de regresin individuales en forma precisa, pero las combinaciones
lineales de estos coeficientes se estiman con mayor exactitud. Esto se
confirma con las regresiones anteriores.
Y X2 X3
1 2 4
2 0 2
3 4 0
4 6 12
5 8 16
DATOS HIPOTETICOS DE Y, X2 y X3
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
= 1.2108 + 0.40142 + 0.02703 0.7480 0.2721 (0.1252)
= 1.6187 1.4752 (0.2158)
2 = 0.8143 23 = 0.8285
2, 3 = 0.0282 = 2
En la primera regresin, la suma de los dos coeficientes parciales de las pendientes es 0.4493, en tanto que en la segunda regresin dicha suma es
0.4284, prcticamente la misma.
No slo eso: sus errores estndar son prcticamente los mismos, 0.1550 frente a 0.1823. Los errores estandar se obtienen de:
Observe, sin embargo, que el coeficiente de X3 cambi en forma notoria, de 0.003 a 0.027.
= 1.1639 + 0.44632 + 0.00303 0.7737 0.1848 (0.0851)
= 1.5431 2.4151 (0.0358)
2 = 0.8101 23 = 0.5523
2, 3 = 0.00868 = 2
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Ejemplo:
y X2 X3
70 80 810
65 100 1009
90 120 1273
95 140 1425
110 160 1633
115 180 1876
120 200 2052
140 220 2201
155 240 2435
150 260 2686
Datos hipoteticos sobre consumo,
ingreso y riqueza
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Ejemplo:Resumen
Estadsticas de la regresin
Coeficiente de correlacin mltiple 0.98158
Coeficiente de determinacin R^2 0.96350
R^2 ajustado 0.95308
Error tpico 6.80804
Observaciones 10
ANLISIS DE VARIANZA
Grados de
libertad
Suma de
cuadrados
Promedio de
los cuadrados F
Regresin 2 8565.55407 4282.77704 92.40196
Residuos 7 324.44593 46.34942
Total 9 8890
Coeficientes Error tpico Estadstico t Probabilidad
Intercepcin 24.77473 6.75250 3.66897 0.00798
Variable X 1 0.94154 0.82290 1.14417 0.29016
Variable X 2 -0.04243 0.08066 -0.52606 0.61509
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
La regresin muestra que el ingreso y la riqueza explican en conjunto
alrededor de 96% de la variacin en los gastos de consumo. A pesar de esto,
ningn coeficiente de las pendientes es estadsticamente significativo de
manera individual. Adems, no slo la variable riqueza es estadsticamente
no significativa, sino que tambin tiene el signo incorrecto. A priori, se
esperara una relacin positiva entre el consumo y la riqueza.
A pesar de que los estimadores no son significativos individualmente en
trminos estadsticos, si se prueba la hiptesis de que 2=3=0
simultneamente, esta hiptesis puede rechazarse.
En la hoja de respuesta de la regresin, podemos ver que el estadstico F es
altamente significativo con el valor de F=92.4019
El valor F se puede calcular teniendo en cuenta la suma de los errores al
cuadrado de la regresin y de los residuos; luego dividimos estos valores
entre su correspondiente grados de libertad. El resultado de dicha divisin se
vuelve a dividir.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
El ejemplo muestra en forma muy evidente lo que hace la multicolinealidad.
El hecho de que la prueba F sea significativa pero los valores t de X2 y X3
no sean significativos individualmente implica que las dos variables estn
tan correlacionadas que es imposible aislar el impacto individual del ingreso
o de la riqueza sobre el consumo.
Regresionar: X3 sobre X2
Regresionar: Y sobre X2
Regresionar: Y sobre X3
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Ejercicio 10.27
La tabla 10.13 proporciona cifras sobre importaciones (M), PIB e ndice de
precios al consumidor (IPC) de Estados Unidos de 1975 a 2005. Se le pide
considerar el siguiente modelo:
Ln Mt=1+ 2 lnPIBt + 3 ln IPCt + mt
a) Estime los parmetros de este modelo con la informacin de la tabla.
b) Sospecha multicolinealidad en los datos?
c) Efecte las siguientes regresiones:
1) Ln Mt= A1 + A2 ln PBIt
2) ln Mt = B1 + B1 ln IPCt
3) ln PBIt = C1 + C2 ln IPCt
Con base en estas regresiones, qu puede decir sobre la naturaleza de la
multicolinealidad en los datos?
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Ejercicio 10.27
Ln Mt=1+ 2 lnPIBt + 3 ln IPCt + mt
a) Estime los parmetros de este modelo con la informacin de la tabla.
El alto valor de R2 y el
valor no significativo de t
del coeficiente de Ln IPC
indican que
probablemente existe
multicolinealaidad en los
datos.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Ejercicio 10.27
c) Efecte las siguientes regresiones: 1) Ln Mt= A1 + A2 ln PBIt
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Ejercicio 10.27
c) Efecte las siguientes regresiones: 2) ln Mt = B1 + B1 ln IPCt
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Ejercicio 10.27
c) Efecte las siguientes regresiones: 3) ln PBIt = C1 + C2 ln IPCt
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Ejercicio 10.27
Con base en estas regresiones, qu puede decir sobre la naturaleza de la
multicolinealidad en los datos?
La regresin LnPBI sobre LnIPC muestran alta correlacin entre estas dos
variables, lo que sugiere que los datos sufren del problema de colinealidad.
La mejor solucin sera expresar
las importaciones y el PBI en
trminos reales, dividiendo cada
uno por el IPC (recordar el
mtodo de la razn que se
discuti en el captulo anterior.
Los resultados son los
siguientes:
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Ejemplo 10.7: Funcin de consumo para EE.UU
A continuacin consideraremos un grupo de datos sobre gasto de consumo
real (C), ingreso personal disponible real (Yd), riqueza real (W) y tasa de
inters real (I) para Estados Unidos, de 1947 a 2000. Hallar la regresin de
los datos, empleando lo siguiente:
= 1 + 2 + 3 + 4 + En este modelo, los coeficientes 2 y 3 dan las elasticidades del ingreso y la riqueza, respectivamente; 4 da la semielasticidad.
Los resultados de la regresin se presentan en la siguiente tabla:
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Ejemplo 10.7: Funcin de consumo para EE.UU
Los resultados demuestran que
todos los coeficientes estimados
son significativos desde el punto
de vista estadstico, pues sus
valores p son muy pequeos.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Ejemplo 10.7: Funcin de consumo para EE.UU
Los coeficientes estimados se
interpretan como sigue: la
elasticidad del ingreso es 0.80,
lo que indica que, cuando las
dems variables se mantienen
constantes, si el Yd aumenta 1%,
la media del gasto de C aumenta
0.8%. El coeficiente de riqueza
es 0.20, lo que significa que si
la riqueza aumenta 1%, la media
del consumo se incrementa slo
0.2%, de nuevo cuando las
variables se mantienen
constantes.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Ejemplo 10.7: Funcin de consumo para EE.UU
El coeficiente de la variable
tasa de inters indica que, a
medida que la tasa de inters
aumenta un punto porcentual,
el gasto de consumo disminuye
0.26%, ceteris paribus.
Todas las regresoras tienen
signos que concuerdan con las
expectativas previas, es decir,
el ingreso y la riqueza tienen
efecto positivo en el consumo,
pero la tasa de inters produce
un efecto negativo.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Ejemplo 10.7: Funcin de consumo para EE.UU
Hay que preocuparse por el
problema de la multicolinealidad
en este caso? Al parecer no,
porque todos los coeficientes
tienen los signos correctos, cada
coeficiente es muy significativo
estadsticamente en lo individual
y el valor F tambin es
estadsticamente muy
significativo, lo que indica que, en
conjunto, todas las variables
tienen efecto significativo en el
gasto de consumo. El valor R2
tambin es muy alto.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Ejemplo 10.7: Funcin de consumo para EE.UU
Por supuesto, casi siempre
existe cierto grado de
colinealidad entre las variables
econmicas. Con tal de que no
sea exacto se pueden estimar
los parmetros del modelo. Por
el momento, lo nico que se
puede decir es que, en el
presente ejemplo, la
colinealidad, si la hay, no
parece muy marcada.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
DETECCIN DE LA MULTICOLINEALIDAD:
Cmo conocer la presencia de colinealidad en cualquier situacin dada, en
especial en modelos con ms de dos variables explicativas?
Advertencias:
1. La multicolinealidad es una cuestin de grado y no de clase. La distincin
importante no es entre presencia o ausencia de multicolinealidad, sino entre
sus diferentes grados.
2. Como la multicolinealidad se refiere a la condicin de las variables
explicativas que son no estocsticas por supuestos, es una caracterstica de la
muestra y no de la poblacin.
Por consiguiente, no es necesario llevar a cabo pruebas sobre
multicolinealidad, pero, si se desea, es posible medir su grado en cualquier muestra determinada.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
DETECCIN DE LA MULTICOLINEALIDAD:
Como la multicolinealidad es en esencia un fenmeno de tipo muestral que
surge de informacin sobre todo no experimental recopilada en la mayora
de las ciencias sociales, no hay un mtodo nico para detectarla o medir su
fuerza. Lo que se tiene en realidad son ciertas reglas prcticas, algunas
informales y otras formales, pero todas reglas prcticas. Consideremos
algunas de ellas.
1. Una R2 elevada pero pocas razones t significativas. Como ya
mencionamos, es un sntoma clsico de multicolinealidad. Si R2 es alta (por encima de 0.8), la prueba F, en la mayora de los casos,
rechazar la hiptesis de que los coeficientes parciales de pendiente son
simultneamente iguales a cero, pero las pruebas t individuales
mostrarn que ningn coeficiente parcial de pendiente, o muy pocos,
son estadsticamente diferentes de cero (ver ejemplo de consumo-
ingreso-riqueza).
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
DETECCIN DE LA MULTICOLINEALIDAD:
2. Altas correlaciones entre parejas de regresoras. Otra regla prctica
recomendable consiste en observar el coeficiente de correlacin de
orden cero o entre dos regresoras. Si ste es alto (superior a 0.8), la
multicolinealidad es un problema grave.
La desventaja con este criterio es que, aunque las altas correlaciones de
orden cero pueden sugerir la presencia de colinealidad, no es necesario
que dichas correlaciones sean altas para tener colinealidad en un
determinado caso especfico. En trminos un poco tcnicos: las
correlaciones de orden cero elevadas son una condicin suficiente pero
no necesaria para la existencia de multicolinealidad, debido a que puede
existir a pesar de que las correlaciones de orden cero o correlaciones
simples sean comparativamente bajas (es decir, inferiores a 0.50).
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
DETECCIN DE LA MULTICOLINEALIDAD:
En los modelos donde hay ms de dos variables explicativas, la
correlacin simple o de orden cero no proporciona una gua infalible
sobre la presencia de multicolinealidad. Claro que si slo existen dos
variables explicativas, bastarn las correlaciones de orden cero.
3. Examen de las correlaciones parciales. Debido al problema recin
descrito, que se basa en correlaciones de orden cero, otros sugieren que
debe observarse, en lugar de ellas, los coeficientes de correlacin
parcial. De esta forma, en la regresin de Y sobre X2, X3 y X4, si se
encuentra que 1.2342 es muy elevada pero 12.34
2 , 13.242 y 14.24
2 son
comparativamente bajas, esto puede sugerir que las variables X2, X3 y X4estn muy intercorrelacionadas y que por lo menos una de estas
variables es superflua.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
DETECCIN DE LA MULTICOLINEALIDAD:
4. Regresiones auxiliares. Como la multicolinealidad surge porque una o
ms de las regresoras son combinaciones lineales exactas o aproximadas
de las dems regresoras, una forma de determinar cul variable X est
relacionada con las dems variables X es efectuar la regresin de cada Xi
sobre las variables X restantes y calcular la R2 correspondiente; cada una
de estas regresiones se denomina regresin auxiliar de Y sobre las X.
As, conforme a la relacin entre F y R2, la variable:
Sigue la distribucin F con k-2 y n-k+1 gl. En la ecuacin n es el tamao
de la muestra, k es el nmero de variables explicativas, incluyendo el
intercepto y 1.232 es el coeficiente de determinacin en la
regresin de la variable sobre las variables X restantes.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
DETECCIN DE LA MULTICOLINEALIDAD:
Si la F calculada excede a la Fi crtica en el nivel de significancia
seleccionado, se dice que la Xi particular es colineal con las dems X; si
no excede a la Fi crtica, se dice que sta no es colineal con las dems X,
en cuyo caso se puede mantener la variable en el modelo. Si Fi es
estadsticamente significativa, an hay que decidir si la Xi en
consideracin debe eliminarse del modelo.
Sin embargo, este mtodo no carece de desventajas, pues si la
multicolinealidad comprende slo unas cuantas variables, de forma que
las regresiones auxiliares no sufran de multicolinealidad extensa, los
coeficientes estimados pueden revelar la naturaleza de la dependencia
lineal entre las regresoras. Por desgracia, si existen diversas
asociaciones lineales complejas, este ejercicio de ajuste de curva puede
no tener gran valor, pues ser difcil identificar las interrelaciones
separadas.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
DETECCIN DE LA MULTICOLINEALIDAD:
En lugar de probar formalmente todos los valores R2 auxiliares, se puede
adoptar la regla prctica de Klein, que sugiere que la multicolinealidad
puede ser un problema complicado solamente si la R2 obtenida de una
regresin auxiliar es mayor que la R2 global, es decir, si se obtiene de la
regresin de Y sobre todas las regresoras. Por cierto, al igual que todas
las dems reglas prcticas, sta debe utilizarse con buen criterio.
5. Valores propios e ndice de condicin. Mediante EViews y Stata
podemos calcular los valores propios y el ndice de condicin para
diagnosticar la multicolinealidad. A partir de estos valores propios puede
derivarse lo que se conoce como nmero de condicin k, definido
como:
=
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
DETECCIN DE LA MULTICOLINEALIDAD:
y el ndice de condicin (IC), definido como:
Entonces tenemos esta regla prctica: Si k est entre l00 y 1000, existe una
multicolinealidad que va de moderada a fuerte, mientras que si excede de
1000, existe multicolinealidad grave.
De otro modo, si el IC est entre 10 y 30, hay multicolinealidad entre
moderada y fuerte, y si excede de 30, una multicolinealidad grave.
Algunos autores consideran que e1 ndice de condicin es el mejor
diagnstico de multicolinealidad disponible. Sin embargo, esta opinin no es
muy aceptada. As, el IC es slo una regla prctica, quiz un poco ms
compleja.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
DETECCIN DE LA MULTICOLINEALIDAD:
6. Tolerancia y factor de inflacin de la varianza. Ya vimos el FIV y la
TOL. Conforme 2 -el coeficiente de determinacin en la regresin de
la regresora Xj sobre las regresoras restantes del modelo- se aproxima a
la unidad, es decir, conforme se incrementa la colinealidad de Xj con las
dems regresoras, FIV tambin aumenta, y en el lmite puede ser
infinito.
Algunos autores utilizan, por consiguiente, el FIV como indicador de la
multicolinealidad: entre mayor es el valor del FIVj, mayor problema
o colinealidad tiene la variable Xj. Pero, cunto debe ascender el FIV
antes de que una regresora se convierta en un problema? Como regla
prctica, si el FIV de una variable es superior a 10 (esto sucede si 2
excede de 0.90), se dice que esa variable es muy colineal.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
DETECCIN DE LA MULTICOLINEALIDAD:
Desde luego, puede utilizarse TOLj como medida de la
multicolinealidad, en vista de su estrecha conexin con FIVj. Mientras
ms cerca est TOLj de cero, mayor ser el grado de colinealidad de esa
variable respecto de las dems regresoras. Por otra parte, mientras ms
cerca est TOLj de 1, mayor ser la evidencia de que Xj no es colineal
con las dems regresoras.
7. Diagrama de dispersin. Es una buena prctica usar un diagrama de
dispersin para ver cmo se relacionan las diversas variables de un
modelo de regresin. La siguiente figura presenta el diagrama de
dispersin del ejemplo de consumo analizado anteriormente.
Se trata de un diagrama de cuatro por cuatro cuadros porque hay cuatro
variables en el modelo, una variable dependiente (C) y tres variables
explicativas: ingreso personal disponible real (Yd), riqueza real (W) y
tasa de inters real (I).
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
0
1000
2000
3000
4000
5000
6000
7000
-12 -8 -4 0 4 8
I
C0
1
0
1000
2000
3000
4000
5000
6000
7000
0 10000 20000 30000 40000
W
C0
1
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
0
1000
2000
3000
4000
5000
6000
7000
0 1000 2000 3000 4000 5000 6000 7000
YD
C0
1
4000
8000
12000
16000
20000
24000
28000
32000
36000
40000
-12 -8 -4 0 4 8
I
W
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
0
1000
2000
3000
4000
5000
6000
7000
-12 -8 -4 0 4 8
I
YD
4000
8000
12000
16000
20000
24000
28000
32000
36000
40000
0 1000 2000 3000 4000 5000 6000 7000
YD
W
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
0
1000
2000
3000
4000
5000
6000
7000
C0
1
-12
-8
-4
0
4
8
I
4000
8000
12000
16000
20000
24000
28000
32000
36000
40000
W
0
1000
2000
3000
4000
5000
6000
7000
0 1000 2000 3000 4000 5000 6000 7000
C01
YD
-12 -8 -4 0 4 8
I
0 10000 20000 30000 40000
W
0 1000 2000 3000 4000 5000 6000 7000
YD
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
DETECCIN DE LA MULTICOLINEALIDAD:
Concluyendo, los diversos mtodos de deteccin de la multicolinealidad,
son, en esencia expediciones de pesca, pues no puede decirse cules funcionan en una aplicacin particular. Sin embargo, no se puede hacer
mucho al respecto, pues la multicolinealidad es un problema especfico de
una muestra dada sobre la cual el investigador puede no tener mucho
control, sobre todo si los datos son no experimentales por naturaleza, como
es lo comn para los investigadores de las ciencias sociales.
Respecto a la micronumerosidad, recordemos que es un problema slo si el
tamao pequeo de la muestra de la muestra y la falta de variabilidad en las
variables explicativas pueden ocasionar problemas por lo menos tan graves
como los debidos a la multicolinealidad.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
MEDIDAS CORRECTIVAS
En general, hay dos posibilidades:
1. No hacer nada. Oliver Blanchard expresa de la siguiente manera la
corriente de pensamiento que aboga por no hacer nada:
Cuando los estudiantes efectan por primera vez la regresin de MCO,
el primer problema que suelen afrontar es el de la multicolinealidad.
Muchos concluyen que hay algo malo con los MCO; otros recurren a
nuevas y con frecuencia creativas tcnicas a fi n de darle la vuelta al
problema. Pero eso est mal. La multicolinealidad es la voluntad de
Dios, no un problema con los MCO ni con la tcnica estadstica en
general.
Lo que Blanchard afirma es que la multicolinealidad es en esencia un
problema de deficiencia de datos (micronumerosidad), y en algunas
ocasiones no hay opcin respecto de los datos disponibles para el anlisis
emprico.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
MEDIDAS CORRECTIVAS
Asimismo, no es que todos los coeficientes en un modelo de regresin
sean estadsticamente insignificantes. Al contrario, aunque no se puedan
estimar uno o ms coeficientes de regresin con gran precisin, es
posible calcular una combinacin lineal de ellos (es decir, una funcin
estimable) con relativa eficiencia.
2. Reglas prcticas. El xito de estas reglas depende de la gravedad de la
multicolinealidad.
A. Informacin a priori. Suponga que consideramos el modelo
= 1 + 22 + 33 + Y: Consumo, X2: ingreso y X3: riqueza.
Como ya mencionamos, las variables ingreso y riqueza tienden a ser
muy colineales.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
MEDIDAS CORRECTIVAS
= 1 + 22 + 33 + Y: Consumo, X2: ingreso y X3: riqueza.
Suponga que, a priori, creemos que 3=0.102; es decir, la tasa de
cambio del consumo respecto de la riqueza es una dcima parte de la
correspondiente respecto del ingreso. Podemos entonces efectuar la
siguiente regresin:
= 1 + 22 + 0.123 + = 1 + 2 +
Donde = 2 + 0.13. Una vez obtenido 2 podemos estimar 3 a partir de la relacin postulada entre 2 y 3.
Cmo obtener informacin a priori? Puede provenir de un trabajo
emprico anterior, en donde el problema de colinealidad result ser
menos grave o de la teora relevante que soporta el campo de estudio.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
MEDIDAS CORRECTIVAS
Por ejemplo, en la funcin de produccin tipo Cobb-Douglas,
desarrollada en el item anterior, = 1223
3; si esperamos que prevalezcan los rendimientos constantes a escala, entonces 2 + 3 = 1, en cuyo caso podemos efectuar la regresin de la razn producto-trabajo
sobre la razn capital-trabajo.
t=(-4.0612) (28.1056)
Valor p= (0.0007) (0.0000)
R2=0.9777 SCRR=0.0166
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
MEDIDAS CORRECTIVAS
Si existe colinealidad entre el trabajo y el capital, como suele ser el caso
en la mayor parte de la informacin muestral, dicha transformacin
puede reducir o eliminar el problema de colinealidad.
Pero es preciso hacer una advertencia aqu respecto de la imposicin
de esas restricciones a priori, . . . pues en general se desean probar las
predicciones a priori de la teora econmica en lugar de imponerlas
simplemente sobre los datos para los cuales pueden no ser vlidas.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
MEDIDAS CORRECTIVAS
2. Reglas prcticas.
B. Combinacin de informacin de corte transversal y de series de
tiempo. Una variante de la tcnica de informacin externa o a priori es la
combinacin de datos de corte transversal y de series de tiempo,
conocida como mezcla de datos.
Suponga que deseamos estudiar la demanda de automviles en Estados
Unidos y que tenemos informacin de series de tiempo sobre el nmero
de automviles vendidos, su precio promedio y el ingreso del
consumidor. Adems, suponga que
= 1 + 2 + 3 + donde Y: nmero de automviles vendidos, P: precio promedio, I:
ingreso y t tiempo. El objetivo es estimar la elasticidad precio 2 y la elasticidad ingreso 3.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
MEDIDAS CORRECTIVAS
B. Combinacin de informacin de corte transversal y de series de
tiempo.
En la informacin de series de tiempo, las variables precio e ingreso
tienden a ser muy colineales. Por consiguiente, si deseamos efectuar la
anterior regresin, debemos enfrentar el problema usual de
multicolinealidad.
Una salida a esto, sostiene que si hay informacin de corte transversal
(por ejemplo, informacin generada a travs de paneles de
consumidores o estudios sindicados realizados por varias agencias
privadas y estatales), puede obtenerse una estimacin relativamente
confiable de la elasticidad ingreso 3, pues, con tal informacin, que est en un punto en el tiempo, los precios no varan mucho. Sea 3 la elasticidad ingreso estimada a partir de los datos de corte transversal.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
MEDIDAS CORRECTIVAS
B. Combinacin de informacin de corte transversal y de series de
tiempo.
Con esta estimacin, la anterior regresin de series de tiempo se escribe
como
= 1 + 2 +
dondeY=lnY3. Es decir, Y* representa ese valor de Y despus de eliminarle el efecto del ingreso. Ahora se puede obtener una estimacin
de la elasticidad precio 2 de la regresin anterior.
Aunque es una tcnica atractiva, la mezcla de datos de series de tiempo
y de corte transversal de esta forma puede crear problemas de
interpretacin porque se supone implcitamente que la elasticidad
ingreso estimada a partir de datos de corte transversal es igual a la que
se habra obtenido a partir de un anlisis puro de series de tiempo.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
MEDIDAS CORRECTIVAS
B. Combinacin de informacin de corte transversal y de series de
tiempo.
= 1 + 2 +
Sin embargo, se ha empleado esta tcnica en muchas aplicaciones y es
en particular valiosa en situaciones en donde las estimaciones de corte
transversal no varan sustancialmente de una seccin transversal a otra.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
MEDIDAS CORRECTIVAS
C. Eliminacin de una(s) variable(s) y el sesgo de especificacin.
Al enfrentar el problema de multicolinealidad grave, una de las
soluciones ms simples consiste en omitir del modelo una de las
variables colineales. As, en el ejemplo consumo-ingreso-riqueza, al
omitir la variable riqueza, obtenemos una regresin la cual muestra que
mientras en el modelo original la variable ingreso no era
estadsticamente significativa, ahora se vuelve altamente significativa.
= 24.45 + 0.50912(6.4138) (0.0357)
t=(3.551) (13.29) R2=0.9567
Sin embargo, al eliminar una variable del modelo se puede incurrir en
un sesgo de especificacin o error de especificacin, que surge de la
especificacin incorrecta del modelo utilizado en el anlisis.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
MEDIDAS CORRECTIVAS
C. Eliminacin de una(s) variable(s) y el sesgo de especificacin.
As, si la teora econmica afirma que tanto el ingreso como la riqueza
deben incluirse en el modelo que explica el gasto de consumo, al
eliminar la variable riqueza se incurrira en un sesgo de especificacin.
Por tanto, el remedio suele ser peor que la enfermedad en algunas
situaciones porque, mientras que la multicolinealidad puede obstaculizar
la estimacin precisa de los parmetros del modelo, la omisin de una
variable generara graves equivocaciones respecto de los verdaderos
valores de los parmetros. Recuerde que los estimadores de MCO son
MELI a pesar de la presencia de multicolinealidad perfecta.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
MEDIDAS CORRECTIVAS
D. Transformacin de variables. Suponga que tenemos informacin de
series de tiempo sobre el gasto de consumo, el ingreso y la riqueza. Una
razn de la alta multicolinealidad entre el ingreso y la riqueza en tal
informacin es que, con el tiempo, las dos variables tienden a moverse
en la misma direccin. Una forma de reducir esta dependencia es
proceder de la siguiente manera.
Si la relacin:
= 1 + 22 + 33 + se cumple en el periodo t, tambin debe cumplirse en el periodo t - 1,
pues el origen del tiempo es, de todas formas, arbitrario. Por
consiguiente, tenemos que:
1 = 1 + 22,1 + 33,1 + 1
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
MEDIDAS CORRECTIVAS
D. Transformacin de variables.
Si restamos las funciones anteriores, tenemos:
1 = 2 2 2,1 + 3 3 3,1 +
donde = 1.
La ltima ecuacin se conoce como la forma en primeras diferencias
porque no se hace la regresin sobre las variables originales, sino sobre
las diferencias de los valores sucesivos de dichas variables.
El modelo de regresin que utiliza primeras diferencias a menudo
reduce la gravedad de la multicolinealidad porque, aunque los niveles de
2 y 3 estn muy correlacionados, no hay razn a priori para pensar que sus diferencias tambin lo estn.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
MEDIDAS CORRECTIVAS
D. Transformacin de variables.
1 = 2 2 2,1 + 3 3 3,1 +
Una ventaja incidental de la transformacin de primeras diferencias
consiste en que puede hacer que una serie de tiempo no estacionaria se
convierta en estacionaria. En general, mencionaremos que, una serie de
tiempo, por ejemplo , es estacionaria si su media y varianza no cambian de manera sistemtica a travs del tiempo.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
MEDIDAS CORRECTIVAS
D. Transformacin de variables.
Otra transformacin comn es la transformacin de razn.
Considere el siguiente modelo:
= 1 + 22 + 33 + donde Y: Gasto de consumo ($ reales), 2: PIB y 3: poblacin total.
Como el PIB y la poblacin aumentan con el tiempo, es muy probable
que estn correlacionados. Una solucin a este problema consiste en
expresar el modelo mediante una base per cpita; es decir, dividir la
funcin entre 3 para obtener:
Dicha transformacin tal vez reduzca la colinealidad en las variables
originales.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
MEDIDAS CORRECTIVAS
D. Transformacin de variables.
Sin embargo, la transformacin que utiliza primeras diferencias o las
transformaciones de razn crean otros problemas. Por ejemplo, el
trmino de error puede no satisfacer el supuesto del MCRL que las perturbaciones no estn serialmente correlacionadas; si esto ocurre, el
remedio puede ser peor que la enfermedad. Adems, se pierde una
observacin debido al procedimiento de diferenciacin y, por
consiguiente, los grados de libertad se reducen en 1. En una muestra
pequea esto puede ser un factor que al menos se debe considerar. Por
aadidura, el procedimiento de primeras diferencias puede no ser el
adecuado en los datos de corte transversal, donde no hay un
ordenamiento lgico de las observaciones.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
MEDIDAS CORRECTIVAS
D. Transformacin de variables.
Del mismo modo, en el modelo de la razn, el trmino de error
ser heteroscedstico, si el trmino de error original es homoscedstico, como veremos ms adelante. Una vez ms, el remedio
quiz resulte peor que la enfermedad de la colinealidad.
En resumen, se debe tener cuidado con las primeras diferencias o el
mtodo de la razn para transformar los datos a fin de resolver el
problema de la multicolinealidad.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
MEDIDAS CORRECTIVAS
E. Nuevos datos adicionales.
Como la multicolinealidad es una caracterstica de la muestra, es posible
que en otra muestra con las mismas variables la colinealidad no sea tan
grave como en la primera. A veces, con slo aumentar el tamao de la
muestra (si esto es posible) se atena el problema de colinealidad.
Sin embargo, La obtencin de datos adicionales o mejores no siempre
es tan sencilla, pues, por desgracia, muy pocas veces pueden los
economistas obtener informacin adicional sin incurrir en altos costos, y
mucho menos pueden seleccionar los valores de las variables
explicativas que desean. Adems, al agregar variables en situaciones no
controladas, se debe tener cuidado de no agregar observaciones
generadas en un proceso diferente del asociado al conjunto original de
datos; es decir, se debe estar seguro de que la estructura econmica
asociada a las nuevas observaciones sea igual a la estructura original.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
MEDIDAS CORRECTIVAS
F. Reduccin de la colinealidad en las regresiones polinomiales. Una
caracterstica especial de los modelos de regresin polinomial, es que
las variables explicativas aparecen elevadas a diversas potencias. Por
tanto, en la funcin cbica de costos totales que implica la regresin del
costo total sobre la produccin, como en:
= 0 + 1 + 22 + 3
3 + los diversos trminos de la produccin van a estar correlacionados, lo
que dificulta la estimacin precisa de los diversos coeficientes de
pendiente. No obstante, en la prctica se ha visto que si las variables
explicativas estn expresadas en forma de desviacin (es decir,
desviaciones del valor medio), la multicolinealidad se reduce
sustancialmente. Pero, si el problema persiste, tal vez convenga
considerar tcnicas como la de los polinomios ortogonales.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
MEDIDAS CORRECTIVAS
G. Otros mtodos de remediar la multicolinealidad. Las tcnicas
estadsticas multivariadas como el anlisis de factores y el de
componentes principales, o como la regresin en cadena, son comunes
para resolver el problema de la multicolinealidad.
Desafortunadamente, estas tcnicas estn fuera del alcance de este
curso, pues no pueden analizarse en forma competente sin recurrir al
lgebra matricial.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
LA MULTICOLINEALIDAD NO ES NECESARIAMENTE MALA SI
EL UNICO OBJETIVO ES SOLO LA PREDICCION
si el nico propsito del anlisis de regresin es el pronstico o la
prediccin, la multicolinealidad no es un problema grave, pues, entre ms
alta sea la R2, mejor ser la prediccin. Pero esto sucede siempre que los
valores de las variables explicativas, para los cuales se desean las
predicciones, obedezcan las mismas dependencias lineales casi exactas de la
matriz X [de datos] del diseo original.
Por tanto, si en una regresin estimada se encuentra que X2=2 X3aproximadamente, entonces, en una muestra futura para pronosticar Y, X2tambin debe ser aproximadamente igual a 2 X3, condicin difcil de cumplir
en la prctica, en cuyo caso la prediccin ser cada vez ms incierta.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
LA MULTICOLINEALIDAD NO ES NECESARIAMENTE MALA SI
EL UNICO OBJETIVO ES SOLO LA PREDICCION
Ms an, si el objetivo del anlisis no es slo la prediccin sino tambin la
estimacin confiable de los parmetros, la presencia de una alta
multicolinealidad puede ser un problema porque genera grandes errores
estndar en los estimadores.
Una de las situaciones en que la multicolinealidad no representa un
problema grave, es el caso en el cual se tiene una R2 elevada y los
coeficientes de regresin son significativos individualmente. Aun as, los
diagnsticos de multicolinealidad, (ndice de condicin), indican que los
datos presentan colinealidad grave. Esto puede suceder si los coeficientes
individuales resultan estar numricamente muy por encima del valor
verdadero, de forma que el efecto siga visible, a pesar de los errores estndar
inflados y/o debido a que el valor verdadero es en s mismo tan grande que,
aunque se obtenga una estimacin subestimada, contine siendo
significativa.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Ejemplo ampliado
Los siguientes datos, originalmente se obtuvieron para evaluar la exactitud
del clculo computacional de las estimaciones de mnimos cuadrados de
varios paquetes de software: los datos Longley. Estos se convirtieron en
ejemplo para ilustrar diversos problemas economtricos, como la
multicolinealidad. Los datos se reproducen en la siguiente tabla y son series
de tiempo de 1947 a 1962, donde:
Y: nmero de personas con trabajo (en miles)
X1: ndice implcito de deflacin de precios para el PIB
X2: PIB (en millones de dlares)
X3: nmero de desempleados (en miles)
X4: nmero de personas enlistadas en las fuerzas armadas
X5: poblacin no institucionalizada mayor de 14 aos de edad
X6: ao (igual a 1 para 1947, 2 para 1948 y 16 para 1962).
Suponga que nuestro objetivo es predecir Y con base en las seis variables X.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Ao Y X1 X2 X3 X4 X5 X6
1947 60323 830 234289 2356 1590 107608 1
1948 61122 885 259426 2325 1456 108632 2
1949 60171 882 258054 3682 1616 109773 3
1950 61187 895 284599 3351 1650 110929 4
1951 63221 962 328975 2099 3099 112075 5
1952 63639 981 346999 1932 3594 113270 6
1953 64989 990 365385 1870 3547 115094 7
1954 63761 1000 363112 3578 3350 116219 8
1955 66019 1012 397469 2904 3048 117388 9
1956 67857 1046 419180 2822 2857 118734 10
1957 68169 1084 442769 2936 2798 120445 11
1958 66513 1108 444546 4681 2637 121950 12
1959 68655 1126 482704 3813 2552 123366 13
1960 69564 1142 502601 3931 2514 125368 14
1961 69331 1157 518173 4806 2572 127852 15
1962 70551 1169 554894 4007 2827 130081 16
Datos Longley
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
A primera vista, dichos
resultados sugieren que se tiene
un problema de colinealidad,
pues el valor R2 es muy alto; sin
embargo, unas cuantas variables
son estadsticamente no
significativas (X1, X2 y X5), lo
cual constituye un sntoma
caracterstico de
multicolinealidad.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Para arrojar ms luz a este problema, en la siguiente tabla se presentan las
intercorrelaciones entre las seis regresoras. Esta tabla se conoce como matriz
de correlacin.
X1 1.00000 0.99159 0.62063 0.46474 0.97916 0.99115
X2 0.99159 1.00000 0.60426 0.44644 0.99109 0.99527
X3 0.62063 0.60426 1.00000 -0.17742 0.68655 0.66826
X4 0.46474 0.44644 -0.17742 1.00000 0.36442 0.41725
X5 0.97916 0.99109 0.68655 0.36442 1.00000 0.99395
X6 0.99115 0.99527 0.66826 0.41725 0.99395 1.00000
MATRIZ DE CORRELACIONES
El primer rengln de esta tabla proporciona la correlacin de X1 con las
otras variables X. Por ejemplo, 0.991589 es la correlacin entre X1 y X2;
0.620633 es la correlacin entre X1 y X3, y as sucesivamente.
Varias de estos pares de correlaciones son muy altos, lo cual sugiere que hay
un grave problema de colinealidad. Por supuesto, debe recordarse la
advertencia de que tales correlaciones tal vez sean una condicin suficiente,
pero no necesaria, para la multicolinealidad.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Observe ahora las regresiones auxiliares; es decir, la regresin de cada
variable X sobre las restantes variables X. En la siguiente tabla se presentan
slo los valores R2 obtenidos con base en esas regresiones,
Variable
dependiente Valor de R2
Tolerancia (TOL)
= 1 R2
X1 0.9926 0.0074
X2 0.9994 0.0006
X3 0.9702 0.0298
X4 0.7213 0.2787
X5 0.9970 0.0030
X6 0.9986 0.0014
Como los valores R2 de las regresiones
auxiliares son muy altos (con la
posible excepcin de la regresin de
X4) sobre las restantes variables X, al
parecer existe un grave problema de
colinealidad.
La misma informacin se obtiene a partir de los factores de tolerancia.
Como ya mencionamos, mientras ms cercano a cero est el factor de
tolerancia, mayor ser la evidencia de colinealidad.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Al aplicar la regla prctica de Klein observamos que los valores R2
obtenidos de las regresiones auxiliares exceden el valor general R2 (es decir,
el que se obtuvo de la regresin de Y sobre todas las variables X), que es
igual a 0.9954, en 3 de 6 regresiones auxiliares, lo cual de nuevo sugiere que
sin duda los datos Longley estn plagados del problema de
multicolinealidad.
Aplicar la prueba F y la variacin ante pequeos cambios.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Qu acciones podemos aplicar para revertir esta situacin de
multicolinealidad?
1. El PIB puede expresarse no en trminos nominales, sino en trminos
reales, lo cual se realiza al dividir el PIB nominal entre el ndice de
deflacin del precio implcito.
2. En vista de que la poblacin no institucional mayor de 14 aos aumenta
con el tiempo debido al crecimiento natural de la poblacin, estar muy
correlacionada con el tiempo, la variable X6 del modelo. Por tanto, en
lugar de conservar esas dos variables, mantenemos la variable X5 y
desechamos X6.
3. En tercer lugar, no hay ninguna razn de peso para incluir X3, el
nmero de personas desempleadas; quiz la tasa de desempleo fuese una
mejor medida de las condiciones del mercado de trabajo; sin embargo,
no hay ningn dato al respecto. Por tanto, eliminamos la variable X3.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Qu acciones podemos aplicar para revertir esta situacin de
multicolinealidad?
Con estos cambios obtenemos los siguientes resultados de la regresin:
Aunque R2 disminuy un poco en
comparacin con la R2 original,
an es muy alta. Ahora todos los
coeficientes estimados son
significativos y sus signos tienen
sentido desde el punto de vista
econmico.
Podemos probar otros modelos y
observar la forma en que cambian
los resultados. Tenga en cuenta la
advertencia respecto de la
utilizacin del mtodo de la razn.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Ejercicio
Suponga el siguiente modelo de regresin aplicado a la economa de Estados
Unidos:
= 1 + 22 + 33 + 44 + : consumo; 2: ingreso salarial; 3: ingreso no salarial, no procedente del campo; 4: ingreso procedente del campo.
Pero, como se espera que 2:, 3: y 4: sean muy colineales, obtuvieron las siguientes estimaciones de 3 y 4 del anlisis de corte transversal: 3 =0.752 y 4 = 0.6252. Con estas estimaciones reformularon su funcin de consumo de la siguiente manera:
= 1 + 2 2 + 0.753 + 0.6254 + = 1 + 2 + a) Ajuste el modelo modificado a los datos que se presentan en la siguiente
tabla y obtenga estimaciones de 1 a 4.
b) Como interpretara la variable Z?
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Ejercicio
Ao Y X2 X3 X4
1936 62.8 43.41 17.10 3.96
1937 65.0 46.44 18.65 5.48
1938 63.9 44.35 17.09 4.37
1939 67.5 47.82 19.28 4.51
1940 71.3 51.02 23.24 4.88
1941 76.6 58.71 28.11 6.37
1945 86.3 87.69 30.29 8.96
1946 95.7 76.73 28.26 9.76
1947 98.3 75.91 27.91 9.31
1948 100.3 77.62 32.30 9.85
1949 103.2 78.01 31.39 7.21
1950 108.9 83.57 35.61 7.39
1951 108.5 90.59 37.58 7.98
1952 111.4 95.47 35.17 7.42
DATOS DEL PROBLEMA
(11.593)(0.002) (0.209)
Ejemplo:OBS GDP PR M1 RS
1952:1 87.875 0.1975607 126.537 1.64
1952:2 88.125 0.1981673 127.506 1.677667 GDP: Producto Domestico Bruto
1952:3 89.625 0.2001787 129.385 1.828667 M1: Medio Circulante
1952:4 92.875 0.2012459 128.512 1.923667 PR: Nivel de precio (GDP deflactor)
1953:1 94.625 0.2010517 130.587 2.047333 RS: Tasa a 3 meses del tesoro
1953:2 95.55 0.2014442 130.341 2.202667
1953:3 95.425 0.2022359 131.389 2.021667
1953:4 94.175 0.2027231 129.891 1.486333
1954:1 94.075 0.2034164 130.173 1.083667
1954:2 94.2 0.203841 131.385 0.8143333
1954:3 95.45 0.2042913 134.627 0.8696667 Solo 2 Click rpidos para
1954:4 97.36375 0.204374 134.252 1.036333 ingresar a la base de datos
1955:1 100.725 0.2056032 136.413 1.256333 de EXCEL1955:2 102.825 0.2062274 136.471 1.614333
1955:3 104.925 0.207762 138.377 1.861333
1955:4 106.6 0.2099975 137.244 2.349333
1956:1 107.275 0.2120478 138.053 2.379333
1956:2 108.675 0.2133287 138.375 2.596667
1956:3 109.875 0.2161404 138.993 2.596667
1956:4 112.125 0.2170651 139.087 3.063667
tttt PRLnRSGDPLnMLn )(**)(*)1( 321
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
La interpretacin de loscoeficientes depende de la
naturaleza de la variable del
modelo. Para nuestro casoutiliza utilizar series en
logaritmo, los coeficientes
representan la elasticidaddemanda por circulante. Si el
producto domstico bruto (GDP)
aumenta en 1% la demanda dedinero aumenta en 0.46%.
Si la tasa de inters (RS) aumenta en un punto porcentual, elcirculante disminuye en 0.027% y si el nivel de precios (PR)
aumenta en 1% la demanda por circulante aumenta en 0.56%, por
ultimo la constate se interpreta que para valores nulos de RS, GDPy PR, la probabilidad que aumente el circulante es de 3.69%.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
STD.Error: Error estndar de los coeficientes a estimar.
t-Statistic: Valor del estadstico t, bajo la hiptesis individual que las
variables (H0: i =0).Con n-k grados de libertad, Indica que la variable contribuye a explicar la variable endgena.
Prob: Si los Valores son superiores al 5% (=5%) no se rechaza la hiptesis nula y la variable exgena no sirve para explicar el modelo.
R squared: Es el R cuadrado de la ecuacin y representa el porcentaje de la variabilidad de la variable dependiente explicada por
la variable independiente.
Adjusted R-squared: Permite medir el incremento neto de R
cuadrado, cuando se incluye un nuevo regresor.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Durbin-Watson stat: Sirve para contrastar la hiptesis deincorrelacin entre perturbaciones aleatorias frente a la presencia de
autocorrelacin.
Mean depent var: Representa la media de la variable dependiente.
S.D depent var: Representa la cuasidesviacin tpica de la muestra.
F-statistic: Es el estadstico que esta asociado a la hiptesis
conjunta de que los parmetros asociados son iguales a cero(excepto el intercepto). H0 : 1 =2 =3 =i
Prob (F-statistic): Mide la probabilidad de cometer el erro tipo I. Secalcula con la distribucin F de Snedecor Fk-1;T-k-1.
Criterios de Informacin: Son el Akaike info criterion y Schwarz
criterion, estos criterios nos dan informacin de la capacidadexplicativa del modelo y permite realizar comparaciones de los
modelos analizados.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Antes de empezar a calcular los intervalo de confianza para los
parmetros. Vamos a introducirnos en el uso de comandos en EViews.
Comandos en EViews
En el rea de comandos podremos escribir y ejecutar los diferentes
comandos, y cuyos resultados se irn almacenando en el Workfile.
Para ejecutar un comando hay que situarse en el rea de sintaxis y
escribir la sentencia completa del comando, para luego pulsar la tecla
Intro para ejecute dicho comando.
Esta rea acta como una calculadora cientfica, donde se pueden
realizar transformaciones (algebraicas o estadsticas) a la variables
para luego obtener los resultados.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Si necesitamos el nmero de
observaciones de la regresin
digitaremos: =@regobs y si
queremos guardar este dato en el
archivo de trabajo digitamos
Scalar, para que sea almacenado
como un escalar, entonces
tenemos que digitar primero el
escalar, luego un nombre como T
igual al comando e Intro:
Scalar T =@regobs.
El escalar se graba como t
El escalar se graba como t
Si hacemos doble Click sobre t, en la parte inferior de la ventana se muestra el valor de 180 observaciones usadas en la regresin.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Si queremos usar los valores de los coeficientes de la regresin hay
que digitar Matrix, porque es una matriz de coeficientes, seguido de
@coefs. Si queremos, esta amatriz lo podemos guardar en el
Workfile con el nombre de Coef. Entonces, debemos digitar los
siguiente: Matrix Coef=@coefsSe guarda la matriz con el nombre Coef.
Al hacer doble click sobre la
carpeta @coef, se muestra la
siguiente ventana:
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Tipo de Funcin Empieza con el Nombre
Distribucin Acumulada (CDF) @c
Densidad o probabilidad @d
Inversa de CDF @q
Generador del Nmero Aleatorio @r
Tambin se pueden obtener, mediante los comandosdistribuciones que se utilizan tanto estadstica como en
econometra.
Los comandos ms usados en Econometra, son:
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Distribucin Funcin Densidad/Funcin de probabilidad
Chi-square @cchisq(x,v),
@dchisq(x,v),
@qchisq(p,v),
@rchisq(v)
F-distibucin @cfdist(x,v1,v2),
@dfdist(x,v1,v2),
@qfdist(p,v1,v2),
@rfdist(v1,v1)
Normal(Gaussian) @cnorm(x),
@dnorm(x),
@qnorm(p),
@rnorm, nrnd
T-Students @ctdist(x,v),
@dtdist(x,v),
@qtdist(p,v),
@rtdist(v)
v,v1,v2: Son los grados de libertad.
X: Es el /2 o valor calculado p: Probabilidad de confianza.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Si queremos obtener la probabilidad acumulada de la t-Student al 5%
de significancia con 20 grados de libertad. El comando a digitar es:
=@qtdist(0.05,20) y Intro. Proporciona como resultado -1.725 por
simetra 1.725
Si queremos obtener la probabilidad acumulada de la chi-cuadrado al
10% de significancia con 15 grados de libertad. El comando a digitar es:
=@qchisq(0.90,15) y Intro, proporciona como resultado 22.31
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Otros comandos usados en EViews son:
Funciones Descripcin
Genr Genera directamente una operacin entre variables.
Log(X) Logaritmo natural.
exp(X) o @exp(X) Funcin exponencial e^x.
Abs o @abs(X) Valor absoluto X.
Sqr o @Sqr(X) Raz cuadrada.
@sin(X) Funcin Seno
@cos(X) Funcin Coseno.
@asin(X) Arco seno.
@acos(X) Arco coseno.
@tan(X) Funcin tengente.
rnd Nmero aleatorio entre cero y uno.
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Funciones Descripcin
nrnd Nmero aleatorio con media cero y varianza uno.
@obs(X) Nmero de observaciones de X.
@se Error estndar de la regresin.
@ssr Suma de cuadrados de los residuos.
Cross(x,y) Producto cruzado de x e y.
@cov(x,y) Covarianza entre x e y.
@aic Criterio de Informacin del Akaike
@coefcov(i,j) Matrix de Covarianza de i,j
@coefs(i) Valor del coeficiente i en la regresin.
@dw El estadistico Durbin-Watson de la regresin.
@f La F-estadstica
@fprob La probabilidad de la F-estadstica
ECONOMETRIA II Econ. JOSE RODRIGUEZ HERRERA
MULTICOLINEALIDAD
MULTICOLINEALIDAD
Funciones Descripcin
@hq Criterio de Informacin de Hannan-Quinn .
@jstat La J-estadstica para la funcin de GMM .
@logl El valor de la funcin de probabilidad de log .
@meandep Media de la variable dependiente
@ncoef el nmero de coeficientes estimados.
@r2 R-cuadrado.
@rbar2 R-cuadrado ajustado.
@coefcov Matriz de coeficientes
@regobs El nmero de observaciones en la regresin.
@schwarz El criterio de informacin de Schwarz.
@sddep La desviacin normal
Top Related