Manual Stata10 Jdc

MMAANNUUAALL DDEE SSTTAATTAAVVVeeerrrsssiiióóónnn ..1000

Autor:PhD.Eco JORGE EDWING DEL CARPIO GONZALES

Copyright ©2008 JDC®-- 3ª Edición

DC CONSULTING - Reservados todos los derechos

2008La Paz - Bolivia

Introduccion a Stata

Descripcion del Curso

1. Introduccion

El objetivo del curso es el de dar un panorama amplio de las capacidades

estadısticas y econometricas del paquete Stata. Comparado con otros paque

tes econometricos los cuales solo cuentan con un formato de ıconos (SPSS,

Eviews, LimDep, etc.), aprender a manejar Stata utilizando comandos tiene

un costo inicial relativamente alto. Sin embargo, los beneficios que ofrece

Stata m´ onas que compensan estos costos iniciales. Este curso de introducci´

nalando los comandos m´ ´pretende minimizar dichos costos, se˜ as utiles para

aquellos analistas que tiene la intencion de hacer de Stata su paquete de uso

diario.

Stata ofrece dos opciones para realizar analisis estadıstico. La primera de ellas

es utilizando ventanas que ya cuentan con funciones y opciones predetermi

nandas (formato de ıconos). La segunda es usando comandos, los cuales deben

ser escritos en la barra de comandos Stata. A lo largo del curso se har´ enfasisa ´

*[email protected]

1

MANUAL DE STATA 10.0Por: PhD.Eco Jorge Edwing. Del Carpio Gonzales

Copyright ©2008 JDC®-- 3ª Edición DC CONSULTING - Reservados todos los derechos

==================================================================================

JORGE E DEL CARPIO G

Rectángulo

en el uso de comandos, senalando la forma alternativa de realizar los ejercicios

utilizando ventanas. Nos concentramos en el uso de comandos ya que consid

eramos que los beneficios asociados a este tipo de uso es uno de los principales

atractivos de Stata con respecto a otros paquetes econometricos. El beneficio

inmediato de aprender a utilizar los comandos Stata es que esto permite al

analista construir rutinas (do-files ) con el tipo de an´ unmente alisis que com´

realiza. De esta forma se pueden llevar al cabo analisis estadısticos de forma

rutinaria sin la necesidad de escribir las operaciones (o usar las ventanas)

de nuevo. El uso de comandos tambien abre toda una posibilidad a realizar

estimaciones que van m´ ultimo, el as alla de las incluidas en las ventanas. Por ´

beneficio de largo plazo de aprender a utilizar los comandos Stata es que el

usuario podrıa eventualmente crear sus propios programas con aplicaciones

que responden a sus necesidades particulares.

A parte de la flexibilidad que da el uso de comandos, Stata ofrece otras

ventajas con respecto a otros paquetes econometricos. La primera de ellas es

la red internacional de analistas que utilizan el paquete (como Angus Deaton

y S.P. Jenkins) de la cual Stata se “nutre” con las rutinas y comandos escritas

por esta red de usuarios. Estos comandos y rutinas estan disponibles sin costo

para todo usuario de Stata. Una tercera ventaja comparativa es que Stata se

especializa en bases de datos grandes permitiendo ajustes por diseno muestral

y analisis de datos longitudinarios (panel).

El curso esta dividido en seis apartados, los cuales explicamos brevemente a

continuacion.

1. Funciones B´ on, se tocar´asicas En esta primera sesi´ an los puntos

asicos sobre el funcionamiento de Stata. Iniciaremos la sesi´b´ on per

sonalizando Stata. Una vez familiarizado con las ventanas del progra

ma, veremos las diferentes formas de introducir datos, modificarlos,

analizarlos y salvarlos. Finalmente aprenderemos a utilizar los recursos

disponibles en la red para responder a nuestras preguntas y estar al dia

sobre los desarrollos de Stata.

2



==================================================================================

2. Estadısticas Descriptivas y G´ on del curso preaficos En esta sesi´

sentamos las distintas herramientas que se pueden utilizar—como un

primer paso—para analizar los datos. Las dos formas mas usuales de

empezar un analisis estadıstico son las tablas con estadısticas descrip

tivas y el an´ afico.alisis gr´

3. An´ on Lineal En esta clase aprenderemos a realizar alisis de Regresi´

regresiones en Stata incluyendo variables dummy e interacciones como

determinantes. Veremos las diferentes hipotesis que podemos evaluar

justo despues de haber corrido el modelo. Otra parte fundamental del

an´ on es obtener los diagn´alisis de regresi´ osticos necesarios para probar

si el modelo cumple con los supuestos clasicos de Mınimos Cuadrados

Ordinarios (OLS, por sus siglas en ingles.)

4. Modelos con Variables Discretas El objetivo de la sesion es el de

ilustrar la manera de estimar modelos cuya variable dependiente toma

valores discretos. Este tipo de modelos son muy utilizados en economıa

laboral aplicada para encontrar los determinantes de la participacion

y ocupacion laboral. Los dos tipos de modelos con variables discre

tas son los binomiales (es decir dos alternativas) y los multinomiales.

Las tecnicas utilizadas para estimar este tipo de modelos difieren del

convencional OLS ya que la discontinuidad de la variable dependiente

implica una relacion no lineal. El documento hace enfasis en la teorıa

on ası como la mec´que hay detras de la estimaci´ anica de la misma. Se

ilustra con un ejemplo en donde estimamos la participaci´ onon y ocupaci´

laboral usando datos de la ENIGH.

5. An´ on es el indicar los alisis de Datos Panel El objetivo de esta sesi´

beneficios de tener una base de datos que combina corte transversal con

series de tiempo. Las tecnicas de estimacion pueden ser ajustadas para

explotar toda la variacion contenida en esta clase de bases de datos.

Todo tipo de modelos como variables continuas usando OLS, modelos

discretos, modelos de mınimos cuadrados generales (GLS), etc. pueden

3



==================================================================================

ser estimados bajo esta estructura de datos. Nos enfocaremos a dos

tipo de modelos que derivan—como lo es caso en cualquier otra especi

ficacion econometrica—del supuesto que hagamos sobre los residuales

de la ecuacion objetivo. Estos modelos son los de efectos fijos y efectos

aleatorios.

onEsta ultima sesi´6. Principios de Programaci´ ´ on la destinaremos a

describir las ventajas de invertir un poco mas de tiempo en Stata y

aprender los procesos b´ on. El hecho que podamos asicos de programaci´

programar y crear nuestros propios comandos es una de las grandes

ventajas que tiene Stata sobre otros paquetes econometricos. Es im

portante explotar esta ventaja y en esta parte veremos ejemplos de

manejo de datos utilizando ‘macros’ locales y loops (repeticion de op

eraciones.)

2. Lecturas Sugeridas

Hamilton, L. C. (2004) ‘Statistics with Stata. Updated for version 8’,

Thomson. (Libro de Texto)

Maddala, G. S. (1983) ‘Limited dependent and qualitative variables in

econometrics’, Cambridge University Press. (Capıtulos 1, 2 y 3)

Wooldrich, J. M. (2003) ‘Introductory econometrics: A modern ap

proach, 2e’, Thomson. (Capıtulos 2, 3, 4 y 8)

Wooldrich, J. M. (2002) ‘Econometric analysis of cross section and

panel data’ MIT press

4



==================================================================================


Clase 1: Funciones Basicas

1. Introduccion

En esta primera sesi´ an los puntos b´ on, se tocar´ asicos sobre el funcionamiento

de Stata. Iniciaremos la sesion personalizando Stata. Una vez familiarizado

con las ventanas del programa, veremos las diferentes formas de introducir

datos, modificarlos, analizarlos y salvarlos. Finalmente aprenderemos a uti

lizar los recursos disponibles en la red para responder a nuestras preguntas

y estar al dia sobre los desarrollos de Stata.

2. Personalizando Stata

El depliegue de Stata presenta cuatro ventas diferentes: “Review”, “Results”,

“Variables” y “Commands”. En “Review” aparencen los comandos que han

sido utilizados durante las sesi´ olo los resultados m´ on en turno. S´ as recientes *[email protected]

1

MANUAL DE STATA 10.0Por: PhD.Eco. Jorge Edwing. Del Carpio Gonzales


==================================================================================


Nota

Rejected definida por JORGE E DEL CARPIO G


Rectángulo

son visibles en la pantalla “Review”, mientras que “Command” sirve para

utilizar Stata de forma interactiva.1

Al instalar Stata, varios archivos son creados para su uso posterior. El mas

utilizado es el archivo “Stata” cuya direccion esta indicada en la parte inferior

izquierda de la pantalla; es aquı donde son salvados los datos y resultados si

no se especifica otra ruta. Para visulizar la ruta de todos los archivos creados

por Stata, escriba la palabra sysdir en la barra de comandos.2 La ruta

de estos archivos puede ser modificada utilizando el comando sysdir set

nombre del archivo seguido por la nueva direccion. La ruta del archivo

“Stata” tambien puede ser modificada escribiendo el comando cd seguido

por la nueva ruta.

Comandos : sysdir

3. Manejando la Base de Datos

Hay varias formas en que podemos introducir datos en Stata. Una de las

mas comunes es utilizando el comando insheet seguido por la ruta del

archivo, este comando premite a Stata leer archivos en formato ASCII3 que

son comunmente realizados en Excel (separados por comas o bien por tabu

ladores). Otros comandos que pueden ser utilzados son: infile1, infile2 e

infix. Tambien es posible introducir datos “a mano” utilizando el comando

edit, el cual abre una hoja de calculo. Aunque no es muy recomendable, los

datos pueden ser introducidos a Stata cortandolos desde Excel y pegandolos

en la hoja de calculo de Stata.

Si los datos ya estan en formato de Stata (terminacion .dta), estos pueden

1El tama˜ on de las ventanas puede ser ajustado seg´ no y posici´ un las preferencias del

usuario y estas pueden ser salvadas utilizando “Prefs” → “Save Windowing Preferences”. 2Es importante se˜ usculas, todos los comandosnalar que Stata es sencible al uso de may´

Stata deben ser escritos utilizando s´ usculas.olo min´ 3American Standard Code for Information Interchange

2



==================================================================================

ser cargados al programa utilizando el comando use seguido por la ruta en

donde se encuentra la base de datos. Por ejemplo:

use ‘‘C:/Mis Documentos/Stata/Datos1.dta’’

Comandos : insheet, infile1, infile2, infix, edit, use

3.1. Asignando Memoria y Tamano de la Matriz

Stata cuenta con un optimizador de memoria el cual asigna una cantidad

predeterminada de memoria a cada observacion, la cantidad asignada au

tomaticamente es de 10M. El usuario debe incrementar esta cantidad si con

sidera que la base de datos necesita mas recursos utilizando el comando set

memory seguido por la cantidad en mega bytes. Si la memoria asignada es in

suficiente dado el tama˜ a el siguiente error: no de la base de datos, Stata emitir´

‘‘no room to add more observations’’. Una ves que los datos han sido

cargados, estos se pueden comprimir usando compress, un comando muy util

cuando se manejan varias bases de datos grandes.

Otro valor que debe ser asignado de acuerdo al tamano de la base de datos y

el tipo de an´ no de la matriz. alisis que se pretende realizar con ella, es el tama˜

El valor asignado por Stata (en su edicion especial) es de 400 variables, este

puede ser incrementado hasta 11,000 en el caso de la edicion especial (800 en

la versi´ as peque˜ on m´ na de Stata) usando el comando set matsize.

Comandos : memory, compress, matsize

3.2. Leyendo los Datos

Stata almacena las varaibles asignandoles diferentes formatos dependiendo

del tipo de informacion de sus observaciones. Para obtener esta y otra infor

maci´ umero de variables u observaciones use el comando describe.on como n´

3



==================================================================================

Para ver las observaciones en pantalla, se puede utilizar edit o bien list

seguido por el nombre de la variable o variables que se deseen visualizar.

La diferencia entre edit y list es que el primero despliega toda la hoja

de calculo mientras el segundo despliega los datos en la ventana de resulta

dos.

Comandos : describe, edit, list

3.3. Guardando los datos

Para guardar los datos use el comando save seguido por la ruta en donde se

quieren salvar. Para borrar una base de datos no deseada utilice el comando

erase seguido por la ruta. El comando clear descarga los datos de la memo

ria temporal de Stata; notese que al utilizar clear no se realizara ninguna

advertencia antes de descargar los datos y si la base de datos original ha sido

modificada sin ser salvada estos cambios se perderan.

Comandos : save, erase, clear

4. Modificando la Base de Datos

Una vez cargada la base de datos, es muy comun modificarla para crear

nuevas variables o bien cambiar el orden o contenido de las mismas. Los

siguientes comandos son muy utiles para estas tareas: ´

label Este comando sirve para anadir etiquetas tanto a variables (label

variable) como a bases de datos (label data).

order, move y aorder Estos comandos cambian el orden en que se encuen

tran las variables. order seguido por lista de var cambia el orden segun

sea especificado por la lista de variables. move var1 var2 en cambio,

sustituye la variable1 en la posicion de la variable2. aorder acomoda

las varibles en orden alfabetico.

4



==================================================================================

sort Ordena de forma acendente las observaciones basado en una o mas

variables.

generate Genera una nueva variable definida en base a una expresion numeri-

ca la cual puede contener otras variables. Por su flexibilidad, este es uno

de los comandos mas importantes de Stata, ya que se pueden utilizar

umero de operaciones l´ aticas para un gran n´ ogicas, aritmeticas y matem´

definir expresion. En el siguiente cuadro tratamos de resumir las expre

siones mas utilizadas con generate.

5



==================================================================================

Cuadro 1: Expresiones usadas por generate

ones L´ Expresi´ ogicas Significado

&, Y (AND), O (OR) | >, < Mayor que, Menor que

==, ! = Igual a, Diferente a

>=, <= Mayor o Igual, Menor o Igual

Expresiones Aritmeticas

+, − Mas, Menos

on, Divisi´ ∗, / Multiplicaci´ on

n, N N´ on corriente, N´ umero de observaci´ umero de

observaciones totales

Algunas funciones Matematicas

abs()

cond(x; y; z)

exp()

round(x; y)

log()

min(x1; x2; : : :)

max(x1; x2; : : :)

sqrt()

sum()

uniform()

See: help functions

Valor absoluto

si x es igual a 0, entonces y.., de otra forma z..

funci´on exponencial

redondea x en unidades de y; round(.,1) rodondea a

la integral mas cercana.

logaritmo natural

el mınimo de x1; : : : ; xn

el maximo de x1; : : : ; xn

raiz cuadrada

La suma para la expresion entre parentesis.

Genera numeros aleatoreos entre 0 y 1 con

una distribucion uniforme.

egen Es una extencion de generate que contiene una gran cantidad de fun

ciones pre-establecidas con las que se pueden generar nuevas variables.

replace Cambia el contenido de una variable ya existente sustituyendola

por una expresion.

6



==================================================================================

encode Cuando una variable esta en formato string (es decir no-numerico) no

se pueden obtener estadısticas sobre ella. encode y su opuesto decode

cambian el formato de una variable string a numerico y viceversa. Alete

nativamente podemos utilizar los comandos tostring y destring los

cuales realizan las mismas funciones pero con mas opciones.

reshape wide, long Este comando transforma la base de datos de una for

mato ancho (wide) a uno largo (long ) y viceversa. reshape puede trans

formar de una base de datos como la siguiente en formato ancho:

Cuadro 2: Datos en formato wide

Xij

id sexo ing80 ing81 ing82

1 0 5000 5500 6000

2 1 2000 2200 3300

3 0 3000 2000 1000

A uno largo como este:

Cuadro 3: Datos en formato long

i j Xij

id ano sexo Ing

1 80 0 5500

1 81 0 5500

1 82 0 6000

2 80 1 2000

2 81 1 2200

2 82 1 3300

3 80 0 3000

3 81 0 2000

3 82 0 1000

7



==================================================================================

keep Seguido por una lista de variables mantiene las variables especificadas

eliminando las no incluidas en la lista. Analogamente el comando drop

elimina las variables que le siguen al comando conservando las no-

incluidas.

5. Combinando Bases de Datos

Muchas veces es necesario combinar dos o mas bases de datos para formar

una sola. Para ello se pueden utilizar los comandos merge o append. merge

une dos bases de datos utilizando una variable en comun. Las dos bases de

datos deben estar en formato .dta (Stata) y las observaciones deben estar

ordenas (utilizando sort) de acuerdo a la variable que sirve como referencia.

El objetivo de merge es anexar variables no observaciones. Por ejemp

lo:

use ds2

sort recid

save ds2, replace

use ds1

sort recid

merge recid using ds2

Lo que este peque˜ odigo nos dice es que carguemos la base de datos ds2no c´

(use) y la ordenemos de acuerdo al identificador recid (sort) y guardemos los

cambios reeplasando ds2 (save). Posteriormente abrimos la segunda base de

datos utilizando el comando use, la ordenemos en base a recid y finalmente

la pegamos (merge) de acuerdo a recid utilizando la base de datos ds2.

En el caso de append sucede lo contrario, lo que se busca es anexar observaciones—

por lo general—a una misma serie de variables. La sintaxis es mucho mas

8



==================================================================================

sencilla pues solo se tiene que nombrar la base da datos que se desea anexar.

Por ejemplo:

append using ndatos

Por ultimo, si se desea contruir una nueva base de datos que contenga in´

formacion condensada de la base original, esto se puede hacer utilizando el

comando collapse. Supanga que tiene una base de datos sobre hogares y que

cada hogar tiene una observacion para cada miembro que lo integra. Si cada

hogar dispone de un identificador unico, entonces se puede formar una base ´

de datos alternativa que contenga una sola observacion por hogar (en lugar

de una observacion por individuo) para cada una de las variables deseadas.

Esta observaci´ on estandar, la suma u on puede contener la media, la desviaci´

otro estadıstico por hogar. Por ejemplo:

collapse (mean) edad educacion ingreso, by(hogar)

El codigo anterior crea una base de datos con cuatro variables (hogar, edad,

educaci´ on por hogar, la cual contiene el promeon e ingreso) con una observaci´

dio de cada variable por hogar.

Comandos : merge, append, collapse

6. Sintaxis y Obteniendo Ayuda

Como lo podemos ver en los ejemplos anteriores, la sintaxis de los comandos

Stata tienen un formato comun. Esta sintaxis es la siguiente:

[by lista de var :] comando lista de var [if expresion] [in rango]

[ponderadores ] [using nombre del archivo], [opciones ]

Sin embargo para la moyor parte del curso s´ onolo necesitaremos una versi´

mucho mas simple como:

[by lista de var :] comandolista de var [if expresion], [opciones ]

9



==================================================================================

El prefijo by permite aplicar el mismo comando separando la base de datos en

subgrupos definidos por lista de var. Posteriormente viene el comando seguido

por una segunda lista de var a las cuales se les aplicara el comando elegido.

Los datos utilizados para evaluar el comando pueden ser limitados con las

opciones if e in. Las opciones especıficas al comando tienen que ser precedi

das por una coma. A lo largo del tutorial se utilizara esta sintaxis de forma

continua de manera que al final del curso el participante estara familiarizado

con ella.

Vea: help language

Otra informacion clave es la forma en que podemos obtener ayuda. Todos

los comandos Stata tienen informacion acerca de la manera en que deben

utilizarce (sintaxis y opciones); para acceder a ella es s´ on de esolo cuesti´

cribir la palabra help seguida por el nombre del comando en la ventana

de comandos de Stata. Si no conoce el nombre del comando que realiza la

tarea que tiene en mente, escriba la palabra findit seguida por una palabra

que este relacionada con dicha tarea. Este comando busca en toda la docu

mentaci´ agina red de on tanto interna como aquella que se encuetra en la p´

Stata. Adicionalmente, existen p´ acticos,aginas de internet con materiales did´

estos son algunas de las mas importantes:

http://www.stata.com/support/

http://www.stata.com/support/faqs/

http://www.ats.ucla.edu/stat/stata/sk/

http://www.ats.ucla.edu/stat/stata/

http://ideas.repec.org/s/boc/bocode.html

Stata se actualiza casi continuamente, los usuarios pueden escribir programas

y mandarlos al archivo de SSC (Statistical Software Components), por lo

tanto es necesario hacer actualizaciones de forma regular. El comando update

10



==================================================================================

query le indicara si es necesario hacer actulizaciones.4

7. Resumen

En esta primera sesi´ as b´ on aprendimos los puntos m´ asicos del funcionamien

to de Stata incluyendo la importaci´ on y el manejo de bases on, tranformaci´

de datos. Otros puntos clave consistieron en el procedimiento para cargar las

bases de datos en formatos diferentes a Stata, ası como asignar la suficiente

memoria y tama˜ alino de matriz para cargar los datos y llevar al cabo el an´

sis. La combinaci´ on de nuevas variables on de bases de datos y la generaci´

utilizando las expresiones del comando generate fueron entre las tareas mas

importantes de la sesion.

4Para hacer las actualizaciones es necesario que su computadora este conactada a la

red; si su conexion utiliza un proxy, tiene que configurar Stata, vea help netio.

11



==================================================================================


Clase 2: Estadısticas Descriptivas y Graficos

1. Introduccion

En esta sesion del curso presentamos las distintas herramientas que se pueden

utilizar—como un primer paso—para analizar los datos. Las dos formas mas

usuales de empezar un analisis estadıstico son las tablas con estadısticas

descriptivas y el an´ afico.alisis gr´

2. Tablas con Estadısticas Descriptivas

codebook es un comando muy util para empezar a analizar la base de datos.

Si no se especifica una variable codebook presenta estadısticas descriptivas

sobre cada una de las variables en la base de datos, alternativamente se puede

obtener informaci´ olo alguna(s) variable(s) en particular escribiendo on sobre s´

el nombre de la(s) variable(s) despues de codebook. Un comando alternativo

*[email protected]

1



==================================================================================


Rectángulo

que presenta estadısticos similares a codebook pero de forma resumida es

summarize. Aqui se presenta un ejemplo del comando summarize:

sysuse auto

summarize price mpg

Cuadro 1: summarize

Variable Obs Mean Std. Dev. Min Max

price 74 6165.25 2949.49 3291 15906

mpg 74 21.29 5.78 12 41

El cuadro 1 presenta informaci´ umero de observaciones, la meon sobre el n´

dia, desviacion estandar y el rango de las variables. Muchas veces necesitamos

crear una tabla con determinados estadısticos descriptivos, para hecer esto se

puede hacer uso de los comandos tabstat o table. Estos comandos tienen

mucha flexibilidad no solo en los estadısticos que se pueden incluir pero tam-

bien en el formato en que estos se presentan como se puede ver en el siguiente

ejemplo:

sysuse auto

tabstat price mpg trunk weight, statistics(mean n sum sk

median)

Cuadro 2: tamstat

Variable price mpg trunk weight

mean 6165.25 21.29 13.75 3019.45

N 74 74 74 74

sum 456229 1576 1018 223440

skewness 1.65 .948 .029 .148

p50 5006.5 20 14 3190

2



==================================================================================

El comando inspect es una forma sencilla de obtener informacion sobre

la distribuci´ nas gr´on de una variable. Presenta peque˜ aficas con puntos de

frecuencias relativas y algunos estadısticos sobre el numero de observaciones

distintas de cero, etc. tabulate, por otro lado, realiza tablas con frecuencias

y presenta varios estadısticos de correlacıon entre dos variables previamente

seleccionadas:

sysuse auto

tabulate rep78 foreign

Cuadro 3: tabulate

Repair record Car type

1978 domestic foreign Total

1 2 0 2

2 8 0 8

3 27 3 30

4 9 9 18

5 2 9 11

Total 48 21 79

Comandos : codebook, summarize, inspect, tabstat, table, tabulate

2.1. Estadısticos de Momentos

Toda distribuci´ ason puede ser inferida por sus momentos. Los momentos m´

utilizados son el primero (la media) y el segundo (la varianza). En la seccion

anterior vimos como podemos obtenerlos. Para probar estadısticamente la

diferencia entre dos medias provenientes de distribuciones independientes, es

necesario utilizar informacion acerca del segundo momento. Esto se puede

llevar al cabo utilizando el comando ci para formar intervalos de confianza

3



==================================================================================

de las medias y ver si se intersectan o no. La no interseccion quiere decir que

no hay evidencia suficiente para rechazar la Ho: igualdad de medias.

Los momentos tercero y cuarto de la distribucion tambien nos dan infor-

maci´ on es on valiosa. La skewness o tercer momento nos dice si la distribuci´

simetrica con respecto a la media. Valores de este estadıstico iguales a cero

indican una distribucion simetrica mientras que valores mayores (menores)

a cero indican que la cola de la distribucion esta sesgada hacia la derecha

(izquierda). La kurtosis o cuarto momento, mide la densidad que se concen

tra en las colas ; una distribucion normal (del tipo Gauss) tiene una kurtosis

igual a tres. Valores que difieren de la normal se dice que tienen colas con

algunos picos (no nos referimos a picos en sentido estricto—numero infinito

de derivadas—sino solo a vecindarios en donde la distribucion no es tan suave

como la normal.)

Para obtener informaci´ on podemos on hacerca de los momentos de la distribuci´

usar el comando summarize con la opcion detail. Pruebas para normalidad

de una distribucion—en base al tercer y cuarto momento—se pueder realizar

utilizando el comando sktest.

Comandos : ci, summarize, sktest

3. Graficos

La mejor manera de resumir la informacion contenida en los datos es haciendo

un an´ afico de los mimsos. Stata tiene un gran n´ aficasalisis gr´ umero de gr´

siendo scatter, twoway, histogram y kdensity entre los comandos mas

utlizados.

Las graficas twoway pueden presentarse de diferentes maneras, una de las

mas comunes es en forma de puntos.1 El comando scatter se utiliza en el

siguiente ejemplo para observar como se ha comportado la expectiativa de

1Los siguientes ejemplos se pueden aplicar a gr´ areas o barras. aficas de lineas, ´

4



==================================================================================

40

45

50

55

60

65

life e

xpecta

ncy

1900 1910 1920 1930 1940Year

40

45

50

55

60

65

life e

xpecta

ncy

1900 1910 1920 1930 1940Year

vida al nacer (le) a travez del tiempo (year). La base de datos (uslifeexp2)

que usamos para realizar la grafica 1 es una de las que provee el sistema

(integradas en Stata) y es llamada utilizando el programa sysuse. En el

segundo rengl´ afica del tipo on del ejemplo especificamos que queremos una gr´

“scatter” que relacione las variables le y year.

sysuse uslifeexp2, clear

scatter le year

Figura 1: Grafica en forma de Puntos

O bien estos puntos se pueden unir utilizando la opcion connect:

scatter le year, connect(l)

Figura 2: Grafica en forma de Puntos Unidos

5



==================================================================================

50

60

70

80

50

60

70

80

0 10000 20000 30000 40000

0 10000 20000 30000 40000

Eur & C.Asia N.A.

S.A.

Life e

xpecta

ncy a

t birth

GNP per capitaGraphs by Region

010

20

30

40

50

60

Fre

quency

5,000 10,000 15,000 20,000 25,000Volume (thousands)/x

mean−1 s.d. +1 s.d.−2 s.d. 17,493Volume (thousands)

La mayorıa de las opciones gr´ alisis por grupos utilizando aficas permite un an´

el comando by:

scatter lexp gnppc, by(region)

Figura 3: Grafica por Grupos

Histogramas de frecuencias y distribuciones de densidad kernel pueden ser

graficados utilizando los comandos histogram y kdensity respectivamente.

Tambien es posible combinar ambas funciones en un s´ afico como se olo gr´

muestra en el siguiente ejemplo:

histogram volume, freq kdensity xaxis(1 2) ylabel(0(10)60,

grid) xlabel(12321 "mean"9735 1 s.d."14907 "+1 s.d."7149

2 s.d."17493)

Figura 4: Histograma y Kernel

6



==================================================================================

Note como dentro de las opciones de histogram se incluye el formato freq

indicando que la altura de las barras del histograma miden el numero de

observaciones en cada rango (las frecuencias). La opcion kdensity le dice a

Stata que queremos una funcion de densidad del tipo kernel superimpuesta

al histograma. Las otras dos opciones, ylabel y xlabel son solo los tıtulos

de los ejes.

El intervalo que define el area de las barras de histogram puede ser ajustado

utilizando las opciones bar y width. Si se reduce el area de las barras de

un histograma hasta formar una grafica con lineas en lugar de barras, el

resultadeo es una distribucion de densidad en lugar de frecuencias. La forma

en que pasamos de un gr´ un la afico de frecuencias a uno de densidad varia seg´

tecnica utilizada, siendo el metodo kernel uno de los mas comunes. La ventaja

de utilizar densidades kernel es que no se impone ninguna estructura, ya que

la linea que produce lo hace utilizando estadısiticos no parametricos.

aficas de Stata le permiten a˜Las opciones gr´ nadir marcos, tıtulos a los ejes,

cambiar de colores las distintas varibles graficadas, elegir la escala de los ejes,

etc. (vea help twoway options.)

Comandos : graph, twoway, scatter, histogram, kernel

4. Resumen

En esta sesi´ on de on exploramos varias opciones para comenzar una inspecci´

la base de datos. Lo m´ un es empezar un an´as com´ alisis produciendo tablas

con estadısticos descriptivos y de corralacion simple entre dos variables; los

comandos summarize, tabstat y tabulate son los ideales para estas tareas.

Por otro lado, vimos c´ aficos de puntos y lineas relacionanomo producir gr´

do dos variables, asi mismo, aprendimos a graficar frecuencias relativas y

densidades usando histogram y kernel repectivamente.

7



==================================================================================


Clase 3: Analisis de Regresion Lineal

1. Introduccion

En esta clase aprenderemos a realizar regresiones en Stata incluyendo vari

ables dummy e interacciones como determinantes. Veremos las diferentes

hipotesis que podemos evaluar justo despues de haber corrido el modelo.

Otra parte fundamental del an´ on es obtener los diagn´alisis de regresi´ osticos

necesarios para probar si el modelo cumple con los supuestos clasicos de Mıni-

mos Cuadrados Ordinarios (OLS, por sus siglas en ingles.) El que se rompa

con uno o mas de los supuestos de OLS tiene diferentes repercusiones sobre

el valor de los parametros en algunos casos o sobre la inferencia estadıstica

en otros.

En esta documento, al contrario de los dos anteriores, casi no se presen

tan ejemplos, concentr´ as en los comandos que podemos utilizar andonos m´

en Stata para realizar las distintas tareas dejando para el ejercicio la im-

plementaci´ atica. El documento se divide en cinco aparatados dedicando on pr´

*[email protected]

1



==================================================================================


Rectángulo

uno para el comando reg, otro para el prefijo xi, seguido por los diagnosticos

(regdiag), estimaciones con errores estandar robustos (robust), pruebas de

hip´ on del modelo (predict).otesis (test) y finalmente la predicci´

2. Regresion

Si, basados en una relaci´ orica, tenemos elementos para suponer que las on te´

variaciones en y son causadas por las variaciones en x, podemos utilizar el

an´ on para probar esta relaci´alsis de regresi´ on estadısticamente. En forma muy

simple, lo que la regresi´ onon hace es encontrar los parametros de la ecuaci´

y = α + βx + � tal que la sumatoria de errores al cuadrado sea mınima (de

ahı su nombre OLS.) Esto se realiza en Stata utilizando el comando reg

seguido por y y x en donde x puede tener mas de un elemento (es decir se

pueden incluir cuantas variables independientes se quiera—dado un numero

finito de grados de libertad.) Por ejemplo si estamos interesados en la relacion

ente ingreso y y educacion s escribimos en Stata:

reg y s

Comando: reg

3. Variables Dummy y el Prefijo xi

El modelo anterior es el m´ as probable as sencillo que podemos estimar, lo m´

es que no tome en cuenta muchas otras variables que estan determinando el

ingreso. Por ejemplo si pensamos que el ingreso de los hombres es mayor al

percibido por las mujeres entonces podemos correr el siguiente modelo:

reg y s m

En donde m es una variable indicador (dummy) la cual toma el valor de 1

si la observacion corresponde a una mujer y cero de lo contrario. Utilizando

2



==================================================================================

datos de la ENIGH se arrojaron los siguientes resultados:

Cuadro 1: regress

Variable Coefficient (Std. Err.)

yschooling 1147.498 (11.927)

mujer -2844.586 (109.824)

Intercept -936.559 (109.701)

En terminos de nuestro modelo, y = α + βs + δm + �, si δ es diferente de

cero (lo que es cierto en nuestro ejemplo) entonces quiere decir que hay evi

dencia suficiente para afirmar que los ingresos de las mujeres difieren del de

los hombres controlando por el nivel de educaci´ un nuestros resultaon. Seg´

dos un a˜ on formal representa un incremento de $1,147 no extra de educaci´

pesos en el salario trimestral y las mujeres ganan, en promedio, $2,844 pesos

menos que los hombres. Ahora suponga que se introduce una variable discre

ta (llamemosla sector) tomando valores del 0 al 6 indicando cada una de las 7

industrian en la muestra. A partir de sector se podrıan contruir 7 variables in

dicadores tomando cada una el valor de 1 cuando la observacion corresponde

a un trabajador de determinada industria y cero de otra forma. Sospechamos

que el ingreso varıa entre industrias y no solo eso sino que el retorno a la

educacion (medido por β en nuestro modelo) tambien toma valores diferentes

dependiendo de la industria. Para probar esto podemos generar variables de

interaccion entre x y los 6 diferentes indicadores de industria o bien utilizar

el prefijo xi. El modelo que estimaremos es el siguiente:

y = α + βs + δm + φ0I0 + . . . + φ5I5 + γ0(s)I0 + . . . + γ5(s)I5 + � (1)

En donde I son los indicadores para cada industria. En Stata este modelo se

correrıa de la siguiente forma:

xi: reg y m i.sector*s

3



==================================================================================

Los resultados son presentados en el siguiente cuadro:

Cuadro 2: xi reg


Isector 0 2707.292 (315.385)

Isector 1 3089.960 (299.282)

Isector 2 3658.951 (1029.817)

Isector 3 3570.618 (474.277)

Isector 4 183.165 (377.134)

Isector 5 1419.964 (384.152)

yschooling 1367.352 (21.367)

IsecXyscho 0 -932.026 (37.764)

IsecXyscho 1 -1239.702 (41.611)

IsecXyscho 2 320.377 (102.659)

IsecXyscho 3 -629.909 (59.936)

IsecXyscho 4 120.991 (40.711)

IsecXyscho 5 -532.240 (41.359)

mujer -2927.649 (111.873)

Intercept -1545.552 (240.282)

Las primeras 6 varaibles en el cuadro 2 (con el prefijo I) miden el impacto

que tienen las diferentes industrias (o sectores) sobre el intercepto α, mientras

que las las que le siguen a la variable “yschooling” miden el impacto sobre

la pendiente β. Si solo nos interesara el impacto sobre la pendiente entonces

el modelo se hubiera estimado incluyendo i.sector sin el asterisco seguido

por la variable educacion.

Opcion: xi

4



==================================================================================

�

4. Diagnosticos

Para que los resultados obtenidos por reg sean validos es necesario que se

cumplan los supuestos clasicos de OLS, es decir, normalidad en los residuales,

hemosedasticidad, no autocorrelacion (en el caso de series de tiempo) y no

multicolinealidad entre otros.

osticos de la regresi´Los diagn´ on son obtenidos justo despues de la prueba es

cribiendo cualquiera de los siguientes comandos: hettest para heterosedas

ticidad, vif para multicolinealidad y ovtest para variables omitidas y es

pecificacion incorrecta.

1. hettest Esta prueba utiliza los residuales obtenidos de la regresion

original, los eleva al cuadrado y posterirormente los corre contra las

variables independientes. De este segundo modelo se obtiene un es-

tadıstico de pueba con distribucion F. Esto es lo que se conoce como

la prueba Breusch-Pagan (1980).

2. ovtest Realiza lo prueba RESET, Regression Specification Error Test,

[Ramsey 1969]. En esta prueba se agregan polinomios de valores ajus

tados para y. Suponga el modelo y = α + βx + � de aquı se obtienen

los valores estimados y, se crean las variables de orden dos o mayor 2 3 y yy , y , . . .. Se corre el modelo alternativo: y = α + βx + ˆ2 + ˆ3 + . . . + �

y por ultimo se prueba el modelo alternativo contra el original utilizan

do un estadistico F. Si el primero es preferido al segundo, entonces

tenemos un problema de especificacion.

3. vif Esta prueba presenta la proporcion de la varianza total de cada

una las variables independientes que no es explicada por las variables

independientes restantes (Variance Inflation Factor.) El procedimiento

consiste en crear regresiones del tipo xi = α + βxj + ε, i = j; j =

1, 2...J en donde xi y xj son regresores en el modelo original. De los

resultados de esta regresion, se calcula el estadıtico R2, el valor vif es

igual a (1 − R2). Valores altos de vif nos indican que gran parte de la

5



==================================================================================

variacion en xi no es explicada por variaciones en las restantes xj por

lo tanto no hay evidencia para afirmar que tenemos un problema de

multicolinealidad.

Comandos : hettest, ovtest, vif

5. Violacion de los Supuestos OLS

Si alguno de los diagnosticos nos indican la presencia de un problema con

los supuestos OLS, hay varias formas de lidiar con el problema. Aquı pre

sentamos las tecnicas mas comunes. El problema de heterosedasticidad, se

da cuando la varianza de los errores no es constante, por lo tanto los inter

valos de confianza que utilizamos para probar hipotesis (compuestos en base

a la varianza del error) tampoco van a ser constantes impidiendo con ello

toda inferencia estadıstica. Corregir este problema es relativamente sencil

lo, en Stata se utiliza la opci´ on de regresi´on robust al final de la ecuaci´ on

para que Stata calcule errores estandar robustos (es decir corrigiendo por

heterosedasticidad.) La tecnica que se utiliza es la conocida como Huber-

White o sandwich. Este procedimiento permite corregir para heterosedas

ticidad de cualquier tipo sin tener que especificar la forma fucnional de la

misma. Normalmente la varianza estimada de los parametros esta definida ˆ on robust es utilizada la varianza como V ar(β) = σ2/SST 2, cuando la opci´

es reeplazada por la siguiente expresion: �n ˆ2 2u

ˆV ar(β) = i=1 rij ij

SSR2 j

En donde rij son los residuales de la regresion de xi contra el resto de las

variables independientes; uij son los residuales de la ecuacion original y SST 2

es la sumatoria de errores al cuadrado. La flexibilidad de la expresion ante

rior est´ u2a contenida en el termino ˆij el cual, evidentemente, varıa para cada

observacion ajustando ası cualquier cambio en varianza.

6



==================================================================================

El problema de mutlicolinealidad es mas sutil ya que—a diferencia de la

heterosedasticidad—este es un problema de grado. En otras palabras, siem

pre vamos a observar que dos o mas variables independientes estan correla

cionadas entre si, sin que ello implique, necesariamente, un problema serio.

Hay ciertos sıntomas que nos permiten identificar el problema. Uno de ellos y

el m´ un es que los signos y valores de los par´as com´ ametros estimados cambian

mucho al anadir o eliminar variables al modelo. Como ya lo vimos, otra for

ma de identificar el probelma es utilizando el diagn´ un con esta ostico vif. A´

prueba la decision de si existe un problema o no es, hasta cierto punto, subje

tiva ya que no se utiliza un estadıstico de prueba con un ditribucion conocida

para realizar inferencia estadıstica. Si creemos que hay un problema de mul

ticolinealidad en nuesto modelo tenemos varias alternativas, lo mas sencillo y

obvio es eliminar una (o mas) de la variables que estan correlacionadas. Otra

tecnica un poco mas elegante es utilizar variables instrumentales (ivreg).

Esto lo veremos en la sesion 5 del curso.

Quiz´ as grave de los tres que estamos tocando, sea el de as el problema m´

especificacion o variables relevantes omitidas. La existencia de este proble

ma causa sesgo en nuestros par´ oticasametros y elmina las propiedades asint´

(no es consistente) del modelo OLS. La correccion de este problema hace

uso de la teorıa econ´ on del investigador para omica combinada con la intuici´

seber identificar la forma funcional correcta y/o las variables relevantes que

han sido omitidas. Muchas veces el problema esta relacionado con las re

stricciones que imponemos de manera implıcita al plantear la forma fun

cional del modelo. Por ejemplo, corremos un modelo de salarios como fun

on del nivel de educaci´ci´ on, la experiencia y la experiencia al cuadrado,

y = α + β1edu + β2exp + β3exp2 + �. Suponga que tomamos como muestra

a todos los asalariados entre 15 y 65 anos, estamos imponiendo implıcita-

mente la restricci´ on (β1) son iguales entre on de que los retornos a la educaci´

hombres y mujeres, estratos urbano y rural, sectores economicos, etc. Si la

prueba ovtest nos rechaza la hipotesis nula de no variables omitidas en el

modelo anterior, entoces muy probablemente se deba a que hay diferencias

7



==================================================================================

importantes en los retornos a la educacion (u otras parametros) entre las

categorıas mencionadas. En la practica siempre hay una disyuntiva entre la

parsimonia y la flexibilidad de un modelo. Lo primero me permite una inter

pretacion clara de cada uno de los parametros y hay un beneficio en grados de

libertad; lo segundo por otro lado, toma en cuenta todas aquellas diferencias

en parametros que se esconderıan detras de un modelo reducido, es aquı en

donde entra la intuicion del investigador para encontrar el modelo que mejor

describa los datos.

Opciones : robust, ivreg

6. Prueba de Hipotesis

Una vez resuelto el problema con los supuestos OLS, el segundo paso de-

spues de realizar el an´ on es el de llevar al cabo pruebas de alisis de regresi´

hip´ ametros. El comando test nos permite probar no otesis acerca de los par´

solo la significancia estadıstica de cada parametro sino tambien la diferencia

con respecto a un valor diferente de cero o cualquier otra expresion numerica

y respecto a una combinacion lineal de otros coeficientes. Por ejemplo de-

spues de estimar el modelo que se presenta en el cuadro 2, pordrıamos estar

interesados en probar que el coeficiente del sector 3 es el doble de la suma

de los coeficientes para los sectores 4 y 5. Esta hipotesis es estimada en Sta

ta de la siguiente manera: justo despues de estimar el modelo de regresion,

escriba:

Comandos : predict, e(sample)

test Isector 3 = 2*( Isector 4 + Isector 5)

Comandos : test

8



==================================================================================

7. Prediccion

El ultimos de los comandos post-regresi´´ on, es predict. Como su nombre lo

indica, este comando se utiliza para crear una nueva variable, llamemosla y ˆla cual es creada con los valores ajustados βx del modelo y = βx + �. El

comando tmbien permite crear variables con errores estandar de la predic

on lineal utilizando la opci´ci´ on stdp. Siguiendo con nuestro ejemplo, despues

de la regresi´ y con los valon escriba predict yhat para crear la variable ˆ

ores ajustados. La predicc´ a para todas las observaciones cuyas on se realizar´

variables independientes no tengan valores en blanco sin importar que no

hayan sido tomados en cuenta al estimar la regresion. Para aclarar, suponga

que los resultados que se presentan en el cuadro 2 solo toman datos de ar

eas urbanas; el comando predict crear´ y para toda la poblaci´a la variable ˆ on

(siempre y cuando haya informacion sobre las variables independientes.) Para

limitar la prediccion a la muestra de donde provienen los resultados, utilice

la limitante if e(sample) como se muestra a continuacion: predict yhat

if e(sample).

Referencias

[1] Hamilton, L. C. (2004) ‘Statistics with Stata. Updated for version 8’,

Thomson. (Capıtulos 6, 7 y 9)

[2] Wooldrich, J. M. (2003) ‘Introductory econometrics: A modern ap

proach, 2e’, Thomson. (Capıtulos 2, 3, 4 y 8)

9



==================================================================================


Clase 43: Modelos con Variables Discretas

1. Introduccion

El objetivo de la sesion es el de ilustrar la manera de estimar modelos cuya

variable dependiente toma valores discretos. Este tipo de modelos son muy

utilizados en economıa laboral aplicada para encontrar los determinantes de

la participaci´ on laboral. Los dos tipos de modelos con variables on y ocupaci´

discretas son los binomiales (es decir dos alternativas) y los multinomiales.

Las tecnicas utilizadas para estimar este tipo de modelos difieren del conven

cional OLS ya que la discontinuidad de la variable dependiente implica una

relacion no lineal. El documento hace enfasis en la teorıa que hay detras de

on ası como la mec´la estimaci´ anica de la misma. Se ilustra con un ejemplo

en donde estimamos la participaci´ on laboral usando datos de la on y ocupaci´

ENIGH. *[email protected]

1



==================================================================================


Rectángulo


Rectángulo

2. Teorıa

2.1. Problema Binomial

Suponga que esta interesado en encontrar los determinantes de una variable

indicador (dummy), y, la cual toma el valor de 1 si se cumple con determi

nado criterio y 0 de otra forma (por ejemplo, en el mercado laboral en donde

el investigador codifica como 1 a los empleados y 0 a los no-empleados.) Si

se estima el modelo y = Xβ + � usando una regresion OLS, el cual se conoce

con el nombre de modelo probilidad lineal, se presentaran los siguientes prob

lemas:

1. Valores fuera del rango (0,1), lo cual no tiene ninguna logica desde el

unto de vista de la teorıa de probabilidad.

2. Heterosedasticidad

3. Los residuales no se distribuyen de forma normal, por lo tanto no hay

eficiencia, es decir, minimizaci´ noon de varianza a medida que el tama˜

de muestra aumenta.

Para resolver estos problemas se asume que hay una variable latente, no ob∗, que determina el valor de la variable dic´iservable, y otoma que observamos.

Formalmente:

� 1

yi = ⇐⇒ y∗i = X iβ + νi > 0

0 otherwise

De esta manera, la realizacion de la variable que observamos se va a dar si y

s´ on de la muestra. La probabilidad de olo si νi > −X iβ para cada observaci´

que la condicion anterior ocurra:

P rob(yi = 1) = P rob(νi > −X iβ)

2



==================================================================================

Definiendo a F (·) como la funcion de densidad acumulada (FDA) de la dis

tribucio de los residuales νi:

P rob(yi = 1) = 1 − F (−X iβ)

Analogamente, la probabilidad de observar yi = 0

P rob(yi = 0) = F (−X iβ)

La forma de F (·) va a depender del supuesto que utilicemos sobre la dis

tribucion de νi. Si asumimos que νi se distribuye de forma normal, entonces

F (−X iβ) es el area debajo de la curva de la normal hasta el punto −X iβ

y el modelo es conocido con el nombre de probit. Para obtener los paramet

ros del modelo, β, tenemos que utilizar tecnicas de maxima verosimilitud.1 Si

definimos a Φ como la FDA de la normal, entonces la funcion de verosimilitud

es definida de la siguiente forma:

L =n�

1 − Φ(−X iβ) n�

yi=0

Φ(−X iβ) yi =1

Los par´ on no son interpretados de manera ametros obtenidos de esta estimaci´

directa, para ver el impacto marginal de un cmabio en xik sobre la probabil

idad de observar yi = 1, se tiene que hacer el siguiente calculo:

∂Φ(X iβ) = φ(X iβ)βk (1)

∂xik

En donde φ(·) est´ on de densidad de la probabilidad. a definido como la funci´

Como podemos ver, el impacto marginal varıa dependiendo del punto en la

distribucion normal en donde se encuentre el umbral X iβ; puntos cercanos

1Lo que este procedimiento hace es maximizar una funcion que se determina por cam

bios en los par´ ametros convergen cuando la funci´ametros, los valores de los par´ on de

verosimilutud es maximizada, para mas detalles ver Hogg and Craig (1994) ‘Introduction

to Mathematical Statistics’, Prentice Hall.

3



==================================================================================

a la media tienen un impacto mucho mayor comparados con aquellos que se

encuentran en las “colas” de la distribucion.

Otro supuesto de distribuci´ unmente utilizado para estimar la variable on com´

latente, yi∗, es asumir que F (·) = exp(−e−νi ) esta es la FDA de la distribucion

logistic. Esta distribuci´ on es on no difiere mucho de la normal y su estimaci´

mucho mas sencilla ya que su FDA tiene una forma “cerrada” (es decir en su

solucion no intervienen integrales, lo cual es el caso del modelo probit.) En

este caso, la probabilidad est´ on:a dada por la siguiente expresi´

exp(X iβ)P rob(yi = 1) = P rob(1 − X iβ) = (2)

1 + exp(X iβ)

La forma de estimar el modelo logit es la misma que para el modelo probit,

es decir, utilizando maxima verosimilitud introduciendo las probabilidades

definidas por la ecuaci´ ametros estimados por logit van a diferir on (2). Los par´

un poco de los encontrados por el modelo probit, ya que las distribuciones—

aun y que son muy similares—no son identicas. Al igual que con el modelo

probit, el impacto marginal de cada variable va a depender del punto en la

distribucion en el que lo estamos evaluando:

∂ �L(X iβ) exp(X iβ) = βk (3)

∂xik [1 + exp(X iβ)]2

Los parametros encontrados por los modelos probit y logit se ajustan de tal

manera que la proporcion de 1s observada es igual a la probabilidad predicha

por el modelo latente:

n�ni=1 yi

= �

pi n

i=1

Esta propiedad nos sirve de referencia para revizar la bondad de ajuste del

modelo. Sin embargo, el estadıstico mas utilizado para evaluar el ajuste del

4



==================================================================================

�

modelo es el pseudo-R2 que es el quivalente al R2 en una regresion OLS. Este

estadıstico esta definido de la siguiente manera:

LΩ ωpseudo − R2 =

2/n − L2/n

1 − L2/n ω

En donde LΩ y Lω son los valores de la funci´ axima verosimilitud on de m´

con el modelo completo y con un modelo de solo una constante, respecti

vamente. El estadıstico pseudo-R2 reporta el incremento en la verosimilitud

que esta explicado por las variables incluidas en el modelo.

Como ya lo explicamos, los modelos probit y logit arrojan estimaciones sobre

el modelo para la variable latente. Para comparar estos resultados con los

observados tenemos que pasar de los resultados de una variable continua a

una discreta, esto se logra de manera sencilla toda vez que la probabilidad

ha sido estimada. Aquellos valores cuya P rob(yi = 1) > 0,5 se les asigna un

valor de 1 y 0 de lo contrario. Este es, probablemente, la evaluacion de ajuste

m´ on de casos en los cuales la predicci´as estricta ya que nos da la proporci´ on

es la correcta.

2.2. Problema Multinomial

Hasta ahora hemos discutido la estimacion de variables dependientes discre

tas que toman s´ on se puede generalizar olo dos valores (0 o 1). Esta discusi´

de forma sencilla al problema mulitnomial. Para hacerlo, tenemos que pen

sar en el problema multinomial como una serie de problemas binomiales, es

decir, evaluar la probabilidad de la alternativa j en contra de la alternativa

i, ∀ j = i. Defina esta probabilidad de la siguiente manera:

Pj = F (Xβj )Pj + Pi

Entonces:

Pj = F (·)(Pj + Pi)

5



==================================================================================

�

��

�

�

Pj F (·) =

1 − F (·) = G(Xβj )Pi

1� Pj =

1 − Pi =

Pi − 1

Pi Pij=i

1 =

� G(Xβj ) + 1

Pi j=i �−1

Pi = G(Xβj ) + 1 j=i

G(Xβj ) (4)↔ Pj =

1 + �

i=j G(Xβi)

En principio la ecuaci´ onon (4) puede ser estimada bajo cualquier especificaci´

de la funcion G(·). Sin embargo si asumimos que los residuales del modelo

Xβj +νi se distribuyen logistic, entonces la estimacion se vuelve muy sencilla.

Para encontrar las probabilidades Pj solo tenemos que substituir el termino

exp(Xβj ) en lugar de la funcion G(·) y llegamos al modelo multinomial logit.

La estimaci´ aximaon de un modelo multinomial logit se realiza en base a m´

verosimilitud en donde la ecuacion a maximizar es la siguiente:

n

L = �

Pi1Pi2 . . . Pim

i=1

Es facil de ver porque el supuesto de distribucion logistic simplifica mucho

la estimacio. Por ejemplo, si hubieramos asumido que los residuales νi se

distribuyen de forma normal, hubiera sido necesario encontrar soluciones de

integrales multiples para resolver la ecuacion de verosimilitud, esto en un

marco de 4 o mas alternativas se vuelve casi imposible.2

2En la actualidad hay muchas otras tecnicas para estimar modelos mucho mas

complejos y apegados a la realidad que el multinomial logit sin embargo su

on quedan fuera del alcance del curso. Para modelos m´discusi´ as recientes vea:

http://www.econ.cam.ac.uk/faculty/weeks/index.htm

6



==================================================================================

3. Participacion Laboral

En esta secci´ omo podemos utilizar los modelos discretos que exon veremos c´

plicamos en la seccion anterior utilizando Stata. El planteamiento del proble

ma es el siguiente. Estamos interesados en saber cuales son los determinantes

on laboral en Mexico. Para la estimaci´de la participaci´ on contamos con datos

micro a nivel individual dentro de los hogares (ENIGH).

La variable yi toma el valor de 1 si el individuo i es activo en el mercado

laboral y 0 de los contrario. Observamos al individuo i participar activamente

en el mercado laboral si y solo si y∗ = X iβ + νi > 0. Tradicionalmente, en i

un modelo m´ on a esta variable as estructurado, se le ha dado la interpretaci´

latente como un salario de reserva, en donde el individuo participa siempre

y cuando el salario de mercado sea mayor al mınimo que el esta dispuesto a

aceptar. Estimamos la siguiente ecuacion:

Activoi = α + β1Esci + β2Expi + β3Exp 2 + γZi + νii

El comando para estimar modelos probit y logit en Stata es probit y logit,

respectivamente. Estos comandos son utilizados de la misma forma que us

amos regression. A continuacion presentamos los resultados, primero esti

mando un modelo probit seguido por el logit :

probit active yschooling experience sqexperience north

south hhsize ohhminc

7



==================================================================================

Cuadro 1: Modelo probit


yschooling 0.069 (0.002)

experience 0.099 (0.001)

sqexperience -0.002 (0.000)

north 0.039 (0.019)

south 0.004 (0.019)

hhsize -0.005 (0.003)

ohhminc 0.000 (0.000)

Intercept -0.969 (0.036)

N 39655

Log-likelihood -21852.957

χ2 (7) 6270.502

En el siguiente cuadro presentamos los efectos marginales (ecuacion 1 en la

on anterior). Escribimos mfx justo despues de la estimaci´secci´ on (prchange

es una buena alternativa a mfx).

Cuadro 2: Efectos Marginales Modelo probit

Variable dy/dx (Std. Err.) z

yschooling .0242725 .0008 30.51

experience .0347209 .00051 68.06

sqexperience -.0005441 .00001 -53.96

north .0136996 .00666 2.06

south .0014767 .00658 0.22

hhsize -.0016648 .0011 -1.51

ohhminc -2.41e-07 .00000 -2.51

Ahora comparemos con el modelo logit :

8



==================================================================================

logit active yschooling experience sqexperience north

south hhsize ohhminc

Cuadro 3: Modelo logit


yschooling 0.120 (0.004)

experience 0.166 (0.002)

sqexperience -0.003 (0.000)

north 0.068 (0.032)

south 0.009 (0.032)

hhsize -0.006 (0.005)

ohhminc 0.000 (0.000)

Intercept -1.663 (0.061)

N 39655


χ2 (7) 6341.767

Y los efectos marginales (ecuaci´ on anterior): on 3, secci´

Cuadro 4: Efectos Marginales Modelo logit

Variable dy/dx (Std. Err.) z

yschooling .0249627 .00082 30.60

experience .0346084 .00051 68.11

sqexperience -.0005384 .00001 -53.75

north .0140927 .0067 2.10

south .0019385 .00662 0.29

hhsize -.0013281 .0011 -1.21

ohhminc -2.26e-07 .00000 -2.29

Los resultados muestran que las estimaciones son practicamente las mismas,

9



==================================================================================

con mismos signos y significancia estadıstica.

Comandos : probit, logit, mfx, prchange

3.1. Ajuste y Prediccion

Para revizar la bondad de ajuste del modelo, el comando post-estimaciones

mas completo es fitstat, el cual presenta una tabla con varios estadısticos

on de verosimilud y el pseudo-R2 los cuales eval´como la funci´ uan el ajuste

del modelo.3

Al igual que con la mayoria de las estimaciones en Stata, el comando predict

genera una variable con los valores ajustados del modelo recien estimado. En

el caso de los modelos discreteos, los valores predichos con la opcion xb,

nos producen el estimado para X iβ de la ecuacion para la variable latente.

Si la opci´ on nos dar´on p es utilizada, entonces la predicci´ a la probabilidad

de exito. Para pasar de este tipo de predicciones de la funcion continua a

una prediccion discreta, es necesario especificar un umbral que divida las

estimaciones de la probabilidad de exito en valores discretos 0 y 1. Lo mas

comun es fijar este umbral en 0.5. Por ejemplo, despues de estimar un modelo

probit, generamos la variable phat con las probabilidades de exito para

cada observaci´ on,on: predict phat, p. Una vez que tenemos esta predicci´

escribimos:

gen ahat = (phat >0.5)

La variable ahat es una variable dicotoma la cual toma el valor de 1 si la

prediccion de la probabilidad de exito es mayor a 0.5 y 0 de otra forma. Una

ves que tenemos esto es facil comaprar los valores predichos y observados

utilizando una tabla con tabulaciones bivariadas: 3Si el comando fitstat no ha sido instalado, escriba net from

http://www.indiana.edu/ jslsoc/stata en la barra de comandos, despues siga

las instrucciones.

10



==================================================================================

tab ahat active

Cuadro 5: Predicciones Modelo probit

active

ahat 0 1 Total

0 5,647 2,881 8,528

1 7,217 23,910 31,127

Total 12,864 26,791 39,655

Los valores en la diagonal de la tabla son los valores predichos correctamente.

El modelo probit predice 7,217 empleados que en realidad estan inactivos. La

proporcion de observaciones predichas correctamente es de 74 %, lo cual no

est´ on de la variable latente (un pseudoa nada mal dado el ajuste en la ecuaci´

R2 de 0.13).

Comandos : fitstat, predict

4. Ocupacion Laboral

Ahora veremos como podemos utilizar el modelo multinomial para encontrar

los determinantes de la ocupacion laboral. Suponga que estamos dentro del

marco de un modelo estructural, en donde las decisiones de los agentes son

el resultado de un proceso de maximizacion de utilidad. Defina la utilidad—

indirecta—que derivada el individuo i de la alternativa j de la siguiente

manera:

Vij = V (X i, Z�i), ∀ j (5)

En donde X i y Z�i son caracterısticas personales y del hogar del individuo i,

respectivamente. Asumiendo linealidad en la forma reducida de la ecuacion

(5) y definiendo la matriz Z como la matriz conjunta de X y Z�:

11



==================================================================================

�

Vij = Ziγj + νij , ∀ j (6)

Si existen j = 1 . . . J ocupaciones, entonces observaremos al individuo i elegir

la alternativa j si y solo si:

Vij > max{Vik }, = j (7)∀ k

Es decir el individuo va a elegir la alternativa que maximice su utilidad indi

recta, que en este caso es la variable latente. Si asumimos que los residuales en

on (6) tienen una distribuci´la ecuaci´ on identica e independiente con valores

extremos (distribucion logistic) entonces llegamos al modelo multinomial log

it (ecuacion 4). Como ya lo vimos, en este modelo la probabilidad de observar

al individuo i elegir la alternativa j est´ on:a dada por la siguiente ecuaci´

exp(Ziγj )P rob(i = j) = �

jJ =1 exp(Ziγj )

Definamos el universo de alternativas que tiene el trabajador. La variable occ

va a ser igual a 0 cuando el individuo este inactivo, 1 cuando sea empleado

y 2 cuando sea auto-empleado. Estimamos el siguiente modelo:

mlogit occ yschooling experience sqexperience north

south hhsize ohhminc, b(0)

Los resultados se presentan en el siguiente cuadro:

12



==================================================================================

Cuadro 6: Modelo mlogit


Equation 1 : Empleado

yschooling 0.172

experience 0.130

sqexperience -0.002

north 0.160

south -0.056

hhsize -0.020

ohhminc 0.000

Intercept -2.152

(0.004)

(0.002)

(0.000)

(0.034)

(0.034)

(0.006)

(0.000)

(0.065)

Equation 2 : Auto-empleado

yschooling 0.071

experience 0.161

sqexperience -0.002

north -0.164

south -0.007

hhsize -0.002

ohhminc 0.000

Intercept -3.498

(0.006)

(0.003)

(0.000)

(0.047)

(0.045)

(0.008)

(0.000)

(0.095)

N 37938


χ2 (14) 11507.34

Los resultados que se presentan en el cuadro 6 nos muestran la probabilidad

relativa de que un individuo con determinandas caracterısticas elija se em

pleado o auto-empleado con respecto a estar inactivo. El modelo no puede

estimar las ecuaciones para las tres alternativas, ya que una de ellas debe

de servir como la base, en este caso siendo la categorıa inactivo (notese co

13



==================================================================================

mo esto ha sido elegido al momento de estimar mlogit e incluir la opcion

b(0).)

Para evaluar el ajuste y obtener otros diagnosticos del modelo utilizamos

el comando mlogtest. Este comando reporta estadısticos de significancia

del modelo y pone a prueba los supuestos acerca de la distribucion de los

residuales νij .

Al igual que en el caso binomial, para obtener valores estimados en forma

discreta tenemos que establecer un criterio. En este caso, como lo indica la

ecuaci´ on es que la opci´on (7), el criterio de evaluaci´ on a elegir es aquella que

maximiza la utilidad del individuo. Por lo tanto una vez que el modelo ha sido

estimado, generamos la variable zhat la cual contiene los valores ajustados del

modelo descrito por la ecuacion (6), esto lo hacemos escribiendo el siguiente

codigo:

predict zhat0-zhat2 if e(sample), p

gen occhat=.

replace occhat = 0 if zhat0 == max(zhat0,zhat1,zhat2) &

e(sample)


e(sample)


e(sample)

tab occhat occ

Los resultados se presentan en el siguiente cuadro.

14



==================================================================================

Cuadro 7: Predicciones Modelo mlogit

occ

occhat Inactivo Empleado Auto-empleado Total

0 6,122 2,839 410 9,371

1 5,415 14,470 3,657 23,542

3 1,327 1,374 2,324 5,025

Total 12,864 18,683 6,391 37,938

De nueva cuenta las predicciones correctas se encuentran en la diagonal del

cuadro 7. El modelo logra predecir el 60 % de las observaciones correcta

mente.

Comandos : mlogit, mlogtest

Referencias

[1] Hamilton, L. C. (2004) ‘Statistics with Stata. Updated for version 8’,

Thomson (Capıtulo 10)

[2] Hogg and Craig (1994) ‘Introduction to Mathematical Statistics’, Pren

tice Hall

[3] Maddala, G. S. (1983) ‘Limited dependent and qualitative variables in

econometrics’, Cambridge University Press (Capıtulos 1, 2 y 3)

15



==================================================================================


Clase 5: Analisis de Datos Panel

1. Introduccion

Muchas veces estamos interesados en estimar un modelo que capte no solo las

variaciones entre unidades de observacion (corte transversal) sino tambien la

variaci´ a formada por una serie de cortes on temporal. Si una base de datos est´

transversales en donde estos incluyen las mismas unidades de observacion,

entonces decimos que tenemos una estructura de datos panel. En esta sesion

veremos el tipo de analisis que podemos realizar en Stata para aprovechar

la estructura de datos panel. A lo largo de la sesion cubriremos los sigu

ientes topicos: mınimos cuadrados generales, efectos fijos, efectos aleatorios

y la prueba de Hausman para escoger uno de los modelos. En la aplicacion

pr´ on entre la apertura comercial y la actica trataremos de encontrar la relaci´

desigualdad del ingreso con datos panel para varios paises en el periodo 1970

a 1995. *[email protected]

1



==================================================================================


Rectángulo

2. Estructura de los Datos

Para tener una base de datos con estructura panel es necesario que la misma

unidad de observacion sea monitoreada a traves del tiempo. Por ejemplo si

tenemos informacion sobre un mismo individuo en diferentes puntos en el

tiempo. Cuando se sigue a la misma unidad de observacion en el tiempo,

on que se nos proporciona es m´la informaci´ as rica que aquella en donde

tenemos una serie de cortes transversales. El analisis de panel aprovecha la

informacion extra para tratar de resolver problemas de variables omitidas y

especificacion. Para informar a Stata que nuestros datos tienen una estructura

de panel, podemos utilizar el comando tsset.

Las propiedades asintoticas de este tipo de bases de datos viene dada por el

numero de unidades de observacion (N ), en donde se asume que N → ∞ y

T es pequena.

Comandos: tsset

3. Mınimos Cuadrados Generales

El objetivo del analisis de panel es explotar la estructura de la base de datos

para resolver la siguiente problematica:

yit = X itβ + (error complicado) (1)

El problema es como modelar este residual; diferentes supuestos hacerca de

la estructura y distribucion de los terminos no observados, van a derivar

en diferentes modelos. Si definos los residuales como ui y asumimos que

se distribuyen de forma aleatoria con media µ y varianza σ2, entonces los

par´ on maametros del modelo van a estar definidos por la siguiente expresi´

tricial:

2



==================================================================================

�

βOLS = (X �X)−1(X �Y ) (2)

Defina la siguiente matriz: Ω = E(uiui�). La matriz Ω permite cualquier

tipo de estrucutra en los residuales sin asumir forma funcional (distribucion)

alguna. El resultado de la minimizacion de estos residuales se conoce con el

nombre de mınimos cuadrados generales, cuyos par´ an definidos ametros est´

de la siguiente manera:

βGLS = (X �ΩX)−1(X �ΩY ) (3)

Mientras la ecuaci´ olo una generalizaci´ on con un on 3 es s´ on de una estimaci´

error que puede ser complicado, el problema estriba en definir Ω. Una vez

que Ω ha sido definido, podemos estimar lo que se conoce con el nombre de

mınimos cuadrados generales factibles (FGLS, por sus siglas en ingles), el

cual puede ser estimado en Stata utilizando el comando xtgls. Una primera

on de Ω puede ser: ˆ ui � oticamente (Nestimaci´ Ω = (ˆ ui), la cual tiende asint´ →

∞) ˆa Ω. Por lo tanto Ω requiere de informacion a priori. Por ejemplo si

asumimos que Ω ∼ i.i.d Ω = I OLS = GLS. ⇒ ⇒

Comandos: xtgls

4. Modelo de Efectos Fijos

Considere el siguiente modelo:

yit = X itβ + c + νit (4)

En donde c es una variables aleatoria no-observada. El problema consiste

en determinar si Cov(xj , c) = 0 ya que si este es el caso, los estimadores

del vector de parametros β estarıan sesgados y serıan inconsistentes. Por el

3



==================================================================================

�

contrario si Cov(xj , c) = 0 entonces podemos utilizar lo que se conoce como

un “pooled” OLS para encontrar parametros insesgados y consistentes. Por

el hecho que c no es observable, es complicado determinar empıricamente si

existe tal correlacion entre esta y las variables independientes. En el contexto

de corte transversal, tenemos las siguientes opciones:

1. Encontrar un “proxy” para c

2. Instrumentar c

Dentro del marco de panel data, c pudiera ser constante a traves del tiempo y

variando entre cada unidades de observacion, capturando efectos inherentes a

estas (pais, familia, individuo, etc.). Esto es lo que se conoce como un efecto

fijo. El modelo esta definido de la siguiente manera:

yit = X itβ + ci + νit (5)

En donde ci es conocido como el efecto fijo ya que no tiene variacion tempo

ral.

4.1. Estimando los Efectos Fijos

El objetivo del modelo de efectos fijos es lidear con Cov(xj , c) = 0 dado que la

estrucutura del error es uit = ci + νit. Para hecer esto existen varias tecnicas.

Una de las mas comunes es la de variables indicador, la cual consisten en

estimar la ecuacion 5 introduciendo una variable dummy para cada unidad

de observaci´ on es obtener la diferencia con respecto a on. Una segunda opci´

la media:

1. Obtenga la media de los datos (variables independientes y la dependi

ente) a traves del tiempo, X, Y , en donde ¯ xit. ¯ ¯ x = �

tT

¯yi = X iβ + ci + νi (6)

4



==================================================================================

2. Obtenga la diferencia entre la expresi´ on 5. on para medias y la ecuaci´

¯(yit − yi) = (X it − X i)β + (νit − νi) (7)

Notese que el efecto fijo, ci desaparece al obtener las diferencias.

3. Estime la ecuacion 7 sin constante (ya que esta no varıa en el tiempo,

es eliminada al hacer la diferencia con respecto a la media.)

Una tercera forma de estimar el modelo de efectos fijos es utilizando las

primeras diferencias. Los pasos a seguir son muy similares a los pasos anteri

ores, sin embarago en lugar de estimar 7, estimamos el modelo en primeras

diferencias:

(yit − yi(t−1)) = (X it − X i(t−1))β + (νit − νi(t−1)) (8)

La logica es la misma, eliminar el efecto fijo no observable, ci.

Comandos: xtreg, fe

4.2. Interpretando los Efectos Fijos

Los parametros del modelo de efectos fijos son interpretados como efectos

temporales. Como ya lo vimos, los modelos con datos panel tienen dos fuentes

de variaci´ on entre unidades de observaci´ on temon: la variaci´ on y la variaci´

poral para cada unidad de observaci´ atico cion. Al eliminar el efecto idiosincr´

estamos excluyendo la variaci´ on qued´on entre unidades de observaci´ andonos

solo con variaciones temporales.

Suponga que tenemos un panel de individuos, y estimamos el modelo yit =

βxit + �, lo que nos arrojarıa el modelo de efectos fijos es el cambio en y dado

por un cambio temporal en x para cualquier individuo.

5



==================================================================================

5. Modelo “Between Effects”

El modelo an´ on total alogo al modelo de efectos fijos es el modelo cuya variaci´

proviene s´ on, elminando olo de las diferencias entre unidades de observaci´

la variacion temporal. El modelo “between effects” (BE) es definido de la

siguiente manera:

¯yi = X iβ + ¯ νi (9)ci + ¯

En otras palabras, el modelo BE no es otra cosa que un OLS el cual toma

s´ on.olo las medias en el tiempo para cada unidad de observaci´

La forma de interpretar los parametros arrojados por el modelo BE es uti

lizando la misma l´ ametrosogica que con el modelo de efectos fijos. Los par´

de BE nos dan el efecto sobre y de un cambio en x entre unidades de obser

vacion. En otras palabras es el efecto de sustituir las caracteristicas observ

ables para un individuo xi, por las de otro individuo xj .

Comandos: xtreg, be

6. Modelo de Efectos Aleatorios

Considere el siguiente modelo:

yit = X itβ + υit (10)

Asuma: E(υit X i) = 0 ∀ t en donde υit = ci + uit, entonces: |

E(ci X i) = E(ci) = 0 ⇔ Cov(ci, X i) = 0 |

Por lo tanto el modelo de efectos aleatorios (RE) asume que el error tiene

una estructura del tipo υit = ci + uit sin embargo supone que el termino

6



==================================================================================

ci no esta correlacionado con los regresores. La otogonalidad entre ci y las

aX i est´ basada en el supuesto de que la variable ci se distribuye de for

ma aleatoria. Sin embargo el modelo de efectos aleatorios asume que hay

autocorrelacion de la forma:

υit = ci + uit

υi(t+1) = ci + ui(t+1)

El modelo RE se puede interpretar como una combinacion entre el modelo de

efectos fijos (FE) y el BE. RE asume una estructura del error como en el mod

elo de efectos fijos sin embargo asume ortogonalidad entre el termino ci y los

regresores. De hecho podemos probar que βRA = P romedio(βF E , βBE ). De la

misma forma, se puede demostrar que el supuesto que hace RE (Cov(ci, X i) =

0) es equivalente a βRE = βBE .

Comandos: xtreg, re

7. Prueba de Efectos Aleatorios

La prueba para el modelo RE, es equivalente a probar su supuesto implıcito,

esto es: Cov(ci, X i) = 0. Esto lo podemos hacer utilizando la prueba de

Breusch-Pagan (multiplicador de Lagrange), en donde Ho: V ar(υit) = 0.

Esta prueba es implementada en Stata con el comando xttest0.

Una alternativa a la prueba LM es una prueba de Hausman. En donde se

estiman dos modelos: (1) El modelo consistente bajo Ho y Ha, esto es, el

modelo FE; (1) El modelo consistente bajo Ho e inconsistente bajo Ha, el

modelo RE. Una vez estimados ambos modelos, comparamos los valores de

los parametros y si son estadısticamente diferentes, entonce conluimos que el

modelo inconsistente bajo Ha no es el correcto.

Comandos: xttest0, hausman

7



==================================================================================

Referencias

Wooldridge, J.M. (2002), ‘The econometric analysis of cross section and

panel data’, The MIT Press, Capıtulos: 7 y 10.

8



==================================================================================

1

PERFIL PROFESIONAL:Economista, (PhD.) Doctor en Economía, Maestría en Economía Publica, Maestría en Crecimiento y

Desarrollo Económico, Maestría en Econometría, Ingeniero de Sistemas, Maestría en Sistemas.

Sólida experiencia en el área Econométrica- Estadística –Comercio Internacional, Política

Económica, Desarrollo Económico , Política Monetaria, Política Fiscal, Preparación y Evaluación de

Proyectos, Economía Política; experiencia relevante en diseño de metodologías de investigación y

capacitación en aula tanto en el área de Económica como en Sistemas, Estrategia de Recursos

Humanos. Capacitador ESCABO II Júnior Chamber International – Gerente propietario de

Consultora DC CONSULTING especializada Multidisciplinaria en elaboración de tesis de grado a

nivel Licenciatura – Maestrías – Doctorados.

FORMACIÓN ACADÉMICA:

University of

London

(PhD. Eco.) DOCTORADO EN ECONOMIA:

Mención:

ANALISIS ECONOMETRICO PARA EL CRECIMIENTO Y DESARROLLO

ECONOMICO

Análisys Econométric for the Growth and Economic Development

University of London England

Londres – Inglaterra Febrero 2006 a octubre 2007 (Duración 1 año 10 meses

característica semi presencial trimestralmente)

TESIS DE DOCTORADO:

ANALYSIS MULTIVARIANT OF THE BOLIVIAN ECONOMY

Análisis Multivariante de la Economía Boliviana

University of

London

(MSc.Eco.) MAESTRIA EN ECONOMIA:Mención:

ECONOMIA PUBLICAEconomy Public

University of London EnglandLondres – Inglaterra Febrero 2006 a octubre 2007 (Duración 6 meses Primeramención del curso de Doctorado…………………...…………………Titulo N° 029883TESIS DE MAESTRIA:

INTEGRAL TRANSFORMATIONS OF WATSON IN SPACES OF FUNCTIONSAND OF DISTRIBUTIONS

Transformaciones integrales de Watson en espacios de funciones y de

distribuciones

JJoorrggee EEddwwiinngg DDeell CCaarrppiioo GGoonnzzaalleessCCII:: 33447766331111 LLPP 2233//FFeebbrreerroo//11997711

Dirección: C.Almirante Grau N’ 786 zona central San PedroEmail: [email protected] - [email protected]

Celular: 73078849

2

University of

London

(MSc.Eco.) MAESTRIA EN ECONOMIA:

Mención:

CRECIMIENTO Y DESARROLLO ECONOMICO

Growth and Economic Development University of London England

Londres – Inglaterra Febrero 2006 a octubre 2007 (Duración 6 meses Segunda

mención del curso de doctorado …………………………………...…Titulo N° 026720

TESIS DE MAESTRIA:

STRUCTURAL MODELS AND ESTACIONALITY IN HIGH-FREQUENCY

ECONOMIC TEMPORARY SERIES

Modelos estructurales y estacionalidad en series temporales económicas de

alta frecuencia

Richmond

University

(MSc.Eco.) MAESTRIA EN ECONOMETRÍA :

Mención:

ANÁLISIS ECONOMÉTRICO FINANCIERO Y PRONÓSTICO MULTIVARIANTE

DE NEGOCIOS

Analysis Financial Econométric presage of Business Multivariants

Richmond University - London England

Londres – Inglaterra 2005 (4 Meses presencial 4 meses

virtual………………………………………….……………………Titulo N° 3354268

TESIS DE MAESTRIA:

METHODS FOR THE PROCEDURE AND ANALYSIS ECONOMÉTRIC

MULTIVARIANT IN THE BOLIVIAN ECONOMY

Métodos para el procedimiento y análisis Econométrico Multivariante

En la economía boliviana

ITESM

(MSc. Sist) MAESTRIA EN SISTEMAS:

Mención:

SISTEMAS INTELIGENTES, ANÁLISIS Y CAPACITACIÓN EN AULA

Instituto Tecnológico de Estudios Superiores de Monterrey

México DF 1998(julio)-2000......................................... Titulo Nº ITESM356984-IMSC

TESIS DE MAESTRIA:

IMPLEMENTATION OF VIRTUAL SYSTEMS OF TRAINING AND - LEARNING

Implementación de Sistemas Virtuales de Capacitación E- Learning

3

DIPLOMADO EN EDUCACION SUPERIOR

Mención de Maestría :

FORMACION DOCENTE Y DISEÑO CURRICULAR

Universidad de Aquino Bolivia

La Paz – Bolivia 2004 (Abril-Julio) ...........................................Titulo Nº 00069735TESIS DE DIPLOMADO:

EDUCACIÓN Y GLOBALIZACIÓN LOS DESAFIOS PARA EL SISTEMAUNIVERSITARIO

U.M.S.A

Licenciado en Economía:

Carrera de Economía:1990-1995Facultad de Ciencias Económicas y Financieras

Universidad Mayor de San Andrés.La Paz – Bolivia 2003

Titulo Académico Nº 0004520 ------------Titulo Prov. Nal. Nº 0004276TESIS DE LICENCIATURA:

BOLIVIA IN THE PROCESS OF GLOBALIZATIONBolivia en el Proceso de Globalización

ITESM

Ingeniero en Sistemas:

Carrera Ingeniería de Sistemas Computacionales (ISC)

Instituto Tecnológico de Estudios Superiores de Monterrey

México DF 1995– 1997............................................ Titulo Nº ITESM225812-ISC

TESIS DE LICENCIATURA:

METHODOLOGY IN THE IMPLEMENTATION SOFTWARE FOR THE CREATION

OF VIRTUAL TUTORSHIPS FOR LEARNING

Metodología en la implementación de software para la creación de tutorías

virtuales para aprendizaje

CURSO Y SEMINARIO INTERNACIONAL DE FORMACION PEDAGOGICA:

PERFIL DOCENTE DEL SIGLO XXIUniversidad Mayor Real Pontificia San Francisco Xavier de Chuquisaca

(U.M.R.P.S.X.)

Sucre – Bolivia 2005

SEMINARIO INTERNACIONAL DE FORMACION PEDAGOGICA:

COMUNICACIÓN NO VERBALUniversidad Publica y Autónoma del Alto

(U.P.E.A.)

La Paz – Bolivia 2004

IDIOMAS:Español (lengua Madre) – Ingles – Francés - Portugués -

4

TRABAJOS ESCRITOS - PRODUCCIÓN INTELECTUAL: Manual de Time Series Processor Ver 7.03 (TSP) (autoría propia) Manual de Econometrics Views Vers. 1.0b (EVIEWS) 1ª – 2ª Edición- 1998 (autoría propia) Manual de Econometrics Views Vers. 1.0B – 2.0 – 3.01 – 4.0B (EVIEWS) 3ª Edición – 2001

(autoría propia) Manual de Econometrics Views Vers 4ª edición – 2003 (autoría propia) Manual de SPSS ver 10 1ª edición – 2004 (autoría propia) Solucionario de los problemas del Texto de Introducción a la Econometría del autor Ernesto

Rivero(autoría propia) Bolivia en el Proceso de Globalización Periodo 1987-2002 Traducción de manual de Econometric Views versión 4.0 Micro Software Quantitative para el

Centro de Tecnologías Aplicadas a Economía (CTAE)(2003) Como elaborar el Proyecto de Tesis en Economía 1ª edición 2004 (autoría Propia) Guía de Elaboración de Tesis 1ª edición 2004 (autoría Propia) Gestión de Proyectos (Identificación – Formulación – Preparación y Evaluación) Financiera –

Económica –social -ambiental Texto como elaborar indicadores estadísticos (autoría propia

Elaboración del tutorial de Eviews vers 3 y 4 (CD contiene video-manual Eviews-Lecturas yotros)2004

Elaboración del tutorial de Análisis Econométrico con Eviews vers 5 Y 5.1 (CD contienevideo-manual EVIEWS-Lecturas y otros)2006

Elaboración del tutorial de Análisis Estadistico con SPSS vers 12 (CD contiene video-manualSPSS-Lecturas y otros)2006

Elaboración del tutorial de Análisis Econométrico con STATA vers 9.1 (CD contiene video-manual STATA-Lecturas y otros)2006

Elaboración del tutorial de Análisis Econométrico con JMULTI vers 4 (CD contiene video-manual JMULTI-Lecturas y otros)2006

Elaboración del tutorial de Análisis Econométrico con GRETL vers 12 (CD contiene video-manual GRETL-Lecturas y otros)2006

Elaboración del tutorial de Análisis de Proyectos y Riesgos con CRYSTAL BALL vers 7.2(CD contiene video-manual CRYSTAL BALL –Lecturas y otros)2006

Elaboración del tutorial de Análisis Econométrico con DEMETRA vers 1.0 (CD contienevideo-manual –Lecturas y otros)2006

Elaboración del tutorial de Análisis Econométrico con EASY REG INTERNATIONAL (CDcontiene video-manual –Lecturas y otros)2006

Elaboración del tutorial de Análisis Econométrico con LIMDEP (CD contiene video-manual–Lecturas y otros)2006

Elaboración del tutorial de Análisis de Proyectos con MSPROJECT (CD contiene video-manual–Lecturas y otros)2006

Elaboración del tutorial de Análisis de Proyectos con PLANTILLAS PARAMETRIZADAS(CD contiene video-manual–Lecturas y otros)2006

Elaboración del tutorial de Análisis de Proyectos con CRYSTAL BALL 7.22 (CD contienevideo-manual–Lecturas y otros)2006

Elaboración del tutorial de Análisis contable con MONICA 8.0 (CD contiene video-manual–Lecturas y otros)2007

Elaboración del tutorial de Análisis Econométrico con Eviews vers 6.0 Y 5.1 (CD contienevideo-manual EVIEWS-Lecturas y otros)2007

CURSOS DE COMPUTACIÓN:1990 Curso de Auxiliar en Contabilidad Computarizada –Instituto “Arrieta”1991 Curso de Auxiliar en Contabilidad Computarizada –Instituto Educacional Británico1994 Curso de Sistemas Computarizados de Oficina- Escuela Industrial “Pedro Domingo

Murillo”Carrera De Electrónica

5

1994 Curso de Sistema Operativo Dos- Word Perfect – Qpro Windows (Universidad SantoTomas” –CENACO-CEIN)

1994 Curso de Programador en Sistemas de Computación Instituto C.I.P.E.C. SRL1994 Curso de Sistema Operativo Ms-Dos, Ms-Windows, Ms-Word, Ms-Excel; ECCOM SRL1998 Curso de Time Series Processor – Instituto MILENIO SRL1998 Curso Estrategia de Recursos Humanos – Escuela Superior de Estudios Especializados1999 Curso de Marketing por teléfono- American Bussines Group1999 Curso de servicio al cliente- American Bussines Group

CONOCIMIENTO Y MANEJO DE PAQUETES DE COMPUTACIÓN:PLATAFORMA D.O.S.

Sistema Operativo D.O.S Vers. 6.0 – 6.21 –6.22 Sistema Operativo PC-D.O.S Versión 6.3-7.0 procesador de texto Word Perfect para entorno D.O.S Vers. 5.1 – 6.0 hoja electrónica Quattro Pro para entorno D.O.S Vers. 4.0 –5.0 Programación en Turbo C Ver 2.0 –Turbo Pascal (ENTORNO DOS) Time Series Processor Vers. 6.54 -7.03 (ECONOMETRIA) DIGITIME (software de control de asistencia de RELOJ CDM-30) ATR6000 (software de control de asistencia de reloj BADGER II)

PLATAFORMA WINDOWS procesador de texto Word Perfect para entorno Windows Vers. 6.0 – 6.1 –7.0 –8.0 Microsoft Windows Vers. 3.1 –3.11 –95 –98- 2000 Profesional – Milenniun Edition – XP

Profesional- Windows XP Home Edition-Lite Edition-Long Horn-lite edition –Vista Edition Microsoft Windows NT Vers. 4.0 – 2000 (Profesional) 2003 Server Enterprise Microsoft office (Word-Excel-Access-Power Point-Outlook) Vers. 93 –94 –95 – 97 – 2000-

XP(Profesional) -2003 Profesional – 2007 profesional Microsoft Publisher – Project – Visio Vers. 95 –97 –98 –2000-XP Profesional 2003

Profesional – Profesional 2007 Microsoft Corel Perfect Office (Word Perfect –Qpro – Presentations ) Microsoft Abc Floor Chart (diagramas de flujo) Econometrics View Vers. 1.0b –2.0b –3.01-3.1 –4.0 -5.0(Econometría) Gretl Econometría – Lindep –Econometría –Simprocess –Stata ver 7.0 -8.0 SPSS Vers. 6.0 – 7.0- 8.0 –9.0 – 10.0 –11.0 -12 – 13(Estadística) Microsoft quicken (contabilidad) Microsoft Visual Studio nterprise (Visual Basic-Visual Fox)

EMSAMBLAJE DE COMPUTADORAS Ensamblaje de Computadoras – Configuración de Computadoras – Formateo y Particionado

de Discos Duros(HDD) – Instalación de Software

CONFIGURACIÓN DE REDES Manejo y Configuración de Redes L.A.N. – W.A.N. - configuración de protocolos IPX / IPS –TCP /IP –NETBEUI –DNS/ HOST configuración de líneas ZET- CIRCUNVALEM – BLANCA- DEDICADA –ADSL

CURSILLOS DICTADOS:1998 Mayo Curso del Paquete Econometric Views Vers 10B Carrera De Economía – CIME

(Centro de Investigación Matemática y Estadística para Economía)-UMSA2000 Como Debe Ser Un Líder Ideal – Cámara Júnior Internacional2001 Curso del Paquete Econometric Views Vers 3.01 Consultora CEPIIB2001 Curso del Paquete SPSS ver 10.0 Consultora CEPIIB2003 Curso Taller del Paquete Econometrics Views Ver 4.0 Colegio de Economistas

6

de la Paz – Centro de Tecnologías Aplicadas a Economía2004 Curso Virtual de Análisis Econométrico con Eviews Diplomado Economía

Informática2005 Curso Análisis Econométrico con Eviews 4 carrera de Economía- UMSA2006 Curso de Análisis Econométrico con Eviews vers 5 Y 5.1 Consultora CADES2006 Curso de Análisis Econométrico con STATA vers 9 Y 9.1 Consultora CADES2006 Curso de Análisis Econométrico con J-MULTI Consultora CADES2006 Curso de Análisis Econométrico con DEMETRA Consultora CADES2006 Curso de Análisis Econométrico con GRETL Consultora CADES2006 Curso de Análisis Econométrico con LIMDEP Consultora CADES2006 Curso de Análisis Econométrico con EASY REG INTERNATIONAL Consultora

CADES2006 Curso de Análisis Estadístico con SPSS vers. 12 Consultora CADES2006 Curso de Análisis de Proyectos y Riesgos con CRYSTAL BALL vers 7.12

Consultora CADES2006 Curso Análisis de Proyectos con MSPROJECT ver 2003 Consultora CADES2007 Curso de Preparacion y Evaluacion de Proyectos con PLANTILLAS PARAMETRIZADAS

Consultora NUEVO MUNDO2007 Curso de Análisis Econométrico con Eviews vers 5 Y 5.1 Consultora NUEVO MUNDO2007 Curso de PAQUETE CONTABLE MONICA 8 Consultora NUEVO MUNDO2007 Curso de Paquete Contable ORION 4.5 Consultora NUEVO MUNDO2007 Curso de OPERADORES DE COMERCIO EXTERIOR SIDUNEA++ Consultora NUEVO

MUNDO2007 Curso de GESTION DE ALMACENES Consultora NUEVO MUNDO2007 Curso de ANALISIS ESTADISTICO CON SPSS13 Consultora NUEVO MUNDO2007 Curso de ADMINISTRACION DE RECURSOS HUMANOS (DIRECCION

EMPRESARIAL) Consultora NUEVO MUNDO2007 Curso de Análisis Econométrico con STATA vers 9 Y 9.1 Consultora NUEVO

MUNDO2007 Curso de Análisis Econométrico con J-MULTI Consultora NUEVO MUNDO2007 Curso de Análisis Econométrico con DEMETRA Consultora NUEVO MUNDO2007 Curso de Análisis Econométrico con GRETL Consultora NUEVO MUNDO2007 Curso de Análisis Econométrico con LIMDEP Consultora NUEVO MUNDO2007 Curso de Análisis Econométrico con EASY REG INTERNATIONAL Consultora

NUEVO MUNDO

EXPERIENCIA DE TRABAJO:1998 enero 00 CARRERA DE ECONOMIA- UMSA: Fac. Ciencias Económicas y

Financieras auxiliar de docencia materia de Informática auxiliar de docencia materia de Econometría en calidad de invitado –

AD HONOREN) CIME –UMSA instalación de la red del laboratorio de informática

1998 agosto2000 enero

INSTITUTO TECNOLOGICO DE ESTUDIOS SUPERIORES DEMONTERREY (ITESM) –CARRERA: ECONOMIA –CARRERA COMERCIOINTERNACIONAL - MEXICODocente de las materias:

Econometría I Econometría II Estadística I Estadística II Comercio internacional Miembro del departamento de Economía Cuantitativa Miembro del Departamento de Economía Aplicada

7

1999 Enero2000 Enero

INSTITUTO TECNOLOGICO DE ESTUDIOS SUPERIORES DEMONTERREY (ITESM) –CARRERA: INGENIERIA DE SISTEMAS – MEXICODocente de las materias :

Programación I Redes Neuronales Inteligencia Artificial lógica difusa Estructuración de redes LAN- WAN Miembro del Departamento Capacitación en sistemas

2000 CURSO PREFACULTATIVO: Fac. Ciencias Económicas y Financieras Jefe de sistemas Elaboración del software Elaboración y codificación de alumnos Mantenimiento y configuración de la red Trabajos Varios

2001 – 2002 INSTITUTO (Bussines Integral Tecnology) BIT- ORURODocente de las materias: Programación I Análisis de sistemas computacionales Estadística

2003 INSTITUTO DE INVESTIGACIONES ECONOMICAS: -U.M.S.A Docente de Diplomado Econometría Avanzada (Materia: Econometría

Básica) Docente de Diplomado Economía Informática (Materia: Redes

Neuronales inteligencia artificial y Lógica Difusa Materia: EconometríaBásica)

2004 INSTITUTO DE INVESTIGACIONES ECONOMICAS: -U.M.S.A Docente de Diplomado Econometría (Materia: Econometría dinámica ) Docente de Diplomado Economía Informática (Materia: Redes

Neuronales inteligencia artificial y Lógica Difusa Materia: EconometríaBásica)

2004 octubre –diciembre

MINISTERIO DE EDUCACION: Profesional En Procesos y Gestión de Almacenes Coordinador de Sistemas para Congreso Nacional de Educación

juntamente Lic. Marcelo Rocabado Sistematización Congresos Departamentales La Paz Marco Lógico

Oruro Marco Filosófico – Santa Cruz Formación Docente – Santa Cruz

2007 Julio –Noviembre

CURSO PREFACULTATIVO: Fac. Ciencias Económicas y Financieras Docente de la materia: Introducción a la Economía

2007 AgostoActual

SOCIEDAD DE ALTOS ESTUDIOS JURIDICOS EMPRESARIALESEUROAMERICANO

Docente TITULAR de la materia: ECONOMETRIA Docente TITULAR de la materia: GESTION Y VALORACION

EMPRESARIAL Docente TITULAR de la materia: LOGISTICA DE EXPORTACIONES

8

EXPERIENCIA EN CAMARA JUNIOR INTERNACIONAL:

Julio 2000 Curso de administración del capitulo –Preparación y Evaluación deProyectos

Agosto 2000 Curso de ESCABO II (Escuela de Capacitadores de Bolivia)Septiembre 2000 Curso de Procedimientos Parlamentarios

ASOCIADO A INSTITUCIONES:Asociación de Scouts de BoliviaJunior Chamber InternationalFundación Economía Informática

Manual Stata10 Jdc

Documents

Transcript of Manual Stata10 Jdc